Python
内容导读
互联网集市收集整理的这篇技术教程文章主要介绍了Python,小编现在分享给大家,供广大互联网技能从业者学习和参考。文章包含1896字,纯文字阅读大概需要3分钟。
内容图文
![Python](/upload/InfoBanner/zyjiaocheng/1233/3a1b07f0b17544089b139f8a80e2355f.jpg)
1 # coding=utf-8 2 3 # 参考文章: 4 # 1. python实现简单爬虫功能 5 # http://www.cnblogs.com/fnng/p/3576154.html 6 # 2. Python 2.7 时间和日期模块常用的例子 7 # http://www.linuxidc.com/Linux/2015-06/118458.htm 8 # 3. Python open读写文件实现脚本 9 # http://www.jb51.net/article/15709.htm 10 # 4. python re 模块 findall 函数用法简述 11 # http://blog.csdn.net/cashey1991/article/details/8875213 12 # 5. [Python]编码声明:是coding:utf-8还是coding=urf-8呢 13 # http://www.xuebuyuan.com/975181.html 14 15 16 # urllib模块提供的上层接口,使我们可以像读取本地文件一样读取www和ftp上的数据。 17 import urllib 18 import re 19 import datetime,time 20 21 # 定义了一个getHtml()函数 22 def getHtml( url ): 23 # urllib.urlopen()方法用于打开一个URL地址。 24 page = urllib.urlopen( url ) 25# read()方法用于读取URL上的数据26 html = page.read() 2728# 返回整个网页数据29return html 3031# 创建getImg()函数32def getImg( html ): 33# ()表示所要提取的字符串,即: 图片名.jpg34 reg = r‘src="(.+?\.jpg)" pic_ext‘35# 可以把正则表达式编译成一个正则表达式对象.36 imgre = re.compile( reg ) 37# 读取html 中包含 imgre(正则表达式)的数据。38# 当给出的正则表达式中带有一个括号时,列表的元素为字符串,39# 此字符串的内容与括号中的正则表达式相对应(不是整个正则表达式的匹配内容)。40 imglist = re.findall( imgre, html ) 4142print"Start downloading the first five pictures"4344# 通过一个for循环对获取的图片连接进行遍历,为了使图片的文件名看上去更规范,45# 对其进行重命名,命名规则通过x变量加1。保存的位置默认为程序的存放目录。46 x = 0 47for imgurl in imglist: 48# 用到了urllib.urlretrieve()方法,直接将远程数据下载到本地49 urllib.urlretrieve( imgurl, ‘%s.jpg‘ % x ) 50# python不支持类似 x++ 或 x-- 这样的前置/后置自增/自减运算符,因此只能用 += 或 -= 这种。51 x += 1 5253# 这里面的图片可能比较多,我们测试前五张就差不多了54if x == 5 : 55break5657print"the first five pictures download completed."5859return imglist 6061# 向getHtml()函数传递一个网址,并把整个页面下载下来,保存在html变量中62 html = getHtml( "http://www.zengjf.org" ) 6364# 合成要保存的文件名,由年月日、时分秒组成,以只写方式打开文件65 saveFile = open( time.strftime( "%Y%m%d%H%M%S" ) + ".html", ‘w‘ ) 66 saveFile.write( html ) # 将html中的内容写入文件67 saveFile.close( ) # 关闭文件6869 html = getHtml( "http://tieba.baidu.com/p/2460150866" ) 70print getImg( html )
原文:http://www.cnblogs.com/zengjfgit/p/4863977.html
内容总结
以上是互联网集市为您收集整理的Python全部内容,希望文章能够帮你解决Python所遇到的程序开发问题。 如果觉得互联网集市技术教程内容还不错,欢迎将互联网集市网站推荐给程序员好友。
内容备注
版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 gblab@vip.qq.com 举报,一经查实,本站将立刻删除。
内容手机端
扫描二维码推送至手机访问。
来源:【匿名】