首页 / PYTHON / Python实现简单网页图片抓取完整代码实例

Python实现简单网页图片抓取完整代码实例

内容导读

互联网集市收集整理的这篇技术教程文章主要介绍了Python实现简单网页图片抓取完整代码实例，小编现在分享给大家，供广大互联网技能从业者学习和参考。文章包含3277字，纯文字阅读大概需要5分钟。

内容图文

@本文来源于公众号：csdn2299，喜欢可以关注公众号程序员学府
这篇文章主要介绍了Python实现简单网页图片抓取完整代码实例，具有一定借鉴价值，需要的朋友可以参考下。
利用python抓取网络图片的步骤是：
1、根据给定的网址获取网页源代码
2、利用正则表达式把源代码中的图片地址过滤出来
3、根据过滤出来的图片地址下载网络图片

以下是比较简单的一个抓取某一个百度贴吧网页的图片的实现：

# -*- coding: utf-8 -*- 
# feimengjuan 
import re 
import urllib 
import urllib2 
#抓取网页图片  
#根据给定的网址来获取网页详细信息，得到的html就是网页的源代码 
def getHtml(url): 
  page = urllib.urlopen(url) 
  html = page.read() 
  return html 
 def getImg(html): 
  #利用正则表达式把源代码中的图片地址过滤出来 
  reg = r'src="(.+?\.jpg)" pic_ext'
  imgre = re.compile(reg) 
  imglist = imgre.findall(html) #表示在整个网页中过滤出所有图片的地址，放在imglist中 
  x = 0
  for imgurl in imglist: 
    urllib.urlretrieve(imgurl,'%s.jpg' %x) #打开imglist中保存的图片网址，并下载图片保存在本地 
    x = x + 1
 html = getHtml("http://tieba.baidu.com/p/2460150866")#获取该网址网页详细信息，得到的html就是网页的源代码 
getImg(html)#从网页源代码中分析并下载保存图片

进一步对代码进行了整理，在本地创建了一个“图片”文件夹来保存图片

# -*- coding: utf-8 -*- 
# feimengjuan 
import re 
import urllib 
import urllib2 
import os 
#抓取网页图片  
#根据给定的网址来获取网页详细信息，得到的html就是网页的源代码 
def getHtml(url): 
  page = urllib.urlopen(url) 
  html = page.read() 
  return html 
  
#创建保存图片的文件夹 
def mkdir(path): 
  path = path.strip() 
  # 判断路径是否存在 
  # 存在  True 
  # 不存在 Flase 
  isExists = os.path.exists(path) 
  if not isExists: 
    print u'新建了名字叫做',path,u'的文件夹'
    # 创建目录操作函数 
    os.makedirs(path) 
    return True
  else: 
    # 如果目录存在则不创建，并提示目录已经存在 
    print u'名为',path,u'的文件夹已经创建成功'
    return False
# 输入文件名，保存多张图片 
def saveImages(imglist,name): 
  number = 1
  for imageURL in imglist: 
    splitPath = imageURL.split('.') 
    fTail = splitPath.pop() 
    if len(fTail) > 3: 
      fTail = 'jpg'
    fileName = name + "/" + str(number) + "." + fTail 
    # 对于每张图片地址，进行保存 
    try: 
      u = urllib2.urlopen(imageURL) 
      data = u.read() 
      f = open(fileName,'wb+') 
      f.write(data) 
      print u'正在保存的一张图片为',fileName 
      f.close() 
    except urllib2.URLError as e: 
      print (e.reason) 
    number += 1 
#获取网页中所有图片的地址 
def getAllImg(html): 
  #利用正则表达式把源代码中的图片地址过滤出来 
  reg = r'src="(.+?\.jpg)" pic_ext'
  imgre = re.compile(reg) 
  imglist = imgre.findall(html) #表示在整个网页中过滤出所有图片的地址，放在imglist中 
  return imglist   
#创建本地保存文件夹，并下载保存图片 
if __name__ == '__main__': 
  html = getHtml("http://tieba.baidu.com/p/2460150866")#获取该网址网页详细信息，得到的html就是网页的源代码 
  path = u'图片'
  mkdir(path) #创建本地文件夹 
  imglist = getAllImg(html) #获取图片的地址列表 
  saveImages(imglist,path) # 保存图片

结果在“图片”文件夹下保存了几十张图片，如截图： Python实现简单网页图片抓取完整代码实例 - 文章图片
非常感谢你的阅读
大学的时候选择了自学python，工作了发现吃了计算机基础不好的亏，学历不行这是

没办法的事，只能后天弥补，于是在编码之外开启了自己的逆袭之路，不断的学习python核心知识，深

入的研习计算机基础知识，整理好了，我放在我们的微信公众号《程序员学府》，如果你也不甘平庸，

那就与我一起在编码之外，不断成长吧！

其实这里不仅有技术，更有那些技术之外的东西，比如，如何

做一个精致的程序员，而不是“屌丝”，程序员本身就是高贵的一种存在啊，难道不是吗？点击加入
想做你自己想成为高尚人，加油！

内容总结

以上是互联网集市为您收集整理的Python实现简单网页图片抓取完整代码实例全部内容，希望文章能够帮你解决Python实现简单网页图片抓取完整代码实例所遇到的程序开发问题。如果觉得互联网集市技术教程内容还不错，欢迎将互联网集市网站推荐给程序员好友。

内容备注

版权声明：本文内容由互联网用户自发贡献，该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容，请发送邮件至 gblab@vip.qq.com 举报，一经查实，本站将立刻删除。

内容手机端

扫描二维码推送至手机访问。

本文链接：https://qyyshop.com/info/630983.html

来源：【匿名】

【上一篇】Python面向对象程序设计类变量与成员变量、类方法与成员方法用法分析【下一篇】浅谈PHP运行Python脚本的方法

更多 ►

【Python实现简单网页图片抓取完整代码实例】教程文章相关的互联网学习教程文章

Python中类的继承代码实例

相对于C++的继承编写，Python更简洁，而且效率也是很高的，下面编写一个简单Python的继承例子。复制代码代码如下: #!/usr/bin/python #filename: pyclass.py class Member: def __init__(self, name, age): self.name = name self.age = age print ‘Member init:%s‘ % self.name def tell(self): print ‘Name:%s...

Python实现高效求解素数代码实例【代码】

素数是编程中经常需要用到的。作为学习Python的示例，下面是一个高效求解一个范围内的素数的程序，不需要使用除法或者求模运算。 #coding:utf-8 #设置python文件的编码为utf-8，这样就可以写入中文注释 def primeRange(n):myArray=[1 for x in range(n+1)] ##列表解析，生成长度为(n+1)的列表，每个数值都为1myArray[0]=0myArray[1]=0startPos=2while startPos <= n:if myArray[startPos]==1:key=2resultPos = startPos * key #...

通过pandas库对cdn日志实现分析的python代码实例

这篇文章主要介绍了利用Python中的pandas库进行cdn日志分析的相关资料，文中分享了pandas对cdn日志分析的完整示例代码，然后详细介绍了关于pandas库的相关内容，需要的朋友可以参考借鉴，下面来一起看看吧。前言最近工作工作中遇到一个需求，是要根据CDN日志过滤一些数据，例如流量、状态码统计，TOP IP、URL、UA、Referer等。以前都是用 bash shell 实现的，但是当日志量较大，日志文件数G、行数达数千万亿级时，通过 shell 处理有...

完成计算文本文件字数的Python代码实例

这篇文章主要介绍了Python实现统计文本文件字数的方法,涉及Python针对文本文件读取及字符串转换、运算等相关操作技巧,需要的朋友可以参考下本文实例讲述了Python实现统计文本文件字数的方法。分享给大家供大家参考，具体如下：统计文本文件的字数，从当前目录下的file.txt取文件# -*- coding: GBK -*- import string import sys reload(sys) def compareItems((w1,c1), (w2,c2)):if c1 > c2:return - 1elif c1 == c2:return cmp(w1...

python基础教程Python JSON常用编解码方法代码实例【图】

更多python教程请到：菜鸟教程 https://www.piaodoo.com/ 概念 JSON(JavaScript Object Notation) 是一种轻量级的数据交换格式，易于人阅读和编写。在日常的工作中，应用范围极其广泛。这里就介绍python下它的两种编解码方法：使用json函数使用 JSON 函数需要导入 json 库：import json。函数含义：源码解析：# coding= utf-8 #!/usr/bin/python import json import sys data = {"username":"测试","age":16} jsondata = js...

以Python代码实例展示kNN算法的实际运用_基础知识【图】

邻近算法，或者说K最近邻(kNN，k-NearestNeighbor)分类算法是数据挖掘分类技术中最简单的方法之一。所谓K最近邻，就是k个最近的邻居的意思，说的是每个样本都可以用它最接近的k个邻居来代表。 kNN算法的核心思想是如果一个样本在特征空间中的k个最相邻的样本中的大多数属于某一个类别，则该样本也属于这个类别，并具有这个类别上样本的特性。该方法在确定分类决策上只依据最邻近的一个或者几个样本的类别来决定待分样本所属的类别。...

以Python代码实例展示kNN算法的实际运用【图】

一起看看python+pygame简单画板实现代码实例【代码】【图】

疑问：pygame已经过时了吗？过没过时不知道，反正这玩意官方已经快四年没有更新了。用的人还是蛮多的（相对于其他同类项目），不过大家都是用来写写小东西玩一玩，没有人用这个做商业项目。pygame其实就是SDL的python绑定，SDL又是基于OpenGL，所以也有人用pygame+pyOpenGL做3D演示什么的。真的要写游戏的话pygame的封装比较底层，不太够用，很多东西都要自己实现（当然自由度也高）。文档也不太好，好在前人留下了很多文章。拿来练...

如何在Python中使用运算符？（代码实例）【图】

初学者如何使用Python中的运算符，在可以说是编程中必不可少的知识的运算符中，下面Gxl网就带领大家来讲解一下如何在Python中使用运算符？【推荐教程：Python教程】一：什么是Python的运算符运算符是用于计算的运算符号，例如四个算术运算和执行编程时的比较，有几种类型的Python运算符。1.代数运算符代数运算符是用于由算术运算表示的运算，它在名称上与赋值运算符类似，但它是代数运算符。+， - ，*，/，％，**，//2.按位运算符按...

Python实现图片像素化的代码实例【图】

本篇文章给大家带来的内容是关于Python实现图片像素化的代码实例，有一定的参考价值，有需要的朋友可以参考一下，希望对你有所帮助。起因看到网上的像素图片，感觉蛮有趣的，就打算用python一些PIL类库写一个。实现思路把一张图片分成多个块，每个块的颜色都等于这个色块中颜色最多的颜色，如下图。这个图取22的像素为块的大小，把快中颜色与每个颜色出现的数量存放到字典里，取最大的颜色，填充整个块。具体实现from PIL import I...

Python中typing模块的介绍（代码实例）【图】

本篇文章给大家带来的内容是关于Python中typing模块的介绍（代码实例），有一定的参考价值，有需要的朋友可以参考一下，希望对你有所帮助。Python是一门弱类型的语言，很多时候我们可能不清楚函数参数类型或者返回值类型，很有可能导致一些类型没有指定方法，typing模块可以很好的解决这个问题。该模块加入并不会影响程序的运行，不会报正式的错误，只有提醒。typing模块只有在python3.5以上的版本中才可以使用，pycharm目前支持ty...

python求解物理学中的双弹簧质能系统的代码实例【图】

这篇文章主要给大家介绍了关于利用python如何求解物理学中的双弹簧质能系统的相关资料，文中通过示例代码介绍的非常详细，对大家的学习或者工作具有一定的参考学习价值，需要的朋友们下面随着小编来一起学习学习吧。前言本文主要给大家介绍了关于利用python求解物理学中双弹簧质能系统的相关内容，分享出来供大家参考学习，下面话不多说了，来一起看看详细的介绍吧。物理的模型如下：在这个系统里有两个物体，它们的质量分别是m1和...

Python实现表情包的代码实例【图】

本文主要介绍了使用Python进行简单图像处理的方法以及Python自动生产表情包的实例，具有很好的参考价值，下面跟着小编一起来看下吧作为一个数据分析师，应该信奉一句话——“一图胜千言”。不过这里要说的并不是数据可视化，而是一款全民向的产品形态——表情包！！！！表情包不仅仅是一种符号，更是一种文化——是促进社交乃至社会发展的动力之一，就像懒。我们坚持认为，一张优秀的表情包，应该是一幅艺术品，是那忽如一夜春风来...

Python爬虫实现取名字的代码实例【图】

每个人一生中都会遇到一件事情，在事情出现之前不会关心，但是事情一旦来临就发现它极其重要，并且需要在很短的时间内做出重大决定，那就是给自己的新生宝宝起个名字。下面这篇文章主要介绍了如何利用Python爬虫给孩子起个好名字，需要的朋友可以参考下。前言相信每位家长都有所体会，因为要在孩子出生后两周内起个名字（需要办理出生证明了），估计很多人都像我一样，刚开始是很慌乱的，虽然感觉汉字非常的多随便找个字做名字都行...

实现端口扫描器Python代码实例【图】

本篇文章主要介绍了Python实现简易端口扫描器的相关代码,具有一定的参考价值，感兴趣的小伙伴们可以参考一下。在网上的一些资料的基础上自己又添了些新内容，算是Python socket编程练手吧。#coding=utf-8 import socket import time import sys import struct import threading from threading import Thread,activeCountresults=[] def portScanner(ip,port):server = (ip,port)sockfd = socket.socket(socket.AF_INET,socket.SOC...

首页 / PYTHON / Python实现简单网页图片抓取完整代码实例

Python实现简单网页图片抓取完整代码实例

内容导读

内容图文

内容总结

内容备注

内容手机端

【Python实现简单网页图片抓取完整代码实例】教程文章相关的互联网学习教程文章

Python中类的继承代码实例

Python实现高效求解素数代码实例【代码】

通过pandas库对cdn日志实现分析的python代码实例

完成计算文本文件字数的Python代码实例

python基础教程Python JSON常用编解码方法代码实例【图】

以Python代码实例展示kNN算法的实际运用_基础知识【图】

以Python代码实例展示kNN算法的实际运用【图】

一起看看python+pygame简单画板实现代码实例【代码】【图】

如何在Python中使用运算符？（代码实例）【图】

Python实现图片像素化的代码实例【图】

Python中typing模块的介绍（代码实例）【图】

python求解物理学中的双弹簧质能系统的代码实例【图】

Python实现表情包的代码实例【图】

Python爬虫实现取名字的代码实例【图】

实现端口扫描器Python代码实例【图】

PYTHON - 相关标签

实例 - 相关标签

PYTHON - 技术教程分类

PYTHON - 最新教程

PYTHON - 最热教程