python 图片爬虫

内容导读

互联网集市收集整理的这篇技术教程文章主要介绍了python 图片爬虫，小编现在分享给大家，供广大互联网技能从业者学习和参考。文章包含654字，纯文字阅读大概需要1分钟。

内容图文

            #
            !/usr/bin/env python
            
#
            coding:utf-8
            import
             urllib

            import
             re


            def
             GetHtml(url):
    
            """
            获取HTML页面所有元素.
            """
            

    page =  urllib.urlopen(url)
    html = page.read()
    return html

def GetImg(html):
    """ 获取HTML页面所有.jpg图片."""

    reg = r‘src="(.+?\.jpg)"‘  
    imgre = re.compile(reg)
    imglist = re.findall(imgre, html)
    x = 0
    for imgurl in imglist:
        urllib.urlretrieve(imgurl, ‘%s.jpg‘ %x, cbx)
        x += 1
        print"img: %s is done!" %x

def cbx(a, b, c):
    """显示下载进度.
    @a: 已经下载的数据块
    @b: 数据块大小
    @c: 远程文件的大小
    """
    
    per = 100.0 * a * b / c
    if per > 100:
        per = 100
    print"%.2f%%" %per

html = GetHtml("http://www.baidu.com")
print GetImg(html)

原文：http://www.cnblogs.com/hujianping/p/4740098.html

内容总结

以上是互联网集市为您收集整理的python 图片爬虫全部内容，希望文章能够帮你解决python 图片爬虫所遇到的程序开发问题。如果觉得互联网集市技术教程内容还不错，欢迎将互联网集市网站推荐给程序员好友。

内容备注

版权声明：本文内容由互联网用户自发贡献，该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容，请发送邮件至 gblab@vip.qq.com 举报，一经查实，本站将立刻删除。

内容手机端

扫描二维码推送至手机访问。

本文链接：https://qyyshop.com/info/1307754.html

来源：【匿名】

【下一篇】浅谈PHP运行Python脚本的方法

更多 ►

【python 图片爬虫】教程文章相关的互联网学习教程文章

#!/usr/bin/env python #coding:utf-8import urllib import redef GetHtml(url):"""获取HTML页面所有元素."""page = urllib.urlopen(url)html = page.read()return htmldef GetImg(html):""" 获取HTML页面所有.jpg图片."""reg = r‘src="(.+?\.jpg)"‘ imgre = re.compile(reg)imglist = re.findall(imgre, html)x = 0for imgurl in imglist:urllib.urlretrieve(imgurl, ‘%s.jpg‘ %x, cbx)x += 1print"img: %s is done!" %xdef...

python 百度图片爬虫【代码】

# -*- coding:utf-8 -*- #https://blog.csdn.net/qq_32166627/article/details/60882964import requests import os import pinyindef getManyPages(keyword,pages):params=[]for i in range(30,30*pages+30,30):params.append({‘tn‘: ‘resultjson_com‘,‘ipn‘: ‘rj‘,‘ct‘: 201326592,‘is‘: ‘‘,‘fp‘: ‘result‘,‘queryWord‘: keyword,‘cl‘: 2,‘lm‘: -1,‘ie‘: ‘utf-8‘,‘oe‘: ‘utf-8‘,‘adpicid‘: ‘‘...

python写的百度图片爬虫【代码】【图】

学了一下python正则表达式，写一个百度图片爬虫玩玩。当技术遇上心术不正的人，就成我这样的2B青年了。python3.6开发,在Windows下需要安装vc2015动态库。下载地址:http://www.cr173.com/soft/146014.html 1#/usr/bin/env python 2#Guoyabin 3#-*- coding:utf-8 -*- 4import re,os5import requests6 7 keyword=input(‘请输入搜索关键词:‘)8 os.chdir(‘C:\\Users\\Administrator\\Desktop\\‘)9if os.path.exists(keyword) ==Fal...

python爬虫入门教程之点点美女图片爬虫代码分享

继续鼓捣爬虫，今天贴出一个代码，爬取点点网「美女」标签下的图片，原图。# -*- coding: utf-8 -*- #--------------------------------------- # 程序：点点美女图片爬虫 # 版本：0.2 # 作者：zippera # 日期：2013-07-26 # 语言：Python 2.7 # 说明：能设置下载的页数 #--------------------------------------- import urllib2 import urllib import repat = re.compile(\n.*?imgsrc="(ht.*?)\".*?) nexturl1 = "h...

python爬虫入门教程之糗百图片爬虫代码分享【图】

学习python少不了写爬虫，不仅能以点带面地学习、练习使用python，爬虫本身也是有用且有趣的，大量重复性的下载、统计工作完全可以写一个爬虫程序完成。用python写爬虫需要python的基础知识、涉及网络的几个模块、正则表达式、文件操作等知识。昨天在网上学习了一下，写了一个爬虫自动下载「糗事百科」里面的图片。源代码如下：代码如下: # -*- coding: utf-8 -*- # 上面那句让代码里支持中文 #--------------------------------...

简单的Python抓taobao图片爬虫

写了一个抓taobao图片的爬虫，全是用if，for，while写的，比较简陋，入门作品。从网页http://mm.taobao.com/json/request_top_list.htm?type=0&page=中提取taobao模特的照片。代码如下: # -*- coding: cp936 -*- import urllib2 import urllib mmurl="http://mm.taobao.com/json/request_top_list.htm?type=0&page=" i=0#第二页有个人的页面没图片,会出现IO错误 while i<15:url=mmurl+str(i)#print url #打印出列表的urlup=urllib...

python制作花瓣网美女图片爬虫

花瓣图片的加载使用了延迟加载的技术，源代码只能下载20多张图片，修改后基本能下载所有的了，只是速度有点慢，后面再优化下import urllib, urllib2, re, sys, os,requests path=r"C:\wqa\beautify" url = http://huaban.com/favorite/beauty #http://huaban.com/explore/zhongwenlogo/?ig1un9tq&max=327773629&limit=20&wfl=1 i_headers = {"User-Agent": "Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.36 (KHTML, like ...

python+tkinter+动画图片+爬虫（查询天气）的GUI图形界面设计【代码】【图】

1.完整代码： import time import urllib.request #发送网络请求，获取数据 import gzip #压缩和解压缩模块 import json #解析获得的数据 from tkinter import * root1 = Tk() #用tkinter建立根窗口 root1.title(天气查询xgj@V1.0)#窗口标题 root1.geometry(1300x800+500+0) #注意x=是小写的字母x，不是乘号 root1.configure(bg=black) #构建一个函数，bg=背景颜色设置 Label(root1,text = 请输入要...

python3.6 涂鸦王国-图片-爬虫笔记【代码】【图】

打开第一个链接，查看详细信息关键点在于前一个.jpg是原图，可以通过操作字符串的方式改写得到原链接更早时候发布的图片，链接方式不一样这里写一个判断获取的src是否为空就可以区分关键问题解决，整理下思路 1.https://www.gracg.com/p599367964217379?page=1 改变“page=x”可以得到所有的图片的目录列表------format可以操作 2.xpath得到每个缩略图所指向的图片单独链接 def get_infos(url):res=requests.get(url,headers=he...

PYTHON - 技术教程分类

Python3 教程 Python3 简介 Python3 环境搭建 Python3 基础语法 Python3 基本数据类型 Python3 解释器 Python3 注释 Python3 运算符 Python3 数字(Number) Python3 字符串 Python3 列表 Python3 元组 Python3 字典 Python3 集合 Python3 编程第一步 Python3 条件控制 Python3 循环语句 Python3 迭代器与生成器 Python3 函数 Python3 数据结构 Python3 模块 Python3 输入和输出 Python3 File Python3 OS Python3 错误和异常 Python3 面向对象 Python3 命名空间/作用域 Python3 标准库概览 Python3 实例 Python3 CGI编程 Python3 MySQL(PyMySQL) Python3 网络编程 Python3 SMTP发送邮件 Python3 多线程 Python3 日期和时间 Python3 内置函数 Python3 MongoDB Python3 urllib python 全部

PYTHON - 最热教程

python如何统计字符串中字母个数？使用Python进行微信公众号开发（三）回...Python+PyQT5的子线程更新UI界面的实例 python时间戳怎么获得？如何获得当前时...vscode调试python时提示无法将“conda”...python接口自动化全局变量access_token...python收取邮件(腾讯企业邮箱)python如何绘制降水图详解python并发获取snmp信息及性能测试...怎么卸载Python3.6？