首页 / PYTHON / Python3批量爬取网页图片

Python3批量爬取网页图片

内容导读

互联网集市收集整理的这篇技术教程文章主要介绍了Python3批量爬取网页图片，小编现在分享给大家，供广大互联网技能从业者学习和参考。文章包含1950字，纯文字阅读大概需要3分钟。

内容图文

所谓爬取其实就是获取链接的内容保存到本地。所以爬之前需要先知道要爬的链接是什么。

要爬取的页面是这个：http://findicons.com/pack/2787/beautiful_flat_icons

技术分享

里面有很多不错的图标，目标就是把这些文件图片爬下来，保存成本地图片。

技术分享

用python3怎么做呢？

第一步：获取要爬取的母网页的内容

            import
             urllib.request

            import
             re

url = "http://findicons.com/pack/2787/beautiful_flat_icons"
webPage=urllib.request.urlopen(url)
data = webPage.read()
data = data.decode(‘UTF-8‘)

第二步：对母网页内容处理，提取出里面的图片链接

k = re.split(r‘\s+‘,data)
s = []
sp = []
si = []
for i in k :
    if (re.match(r‘src‘,i) or re.match(r‘href‘,i)):
        if (not re.match(r‘href="#"‘,i)):
            if (re.match(r‘.*?png"‘,i) or re.match(r‘.*?ico"‘,i)):
                if (re.match(r‘src‘,i)):
                    s.append(i)

for it in s :
    if (re.match(r‘.*?png"‘,it)):
        sp.append(it)

第三步：获取这些图片链接的内容，并保存成本地图片

cnt = 0
cou = 1
for it in sp:
    m = re.search(r‘src="(.*?)"‘,it)
    iturl = m.group(1)
    print(iturl)
    if (iturl[0]==‘/‘):
        continue;
    web = urllib.request.urlopen(iturl)
    itdata = web.read()
    if (cnt%3==1 and cnt>=4 and cou<=30):
        f = open(‘d:/pythoncode/simplecodes/image/‘+str(cou)+‘.png‘,"wb")
        cou = cou+1
        f.write(itdata)
        f.close()
        print(it)
    cnt = cnt+1

保存目录可以自行设定。

以下是综合起来的代码：

            import
             urllib.request

            import
             re

url = "http://findicons.com/pack/2787/beautiful_flat_icons"
webPage=urllib.request.urlopen(url)
data = webPage.read()
data = data.decode(‘UTF-8‘)

k = re.split(r‘\s+‘,data)
s = []
sp = []
si = []
for i in k :
    if (re.match(r‘src‘,i) or re.match(r‘href‘,i)):
        if (not re.match(r‘href="#"‘,i)):
            if (re.match(r‘.*?png"‘,i) or re.match(r‘.*?ico"‘,i)):
                if (re.match(r‘src‘,i)):
                    s.append(i)

for it in s :
    if (re.match(r‘.*?png"‘,it)):
        sp.append(it)

cnt = 0
cou = 1
for it in sp:
    m = re.search(r‘src="(.*?)"‘,it)
    iturl = m.group(1)
    print(iturl)
    if (iturl[0]==‘/‘):
        continue;
    web = urllib.request.urlopen(iturl)
    itdata = web.read()
    if (cnt%3==1 and cnt>=4 and cou<=30):
        f = open(‘d:/pythoncode/simplecodes/image/‘+str(cou)+‘.png‘,"wb")
        cou = cou+1
        f.write(itdata)
        f.close()
        print(it)
    cnt = cnt+1

原文：http://www.cnblogs.com/itlqs/p/5767054.html

内容总结

以上是互联网集市为您收集整理的Python3批量爬取网页图片全部内容，希望文章能够帮你解决Python3批量爬取网页图片所遇到的程序开发问题。如果觉得互联网集市技术教程内容还不错，欢迎将互联网集市网站推荐给程序员好友。

内容备注

版权声明：本文内容由互联网用户自发贡献，该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容，请发送邮件至 gblab@vip.qq.com 举报，一经查实，本站将立刻删除。

内容手机端

扫描二维码推送至手机访问。

本文链接：https://qyyshop.com/info/1176730.html

来源：【匿名】

【上一篇】Python易忽视知识点小结【下一篇】浅谈PHP运行Python脚本的方法

更多 ►

【Python3批量爬取网页图片】教程文章相关的互联网学习教程文章

用python操作mysql数据库（之批量插入数据）【代码】

#!/usr/bin/env python # -*- coding: utf-8 -*- import MySQLdb#建立连接 conn = MySQLdb.connect(host=‘127.0.0.1‘,user=‘root‘,passwd=‘1qaz#EDC‘,db=‘test_db‘) cur = conn.cursor()#对数据进行操作 li = [(‘tanzhenx‘,‘shaoguan‘),(‘huangmengdie‘,‘shaoguan‘)] #定义一个列表，列表中含多个元组，等会批量插入每个元组中的数据 cur.executemany(‘insert into user (name,address) values(%s,%s)‘,li) #批量...

Python图形编程探索系列-06-按钮批量生产函数【代码】【图】

设计任务初步设计一个批量生产按钮的函数，根据需要的按钮数量，自动生成多少按钮。函数设计import tkinter as tk # 导入tkinter库 root = tk.Tk() # 建立程序主窗口 root.title("Button按钮的自动生成函数") # 设置主窗口的标题def button_created(button_number):button_list = []for i in range(button_number):text_str = '按钮' + str(i+1)bt = tk.Button(root, text=text_str)button_list.append(bt)for i in range(button_n...

python 批量ping服务器【代码】【图】

最近在https://pypi.python.org/pypi/mping/0.1.2找到了一个python包，可以用它来批量ping服务器，它是中国的大神写的，支持单个服务器、将服务器IP写在txt或json里都可以。具体用法有中文文档，感谢作者youfou这里我改了几个字，方便我这种英文不好的同学使用mping.py#!/usr/bin/env python3 # coding: utf-8import argparse import ctypes import json import os import random import re import select import socket import st...

Python3批量爬取网页图片【代码】【图】

所谓爬取其实就是获取链接的内容保存到本地。所以爬之前需要先知道要爬的链接是什么。要爬取的页面是这个：http://findicons.com/pack/2787/beautiful_flat_icons 里面有很多不错的图标，目标就是把这些文件图片爬下来，保存成本地图片。用python3怎么做呢？第一步：获取要爬取的母网页的内容import urllib.request import reurl = "http://findicons.com/pack/2787/beautiful_flat_icons" webPage=urllib.request.urlopen(u...

如何用python从文中获取文件名再用正则表达式批量修改文件名【图】

第零步：问题的提出我在网上购买了星火英语的六级晨读美文100篇（六级早已高分飘过，不过很喜欢这些文章，买来重新品味），但是发现其文章的命名都为01.txt或10.txt等。为了便于检索需要修改文件名称。第一步：从文件中取出文件名。我发现txt文件的第一行为文件名，格式为如：Passage 3. Three Passions I Have Lived for, 后面还有几个换行符。写下如下代码进行第一步修改：import os x = 1 while x < 101:if x < 10:file_name = ...

python批量生成word文档【代码】【图】

一.python-docx安装新建文档添加段落添加标题新起一页添加表格取出表格内容综合应用二.python-docx-template动态生成表格动态改变单元格的背景色动态生成页眉；页脚及标题替换图片段落和表格中插入图片默认的页眉页脚生成账单嵌套for循环一.python-docx这是一个很强大的包，可以用来创建docx文档，包含段落、分页符、表格、图片、标题、样式等几乎所有的word文档中能常用的功能都包含了，这个包的主要功能便是用来创建文档，相对来...

基于 Python 批量实现地理位置和经纬度坐标转换【代码】【图】

做地图可视化时需要提供经纬度坐标，但一般来说我们手上拿到的通常只有地理位置，比如说北京市东大街302号狗不理包子店，可视化之前需要经纬度坐标转换需要转换的坐标如果仅有几个还好，可以直接借助谷歌地图自带的经纬度转换，但真实场景下需要转换的数据量可能要上百甚至上千，再手动的话就比较头疼了如何将地理位置批量转化为经纬度坐标？本文将针对这个问题，介绍两个用 Python 来实现的方法1，调用第三方 API最常见办法就是...

用python批量修改文件名【代码】

从youtube上当下来百来首mv，每个都需要去掉视频，这还挺好弄得，格式工厂一弄就完了，但是文件名，都带有乱七八糟的*啥的巴拉巴拉的，咋修改啊，几百首总不可能一个一个rename吧 1 2#批量修改文件名 3import os4#1. 获取文件夹名字 5 folder_name = input("please input a name of folder")6 7#2. 获取文件夹中所有文件的名字 8 file_names = os.listdir(folder_name)910#改变路径为文件夹的路径11#os.chdir(folder_name)1213#3. ...

利用Python几行代码批量生成验证码【代码】【图】

几行代码批量生成authCode整体步骤：1.创建图片2.创建画笔3.在图片上生成点4.在图片上画线5.在图片在画圆6.在图片在写文本7.在图片在生成指定字体的文本代码奉上#!/usr/bin/env python# author:Torre Yang# datetime:2018/9/9 10:18# 改进：1.自适应调整验证码的数量;2.随机输出字符import randomimport logginglogging.basicConfig(level=logging.INFO)# 导入Image,ImageDraw,ImageFont模块from PIL import Image, ImageDraw, Ima...

Python之批量修改md文档内容【代码】

目录Python之批量修改md文档内容Python之批量修改md文档内容#!/usr/bin/env python # -*- coding:utf-8 -*- import os import re import timedef modify_md_content(top):for root, dirs, files in os.walk(top, topdown=False):# 循环文件for file_name in files:file_name_split = file_name.split('.')try:if file_name_split[-1] == 'md':# 找到md文件并且复制一份md文件路径md_file_path = os.path.join(root, '.'.join(file_...

python3调用exe程序编写cve20190708批量检测工具【代码】【图】

1、python3调用exe程序编写cve20190708批量检测工具工具下载地址：https://www.qianxin.com/other/CVE-2019-0708由于这个exe程序只是单IP扫描版本，于是使用python3修改为批量扫描脚本版本#!/usr/bin/python3 #-*- coding:utf-8 -*-#编写环境 windows 7 x64 Notepad++ + Python3.5.0import os import sysdef main():#需要修改的地址,注意后面有个空格path="D:\\MS_19_0708_Scan\\cve20190708批量脚本检测工具\\cve-2019-0708-sca...

Python 批量获取Google用户动态（分页）

CODE:#!/usr/bin/python # -*- coding: utf-8 -*-''' Created on 2014-9-7 @author: guaguastd @name: user_activity_loop.py '''import json from login import google_api_request from html import cleanHtml import osMAX_RESULTS = 40 while True:query = raw_input("Input query(None to quit): ")if query.strip() == '':breakpeople_feed = google_api_request(0, action='search', query=query)for user in people_feed[...

python批量给图片添加log【代码】【图】

直接上代码from PIL import Image import osall_path=[] dirName = os.getcwd() file_dir = os.path.join(dirName,‘file_log‘)#创建目录保存处理后的图片try:os.mkdir(‘file_log‘) except FileExistsError:print(‘dir Exists ‘)#获取当前目录下所有的jpeg格式文件路径for root, dirs, files in os.walk(dirName):for file in files:if"jpeg"in file:all_path.append(os.path.join(root, file))#打开logo图片文件 LOGO_FILE =...

python3 批量查询域名A记录 & CNAME【代码】

场景：需要批量查询域名信息需要生成一个 domain_in.txt的文件文件内容格式（尾行不可有空行）：baidu.com bilibili.com 代码import random import string from dns.resolver import Resolver import requests import socket from parsel import Selector""" # python3 pip install dnspython3 pip install lxml pip install requests pip install parsel """dns_resolver = Resolver() dns_resolver.nameservers = ["8.8.8.8", "...

Python 批量修改文件名【代码】【图】

最近下载了几部美剧（越狱、迷失、权利的游戏......），每集文件名都好长好长。。想改短一些，但一个一个改太累了，于是写了个脚本来实现批量修改：修改前文件名：修改后文件名：代码实现：#encoding=utf-8import osdef rename(path,newname):# 获取path目录下的所有文件名和目录名filenames = os.listdir(path)for filename in filenames:# 判断是文件还是目录if os.path.isdir(os.path.join(path,filename)):continue# 获取文件...

PYTHON - 技术教程分类

Python3 教程 Python3 简介 Python3 环境搭建 Python3 基础语法 Python3 基本数据类型 Python3 解释器 Python3 注释 Python3 运算符 Python3 数字(Number) Python3 字符串 Python3 列表 Python3 元组 Python3 字典 Python3 集合 Python3 编程第一步 Python3 条件控制 Python3 循环语句 Python3 迭代器与生成器 Python3 函数 Python3 数据结构 Python3 模块 Python3 输入和输出 Python3 File Python3 OS Python3 错误和异常 Python3 面向对象 Python3 命名空间/作用域 Python3 标准库概览 Python3 实例 Python3 CGI编程 Python3 MySQL(PyMySQL) Python3 网络编程 Python3 SMTP发送邮件 Python3 多线程 Python3 日期和时间 Python3 内置函数 Python3 MongoDB Python3 urllib python 全部

PYTHON - 最热教程

python如何统计字符串中字母个数？使用Python进行微信公众号开发（三）回...Python+PyQT5的子线程更新UI界面的实例 python时间戳怎么获得？如何获得当前时...vscode调试python时提示无法将“conda”...python接口自动化全局变量access_token...python收取邮件(腾讯企业邮箱)python如何绘制降水图详解python并发获取snmp信息及性能测试...怎么卸载Python3.6？

首页 / PYTHON / Python3批量爬取网页图片

Python3批量爬取网页图片

内容导读

内容图文

内容总结

内容备注

内容手机端

【Python3批量爬取网页图片】教程文章相关的互联网学习教程文章

用python操作mysql数据库（之批量插入数据）【代码】

Python图形编程探索系列-06-按钮批量生产函数【代码】【图】

python 批量ping服务器【代码】【图】

Python3批量爬取网页图片【代码】【图】

如何用python从文中获取文件名再用正则表达式批量修改文件名【图】

python批量生成word文档【代码】【图】

基于 Python 批量实现地理位置和经纬度坐标转换【代码】【图】

用python批量修改文件名【代码】

利用Python几行代码批量生成验证码【代码】【图】

Python之批量修改md文档内容【代码】

python3调用exe程序编写cve20190708批量检测工具【代码】【图】

Python 批量获取Google用户动态（分页）

python批量给图片添加log【代码】【图】

python3 批量查询域名A记录 & CNAME【代码】

Python 批量修改文件名【代码】【图】

批量 - 相关标签

PYTHON - 技术教程分类

PYTHON - 最新教程

PYTHON - 最热教程