首页 / PYTHON / python 单线程图片下载
python 单线程图片下载
内容导读
互联网集市收集整理的这篇技术教程文章主要介绍了python 单线程图片下载,小编现在分享给大家,供广大互联网技能从业者学习和参考。文章包含2912字,纯文字阅读大概需要5分钟。
内容图文
import urllib.request import urllib.parse import urllib.error import re import os import ssl ssl._create_default_https_context = ssl._create_unverified_context path = "./images" headers = { "User-Agent": "Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/75.0.3770.100 Safari/537.36", "referer": "https://www.mzitu.com/xinggan/" } def handler_request(url, pageIndex): url = url + str(pageIndex) # 构建请求对象 request = urllib.request.Request(url=url, headers=headers) return request def get_images_url(content, basePath): patternNames = re.compile(r‘<li>.*?<img .* alt=(.*?) .*? />.*?‘) patternHrefs = re.compile(r‘<li><a href=(.*?) .*?>.*?‘) alts = patternNames.findall(content, re.S) hrefs = patternHrefs.findall(content, re.S) image_map = {} for i in range(len(hrefs)): key = alts[i][1: len(alts[i]) - 1] image_map[key] = hrefs[i] for item in image_map.items(): image_category_response(item, basePath) def image_category_response(item, basePath): alt = item[0] save_folder = os.path.join(basePath, alt) if not os.path.exists(save_folder): os.mkdir(save_folder) baseurl = item[1][1: len(item[1]) -1] pageCount = 1000try: for pageIndex in range(pageCount): page_url = baseurl + "/" + str(pageIndex) try: # 构建请求对象 request = urllib.request.Request(url=page_url, headers=headers) # 发送请求 response = urllib.request.urlopen(request) content = response.read().decode() imgPattern = re.compile(r‘<div class="main-image"><p>.*?<img src=(.*?) .*? />.*?‘) imgUrl = imgPattern.findall(content, re.S) download_images(imgUrl[0], save_folder) except urllib.error.URLError as e: raise TypeError("最大页面数{0}".format(pageIndex - 1)) except Exception as e: print(e) def download_images(url, save_path): url = url[1: len(url) - 1] print(url) # 构建请求对象 request = urllib.request.Request(url=url, headers=headers) # 发送请求 response = urllib.request.urlopen(request) filename = url.split(‘/‘)[-1] with open(os.path.join(save_path, filename), ‘wb‘) as fb: fb.write(response.read()) def parse_pages(content): print(content) def main(): url = ‘https://www.mzitu.com/xinggan/page/‘ start_page = int(input("请输入起始页码:")) end_page = int(input("请输入结束页码:")) # 创建根文件夹 if not os.path.exists(path): os.mkdir(path) for pageIndex in range(start_page, end_page + 1): print("...........开始下载第{0}页".format(pageIndex)) # 创建文件夹 save_path = create_folder(pageIndex) # 生成request request = handler_request(url, pageIndex) # 发送请求对象,获取相应内容 response = urllib.request.urlopen(request) content = response.read().decode() # 解析内容,提取图片并且下载 get_images_url(content, save_path) print("...........结束下载第{0}页".format(pageIndex)) def create_folder(pageIndex): save_path = os.path.join(path, str(pageIndex)) if not os.path.exists(save_path): os.mkdir(save_path) return save_path.replace("\\", "/") + "/"if __name__ == "__main__": main()
原文:https://www.cnblogs.com/KruceCoder/p/12076682.html
内容总结
以上是互联网集市为您收集整理的python 单线程图片下载全部内容,希望文章能够帮你解决python 单线程图片下载所遇到的程序开发问题。 如果觉得互联网集市技术教程内容还不错,欢迎将互联网集市网站推荐给程序员好友。
内容备注
版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 gblab@vip.qq.com 举报,一经查实,本站将立刻删除。
内容手机端
扫描二维码推送至手机访问。