python 单线程图片下载

内容导读

互联网集市收集整理的这篇技术教程文章主要介绍了python 单线程图片下载，小编现在分享给大家，供广大互联网技能从业者学习和参考。文章包含2912字，纯文字阅读大概需要5分钟。

内容图文

            import urllib.request
import urllib.parse
import urllib.error
import re
import os
import ssl

ssl._create_default_https_context = ssl._create_unverified_context

path = "./images"

headers = {
    "User-Agent": "Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/75.0.3770.100 Safari/537.36",
    "referer": "https://www.mzitu.com/xinggan/"
}


def handler_request(url, pageIndex):
    url = url + str(pageIndex)
    # 构建请求对象
    request = urllib.request.Request(url=url, headers=headers)

    return request


def get_images_url(content, basePath):
    patternNames = re.compile(r‘<li>.*?<img .* alt=(.*?) .*? />.*?‘)
    patternHrefs = re.compile(r‘<li><a href=(.*?) .*?>.*?‘)
    alts = patternNames.findall(content, re.S)
    hrefs = patternHrefs.findall(content, re.S)
    image_map = {}
    for i in range(len(hrefs)):
        key = alts[i][1: len(alts[i]) - 1]
        image_map[key] = hrefs[i]

    for item in image_map.items():
        image_category_response(item, basePath)


def image_category_response(item, basePath):
    alt = item[0]
    save_folder = os.path.join(basePath, alt)
    if not os.path.exists(save_folder):
        os.mkdir(save_folder)

    baseurl = item[1][1: len(item[1]) -1]
    pageCount = 1000try:
        for pageIndex in range(pageCount):
            page_url = baseurl + "/" + str(pageIndex)
            try:
                # 构建请求对象
                request = urllib.request.Request(url=page_url, headers=headers)
                # 发送请求
                response = urllib.request.urlopen(request)
                content = response.read().decode()
                imgPattern = re.compile(r‘<div class="main-image"><p>.*?<img src=(.*?) .*? />.*?‘)
                imgUrl = imgPattern.findall(content, re.S)
                download_images(imgUrl[0], save_folder)
            except urllib.error.URLError as e:
                raise TypeError("最大页面数{0}".format(pageIndex - 1))
    except Exception as e:
        print(e)


def download_images(url, save_path):
    url = url[1: len(url) - 1]
    print(url)
    # 构建请求对象
    request = urllib.request.Request(url=url, headers=headers)
    # 发送请求
    response = urllib.request.urlopen(request)

    filename = url.split(‘/‘)[-1]
    with open(os.path.join(save_path, filename), ‘wb‘) as fb:
        fb.write(response.read())


def parse_pages(content):
    print(content)


def main():
    url = ‘https://www.mzitu.com/xinggan/page/‘
    start_page = int(input("请输入起始页码："))
    end_page = int(input("请输入结束页码："))
    # 创建根文件夹
    if not os.path.exists(path):
        os.mkdir(path)

    for pageIndex in range(start_page, end_page + 1):

        print("...........开始下载第{0}页".format(pageIndex))
        # 创建文件夹
        save_path = create_folder(pageIndex)
        # 生成request
        request = handler_request(url, pageIndex)
        # 发送请求对象，获取相应内容
        response = urllib.request.urlopen(request)
        content = response.read().decode()
        # 解析内容，提取图片并且下载
        get_images_url(content, save_path)

        print("...........结束下载第{0}页".format(pageIndex))


def create_folder(pageIndex):
    save_path = os.path.join(path, str(pageIndex))
    if not os.path.exists(save_path):
        os.mkdir(save_path)

    return save_path.replace("\\", "/") + "/"if __name__ == "__main__":
    main()

原文：https://www.cnblogs.com/KruceCoder/p/12076682.html

内容总结

以上是互联网集市为您收集整理的python 单线程图片下载全部内容，希望文章能够帮你解决python 单线程图片下载所遇到的程序开发问题。如果觉得互联网集市技术教程内容还不错，欢迎将互联网集市网站推荐给程序员好友。

内容备注

版权声明：本文内容由互联网用户自发贡献，该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容，请发送邮件至 gblab@vip.qq.com 举报，一经查实，本站将立刻删除。

内容手机端

扫描二维码推送至手机访问。

本文链接：https://qyyshop.com/info/1094848.html

来源：【匿名】

【上一篇】初学Python3 - 写一个登录程序【下一篇】浅谈PHP运行Python脚本的方法

更多 ►

【python 单线程图片下载】教程文章相关的互联网学习教程文章

广度优先算法：# -*- coding: utf-8 -*- import urllib import urllib.request from bs4 import BeautifulSoup import threading mylock = threading.RLock() class Crawler:unVisitUrl = set()visitedUrl = []def getHtml(self , url):html = ‘‘req = urllib.request.Request(url , headers = {‘Connection‘: ‘Keep-Alive‘,‘Accept‘: ‘text/html, application/xhtml+xml, */*‘,‘Accept-Language‘: ‘en-US,en;q=0.8,z...

python单线程解决并发【代码】

1.单线程解决并发方式一import socket import select# 百度创建连接:非阻塞 client1 = socket.socket() client1.setblocking(False) try:client1.connect(('www.baidu.com', 80)) except BlockingIOError as e:pass# 搜狗创建连接:非阻塞 client2 = socket.socket() client2.setblocking(False) try:client2.connect(('www.sogou.com', 80)) except BlockingIOError as e:pass# GitHub创建连接:非阻塞 client3 = socket.socket() c...

python 单线程图片下载【代码】

import urllib.request import urllib.parse import urllib.error import re import os import sslssl._create_default_https_context = ssl._create_unverified_contextpath = "./images"headers = {"User-Agent": "Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/75.0.3770.100 Safari/537.36","referer": "https://www.mzitu.com/xinggan/" }def handler_request(url, pageIndex):u...

多线程比单线程快，是真的吗？【代码】【图】

pyrhon视频教程栏目介绍多线程是否真的比单线程快。事实上，Python 多线程另一个很重要的话题叫，GIL（Global Interpreter Lock，即全局解释器锁）。多线程不一定比单线程快在Python中，可以通过多进程、多线程和多协程来实现多任务。难道多线程就一定比单线程快？下面我用一段代码证明我自己得观点。 @Author： Runsen @微信公众号： Python之王 @博客： https://blog.csdn.net/weixin_44510615 @Date： 2020/6/4 import threadin...

Python开发之多个定时任务在单线程下执行的实例分析【图】

单线程多定时任务 1、初始版本：思路：定时器，说白了就是延时执行指定的程序，目前自己重构python里面的定时器不太现实，能力达不到，所以延时操作时还得用到系统定时器，不过我们可以改一下规则；把所有要进行定时操作的程序添加到特定列表中，把列表中定时时间最短程序拿出来，进行threading.Timer（time，callback）绑定，等时间超时触发自定义的callback，执行刚刚列表取出的程序；然后把时间更新，再次把列表中时间最短的程序...

python简单线程和协程的实例详解【图】

python中对线程的支持的确不够，不过据说python有足够完备的异步网络框架模块，希望日后能学习到，这里就简单的对python中的线程做个总结threading库可用来在单独的线程中执行任意的python可调用对象。尽管此模块对线程相关操作的支持不够，但是我们还是能够用简单的线程来处理I/O操作，以减低程序响应时间.from threading import Thread import timedef countdown(n):while n > 0:print(T-minus:, n)n -= 1t = Thread(target=coun...

Python中单线程、多线程和多进程的效率对比实验【图】

对比实验资料显示，如果多线程的进程是CPU密集型的，那多线程并不能有多少效率上的提升，相反还可能会因为线程的频繁切换，导致效率下降，推荐使用多进程；如果是IO密集型，多线程进程可以利用IO阻塞等待时的空闲时间执行其他线程，提升效率。所以我们根据实验对比不同场景的效率(1)引入所需要的模块import requests import time from threading import Thread from multiprocessing import Process(2)定义CPU密集的计算函数def co...

python的单线程多任务的实现

这篇文章主要为大家详细介绍了python实现单线程多任务非阻塞TCP服务端的相关资料，具有一定的参考价值，感兴趣的小伙伴们可以参考一下本文实例为大家分享了python实现单线程多任务非阻塞TCP服务端的具体代码，供大家参考，具体内容如下# coding:utf-8 from socket import *# 1.创建服务器socket sock = socket(AF_INET, SOCK_STREAM)# 2.绑定主机和端口 addr = (, 7788) # sock.bind(addr)# 3. 设置最大监听数目，并发 sock.listen...

python单线程实现多个定时器示例

单线程实现多个定时器 NewTimer.py 代码如下:#!/usr/bin/env python from heapq import *from threading import Timerimport threadingimport uuidimport timeimport datetimeimport sysimport math global TimerStampglobal TimerTimesclass CancelFail(Exception): pass class Slot(object): def __init__(self, period=0, interval=1, function=None, args=[], kwargs={}): self.period = period self.pc =...

既然python解释器是单线程的，还有进行多线程编程的必要吗？

写再多的线程都绕不过解释器是单线程，那不还等于是单线程？且线程切换消耗，既然这样，python还有必要进行多线程编程吗？回复内容：有必要，至少能解决很多IO阻塞问题。能产生IO阻塞的情况很多，比如网络、磁盘，等等。当发生阻塞时，Python是不耗CPU的，此时如果就一个线程就没法处理其他事情了。所以对于含有IO阻塞的环境。多线程至少有机会让你把一个CPU核心跑到100%。另一个用处来自于Python的C扩展模块。在扩展模块里是可以...

day35 python socket 单线程的并发 io多路复用协程 greenlet模块 gevent模块

day35?python?socket?单线程的并发 io多路复用?协程?greenlet模块?gevent模块 ? 一.socket相关 ?? ?1.socket: 所有的网络请求都是基于socket实现的,默认是阻塞的 ?? ?2.requests是用的socket的客户端 ?? ?3.socket到底哪端(谁)发生了变化 ?? ??? ?如果客户端向服务端发起连接时,?则服务端发生了变化 ?? ??? ?如果服务端向客户端发送数据时,?则客户端发生了变化 ?? ??? ??? ?conn,addr = server.accept() ?? ??? ??? ?conn.recv() ?...

【多任务线程高级day03】线程+使用threading模块+单线程执行+多线程执行+主线程会等待所有的子线程结束后才结束+查看线程数量+python的thread模块是比较底层的模块，python的【代码】【图】

文章目录线程python的thread模块是比较底层的模块，python的threading模块是对thread做了一些包装的，可以更加方便的被使用1. 使用threading模块单线程执行多线程执行说明2. 主线程会等待所有的子线程结束后才结束3. 查看线程数量线程 python的thread模块是比较底层的模块，python的threading模块是对thread做了一些包装的，可以更加方便的被使用 1. 使用threading模块单线程执行 #coding=utf-8 import timedef saySorry():print...

python-多线程Web服务器与单线程

我们有一个简单的内部供内部使用的Web服务器,它只有一个职责：侦听请求,读取请求并将数据推送到数据库中.数据库和Web服务器都位于同一台计算机上. db是mysql-db,服务器是运行单线程的python Web服务器(BaseHTTPServer.HTTPServer). 问题是不能同时处理两个请求.问题是,这将有助于使Web服务器成为多线程(使用django,cheryypy等)吗？直观地讲,Web服务器仅执行占用CPU的任务,因此将其更改为多线程无济于事.这个对吗？解决方法:当您想一...

Python中的简单线程示例【代码】

我对Python中的线程有疑问(我承认,我是这个主题的新手). 我有对象,我想在方法part1()中生成数字列表(具有一些随机时间间隔),并在part2()中生成-尽快打印所有生成的数字. 这是我的代码：import random import time from threading import Threadclass GenerateRand:def __init__(self):self.h = []def part1(self):while True:r = random.choice(range(9))self.h.append(r)print "Rand in list:", self.htime.sleep(random.randint(...

python单线程爬取糗事百科【代码】【图】

对于span标签。 content = node.xpath('.//div[@class="content"]/span')[0].text这样的话，只能取到第一段的内容。item["content"] = [i.strip() for i in div.xpath(".//div[@class='content']/span/text()")]####完整代码. import requests from lxml import etree import time ''' 遇到不懂的问题？Python学习交流群：821460695满足你的需求，资料都已经上传群文件，可以自行下载！ ''' class QiuBai:def __init__(self):self....

首页 / PYTHON / python 单线程图片下载

python 单线程图片下载

内容导读

内容图文

内容总结

内容备注

内容手机端

【python 单线程图片下载】教程文章相关的互联网学习教程文章

python单线程爬虫code【代码】

python单线程解决并发【代码】

python 单线程图片下载【代码】

多线程比单线程快，是真的吗？【代码】【图】

Python开发之多个定时任务在单线程下执行的实例分析【图】

python简单线程和协程的实例详解【图】

Python中单线程、多线程和多进程的效率对比实验【图】

python的单线程多任务的实现

python单线程实现多个定时器示例

既然python解释器是单线程的，还有进行多线程编程的必要吗？

day35 python socket 单线程的并发 io多路复用协程 greenlet模块 gevent模块

【多任务线程高级day03】线程+使用threading模块+单线程执行+多线程执行+主线程会等待所有的子线程结束后才结束+查看线程数量+python的thread模块是比较底层的模块，python的【代码】【图】

python-多线程Web服务器与单线程

Python中的简单线程示例【代码】

python单线程爬取糗事百科【代码】【图】

单线程 - 相关标签

下载 - 相关标签

PYTHON - 技术教程分类

PYTHON - 最新教程

PYTHON - 最热教程