首页 / PYTHON / Python并发编程之线程池/进程池--concurrent.futures模块

Python并发编程之线程池/进程池--concurrent.futures模块

内容导读

互联网集市收集整理的这篇技术教程文章主要介绍了Python并发编程之线程池/进程池--concurrent.futures模块，小编现在分享给大家，供广大互联网技能从业者学习和参考。文章包含4957字，纯文字阅读大概需要8分钟。

内容图文

Python并发编程之线程池/进程池--concurrent.futures模块

一、关于concurrent.futures模块

Python标准库为我们提供了threading和multiprocessing模块编写相应的多线程/多进程代码，但是当项目达到一定的规模，频繁创建/销毁进程或者线程是非常消耗资源的，这个时候我们就要编写自己的线程池/进程池，以空间换时间。但从Python3.2开始，标准库为我们提供了concurrent.futures模块，它提供了ThreadPoolExecutor和ProcessPoolExecutor两个类，实现了对threading和multiprocessing的进一步抽象，对编写线程池/进程池提供了直接的支持。

1.Executor和Future：

　　concurrent.futures模块的基础是Exectuor，Executor是一个抽象类，它不能被直接使用。但是它提供的两个子类ThreadPoolExecutor和ProcessPoolExecutor却是非常有用，顾名思义两者分别被用来创建线程池和进程池的代码。我们可以将相应的tasks直接放入线程池/进程池，不需要维护Queue来操心死锁的问题，线程池/进程池会自动帮我们调度。

　　Future这个概念相信有java和nodejs下编程经验的朋友肯定不陌生了，你可以把它理解为一个在未来完成的操作，这是异步编程的基础，传统编程模式下比如我们操作queue.get的时候，在等待返回结果之前会产生阻塞，cpu不能让出来做其他事情，而Future的引入帮助我们在等待的这段时间可以完成其他的操作。

　　p.s: 如果你依然在坚守Python2.x，请先安装futures模块。

pip install futures

二、操作线程池/进程池

1.使用submit来操作线程池/进程池：

            #
             线程池：
            from concurrent.futures import ThreadPoolExecutor
import urllib.request
URLS = [‘http://www.163.com‘, ‘https://www.baidu.com/‘, ‘https://github.com/‘]
def load_url(url):
    with urllib.request.urlopen(url, timeout=60) as conn:
        print(‘%r page is %d bytes‘ % (url, len(conn.read())))

executor = ThreadPoolExecutor(max_workers=3)

for url in URLS:
    future = executor.submit(load_url,url)
    print(future.done())

print(‘主线程‘)

# 运行结果：False
False
False
主线程
‘https://www.baidu.com/‘ page is 227 bytes
‘http://www.163.com‘ page is 662047 bytes
‘https://github.com/‘ page is 54629 bytes

　　我们根据运行结果来分析一下。我们使用submit方法来往线程池中加入一个task，submit返回一个Future对象，对于Future对象可以简单地理解为一个在未来完成的操作。由于线程池异步提交了任务，主线程并不会等待线程池里创建的线程执行完毕，所以执行了print(‘主线程‘)，相应的线程池中创建的线程并没有执行完毕，故future.done()返回结果为False。

            #
             进程池：同上
            from concurrent.futures import ProcessPoolExecutor
import urllib.request
URLS = [‘http://www.163.com‘, ‘https://www.baidu.com/‘, ‘https://github.com/‘]
def load_url(url):
    with urllib.request.urlopen(url, timeout=60) as conn:
        print(‘%r page is %d bytes‘ % (url, len(conn.read())))

executor = ProcessPoolExecutor(max_workers=3)
if__name__ == ‘__main__‘: # 要加mainfor url in URLS:
        future = executor.submit(load_url,url)
        print(future.done())
    print(‘主线程‘)

#运行结果：
False  #　子进程只完成创建，并没有执行完成False　
False
主线程　＃　子进程创建完成就会向下执行主线程，并不会等待子进程执行完毕
‘http://www.163.com‘ page is 662049 bytes
‘https://www.baidu.com/‘ page is 227 bytes
‘https://github.com/‘ page is 54629 bytes

2.使用map来操作线程池/进程池：

　　除了submit，Exectuor还为我们提供了map方法，和内建的map用法类似：

            from concurrent.futures import ThreadPoolExecutor
import urllib.request
URLS = [‘http://www.163.com‘, ‘https://www.baidu.com/‘, ‘https://github.com/‘]
def load_url(url):
    with urllib.request.urlopen(url, timeout=60) as conn:
        print(‘%r page is %d bytes‘ % (url, len(conn.read())))

executor = ThreadPoolExecutor(max_workers=3)

executor.map(load_url,URLS)

print(‘主线程‘)

# 运行结果：主线程
‘http://www.163.com‘ page is 662047 bytes
‘https://www.baidu.com/‘ page is 227 bytes
‘https://github.com/‘ page is 54629 bytes

　　从运行结果可以看出，map是按照URLS列表元素的顺序返回的，并且写出的代码更加简洁直观，我们可以根据具体的需求任选一种。

3.wait：

　　wait方法接会返回一个tuple(元组)，tuple中包含两个set(集合)，一个是completed(已完成的)另外一个是uncompleted(未完成的)。使用wait方法的一个优势就是获得更大的自由度，它接收三个参数FIRST_COMPLETED, FIRST_EXCEPTION 和ALL_COMPLETE，默认设置为ALL_COMPLETED。

　　如果采用默认的ALL_COMPLETED，程序会阻塞直到线程池里面的所有任务都完成，再执行主线程：

            from concurrent.futures import ThreadPoolExecutor,wait,as_completed
import urllib.request
URLS = [‘http://www.163.com‘, ‘https://www.baidu.com/‘, ‘https://github.com/‘]
def load_url(url):
    with urllib.request.urlopen(url, timeout=60) as conn:
        print(‘%r page is %d bytes‘ % (url, len(conn.read())))

executor = ThreadPoolExecutor(max_workers=3)

f_list = []
for url in URLS:
    future = executor.submit(load_url,url)
    f_list.append(future)
print(wait(f_list))

print(‘主线程‘)

# 运行结果：‘http://www.163.com‘ page is 662047 bytes
‘https://www.baidu.com/‘ page is 227 bytes
‘https://github.com/‘ page is 54629 bytes
DoneAndNotDoneFutures(done={<Future at 0x2d0f898 state=finished returned NoneType>, <Future at 0x2bd0630 state=finished returned NoneType>, <Future at 0x2d27470 state=finished returned NoneType>}, not_done=set())
主线程

　　如果采用FIRST_COMPLETED参数，程序并不会等到线程池里面所有的任务都完成。

            from concurrent.futures import ThreadPoolExecutor,wait,as_completed
import urllib.request
URLS = [‘http://www.163.com‘, ‘https://www.baidu.com/‘, ‘https://github.com/‘]
def load_url(url):
    with urllib.request.urlopen(url, timeout=60) as conn:
        print(‘%r page is %d bytes‘ % (url, len(conn.read())))

executor = ThreadPoolExecutor(max_workers=3)

f_list = []
for url in URLS:
    future = executor.submit(load_url,url)
    f_list.append(future)
print(wait(f_list,return_when=‘FIRST_COMPLETED‘))

print(‘主线程‘)

# 运行结果：‘http://www.163.com‘ page is 662047 bytes
DoneAndNotDoneFutures(done={<Future at 0x2bd15c0 state=finished returned NoneType>}, not_done={<Future at 0x2d0d828 state=running>, <Future at 0x2d27358 state=running>})
主线程
‘https://www.baidu.com/‘ page is 227 bytes
‘https://github.com/‘ page is 54629 bytes

　　？写一个小程序对比multiprocessing.pool(ThreadPool)和ProcessPollExecutor(ThreadPoolExecutor)在执行效率上的差距，结合上面提到的Future思考为什么会造成这样的结果？

原文：http://www.cnblogs.com/dylan-wu/p/7163823.html

内容总结

以上是互联网集市为您收集整理的Python并发编程之线程池/进程池--concurrent.futures模块全部内容，希望文章能够帮你解决Python并发编程之线程池/进程池--concurrent.futures模块所遇到的程序开发问题。如果觉得互联网集市技术教程内容还不错，欢迎将互联网集市网站推荐给程序员好友。

内容备注

版权声明：本文内容由互联网用户自发贡献，该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容，请发送邮件至 gblab@vip.qq.com 举报，一经查实，本站将立刻删除。

内容手机端

扫描二维码推送至手机访问。

本文链接：https://qyyshop.com/info/1234267.html

来源：【匿名】

【上一篇】Python基础5 【下一篇】浅谈PHP运行Python脚本的方法

更多 ►

【Python并发编程之线程池/进程池--concurrent.futures模块】教程文章相关的互联网学习教程文章

Python并发编程之线程池/进程池--concurrent.futures模块【代码】

h2 { color: #fff; background-color: #f7af0d; padding: 3px; margin: 10px 0px }一、关于concurrent.futures模块Python标准库为我们提供了threading和multiprocessing模块编写相应的多线程/多进程代码，但是当项目达到一定的规模，频繁创建/销毁进程或者线程是非常消耗资源的，这个时候我们就要编写自己的线程池/进程池，以空间换时间。但从Python3.2开始，标准库为我们提供了concurrent.futures模块，它提供了ThreadPoolExecuto...

Python并发编程之初识异步IO框架：asyncio 上篇（九）【代码】【图】

大家好，并发编程进入第九篇。通过前两节的铺垫（关于协程的使用），今天我们终于可以来介绍我们整个系列的重点 -- asyncio。asyncio是Python 3.4版本引入的标准库，直接内置了对异步IO的支持。有些同学，可能很疑惑，既然有了以生成器为基础的协程，我们直接使用yield 和 yield from 不就可以手动实现对IO的调度了吗？为何Python吃饱了没事干，老重复造轮子。这个问题很好回答，就跟为什么会有Django，为什么会有Scrapy，是一个...

Learning-Python【33】：并发编程之多进程【代码】

一、multiprocessing 模块介绍Python 中的多线程无法利用多核优势，如果想要充分地使用多核 CPU 的资源（os.cpu_count()查看），在 Python 中大部分情况需要使用多进程。Python提供了 multiprocessing。multiprocessing 模块用来开启子进程，并在子进程中执行我们定制的任务（比如函数），该模块与多线程模块 threading 的编程接口类似。multiprocessing 模块的功能众多：支持子进程、通信和共享数据、执行不同形式的同步，提供了 ...

Python并发编程【代码】

并发执行-并发编程1.物理机01.WindowsNumberOfCoresNumberOfLogicalProcessorscpu个数是指物理上安装了几个cpu，一般的个人电脑是安装了1个cpucpu内核数是指物理上，一个cpu芯片上集成了几个内核单元，现代cpu都是多核的。cpu线程数是指逻辑上处理单元，这个技术是Intel的超线程技术，它让操作系统识别到有多个处理单元02.Linux服务器-- 正在运行的程序都会在/procCPU的信息cat /proc/cpuinfo | grep name | cut -f2 -d: | un...

python_并发编程——多进程的第二种启动方式【代码】【图】

1.多进程的第二种启动方式import os from multiprocessing import Process # 创建一个自定义类，继承Process类class MyProcess(Process):# 必须实现一个run方法，run方法中是子进程中执行的代码def run(self):print(‘子进程：‘,os.getpid())if__name__ == ‘__main__‘:print(‘主进程‘,os.getpid())p1 = MyProcess()p1.start()p2 = MyProcess()p2.start()结果： 2.进程号和进程名import os from multiprocessing import Proc...

python并发编程：异步IO(Asynchronous I/O)【图】

异步IO(Asynchronous I/O)Linux下的asynchronous IO其实用得不多，从内核2.6版本才开始引入。先看一下它的流程：　　用户进程发起read操作之后，立刻就可以开始去做其它的事。而另一方面，从kernel的角度，当它受到一个asynchronous read之后，首先它会立刻返回，所以不会对用户进程产生任何block。然后，kernel会等待数据准备完成，然后将数据拷贝到用户内存，当这一切都完成之后，kernel会给用户进程发送一个signal，告诉它read...

python并发编程之多进程【代码】

一.multiprocessing模块　　multiprocessing模块用来开启子进程，并在子进程中执行我们定制的任务（比如函数），该模块与多线程模块threading的编程接口类似。　 multiprocessing模块的功能众多：支持子进程、通信和共享数据、执行不同形式的同步，提供了Process、Queue、Pipe、Lock等组件。　　注意：与线程不同，进程没有任何共享的状态，进程修改的数据，仅限于进程内。二.Process类　由该类实例化得到的对象，表示一个子进程...

python 并发编程多进程 Process对象的其他属性方法 join 方法【代码】

一 Process对象的join方法在主进程运行过程中如果想并发地执行其他的任务，我们可以开启子进程，此时主进程的任务与子进程的任务分两种情况情况一：在主进程的任务与子进程的任务彼此独立的情况下，主进程的任务先执行完毕后，主进程还需要等待子进程执行完毕，然后统一回收资源。这种是没有join方法情况二：如果主进程的任务在执行到某一个阶段时，需要等待子进程执行完毕后才能继续执行，就需要有一种机制能够让主进程检测子进...

Python学习之路并发编程--信号量、事件、队列及生产消费模型【代码】

1. 信号量　　　　对于多进程来说，多个进程同时修改数据，就可能出现安全隐患，所以引入了锁，这一机制，但锁只能有一把来控制一个的开关，当你需要几把锁的时候，就可能用到信号量的概念。他是用了锁的原理，内置了一个计数器，在同一时内，只能有指定数量的进程来执行某一段被控制的代码。import time,random from multiprocessing import Process,Semaphoredef singing(i,sem):‘‘‘:param i: 随机生成20个数的值:param sem:生...

Cpython解释器下实现并发编程【代码】

阅读目录一背景知识二 python并发编程之多进程三 python并发编程之多线程四 python并发编程之协程五 python并发编程之IO模型六补充：paramiko模块七作业一背景知识顾名思义，进程即正在执行的一个过程。进程是对正在运行程序的一个抽象。进程的概念起源于操作系统，是操作系统最核心的概念，也是操作系统提供的最古老也是最重要的抽象概念之一。操作系统的其他所有内容都是围绕进程的概念展开的。所以想要真正了解进程，必须事...

Python并发编程-事件驱动模型【图】

? 1、传统的编程模式一、事件驱动模型介绍例如：线性模式大致流程开始--->代码块A--->代码块B--->代码块C--->代码块D--->......--->结束每一个代码块里是完成各种各样事情的代码，但编程者知道代码块A,B,C,D...的执行顺序，唯一能够改变这个流程的是数据。输入不同的数据，根据条件语句判断，流程或许就改为A--->C--->E...--->结束。每一次程序运行顺序或许都不同，但它的控制流程是由输入数据和你编写的程序决定的。如果你知道这个...

Python之并发编程（五）多线程【代码】

并发编程之多线程多线程的概念介绍threading模块介绍：threading模块和multiprocessing模式在使用层面，有甚大的相似性开启多线程的两种方式开启进程的第一种方式：#1.创建线程的开销比创建进程的开销小，因而创建线程的速度快 from multiprocessing import Process from threading import Thread import os import time def work():print('<%s> is running'%os.getpid())time.sleep(2)print('<%s> is done'%os.getpid())if __name...

python下的并发编程【代码】

Python基础并发编程——操作系统【图】

一、操作系统简介1、手工操作——穿孔卡片 1946年第一台计算机诞生--20世纪50年代中期，计算机工作还在采用手工操作方式。此时还没有操作系统的概念。程序员将对应于程序和数据的已穿孔的纸带（或卡片）装入输入机，然后启动输入机把程序和数据输入计算机内存，接着通过控制台开关启动程序针对数据运行；计算完毕，打印机输出计算结果；用户取走结果并卸下纸带（或卡片）后，才让下一个用户上机。手工操作方式两个特点：　　（1）...

python并发编程之线程(创建线程,锁(死锁现象,递归锁),GIL锁)【代码】【图】

什么是线程进程:资源分配单位线程:cpu执行单位(实体),每一个py文件中就是一个进程,一个进程中至少有一个线程线程的两种创建方式:一from multiprocessing import Process def f1(n):print(n,‘号线程‘)if__name__ == ‘__main__‘:t1 = Thread(target=f1,args=(1,))t1.start()print(‘主线程‘) 二from threading import Thread class MyThread(Thread):def__init__(self,name):super().__init__()self.name = namedef run(self):p...

PYTHON - 技术教程分类

Python3 教程 Python3 简介 Python3 环境搭建 Python3 基础语法 Python3 基本数据类型 Python3 解释器 Python3 注释 Python3 运算符 Python3 数字(Number) Python3 字符串 Python3 列表 Python3 元组 Python3 字典 Python3 集合 Python3 编程第一步 Python3 条件控制 Python3 循环语句 Python3 迭代器与生成器 Python3 函数 Python3 数据结构 Python3 模块 Python3 输入和输出 Python3 File Python3 OS Python3 错误和异常 Python3 面向对象 Python3 命名空间/作用域 Python3 标准库概览 Python3 实例 Python3 CGI编程 Python3 MySQL(PyMySQL) Python3 网络编程 Python3 SMTP发送邮件 Python3 多线程 Python3 日期和时间 Python3 内置函数 Python3 MongoDB Python3 urllib python 全部

PYTHON - 最热教程

python如何统计字符串中字母个数？使用Python进行微信公众号开发（三）回...Python+PyQT5的子线程更新UI界面的实例 python时间戳怎么获得？如何获得当前时...vscode调试python时提示无法将“conda”...python接口自动化全局变量access_token...python收取邮件(腾讯企业邮箱)python如何绘制降水图详解python并发获取snmp信息及性能测试...怎么卸载Python3.6？

首页 / PYTHON / Python并发编程之线程池/进程池--concurrent.futures模块

Python并发编程之线程池/进程池--concurrent.futures模块

内容导读

内容图文

一、关于concurrent.futures模块

二、操作线程池/进程池

1.使用submit来操作线程池/进程池：

2.使用map来操作线程池/进程池：

3.wait：

内容总结

内容备注

内容手机端

【Python并发编程之线程池/进程池--concurrent.futures模块】教程文章相关的互联网学习教程文章

Python并发编程之线程池/进程池--concurrent.futures模块【代码】

Python并发编程之初识异步IO框架：asyncio 上篇（九）【代码】【图】

Learning-Python【33】：并发编程之多进程【代码】

Python并发编程【代码】

python_并发编程——多进程的第二种启动方式【代码】【图】

python并发编程：异步IO(Asynchronous I/O)【图】

python并发编程之多进程【代码】

python 并发编程多进程 Process对象的其他属性方法 join 方法【代码】

Python学习之路并发编程--信号量、事件、队列及生产消费模型【代码】

Cpython解释器下实现并发编程【代码】

Python并发编程-事件驱动模型【图】

Python之并发编程（五）多线程【代码】

python下的并发编程【代码】

Python基础并发编程——操作系统【图】

python并发编程之线程(创建线程,锁(死锁现象,递归锁),GIL锁)【代码】【图】

进程 - 相关标签

线程 - 相关标签

PYTHON - 技术教程分类

PYTHON - 最新教程

PYTHON - 最热教程