首页 / PYTHON / python – numpy与多处理和mmap

python – numpy与多处理和mmap

内容导读

互联网集市收集整理的这篇技术教程文章主要介绍了python – numpy与多处理和mmap，小编现在分享给大家，供广大互联网技能从业者学习和参考。文章包含2774字，纯文字阅读大概需要4分钟。

内容图文

我正在使用Python的多处理模块并行处理大型numpy数组.在主进程中使用numpy.load(mmap_mode =’r’)对数组进行内存映射.之后,multiprocessing.Pool()分叉进程(我推测).

一切似乎都很好,除了我得到的行：

AttributeError("'NoneType' object has no attribute 'tell'",)
  in `<bound method memmap.__del__ of
       memmap([ 0.57735026,  0.57735026,  0.57735026,  0.        ,  0.        ,        0.        ,  0.        ,  0.        ,  0.        ,  0.        ,        0.        ,  0.        ], dtype=float32)>`
     ignored

在unittest日志中.尽管如此,测试仍然没有通过.

知道那里发生了什么吗？

使用Python 2.7.2,OS X,NumPy 1.6.1.

更新：

经过一些调试后,我把原因归结为一个代码路径,该代码路径使用这个内存映射的numpy数组(小片)作为Pool.imap调用的输入.

显然,“问题”是多处理的方式.Pool.imap将其输入传递给新进程：它使用pickle.这不适用于mmaped numpy数组,而内部的某些内容会导致错误.

我找到了Robert Kern的this reply,它似乎解决了同样的问题.他建议为imap输入来自内存映射数组时创建一个特殊的代码路径：在生成的进程中手动映射同一个数组.

这将是如此复杂和丑陋,我宁愿忍受错误和额外的内存副本.有没有其他方法可以更轻松地修改现有代码？

解决方法:

我通常的方法(如果你可以使用额外的内存副本)是在一个进程中执行所有IO,然后将事情发送到工作线程池.要将一个memmapped数组的片段加载到内存中,只需执行x = np.array(data [yourslice])(data [yourslice] .copy()实际上不会这样做,这可能会导致一些混淆.).

首先,让我们生成一些测试数据：

import numpy as np
np.random.random(10000).tofile('data.dat')

您可以使用以下内容重现错误：

import numpy as np
import multiprocessing

def main():
    data = np.memmap('data.dat', dtype=np.float, mode='r')
    pool = multiprocessing.Pool()
    results = pool.imap(calculation, chunks(data))
    results = np.fromiter(results, dtype=np.float)

def chunks(data, chunksize=100):
    """Overly-simple chunker..."""
    intervals = range(0, data.size, chunksize) + [None]
    for start, stop in zip(intervals[:-1], intervals[1:]):
        yield data[start:stop]

def calculation(chunk):
    """Dummy calculation."""
    return chunk.mean() - chunk.std()

if __name__ == '__main__':
    main()

如果你只是转而生成np.array(data [start：stop]),你就可以解决问题了：

import numpy as np
import multiprocessing

def main():
    data = np.memmap('data.dat', dtype=np.float, mode='r')
    pool = multiprocessing.Pool()
    results = pool.imap(calculation, chunks(data))
    results = np.fromiter(results, dtype=np.float)

def chunks(data, chunksize=100):
    """Overly-simple chunker..."""
    intervals = range(0, data.size, chunksize) + [None]
    for start, stop in zip(intervals[:-1], intervals[1:]):
        yield np.array(data[start:stop])

def calculation(chunk):
    """Dummy calculation."""
    return chunk.mean() - chunk.std()

if __name__ == '__main__':
    main()

当然,这确实为每个块提供了额外的内存副本.

从长远来看,你可能会发现从memmap文件切换到HDF更容易.如果您的数据是多维的,则尤其如此. (我会推荐h5py,但是如果你的数据是“像桌子一样”的话pyTables很好.)

祝你好运,无论如何！

内容总结

以上是互联网集市为您收集整理的python – numpy与多处理和mmap全部内容，希望文章能够帮你解决python – numpy与多处理和mmap所遇到的程序开发问题。如果觉得互联网集市技术教程内容还不错，欢迎将互联网集市网站推荐给程序员好友。

内容备注

版权声明：本文内容由互联网用户自发贡献，该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容，请发送邮件至 gblab@vip.qq.com 举报，一经查实，本站将立刻删除。

内容手机端

扫描二维码推送至手机访问。

本文链接：https://qyyshop.com/info/707607.html

来源：【匿名】

【上一篇】python – 熊猫：条形图xtick频率【下一篇】浅谈PHP运行Python脚本的方法

更多 ►

【python – numpy与多处理和mmap】教程文章相关的互联网学习教程文章

Python: numpy--函数 shape用法

shape函数是numpy.core.fromnumeric中的函数，它的功能是查看矩阵或者数组的维数。举例说明：建立一个3×3的单位矩阵e, e.shape为（3，3），表示3行3列,第一维的长度为3，第二维的长度也为3 [plain] view plain copy >>> e = eye(3) >>> e array([[ 1., 0., 0.], [ 0., 1., 0.], [ 0., 0., 1.]]) >>> e.shape (3, 3) 建立一个一维矩阵b, b.shape 为矩阵的长度[plain] view plain copy >>> b =array([1,2...

numpy 中的几个函数功能，在python学习中不断更新

numpy.eye(N, M=None, k=0, dtype=<type ‘float’>)生成对角矩阵列数N 行数M 写一个代表行数等于列数 k代表偏移量正数向上偏移，负数向下偏移如numpy.eye(3,k=1,dtyle=int)0 1 00 0 10 0 0numpy.shape(a)a为数组，返回数组的大小即几维及每维的元素个数numpy.shape([[1, 2]])(1, 2) 1维每维2个元素a = numpy.array([(1,2),(3,4)])numpy.shape(a)等效于a.shape(2, )一维2个元素a.s...

【转载】python安装numpy和pandas【代码】

转载：原文地址 http://www.cnblogs.com/lxmhhy/p/6029465.html 最近要对一系列数据做同比比较，需要用到numpy和pandas来计算，不过使用python安装numpy和pandas因为linux环境没有外网遇到了很多问题就记下来了。首要条件，python版本必须是2.7以上。linux首先安装依赖包yum -y install blas blas-devel lapack-devel lapack yum -y install seaborn scipy yum -y install freetype freetype-devel libpng libpng-devel yum -y ins...

Python Numpy,Pandas笔记【代码】

NumpyNumpy是python的一个库。支持维度数组与矩阵计算并提供大量的数学函数库。#浮点数转int arr = np.array([1.2,1.3,1.4],[1.5,1.6,1.7])#创建ndarray时候也可以指定dtype arr.astype(dtype = np.int) #对数组批量运算,作用在每个元素上 arr = np.array([1,2,3],[4,5,6]) print arr**5 #索引和切片 arr = np.array([1,2,3,4,5,6]) print arr[:2]#arr[0]和arr[1] arr = np.array([1,2,3],[4,5,6]) print arr[:2] #打印第1，2行#布...

python数据处理：NumPy基础【图】

本文资料来自：Python for Data Analysis， Chapter 4 1. NumPy简介NumPy，Numerical Python简称，是科学计算和数据分析所用的基础包。对于数据分析师，主要关注以下几点：　　a: Fast vectorized arrya operations for data munging and cleaning(数据分析和清洗), subsetting and filtering(和过滤), transformation and any other kind of computations.　　b: Coomn array algortihsm like sorting, unique, and set operation...

[Tips] python numpy 多维矩阵结构和一维结构的等价转换【代码】

假设aa是原始多维矩阵，bb是转换的一维向量，转换方式：bb=aa.reshape(-1) 将bb转换回aa的方法是：cc=bb.reshape(aa.shape) 验证：>>> aa array([[[ 8, 15],[ 0, 8],[-10, 0],[ -5, 2],[ -2, -4]],[[ 7, 4],[-14, 7],[ 20, -7],[ -7, -11],[-18, 8]],[[ 26, -3],[ 12, 0],[ -8, -19],[ 18, -12],[ 3, -5]]], dtype=int32) >>> aa.shape (3, 5, 2) >>> bb=aa.reshape(-1) >>> bb array([ 8, 15, 0, 8,...

Python For Data Analysis -- NumPy【图】

NumPy作为python科学计算的基础，为何python适合进行数学计算，除了简单易懂，容易学习Python可以简单的调用大量的用c和fortran编写的legacy的库 The NumPy ndarray: A Multidimensional Array Objectndarray，可以理解为n维数组，用于抽象矩阵和向量Creating ndarrays最简单的就是，从list初始化，当然还有其他的方式，比如，汇总， Data Types for ndarrays首先对于ndarray只能存放同一类型数据，并且由于封装了c和fortran的库，...

python：将numpy数组写入csv文件【代码】

1import numpy as np 2 np.savetxt(‘E:\\forpython\\featvector.csv‘,data_to_save,delimiter=‘,‘) 原文：http://www.cnblogs.com/hahaxzy9500/p/6854187.html

数学之路-python计算实战(5)-初识numpy以及pypy下执行numpy

NNumPy系统是Python的一种开源的数字扩展。这样的工具可用来存储和处理大型矩阵，比Python自身的嵌套列表（nested list structure)结构要高效的多（该结构也能够用来表示矩阵（matrix））。据说NumPy将Python相当于变成一种免费的更强大的MatLab系统。一个用python实现的科学计算包。包含：1、一个强大的N维数组对象Array；2、比較成熟的（广播）函数库；3、用于整合C/C++和Fortran代码的工具包；4、有用的线性代数、傅里叶变换和随...

Python——Numpy学习笔记【代码】

创建：np.array()a = np.array([1,2,3,4]) b = np.array([1,2,3,4][4,5,6,7][7,8,9,10])a [1,2,3,4] b [[1,2,3,4], [4,5,6,7], [7,8,9,10]]获得：数组形状各个轴的长度的元组 .shape()>>a.shape (4,) >>b.shape (3,4)修改轴的长短(内存地址没变)：.shape =>>b.shape = 4,3 >>b array([[1,2,3],[4,4,5],[6,7,7],[8,9,10]])>>b.shape =2,-1 %设置某个轴为-1表示自动计算长度>>barray([[1,2,3,4,4,5], [6,7,7,8,9,10]])用已...

Python中使用numpy创建的array之间的乘法

Python中使用numpy创建的array之间的乘法import numpy as npnumpy模块的array相乘时，有两种方式：一是矩阵形式，二是挨个相乘。需要用矩阵形式相乘时，则要用np.dot()函数。矩阵与矩阵：a = np.array([[1,2,3],[4,5,6],[7,8,9]])c = a.copy()a*c 得出的结果是a和c中每个元素依次相乘，为3x3的矩阵np.dot(a, c) 得到的结果是a和c进行矩阵相乘，为3x3的矩阵矩阵与向量：a = np.array([[1,2,3],[4,5,6],[7,8,9]])b = np.array([1,2...

利用 Python 进行数据分析（四）NumPy 基础：ndarray 简单介绍【图】

一、NumPy 是什么NumPy 是 Python 科学计算的基础包，它专为进行严格的数字处理而产生。在之前的随笔里已有更加详细的介绍，这里不再赘述。利用 Python 进行数据分析（一）简单介绍二、ndarray 是什么ndarray 是一个多维的数组对象，具有矢量算术运算能力和复杂的广播能力，并具有执行速度快和节省空间的特点。ndarray 的一个特点是同构：即其中所有元素的类型必须相同。三、ndarray 的创建array() 函数最简单的方法，使用 NumP...

python3存储numpy格式的矩阵【代码】

技术背景numpy在python中的地位是相当高的，即使是入门的python使用者也会经常看到这个库的使用。除了替代python自带的列表数据格式list之外，numpy的一大优势是其底层的高性能实现方式，比如前一篇博客中所提到的矢量运算，就是一种基于SIMD的底层运算优化方案，使得numpy的计算速度远高于一个普通的for循环。而在日常运算的过程中，有些数据往往是不会变化的，比如机器学习中的测试和训练数据。那么如果这里使用的是numpy的数据结...

Python下科学计算包numpy和SciPy的安装

转载自：http://blog.sina.com.cn/s/blog_62dfdc740101aoo6.htmlPython下大多数工具包的安装都很简单，只需要执行 “python setup.py install”命令即可。然而，由于SciPy和numpy这两个科学计算包的依赖关系较多，安装过程较为复杂。网上教程较为混乱，而且照着做基本都不能用。在仔细研读各个包里的README和INSTALL之后，终于安装成功。现记录如下。系统环境：OS：RedHat5Python版本：Python2.7.3gcc版本：4.1.2 各个安装包版本：...

Python科学计算学习一 NumPy 快速处理数据

1 创建数组(1) array(boject, dtype=None, copy=True, order=None, subok=False, ndmin=0)a = array([1, 2, 3, 4])b = array([[1, 2, 3, 4], [5, 6, 7, 8], [9, 10, 11, 12]]) a.dtype --> dtype(‘int32‘)a.shape --> (4,)b.shape -->(3, 4)a.shape=2, -1 #(-1时自动计算，相当于2, 6)c = a.reshape((2,2)) #c和a公用一个空间 (2) arange([start,] stop [,step], dtype=None) a = arange(5) -->array([0, 1, 2, ...

PYTHON - 技术教程分类

Python3 教程 Python3 简介 Python3 环境搭建 Python3 基础语法 Python3 基本数据类型 Python3 解释器 Python3 注释 Python3 运算符 Python3 数字(Number) Python3 字符串 Python3 列表 Python3 元组 Python3 字典 Python3 集合 Python3 编程第一步 Python3 条件控制 Python3 循环语句 Python3 迭代器与生成器 Python3 函数 Python3 数据结构 Python3 模块 Python3 输入和输出 Python3 File Python3 OS Python3 错误和异常 Python3 面向对象 Python3 命名空间/作用域 Python3 标准库概览 Python3 实例 Python3 CGI编程 Python3 MySQL(PyMySQL) Python3 网络编程 Python3 SMTP发送邮件 Python3 多线程 Python3 日期和时间 Python3 内置函数 Python3 MongoDB Python3 urllib python 全部

PYTHON - 最热教程

python如何统计字符串中字母个数？使用Python进行微信公众号开发（三）回...Python+PyQT5的子线程更新UI界面的实例 python时间戳怎么获得？如何获得当前时...vscode调试python时提示无法将“conda”...python接口自动化全局变量access_token...python收取邮件(腾讯企业邮箱)python如何绘制降水图详解python并发获取snmp信息及性能测试...怎么卸载Python3.6？

首页 / PYTHON / python – numpy与多处理和mmap

python – numpy与多处理和mmap

内容导读

内容图文

内容总结

内容备注

内容手机端

【python – numpy与多处理和mmap】教程文章相关的互联网学习教程文章

Python: numpy--函数 shape用法

numpy 中的几个函数功能，在python学习中不断更新

【转载】python安装numpy和pandas【代码】

Python Numpy,Pandas笔记【代码】

python数据处理：NumPy基础【图】

[Tips] python numpy 多维矩阵结构和一维结构的等价转换【代码】

Python For Data Analysis -- NumPy【图】

python：将numpy数组写入csv文件【代码】

数学之路-python计算实战(5)-初识numpy以及pypy下执行numpy

Python——Numpy学习笔记【代码】

Python中使用numpy创建的array之间的乘法

利用 Python 进行数据分析（四）NumPy 基础：ndarray 简单介绍【图】

python3存储numpy格式的矩阵【代码】

Python下科学计算包numpy和SciPy的安装

Python科学计算学习一 NumPy 快速处理数据

PYTHON - 相关标签

PYTHON - 技术教程分类

PYTHON - 最新教程

PYTHON - 最热教程