首页 / PYTHON / python – 如何一次将超大文件读入Numpy数组N行

python – 如何一次将超大文件读入Numpy数组N行

内容导读

互联网集市收集整理的这篇技术教程文章主要介绍了python – 如何一次将超大文件读入Numpy数组N行，小编现在分享给大家，供广大互联网技能从业者学习和参考。文章包含2207字，纯文字阅读大概需要4分钟。

内容图文

我有一个巨大的文件(大约30GB),每行包括2D表面上的点的协调.我需要将文件加载到Numpy数组：points = np.empty((0,2)),并在其上应用scipy.spatial.ConvexHull.由于文件的大小非常大,我无法将其一次加载到内存中,我想将其作为N行批处理加载并在小部分上应用scipy.spatial.ConvexHull,然后加载下N行！这样做有效吗？
我found out在python中你可以使用islice读取文件的N行,但问题是lines_gen是一个生成器对象,它给你文件的每一行,应该在循环中使用,所以我不知道我怎么能以有效的方式将lines_gen转换为Numpy数组？

from itertools import islice
with open(input, 'r') as infile:
    lines_gen = islice(infile, N)

我的输入文件：

0.989703    1
0   0
0.0102975   0
0.0102975   0
1   1
0.989703    1
1   1
0   0
0.0102975   0
0.989703    1
0.979405    1
0   0
0.020595    0
0.020595    0
1   1
0.979405    1
1   1
0   0
0.020595    0
0.979405    1
0.969108    1
...
...
...
0   0
0.0308924   0
0.0308924   0
1   1
0.969108    1
1   1
0   0
0.0308924   0
0.969108    1
0.95881 1
0   0

解决方法:

有了你的数据,我可以用5行的方式读取它,如下所示：

In [182]: with open(input,'r') as infile:
    while True:
        gen = islice(infile,N)
        arr = np.genfromtxt(gen, dtype=None)
        print arr
        if arr.shape[0]<N:
            break
   .....:             
[(0.989703, 1) (0.0, 0) (0.0102975, 0) (0.0102975, 0) (1.0, 1)]
[(0.989703, 1) (1.0, 1) (0.0, 0) (0.0102975, 0) (0.989703, 1)]
[(0.979405, 1) (0.0, 0) (0.020595, 0) (0.020595, 0) (1.0, 1)]
[(0.979405, 1) (1.0, 1) (0.0, 0) (0.020595, 0) (0.979405, 1)]
[(0.969108, 1) (0.0, 0) (0.0308924, 0) (0.0308924, 0) (1.0, 1)]
[(0.969108, 1) (1.0, 1) (0.0, 0) (0.0308924, 0) (0.969108, 1)]
[(0.95881, 1) (0.0, 0)]

同样的事情就像一个块一样：

In [183]: with open(input,'r') as infile:
    arr = np.genfromtxt(infile, dtype=None)
   .....:     
In [184]: arr
Out[184]: 
array([(0.989703, 1), (0.0, 0), (0.0102975, 0), (0.0102975, 0), (1.0, 1),
       (0.989703, 1), (1.0, 1), (0.0, 0), (0.0102975, 0), (0.989703, 1),
       (0.979405, 1), (0.0, 0), (0.020595, 0), (0.020595, 0), (1.0, 1),
       (0.979405, 1), (1.0, 1), (0.0, 0), (0.020595, 0), (0.979405, 1),
       (0.969108, 1), (0.0, 0), (0.0308924, 0), (0.0308924, 0), (1.0, 1),
       (0.969108, 1), (1.0, 1), (0.0, 0), (0.0308924, 0), (0.969108, 1),
       (0.95881, 1), (0.0, 0)], 
      dtype=[('f0', '<f8'), ('f1', '<i4')])

(这是在Python 2.7中;在3中有一个我需要解决的字节/字符串问题).

内容总结

以上是互联网集市为您收集整理的python – 如何一次将超大文件读入Numpy数组N行全部内容，希望文章能够帮你解决python – 如何一次将超大文件读入Numpy数组N行所遇到的程序开发问题。如果觉得互联网集市技术教程内容还不错，欢迎将互联网集市网站推荐给程序员好友。

内容备注

版权声明：本文内容由互联网用户自发贡献，该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容，请发送邮件至 gblab@vip.qq.com 举报，一经查实，本站将立刻删除。

内容手机端

扫描二维码推送至手机访问。

本文链接：https://qyyshop.com/info/817816.html

来源：【匿名】

【上一篇】python – Django：与TCP服务器通信(扭曲？)【下一篇】浅谈PHP运行Python脚本的方法

更多 ►

【python – 如何一次将超大文件读入Numpy数组N行】教程文章相关的互联网学习教程文章

python：将numpy数组写入csv文件【代码】

1import numpy as np 2 np.savetxt(‘E:\\forpython\\featvector.csv‘,data_to_save,delimiter=‘,‘) 原文：http://www.cnblogs.com/hahaxzy9500/p/6854187.html

python – 将一个队列连接到tensorflow中的numpy数组,以获取数据而不是文件？【代码】

我已经阅读了CNN Tutorial on the TensorFlow,我正在尝试为我的项目使用相同的模型.现在的问题是数据读取.我有大约25000张图像用于培训,大约5000张用于测试和验证.文件是png格式,我可以读取它们并将它们转换为numpy.ndarray. 教程中的CNN示例使用队列从提供的文件列表中获取记录.我试图通过将我的图像重塑为一维数组并在其前面附加标签值来创建我自己的二进制文件.所以我的数据看起来像这样[[1,12,34,24,53,...,105,234,102],[12,1...

python-具有numpy数组的numpy日志【代码】

我想了解以下代码的原因：print((hypothesis(x, theta_)))产生具有这种格式的数组[0.5, 0.5, 0.5, 0.5, 0.5, 0.5, 0.5, 0.5, 0.5, 0.5, 0.5, 0.5, 0.5, 0.5, 0.5,0.5, 0.5, 0.5, 0.5, 0.5, 0.5, 0.5, 0.5, 0.5, 0.5, 0.5, 0.5, 0.5, 0.5, 0.5,0.5, 0.5, 0.5, 0.5, 0.5, 0.5, 0.5, 0.5, 0.5, 0.5, 0.5, 0.5, 0.5, 0.5, 0.5, 0.5, 0.5, 0.5, 0.5, 0.5, 0.5, 0.5, 0.5, 0.5, 0.5, 0.5, 0.5, 0.5, 0.5, 0.5, 0.5, 0.5, 0.5, 0.5, 0.5, ...

Pythonic方法将多维复杂numpy数组打印到字符串【代码】

我有一个像这样定义的3D复杂numpy数组：> import numpy as np > a = np.random.rand(2,3,4) + np.random.rand(2,3,4) * 1j > a array([[[ 0.40506245+0.68587874j, 0.74700976+0.73208816j,0.42010818+0.31124884j, 0.27181199+0.54599156j],[ 0.29457621+0.34057513j, 0.82490182+0.63943948j,0.46887722+0.12734375j, 0.77184637+0.21522095j],[ 0.67774944+0.8208908j , 0.41476702+0.85332392j,0.10084665+0.56146324j, ...

Python的numpy数组怎么合并【图】

这次给大家带来Python的numpy数组怎么合并，Python的numpy数组合并的注意事项有哪些，下面就是实战案例，一起来看一下。Python中numpy数组的合并有很多方法，如- np.append() - np.concatenate() - np.stack() - np.hstack() - np.vstack() - np.dstack()其中最泛用的是第一个和第二个。第一个可读性好，比较灵活，但是占内存大。第二个则没有内存占用大的问题。方法一——appendparametersintroductionarr待合并的数组的复制（特别...

numpy数组与矩阵的乘法怎么使用【图】

这次给大家带来numpy数组与矩阵的乘法怎么使用，使用numpy数组与矩阵乘法的注意事项有哪些，下面就是实战案例，一起来看一下。1、当为array的时候，默认d*f就是对应元素的乘积，multiply也是对应元素的乘积，dot（d,f）会转化为矩阵的乘积， dot点乘意味着相加，而multiply只是对应元素相乘，不相加2、当为mat的时候，默认d*f就是矩阵的乘积，multiply转化为对应元素的乘积，dot（d,f）为矩阵的乘积3、混合时候的情况，一般不要混...

对numpy数组和矩阵的乘法的进一步理解【图】

下面就为大家分享一篇对numpy 数组和矩阵的乘法的进一步理解，具有很好的参考价值，希望对大家有所帮助。一起过来看看吧1、当为array的时候，默认d*f就是对应元素的乘积，multiply也是对应元素的乘积，dot（d,f）会转化为矩阵的乘积， dot点乘意味着相加，而multiply只是对应元素相乘，不相加2、当为mat的时候，默认d*f就是矩阵的乘积，multiply转化为对应元素的乘积，dot（d,f）为矩阵的乘积3、混合时候的情况，一般不要混合混合...

python3库numpy数组属性的查看方法

下面就为大家分享一篇python3库numpy数组属性的查看方法，具有很好的参考价值，希望对大家有所帮助。一起过来看看吧实例如下所示：import numpy as np a1 = np.array([1,2,3,4],dtype=np.complex128) print(a1) print("数据类型",type(a1)) #打印数组数据类型 print("数组元素数据类型：",a1.dtype) #打印数组元素数据类型 print("数组元素总数：",a1.size) #打印数组尺寸，即数组元素总数 print("数组形状：",a1.shape) ...

Numpy数组应该怎么保存与读取

这次给大家带来Numpy数组应该怎么保存与读取，Numpy数组保存与读取的注意事项有哪些，下面就是实战案例，一起来看一下。1. 数组以二进制格式保存np.save和np.load是读写磁盘数组数据的两个主要函数。默认情况下，数组以未压缩的原始二进制格式保存在扩展名为npy的文件中，以数组a为例np.save("filename.npy",a) b = np.load("filename.npy")利用这种方法，保存文件的后缀名字一定会被置为.npy2. 存取文本文件使用 np.savetxt 和 np...

怎样操作Python遍历numpy数组

这次给大家带来怎样操作Python遍历numpy数组，操作Python遍历numpy数组的注意事项有哪些，下面就是实战案例，一起来看一下。在用python进行图像处理时，有时需要遍历numpy数组，下面是遍历数组的方法：[rows, cols] = num.shape for i in range(rows - 1): for j in range(cols-1): print(num[j, i])相信看了本文案例你已经掌握了方法，更多精彩请关注Gxl网其它相关文章！推荐阅读：python如何取得二维数组局部峰值Python接口使用...

怎样取numpy数组指定行列

这次给大家带来怎样取numpy数组指定行列，取numpy数组指定行列的注意事项有哪些，下面就是实战案例，一起来看一下。这个操作在numpy数组上的操作感觉有点麻烦，但是也没办法。例如 a = [[1,2,3], [4,5,6], [7,8,9]]取 a 的 2 3 行， 1 2 列c=[1,2] d =[0,1]若写为 b = a[c,d] output: [4 8]取的是第二行第一列和第三行第二列的数据这并不是我们想要的结果。正确做法是：b = a[c]先取想要的行数据 b = b[:,d] print(b) ou...

numpy数组拼接简单示例_python

这篇文章主要介绍了numpy数组拼接简单示例，涉及对numpy数组的介绍，numpy数组的属性等内容，具有一定借鉴价值，需要的朋友可以参考下。NumPy数组是一个多维数组对象，称为ndarray。其由两部分组成：实际的数据描述这些数据的元数据大部分操作仅针对于元数据，而不改变底层实际的数据。关于NumPy数组有几点必需了解的：NumPy数组的下标从0开始。同一个NumPy数组中所有元素的类型必须是相同的。NumPy数组属性在详细介绍NumPy数组之前...

浅谈numpy数组的几种排序方式_python

这篇文章主要介绍了浅谈numpy数组的几种排序方式，涉及对numpy的简单介绍和创建数组的方式，具有一定借鉴价值，对numpy感兴趣的朋友可以参考下。简单介绍NumPy系统是Python的一种开源的数组计算扩展。这种工具可用来存储和处理大型矩阵，比Python自身的嵌套列表（nested list structure)结构要高效的多（该结构也可以用来表示矩阵（matrix））。创建数组创建1维数组：data = np.array([1,3,4,8])　　查看数组维度data.shape查看数组...

Python列表、Numpy数组与矩阵的区别【图】

原文链接 Python列表和Numpy数组的区别： Numpy使用ndarray对象来处理多维数组，该对象是一个快速而灵活的大数据容器。使用Python列表可以存储一维数组，通过列表的嵌套可以实现多维数组，那么为什么还需要使用Numpy呢？Numpy是专门针对数组的操作和运算进行了设计，所以数组的存储效率和输入输出性能远优于Python中的嵌套列表，数组越大，Numpy的优势就越明显。通常Numpy数组中的所有元素的类型都是相同的，而Python列表中的元素类...

python中numpy数组保存为Excel文件【代码】

# Encoding: utf-8 author: yhwu version: 2021-04-19 function: numpy array write in the excel file import numpy as np import pandas as pd# define a as the numpy array a = np.array([1, 2, 3]) # transform a to pandas DataFrame a_pd = pd.DataFrame(a) # create writer to write an excel file writer = pd.ExcelWriter(a.xlsx) # write in ro file, sheet1 is the page title, float_format is the accuracy of data ...

PYTHON - 技术教程分类

Python3 教程 Python3 简介 Python3 环境搭建 Python3 基础语法 Python3 基本数据类型 Python3 解释器 Python3 注释 Python3 运算符 Python3 数字(Number) Python3 字符串 Python3 列表 Python3 元组 Python3 字典 Python3 集合 Python3 编程第一步 Python3 条件控制 Python3 循环语句 Python3 迭代器与生成器 Python3 函数 Python3 数据结构 Python3 模块 Python3 输入和输出 Python3 File Python3 OS Python3 错误和异常 Python3 面向对象 Python3 命名空间/作用域 Python3 标准库概览 Python3 实例 Python3 CGI编程 Python3 MySQL(PyMySQL) Python3 网络编程 Python3 SMTP发送邮件 Python3 多线程 Python3 日期和时间 Python3 内置函数 Python3 MongoDB Python3 urllib python 全部

PYTHON - 最热教程

python如何统计字符串中字母个数？使用Python进行微信公众号开发（三）回...Python+PyQT5的子线程更新UI界面的实例 python时间戳怎么获得？如何获得当前时...vscode调试python时提示无法将“conda”...python接口自动化全局变量access_token...python收取邮件(腾讯企业邮箱)python如何绘制降水图详解python并发获取snmp信息及性能测试...怎么卸载Python3.6？

首页 / PYTHON / python – 如何一次将超大文件读入Numpy数组N行

python – 如何一次将超大文件读入Numpy数组N行

内容导读

内容图文

内容总结

内容备注

内容手机端

【python – 如何一次将超大文件读入Numpy数组N行】教程文章相关的互联网学习教程文章

python：将numpy数组写入csv文件【代码】

python – 将一个队列连接到tensorflow中的numpy数组,以获取数据而不是文件？【代码】

python-具有numpy数组的numpy日志【代码】

Pythonic方法将多维复杂numpy数组打印到字符串【代码】

Python的numpy数组怎么合并【图】

numpy数组与矩阵的乘法怎么使用【图】

对numpy数组和矩阵的乘法的进一步理解【图】

python3库numpy数组属性的查看方法

Numpy数组应该怎么保存与读取

怎样操作Python遍历numpy数组

怎样取numpy数组指定行列

numpy数组拼接简单示例_python

浅谈numpy数组的几种排序方式_python

Python列表、Numpy数组与矩阵的区别【图】

python中numpy数组保存为Excel文件【代码】

PYTHON - 相关标签

数组 - 相关标签

文件 - 相关标签

PYTHON - 技术教程分类

PYTHON - 最新教程

PYTHON - 最热教程