首页 / PYTHON / python-将巨大的.dat加载到数组中的最快方法

python-将巨大的.dat加载到数组中的最快方法

内容导读

互联网集市收集整理的这篇技术教程文章主要介绍了python-将巨大的.dat加载到数组中的最快方法，小编现在分享给大家，供广大互联网技能从业者学习和参考。文章包含1842字，纯文字阅读大概需要3分钟。

内容图文

我已经在stackexchange中广泛搜索了一种简洁的解决方案,用于将巨大的(?2GB).dat文件加载到numpy数组中,但是没有找到合适的解决方案.到目前为止,我设法以一种非常快的方式(小于1分钟)将其作为列表加载：

list=[]
f = open('myhugefile0')
for line in f:
    list.append(line)
f.close()

使用np.loadtxt会冻结我的计算机,并且需要花费几分钟来加载(?10分钟).如何才能将文件作为数组打开而不会出现似乎困扰np.loadtxt的分配问题？

编辑：

输入数据是一个float(200000,5181)数组.一行示例：

2.27069e-15 2.40985e-15 2.22525e-15 2.1138e-15 1.92038e-15 1.54218e-15 1.30739e-15 1.09205e-15 8.53416e-16 7.71566e-16 7.58353e-16 7.58362e-16 8.81664e -16 1.09204e-15 1.27305e-15 1.58008e-15

等等

谢谢

解决方法:

查看source,看来numpy.loadtxt包含许多代码来处理许多不同的格式.如果您有一个定义良好的输入文件,那么编写针对您的特定文件格式优化的函数并不难.像这样(未经测试)：

def load_big_file(fname):
    '''only works for well-formed text file of space-separated doubles'''

    rows = []  # unknown number of lines, so use list
    with open(fname) as f:
        for line in f:
            line = [float(s) for s in line.split()]
            rows.append(np.array(line, dtype = np.double))
    return np.vstack(rows)  # convert list of vectors to array

如果以前知道行数和列数,则另一种解决方案可能是：

def load_known_size(fname, nrow, ncol)
    x = np.empty((nrow, ncol), dtype = np.double)
    with open(fname) as f:
        for irow, line in enumerate(f):
            for icol, s in enumerate(line.split()):
                x[irow, icol] = float(s)
    return x

这样,您不必分配所有中间列表.

编辑：似乎第二个解决方案要慢一些,列表理解可能比显式的for循环更快.结合这两种解决方案,并使用Numpy进行从字符串到浮点的隐式转换的技巧(才刚刚发现),这可能会更快：

def load_known_size(fname, nrow, ncol)
    x = np.empty((nrow, ncol), dtype = np.double)
    with open(fname) as f:
        for irow, line in enumerate(f):
            x[irow, :] = line.split()
    return x

为了进一步提高速度,您可能必须使用一些用C或Cython编写的代码.我想知道这些功能需要多少时间才能打开文件.

内容总结

以上是互联网集市为您收集整理的python-将巨大的.dat加载到数组中的最快方法全部内容，希望文章能够帮你解决python-将巨大的.dat加载到数组中的最快方法所遇到的程序开发问题。如果觉得互联网集市技术教程内容还不错，欢迎将互联网集市网站推荐给程序员好友。

内容备注

版权声明：本文内容由互联网用户自发贡献，该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容，请发送邮件至 gblab@vip.qq.com 举报，一经查实，本站将立刻删除。

内容手机端

扫描二维码推送至手机访问。

本文链接：https://qyyshop.com/info/660407.html

来源：【匿名】

【上一篇】python-sympy中索引符号的派生【下一篇】浅谈PHP运行Python脚本的方法

更多 ►

【python-将巨大的.dat加载到数组中的最快方法】教程文章相关的互联网学习教程文章

Python数组使用

python数组的使用2010-07-28 17:171、Python的数组分三种类型： (1) list 普通的链表，初始化后可以通过特定方法动态增加元素。定义方式：arr = [元素] (2) Tuple 固定的数组，一旦定义后，其元素个数是不能再改变的。定义方式：arr = (元素) (2) Dictionary 词典类型，即是Hash数组。定义方式：arr = {元素k:v} 2、下面具体说明这些数组的使用方法和技巧： (1) list 链表数组 a、定义时初始化 a = [1,2,[1,2,3]] b、定义时不初...

《Fluent Python》- 02 序列构成的数组【代码】

Guido曾为ABC语言贡献过代码。Python也从ABC继承了用统一的风格去处理序列数据这一点。它们都共用一套丰富的操作：迭代，切片，排序，还有拼接深入理解Python中的不同序列类型，不但能让我们避免重新发明轮子，它们的API还能帮助我们把自己定义的API设计得跟原生的序列一样，或者和未来可能出现的序列类型保持兼容内置序列类型概览容器序列： list，tuple，collections.deque扁平序列： str，bytes，bytearry，memoryview和a...

python 数组array的一些操作

对一些特定大小的元素进行操作1.将数组Arr中大于100的值都设定为100　　Arr[Arr >100] = 100 利用array索引的内置　　numpy.minimum(Arr, 100) 返回的数组里大于100的都变为了100。minimum(arr1,arr2) 这是挨个比较两个数组里相应位置的元素大小，哪个小返回哪个，最终返回的是一个两者中相对应元素值小的元素组成的数组。这里后面是个100,100会扩展为跟Arr的shape一样的每个元素都是100的数组。相应的有numpy.maximum(arr1, a...

LeetCode | 面试题03. 数组中重复的数字【剑指Offer】【Easy】【Python】【数组】【哈希表】【排序】【代码】

LeetCode 面试题03. 数组中重复的数字【剑指Offer】【Easy】【Python】【数组】【哈希表】【排序】问题力扣找出数组中重复的数字。在一个长度为 n 的数组 nums 里的所有数字都在 0～n-1 的范围内。数组中某些数字是重复的，但不知道有几个数字重复了，也不知道每个数字重复了几次。请找出数组中任意一个重复的数字。示例 1：输入： [2, 3, 1, 0, 2, 5, 3] 输出：2 或 3 限制：2 <= n <= 100000思路解法一哈希表遍历数组，未出现过的...

leetcode-python-合并两个有序数组【代码】

看似简单，实际上想了挺久的1）内置api方法class Solution:def merge(self, nums1: List[int], m: int, nums2: List[int], n: int) -> None:"""Do not return anything, modify nums1 in-place instead."""while nums1 and nums1[-1] == 0:if len(nums1) == m:breakdel nums1[-1]nums1 += nums2nums1.sort()2）双指针，哪个小输入哪个，再替换Nums1temp = []p1 = 0p2 = 0while(p1 < m and p2 < n):if (nums1[p1] <= nums2[p2]):tem...

Python 数组【代码】

arr = [‘a‘,‘b‘,‘c‘] arr.append(‘d‘) print(arr)for each in arr:print(each)原文：https://www.cnblogs.com/guxingy/p/12204845.html

python创建二维数组【代码】

1 c=[[0]*3 for i in range(3)] 23 c=[[0 for i in range(3)] for i in range(3)] 原文：http://www.cnblogs.com/smuxiaolei/p/7460678.html

旋转数组的最小数字（Python and C++解法）【代码】

题目：　　把一个数组最开始的若干个元素搬到数组的末尾，我们称之为数组的旋转。输入一个递增排序的数组的一个旋转，输出旋转数组的最小元素。例如，数组 [3,4,5,1,2] 为 [1,2,3,4,5] 的一个旋转，该数组的最小值为1。示例 1：输入：[3,4,5,1,2] 输出：1 示例 2：输入：[2,2,2,0,1] 输出：0来源：力扣（LeetCode）链接：https://leetcode-cn.com/problems/xuan-zhuan-shu-zu-de-zui-xiao-shu-zi-lcof思路：本题需要对二分查找法灵...

python：将numpy数组写入csv文件【代码】

1import numpy as np 2 np.savetxt(‘E:\\forpython\\featvector.csv‘,data_to_save,delimiter=‘,‘) 原文：http://www.cnblogs.com/hahaxzy9500/p/6854187.html

合并2个有序数组--Go对比Python【代码】

Go实现： 1package main2 3import (4"fmt" 5"sort" 6)7 8func main() {9 var a = []int{1, 6, 45, 2, 9, 15, 7} 10 var b = []int{2, 80, 9, 67, 52, 15, 100, 99} 11 c := sumArr(a, b) 12 fmt.Println("合并后的数组为") 13 fmt.Println(c) 14 d := remArr(c) 15 fmt.Println("合并、去重后的数组为") 16 fmt.Println(d) 17 e := sortArr(d) 18 fmt.Println("合并、去重、排序后的数组为"...

python 字符串，数组，元祖操作基础巩固。【代码】

由于上个星期有点忙，没时间来抽空记一些有用的东西。丢了比较久的python很多忘记的小操作我也会重新捡起来以前最容易搞混的 str.split() #操作会生成一个数组对象。example:‘laplace‘.split() #后面参数什么都没有加入，也会返回一个值[‘laplace‘]#如果后面加入分隔值‘laplace‘.split(‘l‘) #以‘l‘作为分隔点进行字符串的切割并生成数组 [‘‘, ‘ap‘, ‘ace‘] 然后是该函数的反效果的函数str.join(iterable)haha = ...

Python用无限制数组实现求素数,不限制质数的个数,用筛选的方法!

#相信很多人能写出比我还精简的算法#但你能写出比Python还优雅的算法吗？！import math #动用并 import 导入 math 函数 A=[] #定义一个数组并且不初始化,因为不知道这个数组要用多少个元素呢 # X为被除数， j 为内循环变量， A[j]为用来试除的除数 A.append(1) #A[0]=1 为数组赋初始值，因为要便于循环 A.append(2) #A[1]=2 X=1 #2==X 时去执行第一次循环 while True: #无限循环 X=X+1 isPrime=1 #默认（假...

Leetcode练习(Python)：数组类：第118题：给定一个非负整数 numRows，生成杨辉三角的前 numRows 行。【图】

题目：给定一个非负整数 numRows，生成杨辉三角的前 numRows 行。思路：本题较简单程序：class Solution: def generate(self, numRows: int) -> List[List[int]]: result = [] if numRows <= 0: return result for index1 in range(1, numRows + 1): data = [] if index1 == 1: data.append(1) elif index1 == 2: data.append...

Leetcode练习(Python)：数组类：第154题：假设按照升序排序的数组在预先未知的某个点上进行了旋转。 ( 例如，数组 [0,1,2,4,5,6,7] 可能变为 [4,5,6,7,0,1,2] )。请找出其中最小的元素。注意数组中可能存在重复的元素。

题目：假设按照升序排序的数组在预先未知的某个点上进行了旋转。 ( 例如，数组 [0,1,2,4,5,6,7] 可能变为 [4,5,6,7,0,1,2] )。请找出其中最小的元素。注意数组中可能存在重复的元素。说明：这道题是寻找旋转排序数组中的最小值的延伸题目。允许重复会影响算法的时间复杂度吗？会如何影响，为什么？思路：仍然使用二分法，考虑到会存在重复元素的情况，因此当判断到有重复数字时(nums[middle] == nums[tail]）时，使用tail...

python 二维数组转矩阵【代码】

x = numpy.array([[1,2,3],[4,5,6],[7,8,9]]) print x print x.shape输出[[123][456][789]] (3L, 3L) [Finished in0.2s] 原文：https://www.cnblogs.com/sea-stream/p/10801261.html

首页 / PYTHON / python-将巨大的.dat加载到数组中的最快方法

python-将巨大的.dat加载到数组中的最快方法

内容导读

内容图文

内容总结

内容备注

内容手机端

【python-将巨大的.dat加载到数组中的最快方法】教程文章相关的互联网学习教程文章

Python数组使用

《Fluent Python》- 02 序列构成的数组【代码】

python 数组array的一些操作

LeetCode | 面试题03. 数组中重复的数字【剑指Offer】【Easy】【Python】【数组】【哈希表】【排序】【代码】

leetcode-python-合并两个有序数组【代码】

Python 数组【代码】

python创建二维数组【代码】

旋转数组的最小数字（Python and C++解法）【代码】

python：将numpy数组写入csv文件【代码】

合并2个有序数组--Go对比Python【代码】

python 字符串，数组，元祖操作基础巩固。【代码】

Python用无限制数组实现求素数,不限制质数的个数,用筛选的方法!

Leetcode练习(Python)：数组类：第118题：给定一个非负整数 numRows，生成杨辉三角的前 numRows 行。【图】

Leetcode练习(Python)：数组类：第154题：假设按照升序排序的数组在预先未知的某个点上进行了旋转。 ( 例如，数组 [0,1,2,4,5,6,7] 可能变为 [4,5,6,7,0,1,2] )。请找出其中最小的元素。注意数组中可能存在重复的元素。

python 二维数组转矩阵【代码】

PYTHON - 相关标签

加载 - 相关标签

数组 - 相关标签

PYTHON - 技术教程分类

PYTHON - 最新教程

PYTHON - 最热教程