【python-将数组添加到熊猫数据框】教程文章相关的互联网学习教程文章

在python中对大量数组进行排序的最快方法【代码】

我正在尝试在python中对大量数组进行排序.我需要一次对超过1100万个数组进行排序. 另外,如果我可以直接获取将对数组进行排序的索引,那就太好了. 这就是为什么,到目前为止,我正在使用numpy.argsort(),但是那在我的机器上太慢了(运行需要一个多小时) 在同一台机器上,R中的相同操作大约需要15分钟. 谁能告诉我在Python中执行此操作的更快方法? 谢谢 编辑: 添加一个例子 如果我有以下数据框:agg:x y w z 1 ...

python-从.m matlab文件中声明的矩阵创建numpy数组【代码】

一位同事留下了一些我想用Numpy分析的数据文件. 每个文件都是一个matlab文件,例如data.m,具有以下格式(但具有更多的行和列):values = [-24.92 -23.66 -22.55 ; -24.77 -23.56 -22.45 ; -24.54 -23.64 -22.56 ; ];这是matlab使用的典型的显式矩阵创建语法. 我的问题是:从这些文件创建numpy数组的最实用方法是什么? 我可以考虑“强力”或“快速而肮脏的”解决方案,但是如果有一个更直接的解决方案,我宁愿使用它,就像numpy甚至另一...

python-为什么数组中的输入会覆盖每一行的值【代码】

这个问题已经在这里有了答案: > Changing an element in one list changes multiple lists 4个> List of lists changes reflected across sublists unexpectedly 13个我有这段代码x=3 a=x*[x*[0]] for i in range(0,x):for j in range(0,x):dt=int(input("insert data: "))a[i][j]=dtprint(a)并且应该只在要求时添加数...

python-在numpy中将3个一维数组连接在一起【代码】

我将MatLab留给numpy,总的来说还可以,但是我梦a以求的是找到一种不错的pythonic方法来完成MatLab的工作:A=[1.0;2.0;3.0;4.0] %Column vector B=[5.0;6.0;7.0;8.0] %Another one C=[A,B,B] %4 x 3 matrix在Python中,像这样设置A:A=np.array([1,2,3,4]) B=np.array([5,6,7,8])并连接如下:C=np.concatenate((A,B,B),axis=1)将它们一个堆叠在另一个之上,并且_C,hstack等也会失败.我猜想我需要一种很好的方法来将(4,)numpy数组变成(4...

python-基于布尔逻辑创建数组【代码】

问题1 我有一个numpy数组data[:,0:5] Out[98]: array([[ 1.00200300e+09, 1.00000000e+00, 2.00000000e+00,3.00000000e+00, 4.00000000e+00],[ 1.00200400e+09, 1.00000000e+00, 2.00000000e+00,4.00000000e+00, 5.00000000e+00],[ 1.00200300e+09, 3.00000000e+00, 4.00000000e+00,1.00000000e+00, 2.00000000e+00],[ 1.00200400e+09, 4.00000000e+00, 5.00000000e+00,1.00000000e+00, 2.00000000e+...

python-将2d数组乘以1d数组【代码】

我有一个形状为(k,n)的2D数组a,我想将它与形状(m,)的一维数组b’相乘’:a = np.array([[2, 8],[4, 7],[1, 2],[5, 2],[7, 4]])b = np.array([3, 5, 5])由于“乘法”,我正在寻找:array([[[2*3,2*5,2*5],[8*3,8*5,8*5]],[[4*3,4*5,4*5],[7*3,7*5,7*5]],[[1*3,1*5,1*5], ..... ]],................. ]]])= array([[[ 6, 10, 10],[24, 40, 40]],[[12, 20, 20],[21, 35, 35]],[[ 3, 5, 5],[ ........ ]],....... ]]])我当然可以通过循...

在Python中从JSON数组中挑选数据对象【代码】

我有这个数据对象,我想知道如何才能选择称为提交(或项目)的子对象.我尝试过all_commits = all_data [‘commits’],但是python强迫我给它一个整数,而不是字符串.思考?[{"commits": [{"project_id": "1","commit_title": "commit 1","date": "date 1","markdown": "markdown 1"},{"project_id": "1","commit_title": "commit 2","date": "date 2","markdown": "markdown 2"},{"project_id": "1","commit_title": "commit 3","date":...

从Python传递大型复杂数组到C-我最好的选择是什么?【代码】

2017/06/13编辑:我尝试按照建议的方法使用boost,但是在花了3天以上的时间尝试使其进行编译和链接后,失败了,我认为这种愚蠢的痛苦方式可能是最快且痛苦更少的方式.保存一堆C然后读取的硕大的文本文件(拆分数组和数字在文件中的复数/虚数部分).优雅…不…有效…是. 我有一些科学代码,当前使用Python编写,但由于循环内的数字3d集成步骤而使其速度变慢.为了克服这个问题,我正在C中重写此特定步骤. (Cython等不是选项). 长话短说:我想...

python-Cython是否提供任何合理简便有效的方法来迭代Numpy数组,就好像它们是平坦的一样?【代码】

假设我要实现Numpy的x[:] += 1在Cython.我可以写@cython.boundscheck(False) @cython.wraparoundcheck(False) def add1(np.ndarray[np.float32_t, ndim=1] x):cdef unsigned long ifor i in range(len(x)):x[i] += 1但是,这仅适用于ndim =1.我可以使用add1(x.reshape(-1))但这仅适用于连续的x. Cython是否提供任何合理简单有效的方法来迭代Numpy数组,就像它们是平坦的一样? (在Cython中重新实现此特定操作没有任何意义,因为上述Nu...

python在numpy数组中转换带格式数字的字符串最快的方法是什么【代码】

我有一个很大的ASCII文件(?100GB),其中包含大约1.000.000行的已知格式化数字,我尝试使用python处理它们.该文件太大,无法完全读入内存,因此我决定逐行处理该文件:fp = open(file_name) for count,line in enumerate(fp):data = np.array(line.split(),dtype=np.float)#do stuff fp.close()事实证明,我将程序的大部分运行时间都花在data =行中.有什么方法可以加快生产速度吗?而且,执行速度似乎比我从带格式读取的本机FORTRAN程序中...

python-np数组之间的欧式距离【代码】

我有两个numpy数组a和b: a和b是相同的尺寸,a的尺寸可能不同于b. 例如:a = [[1,2], ..., [5,7]] b = [ [3,8], [4,7], ... [9,15] ] 有没有一种简单的方法来计算a和b之间的欧几里得距离,以便可以在k个最近的邻居学习算法中使用此新数组. 注意:这是在python中解决方法:scipy.spatial.distance.cdist会这样做.

python-用类实例替换数组中的元素【代码】

这类似于this,所以请先阅读它,以了解我要做什么. 现在,我想在有类实例时进行替换.import numpy as npclass B():def __init__(self, a,b):self.a = aself.b = barr = np.array([ [1,2,3,4,5],[6,7,8,9,10] ])b1 = np.array([B(100,'a'),B(11,'b'),B(300,'c'),B(33,'d')])b2 = np.array([B(45,'a'),B(65,'b'),B(77,'c'),B(88,'d')])# My d array will be like that and I will have to # run 3 loops as below . I can't change tha...

python-将具有numpy数组的字典写入.csv【代码】

我想将结果文件写入.csv.我准备了一个简单的测试示例.import numpy as np data = {} testdata = np.array([1,2,3,4,5])data['set1'] = {'a': testdata, 'b': testdata, 'c': testdata} data['set2'] = {'a2': testdata, 'b2': testdata, 'c2': testdata} data['set3'] = {'a3': testdata, 'b3': testdata, 'c3': testdata}得到这样的结果文件将是很棒的:有一种简单的建议方法吗?解决方法:您可以在单独的数据结构中收集标题和行,然...

python-连接两个不同维度的数组numpy【代码】

我正在尝试连接两个numpy数组以添加额外的列:array_1为(569,30)和array_2为(569,) 组合= np.concatenate((array_1,array_2),axis = 1) 我以为如果将axis = 2设置为有效,那么它将垂直连接.末尾应为569 x 31阵列. 我得到的错误是ValueError:所有输入数组的维数必须相同 有人可以帮忙吗? 谢谢!解决方法:您可以使用numpy.column_stack:np.column_stack((array_1, array_2))由@umutto注释,它会将1-d数组隐式转换为2-d,因此等效于np...

python-Keras和错误:设置带有序列的数组元素【代码】

我在神经网络中输入多个数据源时遇到问题.我的数据框是:0 1 2 3 4 0 [True, True, False] 3 -1 [False, True, True] 1输入与前4列相关,输出与最后4列相关.训练神经网络时,我会得到设置带有序列的数组元素.def network():model = Sequential()model.add(Dense(output_dim=50, activation='relu', input_dim=4))model.add(Dense(output_dim=50, activation='relu'))model.add(Dense(output_dim=5...