【python-当前在Google App Engine上存储,索引和查询地理空间数据的选项是什么?】教程文章相关的互联网学习教程文章

python – 如何在Pandas中的.csv文件中写入DataFrame时删除索引列?【代码】

参见英文答案 > Pandas to_csv call is prepending a comma 1个我的DataFrame包含两列名为“a”,“b”的列.现在,当我创建此DataFrame的csv文件时:df.to_csv(‘myData.csv’)当我在一个excel文件中打开它时,有一个额外的列,索引出现在列’a’和’b’旁边,但我不希望这样.我只希望列’a’和’b’出现在Excel工作表中. 有没有办法做到这一点?解决方法:尝试,df.to_csv('myData.csv',index=False)

python – 查找多索引数据框的每个级别的最大值【代码】

我有一个看起来像这样的DataFrame:data a b 1 1 0.12 0.23 0.3 2 1 0.52 0.63 0.7我想找到忽略b级别的每个级别的最小值,所以作为输出我正在寻找像a min 1 0.1 2 0.5解决方法:最简单的是使用参数级别= 0的min:print (df.data.min(level=0).reset_index(name='min'))a min 0 1 0.1 1 2 0.5如果需要输出为df且只有一列df:print (df.min(level=0))data a 1 0.1 2 0.5或者通过第一级聚合min分...

使用dict(python3)重新索引pandas DataFrame【代码】

有没有办法,不使用循环,使用dict重新索引DataFrame?这是一个例子:df = pd.DataFrame([[1,2], [3,4]]) dic = {0:'first', 1:'second'}我想对df应用一些有效的东西来获得:0 1 first 1 2 second 3 4速度很重要,因为我正在处理的实际DataFrame中的索引具有大量的唯一值.谢谢解决方法:你需要rename功能:df.rename(index=dic)# 0 1 #first 1 2 #second 3 4修改了dic来得到结果:dic = {0:’first’,1:’second’...

python – Pandas索引isin方法【代码】

在使用pandas索引时,我正在使用isin方法,它总是返回False.from pandas import DataFrame df = DataFrame(data=[['a', 1], ['b', 2], ['c', 3]], index=['N01', 'N02', 'N03']) df.index.isin(['01', '02'])回报array([False, False, False], dtype=bool)解决方法:使用str.contains并传递正则表达式模式:In[5]: df.index.str.contains('01|02')Out[5]: array([ True, True, False], dtype=bool)isin查找完全匹配,这就是为什么你返...

python – Numpy教程 – 布尔索引【代码】

读Numpy快速教程,我无法理解这句话.a = np.arange(12).reshape(3,4) b1 = np.array([False,True,True]) b2 = np.array([True,False,True,False]) >>> a[b1,b2] array([ 4, 10])为什么[b1,b2]是数组([4,10])而不是数组([[4,6],[8,10]])?解决方法:这是因为你在那里表演integer array indexing. 在内部,索引是从布尔数组计算的 – In [72]: idx1 = np.flatnonzero(b1)In [73]: idx2 = np.flatnonzero(b2)In [75]: idx1 Out[75]: a...

python – Pandas – 从列中获取唯一值以及它们出现的行索引列表【代码】

我的数据框有一个字符串列,可以包含长字符串.我想获得一个唯一字符串列表,以及每个包含行索引的唯一字符串的列表. 我可以想到两种方法. >首先使用.unique()获取唯一列表,然后遍历数据帧以构建索引列表,其中每个唯一值都显示出来>使用.groupBy()创建组并获取每个组中的行索引列表 但我不太确定哪一个更有效(或者是否还有其他方法可以更有效地做到这一点).我考虑效率的原因是我想要统一的字段和groupBy是一个字符串字段,可能有很长的...

python – 形状不匹配:索引数组无法与形状一起广播【代码】

j=np.arange(20,dtype=np.int) site=np.ones((20,200),dtype=np.int) sumkma=np.ones((100,20))[sumkma[site[x],x] for x in range(20)]这有效,但我不想使用for循环.当我尝试sumkma[site[j],j]我收到此错误:IndexError: shape mismatch: indexing arrays could not be broadcast together with shapes (20,200) (20,) 如何修复错误?解决方法:当访问具有整数类型的其他多维数组的numpy多维数组时,用于索引的数组需要具有相同的形状...

python – 将一个DataFrame分组到一个新的DataFrame中,并将一个范围作为索引【代码】

参见英文答案 > Converting a Pandas GroupBy object to DataFrame 8个我有一个问题,在这个例子中简化了.考虑一下这个Pandas DataFrame,df_a:df_a=pd.DataFrame([['1001',34.3,'red'],['1001',900.04,'red'],['1001',776,'red'],['1003',18.95,'green'],['1004',321.2,'blue']],columns=['id','amount','name'])id amount name 0 1001 34.30 red 1 1001 900.04 red 2 10...

python – Pandas – Groupby一个多索引级别,获得可能的组合,然后转换数据【代码】

我一直在努力解决分组,组合和转换的问题.我目前的解决方案是:df = df.groupby(level='lvl_2').transform(lambda x: x[0]/x[1])但这并没有解决我问题的某些部分. 假设代码如下:import pandas as pd import numpy as np import datetime today = datetime.date.today() today_1 = datetime.date.today() - datetime.timedelta(1) today_2 = datetime.date.today() - datetime.timedelta(2) ticker_date = [('first', 'a',today), (...

Python学习索引

索引目录1.Python简介2.Python基本数据运算3.Python语句4.Python容器类型的通用操作5.Python容器类型‘字符串’

python – 如何使用两个索引替换列表中的项目【代码】

我是python的初学者,我正在尝试制作一个刽子手游戏,但我似乎无法让它工作.这是我的代码:word = "street" letters = list(word) dashes = ["_","_","_","_","_","_"] guess = input("Guess the letter. ") #assuming that "e" was the input x = [index for index, value in enumerate(letters) if value == guess] dashes[x] = guess我想用破折号替换具有x中索引的破折号.在“e”是输入的情况下,表示破折号[3]和破折号[4]变为“e”...

Python字符串递归,字符串索引超出范围【代码】

我是python的新手,并且以递归方式思考非常糟糕.这段代码给了我一个IndexError:字符串索引超出范围.我不知道如何纠正它.def get_permutations(sequence):def permutationhelp(sequence,chosen):if sequence=="":print(chosen)else:for i in range(len(sequence)):c= sequence[i]chosen +=csequence=sequence[i+1:]permutationhelp(sequence,chosen)sequence=c+sequencechosen=chosen[:-1]def permutation(sequence):permutationhel...

python – 从pandas dataframe中删除重复的列索引【代码】

我正在寻找一个解决方案来删除我的数据框中的重复列索引 – 我需要做的是逐行添加重复列中的值,然后只保留这些列中的一个与总和值df = pd.DataFrame(np.array([[0,0,0,1,0,0,0], [0,1,0,0,0,0,0],[0,0,0,0,0,0,1]]), columns=[1,1,2,2,2,3,3], index=[1,2,3])1 1 2 2 2 3 3 1 0 0 0 1 0 0 0 2 0 1 0 0 0 0 0 3 0 0 0 0 0 0 1应该成为1 2 3 1 0 1 0 2 1 0 0 3 0 0 1解决方法:由于缺少数据,对...

python – 在SciPy中,csr_matrices的花式索引【代码】

我是Python的新手,所以如果这是一个基本问题,请提前原谅我,但我已经四处寻找并且没有找到令人满意的答案. 我正在尝试使用NumPy和SciPy执行以下操作:I,J = x[:,0], x[:1] # x is a two column array of (r,c) pairs V = ones(len(I)) G = sparse.coo_matrix((V,(I,J))) # G's dimensions are 1032570x1032570 G = G + transpose(G) r,c = G.nonzero() G[r,c] = 1 ... NotImplementedError: Fancy indexing in assig...

python – 优化两个列表之间的比较,给出不同的索引【代码】

我有三个列表:old,new和ignore.旧的和新的是字符串列表. ignore是一个索引列表,如果它们不匹配则应该忽略.目标是创建一个不同且不被忽略的索引列表. 旧的和新的可能包含不同数量的元素.如果旧旧之间的大小存在差异,则应将差异标记为不匹配(除非忽略). 我目前的功能如下:def CompareFields( old, new, ignore ):if ( old == None ):if ( new == None ):return [];else:return xrange( len(new) )elif ( new == None ):return xran...