【python – 如何获得索引的排列?】教程文章相关的互联网学习教程文章

python – Pandas:查找具有第二高值的行的索引【代码】

我正在尝试在groupby之后得到具有第二高值的行的索引但是我得不到正确的结果df = pd.DataFrame({'Sp':['a','b','c','d','e','f'], 'Mt':['s1', 's1', 's2','s2','s2','s3'], 'Value':[1,2,3,4,5,6], 'count':[3,2,5,10,10,6]})这样做df.iloc[df.groupby(['Mt'])['Value'].apply(lambda x: (x!=max(x)).idxmax())]正在回归Mt Sp Value count 0 s1 a 1 3 2 s2 c 3 5 5 s3 f 6 6对于组s2,应返回原始数据帧的...

python – 如何在使用stack / unstack时维护Pandas DataFrame索引顺序?【代码】

示例一:注意给定Pandas DataFrame df的索引顺序:>>> dfA B first second zzz z 2 4a 1 5 aaa z 6 3a 7 8在给定的df DataFrame对象上使用堆栈和unstack方法之后,索引将按字典顺序(按字母顺序)自动排序,以便丢失行的原始顺序.>>> df.unstack().stack()A B first second aaa a 7 8z 6 3 zzz a 1 5z 2 4在上面的拆卸/堆栈操作之后是否可以保持原始顺...

python – 多索引 – 每天访问最后一次【代码】

Pandas中多索引的新手.我的数据看起来像这样Date Time value 2014-01-14 12:00:04 .42412:01:12 .34212:01:19 .341...12:05:49 .23 2014-05-12 ...1:02:42 .23 ....现在,我想访问每个日期的最后一次并将值存储在某个数组中.我做了这样的多索引df= pd.read_csv("df.csv",index_col=0) df.index = pd.to_datetime(df.index,infer_datetime_format=True) df.index = pd.MultiIndex.from_arrays([df.i...

python – 为什么`set_index`为列名创建索引标签?【代码】

我有一个CSV文件,开头像这样:Year,Boys,Girls 1996,333490,315995 1997,329577,313518 1998,325903,309998当我把它读入熊猫并设置一个索引时,它并没有达到我的预期:df = pd.read_csv('../data/myfile.csv') df.set_index('Year', inplace=True) df.head()为什么列标签有索引条目,旁边有空白值?这不应该消失吗?此外,我不清楚如何检索1998年的值.如果我尝试df.loc [‘1998′]我得到一个错误:KeyError:’标签[1998]不在[index]’...

python – 计算由长度不等的索引的二维列表给出的DataFrame行组的平均值【代码】

我有一个有n行的DataFrame.我还有一个二维索引数组.该数组也有n行,但每行的长度可以变化.我需要根据索引对DataFrame行进行分组并计算列的平均值. 例如: 如果我有DataFrame df和array ind,我需要得到 [df.loc [ind [n],col_name] .mean()for n in ind]. 我已经使用apply pandas函数实现了这个:size = 100000 df = pd.DataFrame(columns=['a']) df['a'] = np.arange(size) np.random.seed(1) ind = np.array([np.random.randint(0,...

python – pandas中的groupby()和索引值【代码】

我有pandas.DataFrame和Multiindex,因此:a valdog 1cat 2 b fox 3rat 4我想要一个系列,其条目是1级索引值的列表, 所以:a [dog, cat] b [fox, rat]以下确实有效,但速度很慢且不够优雅:fff = df.groupby(level=0)['val'].agg(lambda x:[i[1] for i in list(x.index.values)])所以我希望有更好的方法.解决方法:reset_index和groupbydf.reset_index(level=1).groupby(level=0)['level_1'].apply(...

索引到dict时,Python NoneType不可调用【代码】

我遇到了这个我无法解释的奇怪错误.Python 2.7.1+ (r271:86832, Apr 11 2011, 18:05:24) [GCC 4.5.2] on linux2 Type "help", "copyright", "credits" or "license" for more information. >>> import UserDict >>> a = UserDict.UserDict() >>> b = {} >>> b[a] Traceback (most recent call last):File "<stdin>", line 1, in <module> TypeError: 'NoneType' object is not callable我明白这应该是一个错误.我不明白为什么它说...

如何在python中相对于索引交叉列表【代码】

我知道这个问题看起来像是重复的.但我很难解决这个问题,但我无法找到有用的解决方案 我正在使用python实现旅行商问题的遗传算法 假设我们有这些列表(旅游)a = [1,0,2,5,4,3,1] b = [1,2,5,4,3,0,1] c = [1,3,5,4,2,0,1]如您所见,[5,4]在整个3个列表中重复出现并且常规交叉点将返回列表中的所有元素. 我想要一些像intersect_list(a,b)这样的函数 返回[5,4] 是否有一个python内置方式来找到它?或者你有什么建议吗? 注意:我知道我可...

Python:反向排序列表中第一个元素的索引小于阈值【代码】

类似的问题已被要求排序列表here,但解决方案使用bisect,它不适用于保留排序列表. 假设我有一个列表,按相反顺序排序,键入中间元素,my_list = [[3,0.99,1], [2,0.98,54], [10,.85,4], [1,0.7,10], [12,0.69,31], [12,0.65,43], [1.56,0] ....]我想在中间元素上应用一系列阈值,例如,在单独的排序列表中threshold = [0.97, 0.90, 0.83, 0.6]我试图找出小于阈值的第一个元素的索引.在上面的例子中它应该返回,index_list = [2, 2, 3, 6]建...

python – numpy的索引如何在这种情况下工作【代码】

plot numpy的逻辑索引如何从下面的代码片段中的“data”变量中获取数据点?我知道第一个参数是x坐标,第二个参数是y坐标.我不确定它如何映射到变量的数据点.data = vstack((rand(150,2) + array([.5,.5]),rand(150,2))) # assign each sample to a cluster idx,_ = vq(data,centroids)# some plotting using numpy's logical indexing plot(data[idx==0,0],data[idx==0,1],'ob',data[idx==1,0],data[idx==1,1],'or') plot(centroids...

python 读没有列索引的数据【图】

数据如下: 普通读法: 结果如下:(会直接把第一列作为索引,导致第一行的数用不了) 解决办法:header=None结果如下:加一行数作为列索引如果不要行索引 index_col=0结果如下: 将缺省值填充为0结果如下:

python – 使用date作为索引合并pandas数据帧【代码】

我正在尝试合并两个不同长度的数据帧(称为df1和df2),这两个数据帧都按其日期索引. dfs(df1)的较长时间内所有日期都列在两者中较短的一个(df2).我试图使用以下命令组合它们:merged = df2.merge(df1,on =’Date’),但是我得到以下错误,当我尝试这样做时我不明白.--------------------------------------------------------------------------- KeyError Traceback (most recent call last) <ipyth...

python – numpy:花哨的索引“意外的行为” – 花哨的索引似乎给出的结果是直观的预期“转置”【代码】

我对花哨索引的行为有点困惑,请参阅:>>> t = np.arange(2*2*3).reshape((2, 2, 3)) >>> t array([[[ 0, 1, 2],[ 3, 4, 5]],[[ 6, 7, 8],[ 9, 10, 11]]]) >>> t[1, :, [1, 2]] array([[ 7, 10],[ 8, 11]])我认为在使用t [1,:,[1,2]]进行索引后,我会得到数组:array([[ 7, 8],[10, 11]])但是相反,我得到了转置,如上所示. 另外,请考虑以下事项:>>> t[:, :, [1, 2]][1] array([[ 7, 8],[10, 11]])这并不遵循我们刚才注意到的...

python – 沿最后一个维度的索引numpy nd数组【代码】

有没有一种简单的方法可以使用索引数组在最后一个维度上索引numpy多维数组?例如,取一个形状的数组a(10,10,20).假设我有一个形状(10,10)的索引b数组,因此结果将是c [i,j] = a [i,j,b [i,j]]. 我尝试过以下示例:a = np.ones((10, 10, 20)) b = np.tile(np.arange(10) + 10, (10, 1)) c = a[b]然而,这不起作用,因为它然后尝试索引像[b [i,j],b [i,j]],这与[i,j,b [i,j]]不同.等等.有没有一种简单的方法可以在不诉诸循环的情况下做到...

python – JSON字符串索引必须是整数【代码】

关于这个主题有很多问题,但大多数人似乎都忘了打电话给json.loads. 这是我的例子:import jsonjson_input = '{ "ar": { "articles": { "12345": {"title": "first title" } , "67890": {"title": "another title" } } } } 'data = json.loads(json_input)for article in data['ar']['articles']:print(article['title'])打印调用因错误而失败:TypeError: string indices must be integers我该如何解决这个问题?解决方法:您当前打...