【python – 从索引列表到单热矩阵】教程文章相关的互联网学习教程文章

python-在熊猫数据框中查找所有模式的索引【代码】

我正在使用按日期时间索引的Pandas数据框,如下所示:TimeSys_Index 2014-08-29 00:00:18 0 2014-08-29 00:00:19 0 2014-08-29 00:00:20 1 2014-08-29 00:00:21 1 2014-08-29 00:00:22 0 2014-08-29 00:00:23 0 2014-08-29 00:00:24 0 2014-08-29 00:00:25 0 2014-08-29 00:00:26 0 2014-08-29 00:00:27 1 2014-08-29 00:00:28 1 2014-08-29 00:00:29 1 2014-08-29 00:00:30 1 2014-08-29 0...

python-sympy中索引符号的派生【代码】

我正在尝试使用sympy对时间索引变量进行符号计算(主要是导数).使用以下类似r [t]的索引符号会产生错误:from sympy import * t = Idx('t',10) r = IndexedBase('r')diff(r[t],r[t]) diff(r,r)ValueError: Can't differentiate wrt the variable: r[t], 1原因可能是这里出了点问题:In [15]: r[t].indices Out[15]: (t,)索引t后面的逗号对我来说可疑,但我不知道出了什么问题. 有人知道如何在sympy中做到这一点吗?解决方法:您可以区...

python-真值的行和列索引【代码】

我有一个NxN熊猫数据框,其中包含布尔值.例如:In[56]: df Out[56]: 15 25 35 45 55 10 True False False False False 20 False True False False False 30 False False True False False 40 False False False True False 50 False False False False True我需要做的是将此框架折叠成一个Nx2大熊猫DataFrame,该框架的索引和列值在交点处为True,作为记录值.例如:In[62]: res Out[62...

python-使用readWrite的mongoengine用户无法创建索引【代码】

我正在运行python 2.7和mongodb 2.6.5.我无法让mongoengine连接并发出请求,但是我可以与用户登录mongo并发出相同的请求.我像这样在mongodb中创建了3个用户(密码不是空白,但我已将其删除):$mongo campaigns db.createUser({"user": "admin", "pwd": "", "roles": [{"role": "dbOwner", "db":"campaigns" },{"role": "dbOwner", "db":"admin" },{"role": "readAnyDatabase", "db": "admin" },"readWrite" ]},{ "w": "majority" , "w...

python-熊猫通过索引从HDF5获取特定行【代码】

我有一个已写入HDF5文件的pandas DataFrame.数据由时间戳记索引,如下所示:In [5]: df Out[5]:Codes Price Size Time 2015-04-27 01:31:08-04:00 T 111.75 23 2015-04-27 01:31:39-04:00 T 111.80 23 2015-04-27 01:31:39-04:00 T 113.00 35 2015-04-27 01:34:14-04:00 T 113.00 85 2015-04-27 01:55:15-04:00 T 113.50 203 ... ... ... ... 2015-05-26 ...

python-如何将多索引更改为平面列名称【代码】

我有这个数据框:import pandas as pd df = pd.DataFrame(data={'Status' : ['green','green','red','blue','red','yellow','black'],'Group' : ['A','A','B','C','A','B','C'],'City' : ['Toronto','Montreal','Vancouver','Toronto','Edmonton','Winnipeg','Windsor'],'Sales' : [13,6,16,8,4,3,1]}) df.drop('Status',axis=1,inplace=True) ndf = pd.pivot_table(df,values=['Sales'],index=['City'],columns=['Group'],fill_va...

python-在DataFrame中折叠具有重复索引值的条目【代码】

import pandas as pd bids = [100, 101, 101, 102] offers = [101, 102, 102.25, 103] data = {'bids': bids, 'offers': offers} index = [0, 1, 1, 2] df = pd.DataFrame(data=data, index=index) print dfbids offers 0 100 101.00 1 101 102.00 1 101 102.25 2 102 103.00如何重新索引df,以便使用每列中给定索引的最新值?在此示例中,我希望索引1具有[101,102.25]解决方法:您可以先呼叫reset_index,然后再呼叫drop...

python-使用索引列表有效填充NumPy数组【代码】

我知道如何在joblib中执行并行循环,该循环返回结果列表. 但是,是否可以并行填充预定义的numpy矩阵? 想象一下以下最小示例矩阵和数据:column_data = ['a', 'b', 'c', 'd', 'e', 'f', 'x'] data = [['a', 'b', 'c'],['d', 'c'],['e', 'f', 'd', 'x']] x = np.zeros((len(data), len(column_data))请注意,column_data已排序且是唯一的.数据是列表的列表,而不是矩形矩阵. 循环:for row in range(len(data)):for column in data[row]...

Python IndexError:在VCF中查找SNP时列出索引超出范围【代码】

大家好,我应该使用Python脚本从vcf文件中的csv文件中的指定位置识别可能的SNP.我刚开始使用python,可悲的是,我总是得到以下错误:Traceback (most recent call last):File "getSNPs.py", line 20, in <module> oo = line[2] + "_" +line[3]IndexError: list index out of range from the following script!/bin/python usage: python getSNPs.py your.vcf PhenoSNPs.csv码:import sys import gzipSNPs = {}for i in gzip.open(...

python-如何在多索引熊猫数据框中获取随机样本?【代码】

我有一个根据以下变量建立索引的数据框:NAME-日期.名称是某种奇怪的ID,日期是..日期. 数据非常大,我想检查一下随机选择的NAME的数据. 那是, >从可能的名称中随机选择一个名称>按时间顺序检查该NAME的数据. 我不知道该怎么做.我看到我们可以使用get_level_values,但是我没有特定的名称,我只是想多次调用随机样本. 任何帮助表示赞赏!谢谢!解决方法: import pandas as pd import numpy as np import random import stringdf = pd.D...

python-将多索引DataFrame的行合并为逗号分隔的列表【代码】

给定一个多索引DataFrame,我想组合重复的索引对并将其值列出为逗号分隔的列表.例如,输入:df = pd.DataFrame({'Last Name' : ['Deere','Deere','Foo' ,'Foo' ,'Man' ],'First Name': ['John' ,'Jane' ,'Kung' ,'Kung' ,'Karate'],'Value1': [ 1 , 2 , 3 , 4 , 5 ],'Value2': ['Green','Blue' ,'Yellow','Black','Purple']})df.set_index(['Last Name','First Name'],inplace=True)提供:Value...

python-IndexError:数组的索引过多.具有42个特征的块状数组不均一【代码】

我正在尝试实例化测试集进行分类,加载具有41个特征和1个标签的数据集:import numpy as npf = open("mydataset") dataset = np.genfromtxt(f, delimiter=',', dtype=None)X = dataset[:, 0:40] # select columns 1 through 41 y = dataset[:, 41] # select column 42 (the labels)由于mydataset不是同质的(并非所有元素都具有相同的类型),因此genfromtxt函数可创建一维数组(元组列表).所以我得到这个错误:X = dataset[:, 0:40] ...

python-如何对齐多个数据框的索引并填写熊猫中各自的缺失值?【代码】

我有4个具有类似日期时间索引的数据的数据框,但是在每个数据框中都缺少几行,我知道可以使用以前的已知数据来填补空白. 我想“对齐”这些数据框,以便它们具有所有数据框的索引的并集并填充缺少的值.我知道如何针对2个数据帧执行此操作:df1,df2 = df1.align(df2,axis = 0,method =’pad’),但是对2个以上的数据框执行此操作的好方法是什么? 我已经尝试过了,它确实有效:df1 = pd.DataFrame({'values': 1}, index=pd.DatetimeIndex(...

python-使用句号选择/切片多索引数据帧时间序列会导致错误?【代码】

我有一个多级索引,它的一级索引是一个时间序列,与下面的索引非常相似:In[168]: rng = pd.date_range('01-01-2000',periods=50,freq='M')In[169]: long_df = pd.DataFrame(np.random.randn(50,4),index = rng, columns=['bar','baz','foo','zoo'])In[170]: long_df = long_df.stack()In[171]: long_df[:10] Out[171]: 2000-01-31 bar 2.079474baz -0.569920foo 1.149012zoo -0.228926 2000-02-29 bar 0.429502baz ...

python-Spotipy-列表索引超出范围【代码】

编写Spotipy脚本以从给定专辑返回专辑曲目,我偶尔会遇到错误:album_id = results["albums"]["items"][0]["uri"] IndexError: list index out of range这种错误往往发生在更多的流行歌手遍历所有专辑的时候.我猜结果列表已达到极限或以某种方式乱序.无论哪种方式,我都不确定如何解决它,因为我很确定我从Spotipy网站上获得了album_id.有任何想法吗?#!/usr/bin/python # -*- coding: utf-8 -*-import spotipysp = spotipy.Spotify()...