【Python:如何从pandas系列中获取字典中的值】教程文章相关的互联网学习教程文章

python – Pandas将Dataframe拆分为两个Dataframe【代码】

我有pandas DataFrame,我是用concat编写的.一行由96个值组成,我想从值72中拆分DataFrame. 这样一行的前72个值存储在Dataframe1中,而下一个24个值存储在Dataframe2中. 我创建我的DF如下:temps = DataFrame(myData) datasX = concat( [temps.shift(72), temps.shift(71), temps.shift(70), temps.shift(69), temps.shift(68), temps.shift(67),temps.shift(66), temps.shift(65), temps.shift(64), temps.shift(63), temps.shift(62...

Python:使用pandas逐列缩放数字【代码】

我有一个Pandas数据框’df’,其中我想逐列执行一些缩放. >在列’a’中,我需要将最大数字设置为1,将最小数字设置为0,并将所有其他数字相应地进行扩展.>但是,在“b”列中,我需要将最小数字设置为1,将最大数字设置为0,并将所有其他数字相应地进行传播. 是否有Pandas功能来执行这两个操作?如果没有,numpy肯定会.a b A 14 103 B 90 107 C 90 110 D 96 114 E 91 114解决方法:您可以减去最小值,然后除以最大值(当...

python – 向具有特定索引名称的Pandas DataFrame添加新行【代码】

我正在尝试使用特定索引名称“e”向DataFrame添加新行.number variable values a NaN bank true b 3.0 shop false c 0.5 market true d NaN government true 我尝试了以下但是它创建了一个新列而不是一个新行.new_row = [1.0, 'hotel', 'true'] df = df.append(new_row)仍然不明白如何插入具有特定索引的行.将不胜感激任何建议.解决方法:您可以...

python – Pandas:pivot和pivot_table之间的区别.为什么只有pivot_table工作?【代码】

我有以下数据帧.df.head(30)struct_id resNum score_type_name score_value 0 4294967297 1 omega 0.064840 1 4294967297 1 fa_dun 2.185618 2 4294967297 1 fa_dun_dev 0.000027 3 4294967297 1 fa_dun_semi 2.185591 4 4294967297 1 ref -1.191180 5 4294967297 2 rama -0.795161 6 4294967297 ...

python – 从pyodbc读取数据到pandas【代码】

我正在查询SQL数据库,我想使用pandas来处理数据.但是,我不确定如何移动数据.以下是我的输入和输出.import pyodbc import pandas from pandas import DataFramecnxn = pyodbc.connect(r'DRIVER={Microsoft Access Driver (*.mdb, *.accdb)};DBQ=C:\users\bartogre\desktop\CorpRentalPivot1.accdb;UID="";PWD="";') crsr = cnxn.cursor() for table_name in crsr.tables(tableType='TABLE'):print(table_name) cursor = cnxn.cursor...

python – pandas数据帧中的对数返回【代码】

Python pandas有一个pct_change函数,我用它来计算数据帧中股票价格的回报:ndf['Return']= ndf['TypicalPrice'].pct_change()我使用以下代码获取对数返回,但它提供与pct.change()函数完全相同的值:ndf['retlog']=np.log(ndf['TypicalPrice'].astype('float64')/ndf['TypicalPrice'].astype('float64').shift(1)) #np is for numpy解决方法:这是使用.shift()计算日志返回的一种方法.结果与pct_change()计算的总回报相似但不相同.您...

python – 将Pandas数据帧转换为Spark数据帧错误【代码】

我正在尝试将Pandas DF转换为Spark.DF头:10000001,1,0,1,12:35,OK,10002,1,0,9,f,NA,24,24,0,3,9,0,0,1,1,0,0,4,543 10000001,2,0,1,12:36,OK,10002,1,0,9,f,NA,24,24,0,3,9,2,1,1,3,1,3,2,611 10000002,1,0,4,12:19,PA,10003,1,1,7,f,NA,74,74,0,2,15,2,0,2,3,1,2,2,691码:dataset = pd.read_csv("data/AS/test_v2.csv") sc = SparkContext(conf=conf) sqlCtx = SQLContext(sc) sdf = sqlCtx.createDataFrame(dataset)我收到一个...

python – 在pandas数据帧上执行复杂搜索的最快方法【代码】

我试图找出在熊猫数据帧上执行搜索和排序的最快方法.下面是我想要完成的数据帧之前和之后. 之前:flightTo flightFrom toNum fromNum toCode fromCodeABC DEF 123 456 8000 8000DEF XYZ 456 893 9999 9999AAA BBB 473 917 5555 5555BBB CCC 917 341 5555 5555搜索/排序后:flightTo flightFrom toNum fromNum toCode from...

python – Pandas列值到列?【代码】

我已经看到了将一个列/系列爆炸成Pandas数据帧的多个列的主题的一些变化,但我一直在尝试做一些事情而不是真正成功地使用现有的方法. 给定一个像这样的DataFrame:key val id 2 foo oranges 2 bar bananas 2 baz apples 3 foo grapes 3 bar kiwis我想将键系列中的项目转换为列,val值用作值,如下所示:foo bar baz id 2 oranges bananas apples 3 grapes kiwis ...

python – Pandas重采样错误:仅对DatetimeIndex或PeriodIndex有效【代码】

在DataFrame上使用panda的重采样功能以将刻度数据转换为OHLCV时,会遇到重采样错误. 我们该如何解决错误?data = pd.read_csv('tickdata.csv', header=None, names=['Timestamp','Price','Volume']).set_index('Timestamp') data.head()# Resample data into 30min bins ticks = data.ix[:, ['Price', 'Volume']] bars = ticks.Price.resample('30min', how='ohlc') volumes = ticks.Volume.resample('30min', how='sum')这给出了错...

python – 根据数据类型获取pandas数据帧列的列表【代码】

如果我有一个包含以下列的数据框:1. NAME object 2. On_Time object 3. On_Budget object 4. %actual_hr float64 5. Baseline Start Date datetime64[ns] 6. Forecast Start Date datetime64[ns] 我想能够说:这是一个数据帧,给我一个类型为O...

python – 用sklearn扩展的pandas数据帧列【代码】

我有一个带有混合类型列的pandas数据帧,我想将sklearn的min_max_scaler应用于某些列.理想情况下,我想在适当的位置进行这些转换,但还没有想出办法.我编写了以下代码:import pandas as pd import numpy as np from sklearn import preprocessingscaler = preprocessing.MinMaxScaler()dfTest = pd.DataFrame({'A':[14.00,90.20,90.95,96.27,91.21],'B':[103.02,107.26,110.35,114.23,114.68], 'C':['big','small','big','small','sm...

python – 子类化Pandas DataFrame,更新?【代码】

继承还是不继承? Pandas子类化问题的最新内容是什么? (大多数其他线程都是3-4岁). 我希望做点像……import pandas as pdclass SomeData(pd.DataFrame):# MethodspassClsInstance = SomeData()# Create a new column on ClsInstance?解决方法:这就是我做到的.我遵循了以下建议: > subclassing-pandas-data-structures> Fix Finalize Issue 下面的示例仅显示了构建pandas.DataFrame的新子类的用法.如果您遵循我的第一个链接中的建...

python – Pandas pytable:如何指定MultiIndex元素的min_itemsize【代码】

我将pandas数据帧存储为包含MultiIndex的pytable. MultiIndex的第一级是对应于userID的字符串.现在,大多数userID长度为13个字符,但其中一些长度为15个字符.当我追加包含long userID的记录时,pytables会引发错误,因为它需要13个字符的字段.ValueError('Trying to store a string with len [15] in [user] column but\nthis column has a limit of [13]!\nConsider using min_itemsize to preset the sizes on these columns',)但是,...

python – 具有2行标头的pandas数据帧并导出到csv【代码】

我有一个数据帧df = pd.DataFrame(columns = ["AA", "BB", "CC"]) df.loc[0]= ["a", "b", "c1"] df.loc[1]= ["a", "b", "c2"] df.loc[2]= ["a", "b", "c3"]我需要在标题中添加secod行df.columns = pd.MultiIndex.from_tuples(zip(df.columns, ["DD", "EE", "FF"]))我的df现在AA BB CCDD EE FF 0 a b c1 1 a b c2 2 a b c3但是当我将这个数据帧写入csv文件时df.to_csv("test.csv", index = False)我得到的行多于预期AA,B...

字典 - 相关标签