【Python:如何从pandas系列中获取字典中的值】教程文章相关的互联网学习教程文章

python – 使用geopy pandas坐标的新列【代码】

我有一个df:import pandas as pd import numpy as np import datetime as DT import hmac from geopy.geocoders import Nominatim from geopy.distance import vincentydfcity_name state_name county_name 0 WASHINGTON DC DIST OF COLUMBIA 1 WASHINGTON DC DIST OF COLUMBIA 2 WASHINGTON DC DIST OF COLUMBIA 3 WASHINGTON DC DIST OF COLUMBIA 4 WASHINGTON DC DIST OF COLUMBIA 5 WASHINGTON...

python – 为pandas.DataFrame复制GROUP_CONCAT【代码】

我有一个pandas DataFrame df:+------+---------+ | team | user | +------+---------+ | A | elmer | | A | daffy | | A | bugs | | B | dawg | | A | foghorn | | B | speedy | | A | goofy | | A | marvin | | B | pepe | | C | petunia | | C | porky | +------+--------- 我想找到或编写一个函数来返回我将在MySQL中使用以下命令返回的...

python – pandas.factorize在整个数据框架上【代码】

pandas.factorize将输入值编码为枚举类型或分类变量. 但是,如何轻松高效地转换数据框的多列?反向映射步骤怎么样? 示例:此数据框包含具有字符串值的列,例如“类型2”,我想将其转换为数值 – 并可能稍后将其转换回来. 解决方法:如果需要分别对每列进行分解,可以使用apply:df = pd.DataFrame({'A':['type1','type2','type2'],'B':['type1','type2','type3'],'C':['type1','type3','type3']})print (df)A B C 0 type1 ...

python – 将索引上的数据帧与pandas合并【代码】

我有两个数据帧,每个数据帧有两个索引列.我想合并它们.例如,第一个数据帧如下:V1A 1/1/2012 122/1/2012 14 B 1/1/2012 152/1/2012 8 C 1/1/2012 172/1/2012 9第二个数据帧如下:V2A 1/1/2012 153/1/2012 21 B 1/1/2012 242/1/2012 9 D 1/1/2012 72/1/2012 16结果我想得到以下内容:V1 V2A 1/1/2012 12 152/1/2012 14 N/A3/1/20...

python – 从pandas中的dataframe列中删除空间【代码】

参见英文答案 > Removing space in dataframe python 2个我试图从我拥有的数据框中删除空格.列名称如下所示.我试图获取名称之间的空格,并将其替换为“_”,无论何时出现.['join_date' 'fiscal_quarter' 'fiscal_year' 'primary_channel''secondary_channel' 'customer_count' 'new_members' 'revisit_next_day''revisit_14_day' 'demand_1yr' 'revisit_next_day_rate''revisit_14_day_rate' 'de...

python – 如何使pandas dataframe列标题全部小写?【代码】

我想让我的pandas数据框中的所有列标题都小写 例 如果我有:data =country country isocode year XRAT tcgdp 0 Canada CAN 2001 1.54876 924909.44207 1 Canada CAN 2002 1.56932 957299.91586 2 Canada CAN 2003 1.40105 1016902.00180 ....我想通过做类似的事情将XRAT改为xrat:data.headers.lowercase()所以我得到:country country isocode year xrat ...

Python:在pandas数据帧上使用多处理【代码】

我想在大型数据集上使用多处理来查找两个gps点之间的距离.我构建了一个测试集,但是我无法使用多处理来处理这个集合.import pandas as pd from geopy.distance import vincenty from itertools import combinations import multiprocessing as mpdf = pd.DataFrame({'ser_no': [1, 2, 3, 4, 5, 6, 7, 8, 9, 0],'co_nm': ['aa', 'aa', 'aa', 'bb', 'bb', 'bb', 'bb', 'cc', 'cc', 'cc'],'lat': [1, 2, 3, 4, 5, 6, 7, 8, 9, 10],'lon...

python – Pandas将csv dateint列读取到datetime【代码】

我是StackOverflow和pandas的新手.我正在尝试使用以下格式读取包含股票市场数据的大型CSV文件:date,time,open,high,low,close,volume,splits,earnings,dividends,sym 20130625,715,49.2634,49.2634,49.2634,49.2634,156.293,1,0,0,JPM 20130625,730,49.273,49.273,49.273,49.273,208.39,1,0,0,JPM 20130625,740,49.1866,49.1866,49.1866,49.1866,224.019,1,0,0,JPM 20130625,745,49.321,49.321,49.321,49.321,208.39,1,0,0,JPM 20...

python – 使用动态名称在pandas中创建新的数据框也添加新列【代码】

我有一个数据帧dfdf = pd.DataFrame({'A':['-a',1,'a'], 'B':['a',np.nan,'c'],'ID':[1,2,2],'t':[pd.tslib.Timestamp.now(),pd.tslib.Timestamp.now(),np.nan]})添加了一个新列df['YearMonth'] = df['t'].map(lambda x: 100*x.year + x.month)现在我想编写一个函数或宏来做日期比较,创建一个新的数据帧也为数据帧添加一个新列. 我试过这样但看起来我错了:def test(df,ym):df_new=dfif(ym <= df['YearMonth']):df_new+"_"+ym=df_n...

使用python中的pandas,将年月日和小时的日期分隔在单独的列中【代码】

参见英文答案 > Parsing DD MM YY HH MM SS columns from TXT file using Python’s pandas 1个看完之后Parse dates when YYYYMMDD and HH are in separate columns using pandas in Python和Using python pandas to parse CSV with date in format Year, Day, Hour, Min, Sec 我仍然无法用年,月,日和小时的分隔列解析日期.我的数据看起来像这样(第0列是ID,第一个是年份,第二个是月份,第三个是...

为什么python pandas不使用3值逻辑?【代码】

参见英文答案 > Why do “Not a Number” values equal True when cast as boolean in Python/Numpy? 4个我想知道为什么python pandas / numpy没有实现具有true,false和NA的3值逻辑(所谓的?ukasiewicz的逻辑)(就像例如R一样).我已经读过(https://www.oreilly.com/learning/handling-missing-data)这在某种程度上是由于pandas使用了比R更多的基本数据类型的事实.但是,这对我来说并不完全清楚为什...

为什么pandas在python中的合并速度比2012年R中的data.table合并更快?

我最近遇到了用于python的pandas库,根据this benchmark,它执行非常快速的内存合并.它甚至比R中的data.table软件包(我选择的分析语言)更快. 为什么pandas比data.table快得多?是因为python具有超过R的固有速度优势,还是有一些我不知道的权衡?有没有办法在data.table中执行内部和外部联接而不诉诸合并(X,Y,all = FALSE)和合并(X,Y,all = TRUE)? 这是用于对各种包进行基准测试的R code和Python code.解决方法:看起来Wes可能在data.t...

python – 将列表转换为pandas中的datetime【代码】

我有这个人.大熊猫名单:str = jan_1 jan_15 feb_1 feb_15 mar_1 mar_15 apr_1 apr_15 may_1 may_15 jun_1 jun_15 jul_1 jul_15 aug_1 aug_15 sep_1 sep_15 oct_1 oct_15 nov_1 nov_15 dec_1 dec_15有没有办法将其转换为日期时间? 我试过了:pd.to_datetime(pd.Series(STR))解决方法:您必须在调用pd.to_datetime时指定format参数.尝试pd.to_datetime(pd.Series(s), format='%b_%d')这给了0 19...

python – 从pandas中的字符串中删除字符【代码】

我有一个类似的问题:Pandas DataFrame: remove unwanted parts from strings in a column. 所以我用过:temp_dataframe['PPI'] = temp_dataframe['PPI'].map(lambda x: x.lstrip('PPI/'))大多数项目都以’PPI /’开头,但不是全部.似乎没有’PPI /’后缀的项目遇到此错误:AttributeError: ‘float’ object has no attribute ‘lstrip’我在这里错过了什么吗?解决方法:使用replace:temp_dataframe['PPI'].replace('PPI/','',reg...

python – 将pandas._period.Period类型的列名转换为小写【代码】

我有一个带有列名的数据集’City’2000-01,2000-02,2000-03,2000-04,2000-05,......,2010-08,2010-09,2010-10,2010-11,2010-12.我使用以下代码并将列名称作为2000Q1 , 2000Q2, 2000Q3, ......, 2010Q4在pandas._period.Period数据类型中.def Problem():hd = pd.read_csv('City.csv')hd = hd.groupby(pd.PeriodIndex(hd.columns, freq='Q'), axis =1).mean()return hd Problem()我希望列为2000q1, 2000q2, 2000q3, ....... ,2010q4我...

字典 - 相关标签