【python – 复制一些行并更改pandas中的某些值】教程文章相关的互联网学习教程文章

python-pandas sort_values函数中axis = 1的含义是什么?【代码】

这个问题已经在这里有了答案: > What does axis in pandas mean? 17个我有以下代码段.df = pd.DataFrame({'col1' : ['A', 'A', 'B', np.nan, 'D', 'C'],'col2' : [2, 1, 9, 8, 7, 4],'col3': [0, 1, 9, 4, 2, 3]}) print(df) sorted=df.sort_values(by=1,axis=1) print(sorted)以上数据为原始数据帧.上面的是df.sort_values()函数的输出. 谁能解释这里发生了什么?解决...

python – pandas和Stata 13个文件【代码】

我安装了pandas 0.13.1,但pandas.read_stata()无法读取以Stata 13格式创建的.dta文件,错误TypeError: cannot concatenate 'str' and 'NoneType' objects使用Stata 12格式保存的相同数据集完全没问题. 我认为最新发布的pandas(0.13.1)处理了Stata 13数据集文件.难道我做错了什么?解决方法:我的猜测是你没有做任何本来就错的事,但是你的熊猫版本无法处理Stata 13数据集文件.如help dta中所述,Stata .dta数据集的格式随着Stata 13的发...

python – 在pandas数据框中展平嵌套的Json【代码】

我正在尝试将json文件加载到pandas数据框.我发现有一些嵌套的json.以下是json示例:{'events': [{'id': 142896214,'playerId': 37831,'teamId': 3157,'matchId': 2214569,'matchPeriod': '1H','eventSec': 0.8935539999999946,'eventId': 8,'eventName': 'Pass','subEventId': 85,'subEventName': 'Simple pass','positions': [{'x': 51, 'y': 49}, {'x': 40, 'y': 53}],'tags': [{'id': 1801, 'tag': {'label': 'accurate'}}]}我使...

python – Pandas XLSWriter – 返回而不是写【代码】

我想从我的Flask(Python)服务器返回一个Excel文件.这段代码:writer = pd.ExcelWriter('filename.xlsx') dataframe.to_excel(writer, index=False) writer.save()将Excel文件写入文件系统.如何返回文件而不是写入文件?解决方法:您可以使用StringIO或BytesIO对象将excel数据写入内存. 此代码从pandas文档here中复制:# Safe import for either Python 2.x or 3.x try:from io import BytesIO except ImportError:from cStringIO im...

在Python和pandas中读取.csv的一般方法是什么?【代码】

我有一个.csv文件,其中包含多列长度的行.import pandas as pd df = pd.read_csv(infile, header=None)返回ParserError: Error tokenizing data. C error: Expected 6 fields in line 8, saw 8错误.我知道我可以使用names=my_cols read_csv调用中的选项,但肯定有更多’pythonic’比那些?此外,这不是一个重复的问题,因为error_bad_lines=False 导致跳过行(这是不希望的). .csv看起来像::Anne,Beth,Caroline,Ernie,Frank,Hannah Beth...

python – 返回在pandas数据帧中出现最小/最大值的索引/索引列表【代码】

我想搜索一个pandas DataFrame以获取最小值.我需要整个数据帧中的min(跨所有值)类似于df.min().min().但是,我还需要知道该值出现的位置的索引. 我尝试了很多不同的方法: > df.where(df ==(df.min().min())),> df.where(df == df.min().min()).notnull()(source)和> val_mask = df == df.min().min(); df [val_mask](source). 这些返回非最小值/布尔值的NaN数据帧,但我无法找到获取这些位置(行,列)的方法. 有没有更优雅的方法来搜索...

python – 使用pd.to_datetime的pandas警告【代码】

使用pandas 0.6.2.我想将数据帧更改为datetime类型,这里是数据帧>>> tt.head() 0 2015-02-01 00:46:28 1 2015-02-01 00:59:56 2 2015-02-01 00:16:27 3 2015-02-01 00:33:45 4 2015-02-01 13:48:29 Name: TS, dtype: object我希望将tt中的每个项目更改为datetime类型,并获取小时.代码是for i in tt.index:tt[i]=pd.to_datetime(tt[i])和waring是__main__:2: SettingWithCopyWarning: A value is trying to be set ...

python – 在pandas中使用iterrows的for循环【代码】

我有2个数据帧如下: data1看起来像这样:id address 1 11123451 2 78947591data2如下所示:lowerbound_address upperbound_address place 78392888 89000000 X 10000000 20000000 Y我想在data1中创建另一个名为“place”的列,其中包含id所在的位置.例如,在上述情况下,对于id 1,我希望place列包含Y,对于id 2,我希望place列包含X.会...

Python:pandas:将行值与列名/键的值匹配【代码】

问题“如何将行值与列名匹配,并在pandas中获取该交叉值” 上下文我们有这样的熊猫df:df = pd.DataFrame([{'name': 'john', 'john': 1, 'mac': 10}, {'name': 'mac', 'john': 2, 'mac': 20}], columns=["name", "john", "mac"])看起来像这样:name | john | mac john | 1 | 10 mac | 2 | 20期望的输出name | john | mac | value john | 1 | 10 | 1 mac | 2 | 20 | 20换句话说,列“值”应该取名称相交的相应列中...

python – 使用多个isin子句进行pandas索引【代码】

如果我想一次对多个列进行is-in测试,我可以这样做:>>> from pandas import DataFrame >>> df = DataFrame({'A': [1, 2, 3], 'B': [1, 4, 7], 'C' : [10, 12, 18]}) >>> mask = df[['A','B']].isin({'A': [1, 3], 'B': [4, 7, 12]}).all(axis=1) >>> df = df[mask]这有效 – 是否有更简洁的解决方案?解决方法:TBH,你目前的做法对我来说很好;我无法通过isin或过滤器来改进它,因为我无法看到如何使用isin仅使用字典中的列或过滤器...

Python – Pandas – 将数据帧写入CSV【代码】

我正在尝试使用pandas将4个表,3列和50行数据帧文件写入csv.我收到以下错误:AttributeError:’dict’对象没有属性’to_csv’.我相信我正在正确地编写语法,但有人能指出我的语法在尝试将数据帧写入csv时不正确吗?'dict' object has no attribute 'to_csv'import pandas as pd import numpy as npdf = pd.read_excel("filelocation.xlsx",sheetname=['pnl1 Data ','pnl2 Data','pnl3 Data','pnl4 Data'],skiprows=8, parse_cols="B...

python – 如何排序降序字母数字pandas索引.【代码】

我有一个pandas数据框,看起来像:df = DataFrame({'id':['a132','a132','b5789','b5789','c1112','c1112'], 'value':[0,0,0,0,0,0,]}) df = df.groupby('id').sum()value id a132 0 b5789 0 c1112 0我想对它进行排序,使它看起来像:value id b5789 0 c1112 0 a132 0它正在查看数字(尽管是字符串)并按降序排序解决方法:一个简单的解决方案是: >拆分索引以提取临时键列中...

删除异常值(/ – 3 std)并用Python / pandas中的np.nan替换【代码】

我已经看到了几个解决我的问题的解决方案 link1link2 但到目前为止他们还没有帮助我成功. 我相信以下解决方案是我需要的,但继续得到错误(我没有声誉点评论/问题):link (我得到以下错误,但我不明白.copy()的位置,或者在管理以下命令时添加“inplace = True”df2 = df.groupby(‘install_site’).transform(replace): SettingWithCopyWarning:尝试在DataFrame的切片副本上设置值.尝试使用.loc [row_indexer,col_indexer] = value ...

python – 将Pandas Column转换为DateTime II【代码】

我试图将DateTime字符串列转换为Pandas可理解的日期时间格式.当然,我已经谷歌搜索并尝试了几种解决方案.Convert Pandas Column to DateTime 这个对我来说似乎是最令人鼓舞的,但两种推荐的方式对我的数据集都不起作用.细节:数据集名称:co, 列:索引列, 格式:15.07.2015 24:00,之前或之后不再有空白. 我的努力:co['newdate'] = pd.to_datetime(co.index, format='%d.%m.%Y %H:%M')在我将Index-col转换为名为“Datum”的“普通”列...

python数据分析——pandas的拼接操作【代码】

pandas的拼接操作pandas的拼接分为两种:级联:pd.concat, pd.append 合并:pd.merge, pd.join 1. 使用pd.concat()级联pandas使用pd.concat函数,与np.concatenate函数类似,只是多了一些参数: objs axis=0 keys join='outer' / 'inner':表示的是级联的方式,outer会将所有的项进行级联(忽略匹配和不匹配),而inner只会将匹配的项级联到一起,不匹配的不级联 ignore_index=False1)匹配级联In?[1]:import numpy as np import pan...