【python – 复制一些行并更改pandas中的某些值】教程文章相关的互联网学习教程文章

python-Pandas DataFrame获取索引匹配特定条件的行【代码】

我有一个Pandas数据框,从中需要索引匹配特定条件的所有行.数据框具有MultiIndex,并且我需要第一个索引TimeStamp在特定范围内的行. MultiIndex的级别1是一系列DateTime对象.以下代码行用于检查月份是否等于5:compare[compare.index.get_level_values(0).month == 5]但是当我修改代码以检查值在某个数组中的行时compare[compare.index.get_level_values(0).month in [5, 6, 7]]我得到错误ValueError: The truth value of an array w...

python-基于Pandas中的堆栈列延长DataFrame【代码】

我正在寻找实现以下目的的功能.最好在示例中显示.考虑:pd.DataFrame([ [1, 2, 3 ], [4, 5, np.nan ]], columns=['x', 'y1', 'y2'])看起来像:x y1 y2 0 1 2 3 1 4 5 NaN我想折叠y1和y2列,在必要时加长DataFame,以便输出为:x y 0 1 2 1 1 3 2 4 5 也就是说,对于x和y1或x和y2之间的每个组合,需要一行.我正在寻找一个功能相对有效的函数,因为我有多个y和许多行.解决方法:这是基于NumPy的,您在寻找性能时-...

Python Pandas:为源列的每个不同值创建一个新列(布尔输出作为列值)【代码】

我试图根据其内容将数据框的源列分为几列,然后以以下方式用布尔值1或0填充此新生成的列: 原始数据框:ID source_column A value 1 B NaN C value 2 D value 3 E value 2生成以下输出:ID source_column value 1 value 2 value 3 A value 1 1 0 0 B NaN 0 0 0 C value 2 0 1 0 D value 3 ...

python-用字典值覆盖pandas DataFrame列,其中字典键与非索引列匹配?【代码】

我有一个DataFrame df和一个dict d,像这样:>>> dfa b 0 5 10 1 6 11 2 7 12 3 8 13 4 9 14 >>> d = {6: 22, 8: 26}对于字典中的每个(键,val),我想查找a列与键匹配的行,并用值覆盖其b列.例如,在这种特定情况下,第1行中b的值将更改为22,而在第3行中b的值将更改为26. 我应该怎么做?解决方法:假设可以将新值传播到与a列匹配的所有行(如果a列中有重复项),则:for a_val, b_val in d.iteritems():df['b'][df.a==a_val] = b...

python-diff()的Pandas反向【代码】

我已经改变了值,但是我无法使用diffinv()来区别它ds_sqrt=np.sqrt(ds)ds_sqrt=pd.DataFrame(ds_sqrt)ds_diff=ds_sqrt.diff().values谁能说出如何与众不同?解决方法:您可以通过numpy做到这一点.算法courtesy of @Divakar. 当然,您需要知道系列中的第一项才能起作用.df = pd.DataFrame({'A': np.random.randint(0, 10, 10)}) df['B'] = df['A'].diff()x, x_diff = df['A'].iloc[0], df['B'].iloc[1:] df['C'] = np.r_[x, x_diff].cu...

python-根据正则表达式字典填充Pandas DataFrame列【代码】

我有一个如下数据框:GE GO 1 AD Weiss 2 KI Ruby 3 OH Port 4 ER Rose 5 KI Rose 6 JJ Weiss 7 OH 7UP 8 AD 7UP 9 OP Coke 10 JJ Stout并且我正在尝试根据GO列的值添加一列.我当时正在考虑使用字典,但是在我的真实情况下,我需要使用正则表达式来识别部分匹配项.例如:Dic={'Weiss|\wuby|Sto\w+':'Beer', 'Port|Rose':'Wine','\dUP|Coke':'Soda'}这会给GE GO OUT 1 A...

python-如何使用Pandas根据实际日期查找一年中的天数?【代码】

我的数据框数据有一个日期变量dateOpen,其格式为date_format =“%Y-%m-%d%H:%M:%S.%f”,我想创建一个名为openDay的新列,即基于一年365天的天数.我尝试应用以下内容data['dateOpen'] = [datetime.strptime(dt, date_format) for dt in data['dateOpen']] data['openDay'] = [dt.day for dt in data['dateOpen']]但是,我得到了当月的一天.例如,如果日期为2013-02-21 10:12:14.3,则上面的公式将返回21.但是,我希望它返回52...

使用Pandas在python中读取csv文件时出错【代码】

这个问题已经在这里有了答案: > Windows path in Python 3个 products = pd.read_csv('C:\amazon_baby.csv')Traceback (most recent call last): File “”, line 1, inproducts = pd.read_csv(‘C:\amazon_baby.csv’) File“C:\Users\kvsn\Anaconda3\lib\site-packages\pandas\io\parsers.py”, line562, in parser_freturn _read(filepath_or_buffer, kwds) File“C...

python-将字符串的列转换为以pandas列出【代码】

我在pandas数据框中的某个列的类型有问题.基本上,该列以字符串形式保存在csv文件中,我想将其用作元组,以便能够将其转换为数字列表.接下来是一个非常简单的csv:ID,LABELS 1,"(1.0,2.0,2.0,3.0,3.0,1.0,4.0)" 2,"(1.0,2.0,2.0,3.0,3.0,1.0,4.0)"如果使用“ read_csv”函数加载它,则会得到字符串列表.我试图转换为列表,但是得到了字符串的列表版本:df.LABELS.apply(lambda x: list(x))收益:['(','1','.','0',.,.,.,.,.,'4','.','0'...

python-为什么在使用pandas apply时会出现AttributeError?【代码】

如何根据条件将NaN值转换为分类值.尝试转换Nan值时出现错误.category gender sub-category titlehealth&beauty NaN makeup lipbalmhealth&beauty women makeup lipstickNaN NaN NaN lipgloss我的DataFrame看起来像这样.我将性别的NaN值转换为分类值的函数看起来像def impute_gender(cols):category=cols[0]sub_category=cols[2]gende...

python-MultiIndex pandas DataFrame的嵌套字典(3级)【代码】

我想做一个等效的三层嵌套字典 Nested dictionary to multiindex dataframe where dictionary keys are column labels解决方法:以三级字典为例In [1]: import pandas as pdIn [2]: dictionary = {'A': {'a': {1: [2,3,4,5,6],...: 2: [2,3,4,5,6]},...: 'b': {1: [2,3,4,5,6],...: 2: [2,3,4,5,6]}},...: 'B': {'a': {1: [2,3,4,5,6],...:...

python-重新格式化pandas DataFrame【代码】

我有一个pandas.DataFrame,其中包含以下数据:country branch Name salary mobile no emailidx a aa 250000 Null Nullx b bb 350000 8976646410 xx@xx.comy c cc 450000 8777945411 yy@yy.comy d dd 589630 Null Null根据某些条件,我过...

如何使用python pandas从Docker容器访问CSV文件(位于pc hdd中)?【代码】

我想实现一种机器学习算法,该算法可以使用PySEAL库对同态数据进行操作. PySEAL库作为docker容器发布,带有一个“ examples.py”文件,其中显示了一些同态加密示例.我想编辑“ examples.py”文件以实现ML算法.我试图以这种方式导入CSV文件-dataset = pd.read_csv ('Dataset.csv')我已经成功导入了熊猫图书馆.我尝试了许多导入CSV文件的方法,但均失败了.如何导入? 我是Docker的新手.详细的过程将非常有帮助.解决方法:您可以通过Docker...

在Python Pandas DataFrame中插入行【代码】

(我是python的新手,对我犯的任何错误深表歉意,希望你能理解我) 我搜索了一种在Python中将行插入到Pandas DataFrame中的方法,并且发现了这一点: add one row in a pandas.DataFrame 我已经使用了fred在该主题的可接受答案中提供的代码,但是该代码覆盖了我的行:我的代码(在某些情况下,为每列插入一个值为“ -1”的行):df.loc[i+1] = [-1 for n in range(len(df.columns))]如何使代码插入一行而不覆盖它?例如,如果我有一个50行的D...

python-如何在Pandas列中的唯一名称上使用groupby和cumcount【代码】

我有一个看起来像这样的数据框ID ..... config_name config_version ... aa A 0 ab A 7ad A 7ad A 27 bb B 0 cc C 0 cd C 8 我想对config_name进行分组,并在每个唯一的config_version上应用cumcount,以便获得诸如ID ....