【python – pandas dataframe,按值复制】教程文章相关的互联网学习教程文章

python – 在Pandas DataFrame中查找连续日期组【代码】

我正在尝试从Pandas DataFrame连续日期获取大量数据.我的df看起来如下.DateAnalyzed Val 1 2018-03-18 0.470253 2 2018-03-19 0.470253 3 2018-03-20 0.470253 4 2018-09-25 0.467729 5 2018-09-26 0.467729 6 2018-09-27 0.467729在这个df中,我想得到前3行,做一些处理然后得到最后3行并对其进行处理. 我通过应用以下代码计算了1滞后的差异.df['Delt...

python – 比较多个列以获取两个Pandas Dataframe中不同的行【代码】

我有两个数据帧:df1=A B C 0 A0 B0 C0 1 A1 B1 C1 2 A2 B2 C2df2=A B C 0 A2 B2 C10 1 A1 B3 C11 2 A9 B4 C12我想在df1中找到基于一列或两列(或更多列)在df2中找不到的行.因此,如果我只比较列’A’,则在df2中找不到df1中的以下行(请注意,列’B’和列’C’不用于df1和df2之间的比较)A B C 0 A0 B0 C0我想回一个系列0 False 1 True 2 True或者,如果我只比较列’A’和列’B...

python – pandas.DataFrame corrwith()方法【代码】

我最近开始和熊猫一起工作.任何人都可以用Series和DataFrame来解释函数.corrwith()的行为差异吗? 假设我有一个DataFrame:frame = pd.DataFrame(data={'a':[1,2,3], 'b':[-1,-2,-3], 'c':[10, -10, 10]})我想要计算特征’a’和所有其他特征之间的相关性.我可以通过以下方式完成:frame.drop(labels='a', axis=1).corrwith(frame['a'])结果将是:b -1.0 c 0.0但非常相似的代码:frame.drop(labels='a', axis=1).corrwith(fram...

python – 为什么pandas.DataFrame.apply打印出垃圾?【代码】

考虑这个简单的数据帧:a b 0 1 2 1 2 3我这样执行.apply:In [4]: df.apply(lambda x: [x.values]) Out[4]: a [[140279910807944, 140279910807920]] b [[140279910807944, 140279910807920]] dtype: objectIn [5]: df.apply(lambda x: [x.values]) Out[5]: a [[37, 37]] b [[37, 37]] dtype: objectIn [6]: df.apply(lambda x: [x.values]) Out[6]: a [[11, 11]] b [[11, 11]] dtype: object为什么大熊...

Python pandas dataframe – 以编程方式设置频率的任何方法?【代码】

我正在尝试处理这样的CSV文件:df = pd.read_csv("raw_hl.csv", index_col='time', parse_dates = True)) df.head(2)high low time 2014-01-01 17:00:00 1.376235 1.375945 2014-01-01 17:01:00 1.376005 1.375775 2014-01-01 17:02:00 1.375795 1.375445 2014-01-01 17:07:00 NaN NaN ... 2014-01-01 17:49:00 1.375645 1.375445type(df.index) pandas.tseries.index.DatetimeIndex...

python – pandas DataFrame在布尔掩码上设置值【代码】

我正在尝试在pandas DataFrame中设置许多不同的值,以达到相同的值.我以为我理解了pandas的布尔索引,但是我没有找到关于这个特定错误的任何资源.import pandas as pd df = pd.DataFrame({'A': [1, 2, 3], 'B': ['a', 'b', 'f']}) mask = df.isin([1, 3, 12, 'a']) df[mask] = 30 Traceback (most recent call last): ... TypeError: Cannot do inplace boolean setting on mixed-types with a non np.nan value上面,我想用值30替换...

python – 将DataFrame列标题设置为MultiIndex【代码】

如何将具有单级列的现有数据框转换为具有分层索引列(MultiIndex)? 示例数据帧:In [1]: import pandas as pd from pandas import Series, DataFramedf = DataFrame(np.arange(6).reshape((2,3)),index=['A','B'],columns=['one','two','three']) df Out [1]:one two three A 0 1 2 B 3 4 5我以为reindex()会起作用,但我得到了NaN:In [2]: df.reindex(columns=[['odd','even','odd'],df.columns]) Out [2...

python – Pandas Dataframe:根据地理坐标(经度和纬度)连接范围内的项目【代码】

我有一个包含纬度和经度的地方的数据框.想象一下,例如城市.df = pd.DataFrame([{'city':"Berlin", 'lat':52.5243700, 'lng':13.4105300},{'city':"Potsdam", 'lat':52.3988600, 'lng':13.0656600},{'city':"Hamburg", 'lat':53.5753200, 'lng':10.0153400}]);现在我试图让所有城市都在另一个城市的半径范围内.假设距离柏林500公里,距汉堡500公里等所有城市.我会通过复制原始数据帧并使用距离函数连接来完成此操作. 中间结果有点像这...

python – 将一个for循环应用于Pandas中的多个DataFrame【代码】

我有多个DataFrames,我想做同样的事情. 首先,我创建一个DataFrame列表.所有这些都有相同的列名为’result’.df_list = [df1,df2,df3]我想只保留所有DataFrame中的行’pass’,所以我在列表中使用for循环:for df in df_list:df =df[df['result'] == 'passed']…这不起作用,不会从每个DataFrame中过滤掉这些值. 如果我分别过滤每一个,那么它确实有效.df1 =df1[df1['result'] == 'passed'] df2 =df2[df2['result'] == 'passed'] df3 =...

python – 向pandas DataFrame添加一个包含列的方法【代码】

我有一个pandas DataFrame,包含一些随时间推移的传感器读数,如下所示:diode1 diode2 diode3 diode4 Time 0.530 7 0 10 16 1.218 17 7 14 19 1.895 13 8 16 17 2.570 8 2 16 17 3.240 14 8 17 19 3.910 13 6 17 18 4.594 13 5 16 19 5.265 9 0 12 ...

如何使用正则表达式删除python pandas DataFrame中的行?【代码】

我有一个模式:patternDel = "( \\((MoM|QoQ)\\))";我想删除pandas dataframe中的所有行,其中列df [‘Event Name’]匹配此模式.这是最好的方法吗?数据帧中有超过100k行.解决方法:str.contains()返回一系列布尔值,我们可以使用它来索引我们的帧patternDel = "( \\((MoM|QoQ)\\))" filter = df['Event Name'].str.contains(patternDel)我倾向于保留我们想要的东西而不是删除行.由于filter表示我们要删除的内容,因此我们使用?来获取所...

Python – 将Dataframe中的所有项目转换为字符串【代码】

我遵循以下过程:In Python, how do I convert all of the items in a list to floats?因为我的Dataframe的每一列都是列表,但我选择将所有值更改为字符串而不是浮点数. df = [str(i)for d in df] 但这失败了. 它只删除了除第一行列名之外的所有数据. 然后,在df.values中尝试df = [str(i)for i]导致将整个Dataframe更改为一个大的列表,但这会使数据过于混乱,无法满足我的脚本目标,即导出我的Oracle表的Dataframe. 有没有办法将我的D...

python – 将字符串的Pandas DataFrame转换为直方图【代码】

假设我有一个像这样创建的DataFrame:import pandas as pd s1 = pd.Series(['a', 'b', 'a', 'c', 'a', 'b']) s2 = pd.Series(['a', 'f', 'a', 'd', 'a', 'f', 'f']) d = pd.DataFrame({'s1': s1, 's2', s2})实际数据中的字符串中存在相当多的稀疏性.我想创建字符串出现的直方图,看起来像d.hist()(例如,带有子图)为s1和s2(每个子图一个)生成的字符串. 只是做d.hist()给出了这个错误:/Library/Python/2.7/site-packages/pandas/tool...

python – Pandas将Dataframe转换为嵌套的Json【代码】

我的问题基本上与这个问题相反: Create a Pandas DataFrame from deeply nested JSON 我想知道是否可以做相反的事情.给出如下表:Library Level School Major 2013 Total 200 MS_AVERY UGRAD GENERAL STUDIES GEST 5079 201 MS_AVERY UGRAD GENERAL STUDIES HIST 5 202 MS_AVERY UGRAD GENERAL STUDIES MELC 2 203 MS_AVERY UGRAD GENERAL STUDIES PHIL 10 204 ...

python – 将具有属性和边缘的节点从DataFrame加载到NetworkX【代码】

我是使用Python处理图形的新手:NetworkX.到现在为止我使用过Gephi.标准步骤(但不是唯一可行的)是: >从表格/电子表格加载节点信息;其中一列应该是ID,其余的是关于节点的元数据(节点是人,因此性别,组…通常用于着色).喜欢:id;NormalizedName;Gender per1;Jesús;male per2;Abraham;male per3;Isaac;male per4;Jacob;male per5;Judá;male per6;Tamar;female ...>然后从表/电子表格加载边缘,使用与节点电子表格的列ID中的节点相同的名...