扁平化Python数据框中的条目,例如Apache PIG bag
内容导读
互联网集市收集整理的这篇技术教程文章主要介绍了扁平化Python数据框中的条目,例如Apache PIG bag,小编现在分享给大家,供广大互联网技能从业者学习和参考。文章包含1448字,纯文字阅读大概需要3分钟。
内容图文
我有像这样的数据框:
dem = {
'{(dt-au=120000),(dt-au=120100)}': ['Y'],
'{(dt-au=120000),(dt-au=120400)}': ['N'],
'{(dt-au=120600),(dt-bi=130450)}': ['Y']
};
df = pd.DataFrame(dem)
pd.melt(df)
variable value
0 {(dt-au=120000),(dt-au=120100)} Y
1 {(dt-au=120000),(dt-au=120400)} N
2 {(dt-au=120600),(dt-bi=130450)} Y
我想生成另一个数据框,该数据框的工作方式与PIG的FLATTEN bag函数相同.该数据框如下所示:
variable value
0 dt-au=120000 Y
1 dt-au=120100 Y
2 dt-au=120400 N
3 dt-au=120000 N
4 dt-au=120600 Y
5 dt-bi=130450 Y
注意:dt-au = 120000出现两次,但值不同(Y和N).
我想知道熊猫怎么做.
解决方法:
您可以使用string个熊猫函数:
import pandas as pd
import numpy as np
import io
dem = {
'{(dt-au=120000),(dt-au=120100)}': ['Y'],
'{(dt-au=120000),(dt-au=120400)}': ['N'],
'{(dt-au=120600),(dt-bi=130450)}': ['Y']
};
df = pd.DataFrame(dem)
df = pd.melt(df)
#cast to str, remove {}
df.variable = df.variable.astype(str).str.strip('{}')
s = df['variable'].str.split(',').apply(pd.Series, 1).stack()
s.index = s.index.droplevel(-1)
s.name = 'variable'
#remove ()
s = s.str.strip('()')
print s
0 dt-au=120000
0 dt-au=120100
1 dt-au=120000
1 dt-au=120400
2 dt-au=120600
2 dt-bi=130450
df = df.drop( ['variable'], axis=1)
df = df.join(s).reset_index(drop=True)
print df
value variable
0 Y dt-au=120000
1 Y dt-au=120100
2 N dt-au=120000
3 N dt-au=120400
4 Y dt-au=120600
5 Y dt-bi=130450
内容总结
以上是互联网集市为您收集整理的扁平化Python数据框中的条目,例如Apache PIG bag全部内容,希望文章能够帮你解决扁平化Python数据框中的条目,例如Apache PIG bag所遇到的程序开发问题。 如果觉得互联网集市技术教程内容还不错,欢迎将互联网集市网站推荐给程序员好友。
内容备注
版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 gblab@vip.qq.com 举报,一经查实,本站将立刻删除。
内容手机端
扫描二维码推送至手机访问。