Python pandas重复值错误
内容导读
互联网集市收集整理的这篇技术教程文章主要介绍了Python pandas重复值错误,小编现在分享给大家,供广大互联网技能从业者学习和参考。文章包含2159字,纯文字阅读大概需要4分钟。
内容图文
![Python pandas重复值错误](/upload/InfoBanner/zyjiaocheng/770/8ed236016da6424b8d7dd8c25529f2b7.jpg)
我有一个大的制表符分隔数据文件,我想使用pandas“read_csv或’read_table’函数在python中读取它.当我读这个大文件时,它显示以下错误,即使关闭”index_col“值.
>>> read_csv("test_data.txt", sep = "\t", header=0, index_col=None)
Traceback (most recent call last):
File "<stdin>", line 1, in <module>
File "/Library/Frameworks/EPD64.framework/Versions/7.3/lib/python2.7/site-packages/pandas/io/parsers.py", line 187, in read_csv
return _read(TextParser, filepath_or_buffer, kwds)
File "/Library/Frameworks/EPD64.framework/Versions/7.3/lib/python2.7/site-packages/pandas/io/parsers.py", line 160, in _read
return parser.get_chunk()
File "/Library/Frameworks/EPD64.framework/Versions/7.3/lib/python2.7/site-packages/pandas/io/parsers.py", line 613, in get_chunk
raise Exception(err_msg)
Exception: Implicit index (columns 0) have duplicate values [372, 1325, 1497, 1636, 2486,<br> 2679, 3032, 3125, 4261, 4669, 5215, 5416, 5569, 5783, 5821, 6053, 6597, 6835, 7485, 7629, 7684, 7827, 8590, 9361, 10194, 11199, 11707, 11782, 12397, 15134, 15299, 15457, 15637, 16147, 17448,<br> 17659, 18146, 18153, 18398, 18469, 19128, 19433, 19702, 19830, 19940, 20284, 21724, 22764, 23514, 25095, 25195, 25258, 25336, 27011, 28059, 28418, 28637, 30213, 30221, 30574, 30611, 30871, 31471, .......
我以为我的数据中可能有重复值,因此使用grep将其中一些值重定向到文件中.
grep "9996744\|9965107\|740645\|9999752" test_data.txt > delnow.txt
现在,当我读到这个文件时,它正确读取,如下所示.
>>> read_table("delnow.txt", sep = "\t", header=0, index_col=None)
<class 'pandas.core.frame.DataFrame'>
Int64Index: 20 entries, 0 to 19
Data columns:
0740645 20 non-null values
M 20 non-null values
BLACK/CAPE VERDEAN 20 non-null values
这里发生了什么?我正在努力寻求解决方案,但无济于事.
我还尝试在unix中使用’uniq’命令来查看是否存在重复行但找不到任何行.
它是否必须使用大小的东西?
我正在使用以下版本的熊猫
>>> pandas.__version__
'0.7.3'
>>>
解决方法:
已安装的熊猫最新版本.
我现在能读.
>>> import pandas
>>> pandas.__version__
'0.8.1'
内容总结
以上是互联网集市为您收集整理的Python pandas重复值错误全部内容,希望文章能够帮你解决Python pandas重复值错误所遇到的程序开发问题。 如果觉得互联网集市技术教程内容还不错,欢迎将互联网集市网站推荐给程序员好友。
内容备注
版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 gblab@vip.qq.com 举报,一经查实,本站将立刻删除。
内容手机端
扫描二维码推送至手机访问。