首页 / 算法 / 数据挖掘算法原理与实践:数据预处理
数据挖掘算法原理与实践:数据预处理
内容导读
互联网集市收集整理的这篇技术教程文章主要介绍了数据挖掘算法原理与实践:数据预处理,小编现在分享给大家,供广大互联网技能从业者学习和参考。文章包含1594字,纯文字阅读大概需要3分钟。
内容图文
第1关:数据集介绍
import pandas as pd
f500 = pd.read_csv('f500.csv',index_col=0)
f500.index.name = None
# 请在此添加代码,分别打印f500的类型和形状大小
#********** Begin **********#
print(type(f500))
print(f500.shape)
#********** End **********#
第5关:值统计的方法
import pandas as pd
f500 = pd.read_csv('f500.csv',index_col=0)
f500.index.name = None
f500_sel = f500.iloc[[0,1,2,3,4,8]]
# 请在此添加代码
#********** Begin **********#
countries = f500_sel["country"]
country_counts = countries.value_counts()
print(countries)
print(country_counts)
#********** End **********#
第6关:通过标签从series中选择项
import pandas as pd
f500 = pd.read_csv('f500.csv',index_col=0)
f500.index.name = None
countries = f500['country']
countries_counts = countries.value_counts()
# 请在此添加代码
#********** Begin **********#
india = countries_counts["India"]
north_america = countries_counts.loc[["USA","Canada","Mexico"]]
print(india)
print(north_america)
#********** End **********#
#********** End **********#
第7关:综合挑战
#i 在educoder.net上测试不了
import pandas as pd
f500 = pd.read_csv('f500.csv',index_col=0)
f500.index.name = None
#i-------------
countries = f500['country']
countries_counts = countries.value_counts()
#india = countries_counts["India"]
#north_america = countries_counts.loc[["USA","Canada","Mexico"]]
# 请在此添加代码
#********** Begin **********#
big_movers = f500.loc[["Aviva","HP","JD.com","BHP Billiton"],["rank","previous_rank"]]
print(big_movers)
bottom_companies = f500.loc["National Grid":"AutoNation",["rank","sector","country"]]
print(bottom_companies)
#********** End **********#
内容总结
以上是互联网集市为您收集整理的数据挖掘算法原理与实践:数据预处理全部内容,希望文章能够帮你解决数据挖掘算法原理与实践:数据预处理所遇到的程序开发问题。 如果觉得互联网集市技术教程内容还不错,欢迎将互联网集市网站推荐给程序员好友。
内容备注
版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 gblab@vip.qq.com 举报,一经查实,本站将立刻删除。
内容手机端
扫描二维码推送至手机访问。