Python Reference in Data Analysis / Mining Tools
内容导读
互联网集市收集整理的这篇技术教程文章主要介绍了Python Reference in Data Analysis / Mining Tools,小编现在分享给大家,供广大互联网技能从业者学习和参考。文章包含3956字,纯文字阅读大概需要6分钟。
内容图文
If you are already familiar with the module/package loading methods of Python, the following table is relatively easy to find.
Python is referenced in the following table as a module. Some modules are not native modules. Please use pip install * to install;
Mechine Learning
|
Connector & IO
Database
Category | Python |
---|---|
MySQL | mysql-connector-python(Official) |
Oracle | cx_Oracle |
Redis | redis |
MongoDB | pymongo |
neo4j | py2neo |
Cassandra | cassandra-driver |
ODBC | pyodbc |
JDBC | Unknown[Jython Only] |
IO
Category | Python |
---|---|
excel | xlsxWriter, pandas.(from/to)_excel, openpyxl |
csv | csv.writer |
json | json |
picture | PIL |
Statistics
Category | Python |
---|---|
描述性统计汇总 | scipy.stats.descirbe |
均值 | scipy.stats.gmean(几何平均数), scipy.stats.hmean(调和平均数), numpy.mean, numpy.nanmean, pandas.Series.mean |
中位数 | numpy.median, numpy.nanmediam, pandas.Series.median |
众数 | scipy.stats.mode, pandas.Series.mode |
分位数 | numpy.percentile, numpy.nanpercentile, pandas.Series.quantile |
经验累积函数(ECDF) | statsmodels.tools.ECDF |
标准差 | scipy.stats.std, scipy.stats.nanstd, numpy.std, pandas.Series.std |
方差 | numpy.var, pandas.Series.var |
变异系数 | scipy.stats.variation |
协方差 | numpy.cov, pandas.Series.cov |
(Pearson)相关系数 | scipy.stats.pearsonr, numpy.corrcoef, pandas.Series.corr |
峰度 | scipy.stats.kurtosis, pandas.Series.kurt |
偏度 | scipy.stats.skew, pandas.Series.skew |
直方图 | numpy.histogram, numpy.histogram2d, numpy.histogramdd |
Regression (including statistics and machine learning)
类别 | Python |
---|---|
普通最小二乘法回归(ols) | statsmodels.ols, sklearn.linear_model.LinearRegression |
广义线性回归(gls) | statsmodels.gls |
分位数回归(Quantile Regress) | statsmodels.QuantReg |
岭回归 | sklearn.linear_model.Ridge |
LASSO | sklearn.linear_model.Lasso |
最小角回归 | sklearn.linear_modle.LassoLars |
稳健回归 | statsmodels.RLM |
Hypothetical Test
类别 | Python |
---|---|
t检验 | statsmodels.stats.ttest_ind, statsmodels.stats.ttost_ind, statsmodels.stats.ttost.paired; scipy.stats.ttest_1samp, scipy.stats.ttest_ind, scipy.stats.ttest_ind_from_stats, scipy.stats.ttest_rel |
ks检验(检验分布) | scipy.stats.kstest, scipy.stats.kstest_2samp |
wilcoxon(非参检验,差异检验) | scipy.stats.wilcoxon, scipy.stats.mannwhitneyu |
Shapiro-Wilk正态性检验 | scipy.stats.shapiro |
Pearson相关系数检验 | scipy.stats.pearsonr |
Time series
Category | Python |
---|---|
AR | statsmodels.ar_model.AR |
ARIMA | statsmodels.arima_model.arima |
VAR | statsmodels.var_model.var |
原文:https://www.cnblogs.com/aiden-liu/p/10773803.html
内容总结
以上是互联网集市为您收集整理的Python Reference in Data Analysis / Mining Tools全部内容,希望文章能够帮你解决Python Reference in Data Analysis / Mining Tools所遇到的程序开发问题。 如果觉得互联网集市技术教程内容还不错,欢迎将互联网集市网站推荐给程序员好友。
内容备注
版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 gblab@vip.qq.com 举报,一经查实,本站将立刻删除。
内容手机端
扫描二维码推送至手机访问。