python – 如何从scikit-learn中的predict_proba中使用cross_val_predict获取类标签
内容导读
互联网集市收集整理的这篇技术教程文章主要介绍了python – 如何从scikit-learn中的predict_proba中使用cross_val_predict获取类标签,小编现在分享给大家,供广大互联网技能从业者学习和参考。文章包含1494字,纯文字阅读大概需要3分钟。
内容图文
![python – 如何从scikit-learn中的predict_proba中使用cross_val_predict获取类标签](/upload/InfoBanner/zyjiaocheng/781/b46a3dbb63ad43b2bbdfc4f3c8e12301.jpg)
我需要使用3倍交叉验证训练Random Forest classifier.对于每个样本,我需要在它恰好位于测试集中时检索预测概率.
我正在使用scikit-learn版本0.18.dev0.
此新版本添加了使用方法cross_val_predict()和附加参数方法来定义估计器需要哪种预测的功能.
在我的情况下,我想使用predict_proba()方法,它返回多类方案中每个类的概率.
但是,当我运行该方法时,我得到预测概率矩阵,其中每行代表一个样本,每列代表特定类的预测概率.
问题是该方法没有指出哪个类对应于每列.
我需要的值与属性classes_中返回的相同(在我的情况下使用RandomForestClassifier)定义为:
classes_ : array of shape = [n_classes] or a list of such arrays
The classes labels (single output problem), or a list of arrays of class labels (multi-output problem).
这是predict_proba()所需要的,因为在其文档中写道:
The order of the classes corresponds to that in the attribute classes_.
最小的例子如下:
import numpy as np
from sklearn.ensemble import RandomForestClassifier
from sklearn.model_selection import cross_val_predict
clf = RandomForestClassifier()
X = np.random.randn(10, 10)
y = y = np.array([1] * 4 + [0] * 3 + [2] * 3)
# how to get classes from here?
proba = cross_val_predict(estimator=clf, X=X, y=y, method="predict_proba")
# using the classifier without cross-validation
# it is possible to get the classes in this way:
clf.fit(X, y)
proba = clf.predict_proba(X)
classes = clf.classes_
解决方法:
是的,它们将按顺序排列;这是因为DecisionTreeClassifier(它是RandomForestClassifier的默认base_estimator)uses np.unique to construct the classes_ attribute,它返回输入数组的排序唯一值.
内容总结
以上是互联网集市为您收集整理的python – 如何从scikit-learn中的predict_proba中使用cross_val_predict获取类标签全部内容,希望文章能够帮你解决python – 如何从scikit-learn中的predict_proba中使用cross_val_predict获取类标签所遇到的程序开发问题。 如果觉得互联网集市技术教程内容还不错,欢迎将互联网集市网站推荐给程序员好友。
内容备注
版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 gblab@vip.qq.com 举报,一经查实,本站将立刻删除。
内容手机端
扫描二维码推送至手机访问。