首页 / PYTHON / python – 关于k折叠交叉验证的建议

python – 关于k折叠交叉验证的建议

内容导读

互联网集市收集整理的这篇技术教程文章主要介绍了python – 关于k折叠交叉验证的建议，小编现在分享给大家，供广大互联网技能从业者学习和参考。文章包含1135字，纯文字阅读大概需要2分钟。

内容图文

我目前正在使用以下代码执行使用支持向量机分类的dicom图像的交叉验证方法：

    #Cross Validation using k-folds
    clf = svm.SVC(kernel='linear')
    scores = cross_validation.cross_val_score(clf,X,Y,cv=16))
    print scores
    print("Accuracy: %0.2f (+/- %0.2f)" % (scores.mean(),scores.std()*2))

正如你所看到的,我目前正在使用16折,我怎样才能找到最好的折叠量？这是更好的情况吗？

此外,我发现在使用交叉验证时,我的准确度得分从66％到100％不等,通常平均准确度为82％ – 85％.关于如何改进这个并且可能确保分类器从每个类中挑选相同数量的图像,是否有任何建议？

对不起,我是Python新手！

谢谢你的建议！

解决方法:

尝试使用GridSearchCV.例如,我可以创建一个管道,如

pipeline = Pipeline([

    ('clf', LogisticRegression())
    ])

    parameters = {

        'clf__C': (0.1, 1, 10, 20, 30)
    }

所以,这里我为我的LogisticRegression()分类器的C参数提供了5个不同的选项,在我的管道中由clf表示

当然,您可以使用SVC代替LogisticRegression().然后

grid_search = GridSearchCV(pipeline, parameters, n_jobs=3, verbose=1, scoring='accuracy')

然后就像是

bestParameters = grid_search.best_estimator_.get_params()
    for param_name in sorted(parameters.keys()):
        print ('\t %s: %r' % (param_name, bestParameters[param_name]))

将为您提供最佳的选项集

内容总结

以上是互联网集市为您收集整理的python – 关于k折叠交叉验证的建议全部内容，希望文章能够帮你解决python – 关于k折叠交叉验证的建议所遇到的程序开发问题。如果觉得互联网集市技术教程内容还不错，欢迎将互联网集市网站推荐给程序员好友。

内容备注

版权声明：本文内容由互联网用户自发贡献，该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容，请发送邮件至 gblab@vip.qq.com 举报，一经查实，本站将立刻删除。

内容手机端

扫描二维码推送至手机访问。

本文链接：https://qyyshop.com/info/766066.html

来源：【匿名】

【上一篇】python – 我在matplotlib中的重叠【下一篇】浅谈PHP运行Python脚本的方法

更多 ►

【python – 关于k折叠交叉验证的建议】教程文章相关的互联网学习教程文章

Python 之 sklearn 交叉验证数据拆分

本文K折验证拟采用的是Python 中 sklearn 包中的 StratifiedKFold 方法。方法思想详见：http://scikit-learn.org/stable/modules/cross_validation.htmlStratifiedKFold isa variation of k-fold which returns stratified folds:each set contains approximately the same percentage of samples of each target class as the complete set.【译】StratifiedKFold 是一种将数据集中每一类样本的数据成分，按均等方式拆分的方法。其...

交叉验证以及python代码实现

这篇文章介绍的内容是关交叉验证以及python代码实现，有着一定的参考价值，现在分享给大家，有需要的朋友可以参考一下模型选择的两种方法：正则化（典型方法）、交叉验证。这里介绍交叉验证及其python代码实现。交叉验证如果给定样本数据充足，进行模型选择的一种简单方法是随机地将数据集切分为3部分，分为训练集、验证集和测试集。训练集：训练模型验证集：模型的选择测试集：最终对模型的评估在学习到不同复杂度的模型中，选择...

在Python和R中使用交叉验证方法提高模型性能

在这里，我们试图找到数量和价格之间的关系。为此，我们采取了以下步骤：我们使用线性方程式建立了关系，并为其显示曲线图。从训练数据点来看，第一幅图有很高的误差。在这种情况下，我们的模型无法捕获数据的潜在趋势在第二个图中，我们刚刚发现了价格和数量之间的正确关系，即较低的训练误差在第三个图中，我们发现训练误差几乎为零的关系。这是因为通过考虑数据点中的每个偏差（包括噪声）来建立关系，即模型过于敏感并且捕获...

（标注普尔500证券实战）Python教程之训练测试数据集划分和交叉验证-Train/Test Split and Cross Validation【图】

欢迎各位同学学习python信用评分卡建模视频系列教程（附代码，博主录制）：腾讯课堂报名入口网易云课堂报名入口（微信二维码扫一扫报名）什么是训练和测试分组？这是将数据集分为多个部分。我们使用一个零件训练模型，而在另一个零件上测试其有效性。在本文中，我们的重点是为2种资产之间的关系建模的正确方法。我们将检查债券是否可用作标准普尔500指数的领先指标。目录建模中的数据拆分是什么？什么是训练集？什么是验证集...

K折交叉验证python实现【代码】【图】

用KNN算法训练iris数据，并使用K折交叉验证方法找出最优的K值 import numpy as np from sklearn import datasets from sklearn.neighbors import KNeighborsClassifier from sklearn.model_selection import KFold # 主要用于K折交叉验证# 导入iris数据集 iris = datasets.load_iris() X = iris.data y = iris.target print(X.shape,y.shape)# 定义想要搜索的K值，这里定义8个不同的值 ks = [1,3,5,7,9,11,13,15]# 进行5折交叉验证...

Python-sklearn包中StratifiedKFold和KFold生成交叉验证数据集的区别【代码】

一、StratifiedKFold及KFold主要区别及函数参数KFold交叉采样：将训练/测试数据集划分n_splits个互斥子集，每次只用其中一个子集当做测试集，剩下的（n_splits-1）作为训练集，进行n_splits次实验并得到n_splits个结果。注：对于不能均等分的数据集，前n_samples%n_spllits子集拥有n_samples//n_spllits+1个样本，其余子集都只有n_samples//n_spllits个样本。（例10行数据分3份，只有一份可分4行，其他均为3行）1 sklearn.model_se...

python-如何访问Scikit学习嵌套的交叉验证得分【代码】

我正在使用python,并且希望将嵌套交叉验证与scikit学习一起使用.我发现一个非常好的example：NUM_TRIALS = 30 non_nested_scores = np.zeros(NUM_TRIALS) nested_scores = np.zeros(NUM_TRIALS) # Choose cross-validation techniques for the inner and outer loops, # independently of the dataset. # E.g "LabelKFold", "LeaveOneOut", "LeaveOneLabelOut", etc. inner_cv = KFold(n_splits=4, shuffle=True, random_state=i) ...

python-如何在sklearn中的每个交叉验证模型中计算特征重要性【代码】

我使用RandomForestClassifier()与10倍交叉验证,如下所示.clf=RandomForestClassifier(random_state = 42, class_weight="balanced") k_fold = StratifiedKFold(n_splits=10, shuffle=True, random_state=42) accuracy = cross_val_score(clf, X, y, cv=k_fold, scoring = 'accuracy') print(accuracy.mean())我想确定特征空间中的重要特征.如下所示,对于单个分类而言,获得功能重要性似乎很简单.print("Features sorted by their s...

python – predict_proba用于交叉验证的模型【代码】

我想用Logistic回归模型预测交叉验证的概率.我知道您可以获得交叉验证分数,但是可以从predict_proba而不是分数返回值吗？# imports from sklearn.linear_model import LogisticRegression from sklearn.cross_validation import (StratifiedKFold, cross_val_score,train_test_split) from sklearn import datasets# setup data iris = datasets.load_iris() X = iris.data y = iris.target# setup model cv = StratifiedKFold(y, ...

python – GridSearchCV是否执行交叉验证？

我目前正在研究一个问题,该问题比较了同一数据集上三种不同的机器学习算法性能.我将数据集划分为70/30个训练/测试集,然后使用GridSearchCV和X_train,y_train对每个算法的最佳参数进行网格搜索. 第一个问题,我想在训练集上进行网格搜索还是假设在整个数据集上？第二个问题,我知道GridSearchCV在其实现中使用K-fold,是否意味着如果我在GridSearchCV中使用相同的X_train,y_train进行所有三种算法,我都会执行交叉验证？任何答案都将不...

python – 关于k折叠交叉验证的建议【代码】

我目前正在使用以下代码执行使用支持向量机分类的dicom图像的交叉验证方法：#Cross Validation using k-foldsclf = svm.SVC(kernel='linear')scores = cross_validation.cross_val_score(clf,X,Y,cv=16))print scoresprint("Accuracy: %0.2f (+/- %0.2f)" % (scores.mean(),scores.std()*2))正如你所看到的,我目前正在使用16折,我怎样才能找到最好的折叠量？这是更好的情况吗？此外,我发现在使用交叉验证时,我的准确度得分从66％到...

python – 有没有办法在GridSearchCV中查看交叉验证的折叠？【代码】

我目前正在使用Python中的GridSearchCV进行3倍的cv来优化超参数.我只是想知道是否有任何方法可以在GridSearchCV中使用的cv中查看训练和测试数据的索引？解决方法:如果你不想在CV阶段折叠之前将样品洗牌,你可以.您可以将KFold(或另一个CV类)的实例传递给GridSearchCV构造函数,并像这样访问它的折叠：import pandas as pd import numpy as np from sklearn.model_selection import GridSearchCV from sklearn.linear_model import Lo...

python – sklearn交叉验证符合JoblibValueError【代码】

我正在使用sklearn.cross_validation.cross_val_score来评估我的模型.以下是我的代码的一部分： – """ 5-fold Cross Validation """ print "*** 5-fold Cross Validation" shuffle = ShuffleSplit(len(y), n_iter=5) clf = LinearSVC(penalty = 'l2') print "Doing cross-validation" cv_res = cross_val_score(clf, X, y, cv=shuffle, verbose=2, n_jobs = 6,scoring=precision_recall_fscore_support) print numpy.unique(y) p...

python – 使用交叉验证评估Logistic回归【代码】

我想使用交叉验证来测试/训练我的数据集,并评估逻辑回归模型在整个数据集上的性能,而不仅仅是在测试集上(例如25％). 这些概念对我来说是全新的,我不确定它是否做得对.如果有人能告诉我正确的步骤,我会在错误的地方采取行动,我将不胜感激.我的部分代码如下所示. 另外,如何在当前图形的同一图形上绘制“y2”和“y3”的ROC？谢谢import pandas as pd Data=pd.read_csv ('C:\\Dataset.csv',index_col='SNo') feature_cols=['A','B','...

机器学习基础：(Python)训练集测试集分割与交叉验证【代码】【图】

在上一篇关于Python中的线性回归的文章之后，我想再写一篇关于训练测试分割和交叉验证的文章。在数据科学和数据分析领域中，这两个概念经常被用作防止或最小化过度拟合的工具。我会解释当使用统计模型时，通常将模型拟合在训练集上，以便对未被训练的数据进行预测。在统计学和机器学习领域中，我们通常把数据分成两个子集：训练数据和测试数据，并且把模型拟合到训练数据上，以便对测试数据进行预测。当做到这一点时，可能会发生两...

首页 / PYTHON / python – 关于k折叠交叉验证的建议

python – 关于k折叠交叉验证的建议

内容导读

内容图文

内容总结

内容备注

内容手机端

【python – 关于k折叠交叉验证的建议】教程文章相关的互联网学习教程文章

Python 之 sklearn 交叉验证数据拆分

交叉验证以及python代码实现

在Python和R中使用交叉验证方法提高模型性能

（标注普尔500证券实战）Python教程之训练测试数据集划分和交叉验证-Train/Test Split and Cross Validation【图】

K折交叉验证python实现【代码】【图】

Python-sklearn包中StratifiedKFold和KFold生成交叉验证数据集的区别【代码】

python-如何访问Scikit学习嵌套的交叉验证得分【代码】

python-如何在sklearn中的每个交叉验证模型中计算特征重要性【代码】

python – predict_proba用于交叉验证的模型【代码】

python – GridSearchCV是否执行交叉验证？

python – 关于k折叠交叉验证的建议【代码】

python – 有没有办法在GridSearchCV中查看交叉验证的折叠？【代码】

python – sklearn交叉验证符合JoblibValueError【代码】

python – 使用交叉验证评估Logistic回归【代码】

机器学习基础：(Python)训练集测试集分割与交叉验证【代码】【图】

PYTHON - 相关标签

验证 - 相关标签

PYTHON - 技术教程分类

PYTHON - 最新教程

PYTHON - 最热教程