python – Scikit的LinearSVC分类器的核外培训
内容导读
互联网集市收集整理的这篇技术教程文章主要介绍了python – Scikit的LinearSVC分类器的核外培训,小编现在分享给大家,供广大互联网技能从业者学习和参考。文章包含748字,纯文字阅读大概需要2分钟。
内容图文
你如何训练Scikit的LinearSVC数据集太大或不适合内存?我正在尝试使用它来对文档进行分类,我有几千个标记的示例记录,但是当我尝试将所有这些文本加载到内存中并训练LinearSVC时,它消耗了超过65%的内存而且我被迫在我的系统变得完全没有反应之前杀死它.
是否可以将我的训练数据格式化为单个文件,并使用文件名将其提供给LinearSVC,而不必调用fit()方法?
我找到了this指南,但它只是真正涵盖了分类,并假设训练是逐步完成的,而LinearSVC不支持.
解决方法:
据我所知,像LinearSVC这样的非增量实现需要整个数据集进行训练.除非您创建它的增量版本,否则您可能无法使用LinearSVC.
scikit-learn中有分类器可以逐步使用,就像你在使用SGDClassifier的指南中一样. SGDClassifier具有* partial_fit *方法,允许您批量训练它.还有一些支持增量学习的分类器,如SGDCLassifier,Multinomial Naive Bayes和Bernoulli Naive Bayes
内容总结
以上是互联网集市为您收集整理的python – Scikit的LinearSVC分类器的核外培训全部内容,希望文章能够帮你解决python – Scikit的LinearSVC分类器的核外培训所遇到的程序开发问题。 如果觉得互联网集市技术教程内容还不错,欢迎将互联网集市网站推荐给程序员好友。
内容备注
版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 gblab@vip.qq.com 举报,一经查实,本站将立刻删除。
内容手机端
扫描二维码推送至手机访问。