首页 / 算法 / 机器学习与回归类算法
机器学习与回归类算法
内容导读
互联网集市收集整理的这篇技术教程文章主要介绍了机器学习与回归类算法,小编现在分享给大家,供广大互联网技能从业者学习和参考。文章包含2464字,纯文字阅读大概需要4分钟。
内容图文
![机器学习与回归类算法](/upload/InfoBanner/zyjiaocheng/843/425369acf7ba41269e023398a46015a8.jpg)
一、分类问题(监督学习,选择题)
1.根据数据样本上抽出的特征,判别其属于有限个类别中的哪一个
2.垃圾邮件识别(结果类别:1、垃圾邮件;2、正常邮件)
3.文本情感褒贬分析(结果类别:1、褒;2、贬)
4.图像内容识别(选择题:结果类别:1、喵星人;2、汪星人;3、人类;4、草拟马;5、都不是)
二、回归问题(监督学习,得分)
1.根据数据样本上抽取出的特征,预测连续值的结果
2.《芳华》票房值
3.魔都放假具体值
4.刘德华和吴彦祖的具体颜值得分
三、聚类问题(无监督学习)
1.根据数据样本上抽取出的特征,挖掘数据的关联模式
2.相似用户挖掘/社区发现
3.新闻聚类
四、强化问题:
1.研究如何基于环境而行动,以取得最大的预期利益
2.游戏最高得分
3.机器人完成的任务
五.下图来自周志华老师西瓜书
上图是一个监督学习。我们需要根据西瓜的色泽、根蒂和敲声来判断到底是一个好瓜还是一个坏瓜,最后的结果是两种情况,要么这个西瓜是一个好瓜,要么是一个坏瓜,依据是前面的三列。在上表中,每一行是一个西瓜样本,每一列是一个属性、特征,如西瓜的颜色、敲声和根蒂都是一个特征。即每一行是一个样本,每一列是一个特征。最后一列是我们的标记空间或者输出空间。最后学习到的是一个从x到y的映射,每一种模型只是映射不一样。
六、线性回归
1.何为线性回归
(1)有监督学习=>学习样本为
(2)输出/预测的结果yi为连续值变量(连续纸是一个回归问题)
(3)需要学习映射f:x->y(对于输入的x,可以输出连续值y)
(4)假定输入x和输出y之间有线性相关关系
(5)线性回归:准备了数据集(x,y),用线性表示完成x到y之间的映射f,目的是学习出这样的一个映射,
2.测试/预测阶段
(1)对于给定的x,预测其输出
3.例子
(1)你让一个六年级的孩子在不同同学具体体重多少的情况下,把班上的同学按照体重从轻到重排队。这个孩子会怎么做呢?她可能会通过观察大家的身高和体重来排队。
我们有一个样本,我们把身高和体重以横纵坐标的形式标到二维坐标系中,蓝色的坐标点是一个样本点,线性回归是根据图中随着身高增大,体重在不断增大的趋势,可以表示为下面一个简单的线性表达方式,用一条直线来拟合出一种变换,最终的线性回归如下图。
(2)房价预测:
(1)通过y=ax+b来进行数据的拟合,得到下面的图:
(2)当我们考虑多个变量的 时候,比如房屋面积,卧室个数的时候,拟合的直线就从二维中的直线成为了高维中的平面或者超平面,能得到下面的式子:
这个地方可以将 写成向量的表达形式,
,
这个地方θ和x都是一个列向量,然后将θ做转置操作,就成为了行向量,
上面的θ转置和x做内积,最后的形式就是这种形式
(3)在大量的样本训练集中,总结出来的规律f用在这次未知的房价预估上,预估拿到结果
如上图,我们需要学习这里的训练集,得到一个x到y的映射f,这个f可以有各种形态,在线性回归中,我们给出了一个最简单的线性组合的形态,f(x)=,对于这种形态,可以写成向量化的表达形式,在特征x中加一维x0=1来表示截距,
4.数据驱动=数据+模型
(1)模型=假设函数+优化(让θ一步步让模型朝着拟合更好拟合更准放入方向走)
内容总结
以上是互联网集市为您收集整理的机器学习与回归类算法全部内容,希望文章能够帮你解决机器学习与回归类算法所遇到的程序开发问题。 如果觉得互联网集市技术教程内容还不错,欢迎将互联网集市网站推荐给程序员好友。
内容备注
版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 gblab@vip.qq.com 举报,一经查实,本站将立刻删除。
内容手机端
扫描二维码推送至手机访问。