机器学习之softmax回归笔记

内容导读

互联网集市收集整理的这篇技术教程文章主要介绍了机器学习之softmax回归笔记，小编现在分享给大家，供广大互联网技能从业者学习和参考。文章包含1176字，纯文字阅读大概需要2分钟。

内容图文

本次笔记绝大部分转自https://www.cnblogs.com/Luv-GEM/p/10674719.html

softmax回归

Logistic回归是用来解决二类分类问题的，如果要解决的问题是多分类问题呢？那就要用到softmax回归了，它是Logistic回归在多分类问题上的推广。此处神经网络模型开始乱入，softmax回归一般用于神经网络的输出层，此时输出层叫做softmax层。

1、softmax函数

首先介绍一下softmax函数，这个函数可以将一个向量(x₁,x₂,...,x_K)映射为一个概率分布(z₁,z₂,...,z_K)，它将数据的范围映射到（0,1）区间：

技术分享图片

那么在多分类问题中，假设类别标签y∈{1, 2, ..., C}有C个取值，那么给定一个样本x，softmax回归预测x属于类别c的后验概率为：

技术分享图片

其中w_c是第c类的权重向量。

那么样本x属于C个类别中每一个类别的概率用向量形式就可以写为：

技术分享图片

其中W=[w₁,w₂,...,w_C]是由C个类的权重向量组成的矩阵，1表示元素全为1的向量，得到是由所有类别的后验概率组成的向量，第c个元素就是预测为第c类的概率，比如[0.05, 0.01, 0.9, 0.02, 0.02]，预测为第3类。

2、softmax回归的损失函数和梯度下降

one-hot向量：[0,0,0,1,0,...,0,0]这个向量就表示第四个类别标签，1所在的位置就是那个位置的类标签，其它全设置为0。

假设训练数据集为{(x¹,y¹),(x²,y²),...(x^M, y^M)}，即有M个样本，softmax回归使用交叉熵损失函数来学习最优的参数矩阵W，对样本进行分类。

由于涉及到多分类，所以损失函数的表示方法稍微复杂一些。我们用C维的one-hot向量y来表示类别标签。对于类别c，其向量表示为：

技术分享图片

其中表示指示函数。

则softmax回归的交叉熵损失函数为：

技术分享图片

其中表示样本技术分享图片预测为每个类别的后验概率组成的向量。

上面这个式子不太好理解，我们单独拿出一个样本来观察。假设类别有三类，预测一个样本x属于第2类的交叉熵损失为，其中，如果预测正确，如技术分享图片，则交叉熵损失为，而如果预测错误，如，则交叉熵损失为，可见预测错误时损失非常大。

同样的，用梯度下降法对损失函数进行优化求解，首先得到损失技术分享图片对参数向量W的梯度：

技术分享图片

初始化W₀=0，然后对所有参数W_C进行迭代更新，直至收敛。

技术分享图片

参考资料：

1、吴恩达：《机器学习》

2、邱锡鹏：《神经网络与深度学习》

3、 https://blog.csdn.net/u010867294/article/details/79138603

原文：https://www.cnblogs.com/yang901112/p/11559711.html

内容总结

以上是互联网集市为您收集整理的机器学习之softmax回归笔记全部内容，希望文章能够帮你解决机器学习之softmax回归笔记所遇到的程序开发问题。如果觉得互联网集市技术教程内容还不错，欢迎将互联网集市网站推荐给程序员好友。

内容备注

版权声明：本文内容由互联网用户自发贡献，该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容，请发送邮件至 gblab@vip.qq.com 举报，一经查实，本站将立刻删除。

内容手机端

扫描二维码推送至手机访问。

本文链接：https://qyyshop.com/info/1279799.html

来源：【匿名】

【上一篇】ABAP Development Tool IDE里编写的CDS view源代码是如何传递到ABAP后台并解析的【下一篇】打印机如何取消打印任务

更多 ►

【机器学习之softmax回归笔记】教程文章相关的互联网学习教程文章

本次笔记绝大部分转自https://www.cnblogs.com/Luv-GEM/p/10674719.htmlsoftmax回归Logistic回归是用来解决二类分类问题的，如果要解决的问题是多分类问题呢？那就要用到softmax回归了，它是Logistic回归在多分类问题上的推广。此处神经网络模型开始乱入，softmax回归一般用于神经网络的输出层，此时输出层叫做softmax层。1、softmax函数首先介绍一下softmax函数，这个函数可以将一个向量(x1,x2,...,xK)映射为一个概率分布(z1,z2,....

机器学习（三）线性归回模型多变量

在（二）中我们讲到了单变量的线性回归模型，但是在现实生活中会有很多对结果产生影响的因素，所以我们引入了多变量的模型。同样的我们有M个样本，$x_i$表示第$i$个特性，$x_i^{(j)}$表示第$j$个样本的第$j$个特性。假设函数$h_{\theta}=\theta_0+\theta_1x_1+\theta_2x_2$我们假设$x_0=1$， $\theta^{T}=(\theta_1, \theta_2, \cdots)$，$X^{T}=(x_1,x_2, \cdots)$。那么$h_{\theta}=\theta^{T}X$。原文：http://www.cnblogs.com/...

ML—机器学习常用包（持续更新….）

机器学习是计算机科学和统计学的边缘交叉领域，R关于机器学习的包主要包括以下几个方面： 1）神经网络（Neural Networks）： nnet、AMORE以及neuralnet，nnet提供了最常见的前馈反向传播神经网络算法。AMORE包则更进一步提供了更为丰富的控制参数，并可以增加多个隐藏层。neuralnet包的改进在于提供了弹性反向传播算法和更多的激活函数形式。但以上各包均围绕着BP网络，并未涉及到神经网络中的其它拓扑结构和网络模型。而新出炉...

【作业二】林轩田机器学习基石【代码】【图】

作业一被bubuko抓取了，要是能注明转载就更好了（http://bubuko.com/infodetail-916604.html）作业二关注的题目是需要coding的Q16~Q20Q16理解了一段时间，题目阐述的不够详细。理解了题意之后，发现其实很简单。理解问题的关键是题目中给的‘s‘是啥意思：（1）如果s=1，则意味着x>theta y预测为1，x<theta y预测为-1；（2）如果s=2，则以为着x<theta y预测为1，x<theta y预测为1想明白这个事情之后，直接分theta大于0，小于0讨论，...

机器学习：数据准备和特征工程【图】

对于数据挖掘，数据准备阶段主要就是进行特征工程。数据和特征决定了模型预测的上限，而算法只是逼近了这个上限。好的特征要少而精，这会使模型更简单、更精准。一、特征构造1.’常见提取方式文本数据的特征提取词袋向量的方式：统计频率图像数据的特征提取像素点RGB用户行为特征提取特征提取总结：特征设计时需要与目标高度相关：　　　　这个特征对预测目标是否有用　　　　如果有用，这个特征的重要程度如何　　　　这...

智能小车29：自动驾驶与机器学习

要让我的小车能自动去倒一杯咖啡。需要的做的事还有很多，其中一个很难的问题就是自动驾驶，怎么才能让我的小车自动驾驶到咖啡机旁边去呢？1.DeepDriving，网址http://deepdriving.cs.princeton.edu/ ，如图: 这是一个不借助mobileye之类硬件的一个软件技术。直接通过图像识别来判断和控制汽车。 2.comma.ai ,一个便宜的硬件+开源软件网址:https://comma.ai/ 3. 市面上已经有的产品，如"那狗N2 ADAS"可以看得出，也是个硬件，不过...

机器学习 - 相关标签

机器学习分类机器学习和深度学习机器学习模型机器学习实战机器学习算法

首页 / 更多教程 / 机器学习之softmax回归笔记

机器学习之softmax回归笔记

内容导读

内容图文

本次笔记绝大部分转自https://www.cnblogs.com/Luv-GEM/p/10674719.html

softmax回归

1、softmax函数

2、softmax回归的损失函数和梯度下降

内容总结

内容备注

内容手机端

【机器学习之softmax回归笔记】教程文章相关的互联网学习教程文章