首页 / 正则 / LASSO回归与L1正则化西瓜书

LASSO回归与L1正则化西瓜书

内容导读

互联网集市收集整理的这篇技术教程文章主要介绍了LASSO回归与L1正则化西瓜书，小编现在分享给大家，供广大互联网技能从业者学习和参考。文章包含2580字，纯文字阅读大概需要4分钟。

内容图文

LASSO回归与L1正则化西瓜书

2018年04月23日 19:29:57 BIT_666 阅读数 2968更多

分类专栏：机器学习机器学习数学原理西瓜书

本文链接：https://blog.csdn.net/BIT_666/article/details/80051737

1.结构风险与经验风险

在支持向量机部分，我们接触到松弛变量，正则化因子以及最优化函数，在朴素贝叶斯分类，决策树我们也遇到类似的函数优化问题。其实这就是结构风险和经验风险两种模型选择策略，经验风险负责最小化误差，使得模型尽可能的拟合数据，而结构风险则负责规则化参数，使得参数的形式尽量简洁，从而达到防止过拟合的作用.所以针对常见模型，我们都有下式：

技术分享图片

第一项经验风险L(yi,f(xi,w))衡量真实值与预测值之间的误差，第二项结构风险Ω(w)规则化项使得模型尽可能简单.而第二项Ω(w)一般是模型复杂度的单调函数，模型越复杂，则规则化项的值越大，这里常引入范数作为规则化项，这也就引入了我们常见的L0范数，L1范数以及L2范数.

2.L0范数，L1范数，L2范数与LASSO回归，岭回归

1）广义定义

L0范数技术分享图片 : 向量中非零元素的个数.

L1范数技术分享图片：向量中各个元素绝对值之和

L2范数技术分享图片：向量各元素平方和然后求平方根

L0，L1范数可以实现稀疏化，而L1系数因为有比L0更好的特性而被广泛应用，L2范数在回归里就是岭回归，也叫均值衰减，常用于解决过拟合，通过对向量各元素平方和再求平方根，使得L2范数最小，从而使得参数W的各个元素都接近于0，与L1范数不同，L2范数规划后w的值会接近于0但不到0，而L1范数规范后则可能令w的一些值为0，所以L1范数规范在特征选择中经常用到，而L2范数在参数规则化时经常用到.在回归模型中，通过添加L1,L2范数引入正则化项，便得到了LASSO回归和岭回归：

2）回归模型

常见线性模型回归：

技术分享图片

LASSOO回归：

技术分享图片

岭回归：

技术分享图片

3.嵌入式选择与LASSO回归

这里主要针对西瓜书第11节的内容，对近端梯度下降PGD法解决L1正则化问题进行讨论.

1）优化目标

令▽表示微分算子，对优化目标：

技术分享图片

若f(x)可导，且▽f 满足L-Lipschitz（利普希茨连续条件），即存在常数L＞0使得：

技术分享图片

2）泰勒展开

则在Xk处我们可以泰勒展开：

技术分享图片

上式是严格相等，由L-Lipschitz条件我们可以看到：

技术分享图片

这里给出了一个L的下界，且下界的形式与二阶导函数形式类似，从而泰勒展开式的二阶导便通过L替代，从而严格不等也变成了近似：

技术分享图片

3）简化泰勒展开式

接下来我们化简上式：

技术分享图片

其中φ(xk)是与x无关的const常数.

技术分享图片

4）简化优化问题

这里若通过梯度下降法对f(x)进行最小化，则每一步下降迭代实际上等价于最小化二次函数f(x)，从而推广到我们最上面的优化目标，类似的可以得到每一步的迭代公式:

技术分享图片

令

技术分享图片

则我们可以先计算z，再求解优化问题：

技术分享图片

5）求解

令xi为x的第i个分量，将上式展开可以看到没有xixj（x≠j）的项，即x的各分量互不影响，所以优化目标有闭式解.这里对于上述优化问题求解需要用到Soft Thresholding软阈值函数，其解为：

技术分享图片

对于本例，带入求解即得：

技术分享图片

因此，PGD能使LASSO和其他基于L1范数最小化的方法得以快速求解.

4.Soft Thresholding软阈值函数证明

1）软阈值函数

上式求解用到了软阈值函数，下面对软阈值函数的解进行求证，从而更好理解上述求解过程.

先看一下软阈值函数：

技术分享图片

2）证明

Proof：

对于优化问题：

技术分享图片

此处X,Z均为n维向量.

展开目标函数：

技术分享图片

从而优化问题变为求解N个独立的函数：

技术分享图片

这是我们常见的二次函数，对其求导：

技术分享图片

令导数为0：

技术分享图片

看到两边都有x，所以我们要对上述情况进行讨论：

A.z>λ/2时

假设 x<0 , 所以 sign(x)=-1 ，但 z-λ/2sign(x)＞0 ，所以矛盾.

假设 x>0 ，所以 sign(x) = 1，z-λ/2sign(x)>0,所以极小值在x>0 取得1.

此时极小值小于f(0)：

技术分享图片

再看x<0,

技术分享图片

所以f(x)在负无穷到0单调递减，所以最小值在z-λ/2处取得.

B.z<-λ/2时

假设 x<0 , 所以 sign(x)=-1 ，z-λ/2sign(x)<0 ，所以极值点在 x<0 处取得.

假设 x>0 ，所以 sign(x) = 1，z-λ/2sign(x)<0,所以矛盾.

此时极值小于f(0）：

技术分享图片

再看 x>0 ,

技术分享图片

所以f(x)在0到正无穷单调递增，所以最小值在z+λ/2处取得.

C.λ/2<z<λ/2时

假设 x<0 , 所以 sign(x)=-1 ，z-λ/2sign(x)>0 ，所以矛盾.

假设 x>0 ，所以 sign(x) = 1，z-λ/2sign(x)<0,所以矛盾.

所以x>0,x<0均不满足条件.

所以有：

技术分享图片

当△x>0时,由条件z<λ/2:

技术分享图片

当△x<0时,由条件z<λ/2:

技术分享图片

所以在0处取极小值，同时也是最小值.

综合以上三种情况：

技术分享图片

3）对应西瓜书的L1正则化与LASSO回归

这里的解对应的优化问题是：

技术分享图片

而我们PGD优化的问题是：

技术分享图片

对上式同乘2/L不影响极值点位置的选取，所以我们的PGD优化问题变成：

技术分享图片

带入综合三种情况的到的最终解：

技术分享图片

西瓜书上11.14也就得证了~

总结：

终于看完了西瓜书11章特征选择与稀疏学习，发现从头至尾都在提到用LASSO解决问题，所以就结合第六章的正则化和之前的模型评价，对正则化范数以及LASSO重新认识了一下，书中解决LASSO的大致方法就是通过利普希茨连续条件得到L，带入到优化函数中对函数简化变形，简易优化函数，然后通过软阈值函数得到最后的解.LASSO大致就是这些了，有问题欢迎大家交流~

原文：https://www.cnblogs.com/think90/p/11555691.html

内容总结

以上是互联网集市为您收集整理的LASSO回归与L1正则化西瓜书全部内容，希望文章能够帮你解决LASSO回归与L1正则化西瓜书所遇到的程序开发问题。如果觉得互联网集市技术教程内容还不错，欢迎将互联网集市网站推荐给程序员好友。

内容备注

版权声明：本文内容由互联网用户自发贡献，该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容，请发送邮件至 gblab@vip.qq.com 举报，一经查实，本站将立刻删除。

内容手机端

扫描二维码推送至手机访问。

本文链接：https://qyyshop.com/info/1204384.html

来源：【匿名】

【下一篇】正则表达式语法

更多 ►

【LASSO回归与L1正则化西瓜书】教程文章相关的互联网学习教程文章

LASSO回归与L1正则化西瓜书【图】

LASSO回归与L1正则化西瓜书2018年04月23日 19:29:57 BIT_666 阅读数 2968更多分类专栏：机器学习机器学习数学原理西瓜书版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。本文链接：https://blog.csdn.net/BIT_666/article/details/800517371.结构风险与经验风险在支持向量机部分，我们接触到松弛变量，正则化因子以及最优化函数，在朴素贝叶斯分类，决策树我们也遇到类似的函数优...

逻辑回归与正则化

逻辑回归与线性回归正则化解决过拟合问题惩罚项范数权重衰减参考https://www.jianshu.com/p/c501ec69864a原文：https://www.cnblogs.com/nrocky/p/12114427.html

线性回归及正则化公式推导

基础公式：?BA/?A = BT?ATB/?A = B?ATBA/?A = 2BA模型函数：hθ(x) = xθ无正则化损失函数：J(θ) = 1/2(Xθ-Y)2令偏导?J(θ)/?θ等于0，得：θ = (XTX)-1XTY正则化损失函数：J(θ) = 1/2(Xθ-Y)2+1/2λθ2令偏导?J(θ)/?θ等于0，得：θ = (XTX+λI)-1XTY 参考文献：https://blog.csdn.net/fleurdalis/article/details/54931721https://blog.csdn.net/u013363719/article/details/22752893原文：https://www.cnblogs.com/jhc8880...

吴裕雄 python 机器学习——数据预处理正则化Normalizer模型【代码】【图】

from sklearn.preprocessing import Normalizer#数据预处理正则化Normalizer模型def test_Normalizer():X=[[1,2,3,4,5],[5,4,3,2,1],[1,3,5,2,4,],[2,4,1,3,5]]print("before transform:",X)normalizer=Normalizer(norm=‘l2‘)print("after transform:",normalizer.transform(X))# 调用 test_Normalizer test_Normalizer() 原文：https://www.cnblogs.com/tszr/p/10801982.html

stanford coursera 机器学习编程作业 exercise 5（正则化线性回归及偏差和方差）【代码】【图】

本文根据水库中蓄水标线(water level) 使用正则化的线性回归模型预水流量(water flowing out of dam)，然后 debug 学习算法以及讨论偏差和方差对该线性回归模型的影响。 ①可视化数据集本作业的数据集分成三部分：?训练集(training set)，样本矩阵(训练集)：X，结果标签(label of result)向量 y?交叉验证集(cross validation set)，确定正则化参数 Xval 和 yval?测试集(test set) for evaluating performance，测试集中的数据 ...

机器学习中正则化的理解【图】

首先述说什么是正则化，正则化是结构风险最小化策略的实现，是在经验风险上加上一个正则项(regularizer)或罚项(penalty term)。是模型选择的典型方法。正则化项一般是模型复杂度的单调递增函数，模型越复杂，正则化值越大。比较常用的正则化项有模型参数向量的范数，l1-norm、l2-norm...... 第1项经验风险较小的模型可能比较复杂（非零参数多），这是第2项的模型复杂度会较大。正则化的作用是选择经验风险与模型复杂度同时较小...

虚拟对抗训练：一种新颖的半监督学习正则化方法【图】

特约作者 | 曹凯本文介绍一种名叫Virtual Adversarial Training (VAT) [1]的方法，是一种对于给定条件标签分布的数据度量该分布局部光滑性的一种方法。其实就是对于每一个数据点，它的条件标签分布对于局部的扰动鲁棒性怎么样，是否数据的一点小变化，就会导致预测的其标签的大变化。这种情况在研究对抗样本的时候很常见，比如本来一张猫的图片，稍微加了一点扰动，神经网络就将其判为梨这种完全不一样的类别，这显然不是我们想要的...

深入理解L1、L2正则化原理与作用【图】

过节福利，我们来深入理解下L1与L2正则化。1 正则化的概念正则化(Regularization) 是机器学习中对原始损失函数引入额外信息，以便防止过拟合和提高模型泛化性能的一类方法的统称。也就是目标函数变成了原始损失函数+额外项，常用的额外项一般有两种，英文称作\(?1-norm\)和\(?2-norm\)，中文称作L1正则化和L2正则化，或者L1范数和L2范数（实际是L2范数的平方）。L1正则化和L2正则化可以看做是损失函数的惩罚项。所谓惩罚是指对损失...

L2正则化方法【图】

在机器学习中，无论是分类还是回归，都可能存在由于特征过多而导致的过拟合问题。当然解决的办法有（1）减少特征，留取最重要的特征。（2）惩罚不重要的特征的权重。但是通常情况下，我们不知道应该惩罚哪些特征的权重取值。通过正则化方法可以防止过拟合，提高泛化能力。先来看看L2正则化方法。对于之前梯度下降讲到的损失函数来说，在代价函数后面加上一个正则化项，得到注意是从1开始的。对其求偏导后得到然...

TensorFlow2.0入门学习笔记(8)——欠拟合与过拟合(正则化)【代码】【图】

TensorFlow2.0入门学习笔记(8)——欠拟合与过拟合(正则化)欠拟合与过拟合欠拟合：模型不能有效拟合数据集对现有数据集学习的不够彻底过拟合：模型对训练集拟合的太好，而缺失了泛化力欠拟合的解决方法：增加输入特征项增加网络参数减少正则化参数过拟合的解决方法：数据清洗增大训练集采用正则化增大正则化参数正则化缓解过拟合正则化在损失函数中引入模型复杂度指标，利用给W加权值，弱化了训练数据的噪声（一般不正则化b...

吴恩达深度学习学习笔记——C2W3——超参数调试、Batch正则化和程序框架——作业

这里主要梳理一下作业的主要内容和思路，完整作业文件可参考: https://github.com/pandenghuang/Andrew-Ng-Deep-Learning-notes/tree/master/assignments/C2W3 作业完整截图，参考本文结尾：作业完整截图。 TensorFlow Tutorial （Tensorflow教程） Welcome to this weeks programming assignment. Until now, youve always used numpy to build neural networks. Now we will step you through a deep learning framework that ...

改善深层神经网络——超参数调试、Batch正则化和程序框架（7）【图】

目录 1.超参数调试为超参数选择合适的范围超参数训练的实践 2.Batch 标准化 Batch Norm为什么奏效测试时的Batch Norm 3.Softmax回归训练Softmax分类器 4.深度学习框架 TensorFlow框架 1.超参数调试深度神经网络需要调试的超参数（Hyperparameters）较多，包括：α：学习因子β：动量梯度下降因子：Adam算法参数#layers：神经网络层数#hidden units：各隐藏层神经元个数learning rate decay：学习因子下降参数mini-batch siz...

L1和L2正则化

http://freemind.pluskid.org/machine-learning/sparsity-and-some-basics-of-l1-regularization/ Sparsity 是当今机器学习领域中的一个重要话题。John Lafferty 和 Larry Wasserman 在 2006 年的一篇评论中提到： Some current challenges … are high dime http://freemind.pluskid.org/machine-learning/sparsity-and-some-basics-of-l1-regularization/Sparsity 是当今机器学习领域中的一个重要话题。John Lafferty 和 Larry W...

第三周超参数调试、Batch正则化和程序框架（Hyperparameter tuning）

第三周超参数调试、Batch正则化和程序框架（Hyperparameter tuning）文章目录第三周超参数调试、Batch正则化和程序框架（Hyperparameter tuning）3.1 调试处理（Tuning process）3.2 为超参数选择合适的范围（Using an appropriate scale to pick hyperparameters）3.3 超参数调试的实践：Pandas VS Caviar（Hyperparameters tuning in practice: Pandas vs. Caviar）3.4 归一化网络的激活函数（Normalizing activations in a ...

python-L1-L2正则化的不同系数【代码】

我想用L1和L2正规化来正规化网络的权重.但是,我找不到独立改变正则化强度的方法. Keras documentation也不提供任何信息. 因此,有没有办法在l1_l2正则化器中使用不同的强度？还是获得相同结果的替代方法？我当前的模型很简单：stren = 0.001 model = Sequential() model.add(Dense(64, input_dim=148, activation='relu', kernel_regularizer=reg.l2(stren))) model.add(Dense(1, activation='sigmoid', kernel_regularizer=reg.l2...

正则 - 最热教程

java正则表达式匹配所有数字，包括带小...UltraEdit正则表达式搜索替换小技巧 php正则表达式，允许有数字，字母，和标...jquery取字符串中数字的正则_jquery 分享正则表达式注册表验证和一些常用的...php正则表达式的特殊字符含义_PHP教程 SwiftUI iOS 超酷组件之支持文本分割炸...python 正则表达式与JSON-JSON java-检查字符串是否仅包含字母空格和引...java网页爬虫正则表达式

首页 / 正则 / LASSO回归与L1正则化西瓜书

LASSO回归与L1正则化西瓜书

内容导读

内容图文

LASSO回归与L1正则化西瓜书

内容总结

内容备注

内容手机端

【LASSO回归与L1正则化西瓜书】教程文章相关的互联网学习教程文章

LASSO回归与L1正则化西瓜书【图】

逻辑回归与正则化

线性回归及正则化公式推导

吴裕雄 python 机器学习——数据预处理正则化Normalizer模型【代码】【图】

stanford coursera 机器学习编程作业 exercise 5（正则化线性回归及偏差和方差）【代码】【图】

机器学习中正则化的理解【图】

虚拟对抗训练：一种新颖的半监督学习正则化方法【图】

深入理解L1、L2正则化原理与作用【图】

L2正则化方法【图】

TensorFlow2.0入门学习笔记(8)——欠拟合与过拟合(正则化)【代码】【图】

吴恩达深度学习学习笔记——C2W3——超参数调试、Batch正则化和程序框架——作业

改善深层神经网络——超参数调试、Batch正则化和程序框架（7）【图】

L1和L2正则化

第三周超参数调试、Batch正则化和程序框架（Hyperparameter tuning）

python-L1-L2正则化的不同系数【代码】

正则 - 相关标签

正则 - 最新教程

正则 - 最热教程

首页 / 正则 / LASSO回归与L1正则化 西瓜书

LASSO回归与L1正则化 西瓜书

内容导读

内容图文

LASSO回归与L1正则化 西瓜书

内容总结

内容备注

内容手机端

【LASSO回归与L1正则化 西瓜书】教程文章相关的互联网学习教程文章

正则 - 相关标签

正则 - 最新教程

正则 - 最热教程

首页 / 正则 / LASSO回归与L1正则化西瓜书

LASSO回归与L1正则化西瓜书

LASSO回归与L1正则化西瓜书

【LASSO回归与L1正则化西瓜书】教程文章相关的互联网学习教程文章