面向在线学习的优化理论及算法研究

内容导读

互联网集市收集整理的这篇技术教程文章主要介绍了面向在线学习的优化理论及算法研究，小编现在分享给大家，供广大互联网技能从业者学习和参考。文章包含3407字，纯文字阅读大概需要5分钟。

内容图文

面向在线学习的优化理论及算法研究

摘要：信息发布方式的不断发展以及云计算、物联网等技术的兴起推动人类社会迈进了大数据时代。大数据时代,数据连续不断、来源众多、价值密度低,数据处理工具要兼顾实时性、可在线处理和在线分析。在线学习技术采用流式计算模式,操作流程简洁快速,学习复杂度低,模型更新速度快,为大数据特别是流式数据的处理提供了一种强有力的工具。在数据可实时处理的前提下,模型的泛化能力(如学习误差、模型空间复杂度)也是研究的重点。正则化技术由于具有模型空间控制功能、可解决建模过程中出现的过拟合等问题,是机器学习研究的一条主轴。目前,大规模数据的学习问题广泛存在,为这些问题量身打造而设计出的简约模型和有效算法将很有前景,也十分必要。为处理大规模数据的学习问题,本论文主要在正则化框架下对在线学习技术进行了进一步的研究和探索,提出了若干在线学习算法,并应用于数据分类、预测、联合分析、图像处理等问题。论文的主要工作与创新点概括如下:(1)提出了基于耦合线性化的在线学习算法。针对目标函数为非光滑的经验风险极小化问题,设计了一种耦合线性化的在线交替方向乘子算法。该算法操作简洁、易于实施。首先,将原问题转化为与之等价的具有可分离结构的等式约束优化问题;接着,对约束优化问题的拉格朗日函数进行分解,得到三个子问题;然后,通过变量固定技巧对子问题分别优化求解。算法每次迭代实施三次线性化操作,求解过程不涉及矩阵求逆运算,且每一步都能得到一个闭式解。通过详尽的理论分析得到了算法的Regret界及收敛速度:对一般的凸学习问题而言,在适当的条件下,其收敛速度为O(1/(?));对于强凸学习问题,其收敛速度为O(log T)/T),其中T表示样本的个数。与当前一些相关算法的对比实验验证了所提算法的可行性和有效性。(2)提出了基于谱梯度下降的在线学习算法。针对目标函数可表示为大量组件函数的平均,且每个组件函数都是光滑的这样一类问题,设计了一种随机谱梯度下降的在线学习算法。与传统的随机梯度下降算法不一样的是,该算法利用Rayleigh商收集目标函数的二阶信息,构造海塞矩阵逆的近似,从而设计了新的学习步长。算法每次迭代所产生的搜索方向具有下降性,现有理论保证了算法收敛。所提算法可以看成是谱梯度方法从确定性优化到随机优化的延伸。在基准数据集上的实验结果表明所提算法是可行的、有效的。(3)提出了面向在线学习的加权多任务特征选择算法。针对特征选择问题中变量稀疏性增强问题,设计了两种加权的多任务特征选择模型,同时给出了求解模型的在线学习算法。据我们所知,该工作是第一个研究在线加权多任务特征选择的工作。这里提出的在线学习算法的优势包括:i)可以应用于训练数据顺序获得的情形,可以在任意时刻执行训练过程;ii)可以处理任意数目和任何维度的数据;iii)推导出更新相应模型权值的闭式解,模型训练相对高效。算法每次迭代在最差情况下的时间复杂度和存储开销成本都是O(N× Q),其中N代表特征的维度,Q表示任务的个数。此外,分析了算法的Regret界,保证了算法的收敛性。实验表明,在线的加权多任务学习算法能得到更稀疏的解,同时拥有更快的收敛速度。(4)提出了面向在线学习的字典学习算法并应用于图像去噪。针对基于稀疏表示的大规模图像去噪问题,利用噪声不能在任何字典上稀疏表示的特性,设计了一种小批量K-sparse字典学习算法。考虑具有l0范数约束的K-sparse优化模型,利用交替优化的方式对模型进行求解。所提算法每次迭代只使用少量的训练样本进行编码和字典更新。具体而言,在稀疏编码阶段,采用迭代硬阈值策略更新表示系数;在字典学习阶段,则采用投影梯度下降策略进行字典更新。具体的操作流程是先从含噪图像中提取出大量的子图像作为训练样本,接着采用分块学习技术得到一个冗余的字典,然后通过含噪图像在该字典上的表示系数实现去噪。实验表明,与现有的一些算法相比,所提算法具有较好的性能,不仅可以更好地去除图像中的噪声、提升图像的视觉质量,而且收敛速度快、计算效率高。?还原关键词：

在线学习;交替方向乘子法;随机梯度下降;多任务学习;字典学习;

基金资助：

国家自然科学基金重点项目；?国家自然科学基金面上项目；

专辑：
信息科技
专题：
自动化技术
分类号：
TP181

导师：

张文生;

内容总结

以上是互联网集市为您收集整理的面向在线学习的优化理论及算法研究全部内容，希望文章能够帮你解决面向在线学习的优化理论及算法研究所遇到的程序开发问题。如果觉得互联网集市技术教程内容还不错，欢迎将互联网集市网站推荐给程序员好友。

内容备注

版权声明：本文内容由互联网用户自发贡献，该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容，请发送邮件至 gblab@vip.qq.com 举报，一经查实，本站将立刻删除。

内容手机端

扫描二维码推送至手机访问。

本文链接：https://qyyshop.com/info/623774.html

来源：【匿名】

【上一篇】分布式共轭对偶梯度算法研究【下一篇】浅谈php实现映射的两种方法（链表和二叉树）

更多 ►

【面向在线学习的优化理论及算法研究】教程文章相关的互联网学习教程文章

树，二叉树和算法总结【代码】【图】

一.思维导图二.概念笔记树的存储结构双亲表示法:当算法中需要在树结构中频繁地查找某结点的父结点时，使用双亲表示法最合适孩子表示法:适用于查找某结点的孩子结点孩子兄弟表示法:可以用孩子兄弟表示法将普通树转化为二叉树二叉树的性质性质一: 在二叉树的第k层上最多有2^(k-1)个结点性质二: 高度为k的二叉树至多有2^k-1个结点，最少有k个结点性质三: 对任何一棵二叉树T,如果其终端结点数为n0，度为2的结点数为n2,则n0 = n2 + ...

各种加密算法比较【图】

算法选择：对称加密AES，非对称加密: ECC，消息摘要: MD5，数字签名:DSA对称加密算法(加解密密钥相同)名称密钥长度运算速度安全性资源消耗DES56位较快低中3DES112位或168位慢中高AES128、192、256位快高低非对称算法(加密密钥和解密密钥不同)名称成熟度安全性(取决于密钥长度)运算速度资源消耗RSA高高慢高DSA高高慢只能用于数字签名ECC低高快低(计算量小,存储空间占用小,带宽要求低) 散列算法比较名称安全性速度SHA-1高慢MD5中快 ...

HMAC-SHA1算法签名及Authorization头认证【代码】

使用PHP进行HMAC-SHA1签名，并通过Authorization头认证Deom $app_id = ‘id‘; $host = "test.abc.com"; $port = "80"; $app_Key = "key"; $app_timestamp = time(); $app_nonce = "8FINtYTUsKbSZGfl".time().rand(10,1000); $uri = "/account/ass/verify.do";//build string$arr = array($app_timestamp, $app_nonce, "POST", $uri, $host, $port); $text = join("\n", $arr) . "\n\n"; var_dump($text); $sig = get_signature($t...

python实现排序算法（一）——插入排序算法【代码】

1‘‘‘ 2插入排序算法3原始数据data4排序数据后数据SortedData,默认是从小打大排序5 61.从data第一个元素开始，该元素赋值给SortedData[0],可以认为SortedData已经被排序 7 82.取出data的一个元素data[i],9 (1)从左到右扫描SortedData， 10 如果data[i]小于SortedData的某个元素SD，那么将data[i]插入SD的位置,选取下一个元素 11 (1)如果data[i]大于SortedData最后一个元素，将data[1]插入到SortedData的末尾，选取下...

C/C++算法竞赛入门经典Page15 习题1-1 平均数【代码】

题目:输入3个整数，输出他们的平均值，保留3位小数。首先,声明三个整数a,b,c和一个浮点数d:int a,b,c; double d;输入三个整数a,b,c:scanf("%d%d%d",&a,&b,&c);将a,b,c取平均值以后复制给d:d=(double)(a+b+c)/3;最后输出d:printf("%.3lf",d);%.3lf表示保留3位小数的long float。注意:不能直接这样输出:printf("%.3lf",(a+b+c)/3);否则会得到不正确的输出。完整代码://P15 习题1-1 平均数 //疑问:为什么不能直接printf("%.3lf",(a+b...

LeetCode面试题 08.12. 八皇后---回溯算法解决N皇后问题(C++实现）【代码】

N皇后问题源于著名的八皇后问题：在8×8格的国际象棋上摆放八个皇后，使其不能互相攻击，即任意两个皇后都不能处于同一行、同一列或同一斜线上，问有多少种摆法！将8x8扩展为NxN即为N皇后问题，要解决此问题，最简单的方法就是暴力枚举，此时的时间复杂度为N^2，回溯算法与简单暴力枚举类似，不同点在于当判定某种状态不符合答案时，便不再继续枚举此状态的后续状态，而是回溯到该状态之前，继续遍历其他的可能值。 1 #include <ios...

十大经典排序算法【代码】【图】

算法复杂度 1、冒泡排序　　冒泡排序（Bubble sort），他重复的走访要排序的数列，一次比较两个元素，如果顺序错误，就将它们交换位置。无论是最坏时间复杂度还是平均时间复杂度都为O(n^2),但算法稳定　　算法步骤：　　1、比较相邻的两个元素，如果第一个比第二个大，就交换，对每一对相邻元素做同样的工作，从开始到结束，这一趟结束之后，最后那个元素就是最大的数　　2、对所有的元素重复以上步骤1，除了最后一个元素　　3、持...

记一道有意思的算法题Rotate Image（旋转图像）【代码】

题出自https://leetcode.com/problems/rotate-image/ 内容为：You are given an n x n 2D matrix representing an image.Rotate the image by 90 degrees (clockwise).Follow up: Could you do this in-place?简单的说就是给出一个n*n的二维数组，然后把这个数组进行90度顺时针旋转，而且不能使用额外的存储空间。最初拿到这道题想到的就是找出每个坐标的旋转规律。假设我们是2*2的矩阵：a b c d进行旋转后，那么就变成了：c a ...

基础算法之选择排序【代码】【图】

选择排序的思路比较简单，它的工作原理是每一次从待排序的数据元素中选出最小（或最大）的一个元素，存放在序列的起始位置，直到全部待排序的数据元素排完。选择排序虽然实现起来比较简单，但是效率也比较低，为O(n2)。C语言的代码实现如下： 1//选择排序的C语言实现 2void selection_sort(int a[])3{4int i , j;5int min = 0;6for(i=0; i<MAXSIZE-1; i++)7 {8for(j=i; j<MAXSIZE; j++)9 { 10if(a[j] <= a[min]) { 11 ...

SEO优化：浅析搜索引擎算法如何判断一个网站的好坏

相应的措施推行，引起一定的连锁性反应。如站长论坛取消了签名，避免受到这一规则性的负面影响。成熟性的网站，失去一定的外部链接，不会有什么影响。而相对小型的网站，产生的结果是很严重的。因此，对当前的搜索引擎，优化人员需要调整好思路。可从如下的角度性展开，有效的应对。方面一、重视搜索引擎的用户体验度现状分析：这是搜索引擎都在提倡的，360搜素引擎对这方面的认可度较高。从刚开始时，就推出了这样的策略性。进而...

算法学习#03--详解最小二乘法原理和代码【代码】【图】

最小二乘法原理最小二乘法的目标：求误差的最小平方和，对应有两种：线性和非线性。线性最小二乘的解是closed-form（如下文），而非线性最小二乘没有closed-form，通常用迭代法求解（如高斯牛顿迭代法，本文不作介绍）。【首先得到线性方程组】1.概念最小二乘法（又称最小平方法）是一种数学优化技术。它通过最小化误差的平方和寻找数据的最佳函数匹配。利用最小二乘法可以简便地求得未知的数据，并使得这些求得的数据与实际数据之...

算法导论第十三章：红黑树【图】

红黑树（red-black tree）是一种“平衡”查找树，它能保证最坏情况下，基本的动态集操作时间为O(lgn).性质：1)每个节点要么是红的，要么是黑的2)根节点和叶子节点（NIL）是黑色的3)若一个节点是红色的，则他的两个孩子节点是黑色的4)对于每一个节点x，从该节点到其子酸节点的所有路径上包含相同数目的黑节点（#black nodes = black-height(x)）引理：一棵有n个内节点的红黑树的高度至多为 2 lg(n+1)红黑树上插入删除的完整代码...

【算法#2】与并查集相关的图论问题

最近被和并查集相关的图论问题卡了几次，稍微写一下好了。分块？咕了，下次再做吧因为许多例题洛谷里头是没有的，所以把题面讲一下。一个模板题是UVA1395，非常典型，题面有了就不给了。为什么会用到并查集呢？判断是否每个点都联通时会用到，那么如何保证联通时差值最小呢？首先我们把边按边权排序，然后我们枚举较小边的编号，连通左右两点，然后我们从小到大枚举较大边，并且联通这些边的左右块，直到所有点联通，这时的边减去小...

编程算法 - K路归并排序(k-way merge sort) 代码(C++)【图】

K路归并排序(k-way merge sort) 代码(C++)本文地址: http://blog.csdn.net/caroline_wendyK路归并排序作为经典的外部排序算法, 是程序员必须要掌握的.知识概念参考: <数据结构>主要思想: 在k个已排序的文件中, 选择第一个值, 采用败者树, 更新二叉树结构, 最终选择最优值.代码仅供参考, 如最小值用(-1)代替, 最大值用(100)代替./** main.cpp** Created on: 2014年9月11日* Author: Spike*/#include <fstream> #include <iost...

Collection of algorithm for sorting. 常见排序算法集(二)【代码】【图】

Collection of algorithm for sortingheap sort 堆排序 The heapsort algorithm can be divided into two parts. In the first step, a heap is built outof the data. The heap is often placed in an array with the layout of a complete binary tree. The complete binary tree maps the binary tree structure into the array indices; each array index represents a node; the index of the n...

算法 - 最热教程

浅谈SQLServer查询优化器中的JOIN算法有没那种可逆算法是密文比明文短的呢？...javascript-类似Excel里面的NORMDIST函...C++中的分治算法及常见题目汇总压缩感知重构算法综述-学习笔记 c++中内置函数qsort（快速排序）和bsea...一、fpga图像处理算法整合基于遗传算法（deap）的非线性函数寻优...集成学习-Bagging集成学习算法随机森林...机器学习笔记（九）聚类算法及实践（K-...

首页 / 算法 / 面向在线学习的优化理论及算法研究

面向在线学习的优化理论及算法研究

内容导读

内容图文

面向在线学习的优化理论及算法研究

薛伟

南京理工大学

内容总结

内容备注

内容手机端

【面向在线学习的优化理论及算法研究】教程文章相关的互联网学习教程文章

树，二叉树和算法总结【代码】【图】

各种加密算法比较【图】

HMAC-SHA1算法签名及Authorization头认证【代码】

python实现排序算法（一）——插入排序算法【代码】

C/C++算法竞赛入门经典Page15 习题1-1 平均数【代码】

LeetCode面试题 08.12. 八皇后---回溯算法解决N皇后问题(C++实现）【代码】

十大经典排序算法【代码】【图】

记一道有意思的算法题Rotate Image（旋转图像）【代码】

基础算法之选择排序【代码】【图】

SEO优化：浅析搜索引擎算法如何判断一个网站的好坏

算法学习#03--详解最小二乘法原理和代码【代码】【图】

算法导论第十三章：红黑树【图】

【算法#2】与并查集相关的图论问题

编程算法 - K路归并排序(k-way merge sort) 代码(C++)【图】

Collection of algorithm for sorting. 常见排序算法集(二)【代码】【图】

算法 - 相关标签

算法 - 最新教程

算法 - 最热教程