首页 / 算法 / 【SVM算法】{1} —— 基于最大间隔分隔数据

【SVM算法】{1} —— 基于最大间隔分隔数据

内容导读

互联网集市收集整理的这篇技术教程文章主要介绍了【SVM算法】{1} —— 基于最大间隔分隔数据，小编现在分享给大家，供广大互联网技能从业者学习和参考。文章包含1913字，纯文字阅读大概需要3分钟。

内容图文

支持向量机模型的代价函数：

如果有一个正样本 $y=1$ y=1，其实仅仅要求 $θ^Tx$ θTx 大于等于0，就能将该样本恰当分出，这是因为如果 $θ^Tx$ θTx >0 的话，代价函数值为0；类似地，如果有一个负样本，则仅需要 $θ^Tx$ θTx<=0 就会将负例正确分离。但是，支持向量机的要求更高，不仅仅要能正确分开输入的样本，即不仅仅要求 $θ^Tx$ θTx>0，它需要的是比0值大很多，比如大于等于1，或者比0小很多，比如小于等于-1，这就相当于在支持向量机中嵌入了一个额外的安全因子，或者说安全的间距因子。

支持向量机的决策边界：

假设将常数 $C$ C 设为一个非常大的值，观察支持向量机会给出什么结果？

如果 $C$ C 非常大，则最小化代价函数的时候，我们将会很希望找到一个使第一项为0的最优解。

在代价项为0的情形下，将有如下约束：如果 $y^{(i)}$ y(i) = 1， $θ^Tx^{(i)}>=1$ θTx(i)>=1 ；如果 $y^{(i)}$ y(i) = 0， $θ^Tx^{(i)}<=-1$ θTx(i)<=?1。
这样当最小化这个关于变量 $θ$ θ 的函数的时候，你会得到一个非常有趣的决策边界：

三条决策边界中，黑线看起来是更稳健的决策界。在分离正样本和负样本上它显得更好。从数学上来讲，这条黑线有更大的距离，这个距离叫做间距(margin)。

当画出两条额外的蓝线，黑色的决策界和训练样本之间有更大的最短距离，这个距离叫做支持向量机的间距，而这是支持向量机具有鲁棒性的原因，因为它努力用一个最大间距来分离样本。因此支持向量机有时被称为大间距分类器。

对代价函数的条件更严格而产生的决策边界

在让代价函数最小化的过程中，我们希望找出在 $y=1$ y=1 和 $y=0$ y=0 两种情况下都使得代价函数中左边一项尽量为零的参数。如果我们找到了这样的参数，则我们的最小化问题便转变成：

事实上，支持向量机要比上述大间距分类器体现得更成熟，尤其是当你使用大间距分类器的时候，你的学习算法会受异常点(outlier) 的影响，比如加入一个额外的正样本：

仅仅基于一个异常值，仅仅基于一个样本，就将决策界从这条黑线变到这条粉线，这实在是不明智的。

实际上应用支持向量机的时，当 $C$ C 不是非常非常大的时候，它可以忽略掉一些异常点的影响，得到更好的决策界。甚至当你的数据不是线性可分的时候，支持向量机也可以给出好的结果。

C较大时，可能会导致过拟合，高方差。
C较小时，可能会导致低拟合，高偏差。

内容总结

以上是互联网集市为您收集整理的【SVM算法】{1} —— 基于最大间隔分隔数据全部内容，希望文章能够帮你解决【SVM算法】{1} —— 基于最大间隔分隔数据所遇到的程序开发问题。如果觉得互联网集市技术教程内容还不错，欢迎将互联网集市网站推荐给程序员好友。

内容备注

版权声明：本文内容由互联网用户自发贡献，该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容，请发送邮件至 gblab@vip.qq.com 举报，一经查实，本站将立刻删除。

内容手机端

扫描二维码推送至手机访问。

本文链接：https://qyyshop.com/info/633670.html

来源：【匿名】

【上一篇】【蓝桥杯】试题算法提高计算超阶乘【下一篇】浅谈php实现映射的两种方法（链表和二叉树）

更多 ►

【【SVM算法】{1} —— 基于最大间隔分隔数据】教程文章相关的互联网学习教程文章

数据挖掘算法：DBSCAN算法的C++实现【图】

(期末考试快到了，所以比较粗糙，请各位读者理解。。)一、概念DBSCAN是一种产生划分聚类的基于密度的聚类算法，簇的个数由算法自动地确定。低密度区域中的点被视为噪声而忽略，因此DBSCAN不产生完全聚类。二、伪代码1 将所有点标记为核心点、边界点和噪声点。2 删除噪声点。3 为距离在Eps之内的所有核心点之间赋予一条边。4 每组连通的核心点形成一个簇。5 将每个边界点指派到一个与之关联的核心点的簇中。...

【Java】大话数据结构(11) 查找算法(2)（二叉排序树/二叉搜索树）【代码】【图】

本文根据《大话数据结构》一书，实现了Java版的二叉排序树/二叉搜索树。二叉排序树介绍在上篇博客中，顺序表的插入和删除效率还可以，但查找效率很低；而有序线性表中，可以使用折半、插值、斐波那契等查找方法来实现，但因为要保持有序，其插入和删除操作很耗费时间。二叉排序树(Binary Sort Tree)，又称为二叉搜索树，则可以在高效率的查找下，同时保持插入和删除操作也又较高的效率。下图为典型的二叉排序树。二叉查找树具有以下...

业务解决方案/-数据结构与算法速成

业务解决方案：0. 数据源加载1. 特征工程: 字符转数值/二值型/多值型把字符型特征转化成算法可以处理的数值表示，实现特征抽象.特征是二值型的，如sex 这个字段有male 和fem 两种，就把sex 抽象成0 和1。如果特征的数值是多值型，如status，就按照严重程度从0 到1 再到2 来抽象.2.数据预处理:数值转double/归一化到0 和1 之间通过“类型转换组件”先把数据类型全部转化成 double 型（机器学习算法普遍对double 型数据的支持比...

数据结构与算法笔记 - 绪论【图】

数据结构与算法笔记 - 绪论 1. 什么是计算2. 评判DSA优劣的参照(直尺)3. 度量DSA性能的尺度(刻度)4. DSA的性能度量的方法5. DSA性能的设计及其优化x1. 理论模型与实际性能的差异x2. DSA优化的极限(下界) 计算机与算法计算机科学（computer science）的核心在于研究计算方法与过程的规律，而不仅仅是作为计算工具的计算机本身，因此E. Dijkstra及其追随者更倾向于将这门科学称作计算科学（computing science）。计算 = 信息处理计算...

数据结构与算法分析

线性表数据元素的排列方式是线性的顺序表：顺序表是在计算机中以数组的形式保存的线性表结构除了头尾，其他的元素依次首尾相连在内存中是一块连续的存储空间，每个元素占用相同的空间，所以顺序表支持随机访问e[i]=e[1]+e[i-1]*length, 1<=i<=n,length是单个元素所占的空间Java数组 Java在定义数组的时候，在堆里面分配一个连续的固定大小的空间，用于存放基本数据类型或者对象的引用。顺序表支持随机存取，所以Java数组用任意下...

[数据结构与算法] : 二分查找【代码】

1 #include <stdio.h>2 3#define NotFound -1;4 typedef int ElementType;5 6int BinarySearch( const ElementType A[], ElementType X, int N )7{8int Low, Mid, High;910 Low = 0; High = N-1; 11while( Low <= High ) // 注意终止条件12 { 13 Mid = (Low + High) / 2; 14if( A[Mid] < X ) 15 Low = Mid + 1; 16elseif( A[Mid] > X ) 17 High = Mid - 1; 18else19return Mid; 20 } 21...

数据结构和算法-001 数组【代码】

数组，都懂的，直接看代码吧，实现以下功能：创建数组查找在索引上的值查找数组中是否含有值删除在索引上的值添加一个值查找一个值在数组的位置public class ArrayStructures {private int[] theArray = new int[50];private int arraySize = 10;public void generateRandomArray(){for (int i =0; i< arraySize;i++){theArray[i] = (int)(Math.random()*10 + 10);}}public void printArray(){StringBuffer sb = new StringBuffer(...

[数据结构与算法] : 栈的数组实现【代码】

头文件 1 typedef int ElementType;2 3#ifndef _STACK_AR_4#define _STACK_AR_5 6struct StackRecord;7 typedef struct StackRecord *Stack;8 9int IsEmpty(Stack S); 10int IsFull(Stack S); 11 Stack CreateStack(int MaxElements); 12void DisposeStack(Stack S); 13void MakeEmpty(Stack S); 14void Push(ElementType X, Stack S); 15ElementType Top(Stack S); 16void Pop(Stack S); 17ElementType TopAndPop(Stack S); 1819#...

09.Java数据算法

好消息博客笔记大汇总【15年10月到至今】，包括Java基础及深入知识点，Android技术博客，Python学习笔记等等，还包括平时开发中遇到的bug汇总，当然也在工作之余收集了大量的面试题，长期更新维护并且修正，持续完善……开源的文件是markdown格式的！同时也开源了生活博客，从12年起，积累共计500篇[近100万字]，将会陆续发表到网上，转载请注明出处，谢谢！链接地址：https://github.com/yangchong211/YCBlogs如果觉得好，可以st...

# 机器学习算法总结-第四天(SKlearn/数据处理and特征工程)【图】

总结：量纲化（归一化，标准化）缺失值处理（补0、均值、中值、众数、自定义）编码/哑变量：忽略数字中自带数学性质（文字->数值类型）连续特征离散化（二值化/分箱处理）原文：https://www.cnblogs.com/afanti/p/10881435.html

数据结构和算法(Golang实现)(16)常见数据结构-字典【代码】

字典我们翻阅书籍时，很多时候都要查找目录，然后定位到我们要的页数，比如我们查找某个英文单词时，会从英语字典里查看单词表目录，然后定位到词的那一页。计算机中，也有这种需求。一、字典字典是存储键值对的数据结构，把一个键和一个值映射起来，一一映射，键不能重复。在某些教程中，这种结构可能称为符号表，关联数组或映射。我们暂且称它为字典，较好理解。如：键=>值"cat"=>2 "dog"=>1 "hen"=>3我们拿出键cat的值，就是2了...

算法与数据结构（八） HashMap源码【代码】

一存储结构 static class Node<K,V> implements Map.Entry<K,V> { final int hash; final K key; V value; Node<K,V> next;｝transient Node<K,V>[] table;内部存储的单元如上所示，整体上就是数组加链表的桶状结构。二 put操作put(key，value)内部调用的是putVal() 下面是源码 jdk1.8采用的是尾插法 final V putVal(int hash, K key, V value, boolean onlyIfAbsent,boolean evict) {Node<K,V>[] tab; Node<K,V...

算法 - 最热教程

浅谈SQLServer查询优化器中的JOIN算法有没那种可逆算法是密文比明文短的呢？...javascript-类似Excel里面的NORMDIST函...C++中的分治算法及常见题目汇总压缩感知重构算法综述-学习笔记 c++中内置函数qsort（快速排序）和bsea...一、fpga图像处理算法整合基于遗传算法（deap）的非线性函数寻优...集成学习-Bagging集成学习算法随机森林...机器学习笔记（九）聚类算法及实践（K-...

首页 / 算法 / 【SVM算法】{1} —— 基于最大间隔分隔数据

【SVM算法】{1} —— 基于最大间隔分隔数据

内容导读

内容图文

支持向量机模型的代价函数：

支持向量机的决策边界：

内容总结

内容备注

内容手机端

【【SVM算法】{1} —— 基于最大间隔分隔数据】教程文章相关的互联网学习教程文章

数据挖掘算法：DBSCAN算法的C++实现【图】

【Java】大话数据结构(11) 查找算法(2)（二叉排序树/二叉搜索树）【代码】【图】

业务解决方案/-数据结构与算法速成

数据结构与算法笔记 - 绪论【图】

数据结构与算法分析

[数据结构与算法] : 二分查找【代码】

数据结构和算法-001 数组【代码】

[数据结构与算法] : 栈的数组实现【代码】

09.Java数据算法

# 机器学习算法总结-第四天(SKlearn/数据处理and特征工程)【图】

数据结构和算法(Golang实现)(16)常见数据结构-字典【代码】

算法与数据结构（八） HashMap源码【代码】

《数据结构与算法分析：C语言描述》复习——第六章“排序”——选择排序【代码】

数据结构与算法 -- Python实现【归并排序算法】【代码】【图】

初转java随感（一）程序=数据结构+算法【图】

算法 - 相关标签

数据 - 相关标签

算法 - 最新教程

算法 - 最热教程