首页 / 算法 / 04-04 AdaBoost算法代码(鸢尾花分类)

04-04 AdaBoost算法代码(鸢尾花分类)

内容导读

互联网集市收集整理的这篇技术教程文章主要介绍了04-04 AdaBoost算法代码(鸢尾花分类)，小编现在分享给大家，供广大互联网技能从业者学习和参考。文章包含4565字，纯文字阅读大概需要7分钟。

内容图文

AdaBoost算法代码(鸢尾花分类)
一、导入模块
二、导入数据
三、构造决策边界
四、训练模型

更新、更全的《机器学习》的更新网站，更有python、go、数据结构与算法、爬虫、人工智能教学等着你：https://www.cnblogs.com/nickchen121/p/11686958.html

AdaBoost算法代码(鸢尾花分类)

一、导入模块

import numpy as np
import matplotlib.pyplot as plt
from matplotlib.colors import ListedColormap
from matplotlib.font_manager import FontProperties
from sklearn.datasets import load_iris
from sklearn.tree import DecisionTreeClassifier
from sklearn.ensemble import AdaBoostClassifier
%matplotlib inline
font = FontProperties(fname='/Library/Fonts/Heiti.ttc')

二、导入数据

X = iris_data.data[:, [2, 3]]
y = iris_data.target
label_list = ['山鸢尾', '杂色鸢尾', '维吉尼亚鸢尾']

三、构造决策边界

def plot_decision_regions(X, y, classifier=None):
    marker_list = ['o', 'x', 's']
    color_list = ['r', 'b', 'g']
    cmap = ListedColormap(color_list[:len(np.unique(y))])
x1_min, x1_max = X[:, <span class="hljs-number">0</span>].<span class="hljs-built_in">min</span>()<span class="hljs-number">-1</span>, X[:, <span class="hljs-number">0</span>].<span class="hljs-built_in">max</span>()+<span class="hljs-number">1</span>
x2_min, x2_max = X[:, <span class="hljs-number">1</span>].<span class="hljs-built_in">min</span>()<span class="hljs-number">-1</span>, X[:, <span class="hljs-number">1</span>].<span class="hljs-built_in">max</span>()+<span class="hljs-number">1</span>
t1 = np.linspace(x1_min, x1_max, <span class="hljs-number">666</span>)
t2 = np.linspace(x2_min, x2_max, <span class="hljs-number">666</span>)

x1, x2 = np.meshgrid(t1, t2)
y_hat = classifier.predict(np.array([x1.ravel(), x2.ravel()]).T)
y_hat = y_hat.reshape(x1.shape)
plt.contourf(x1, x2, y_hat, alpha=<span class="hljs-number">0.2</span>, cmap=cmap)
plt.xlim(x1_min, x1_max)
plt.ylim(x2_min, x2_max)

<span class="hljs-keyword">for</span> ind, clas <span class="hljs-keyword">in</span> <span class="hljs-built_in">enumerate</span>(np.unique(y)):
    plt.scatter(X[y == clas, <span class="hljs-number">0</span>], X[y == clas, <span class="hljs-number">1</span>], alpha=<span class="hljs-number">0.8</span>, s=<span class="hljs-number">50</span>,
                c=color_list[ind], marker=marker_list[ind], label=label_list[clas])


四、训练模型
4.1 训练模型(n_e=10, l_r=0.8)
adbt = AdaBoostClassifier(DecisionTreeClassifier(max_depth=2, min_samples_split=20, min_samples_leaf=5),
                          algorithm="SAMME", n_estimators=10, learning_rate=0.8)
adbt.fit(X, y)

AdaBoostClassifier(algorithm='SAMME',
          base_estimator=DecisionTreeClassifier(class_weight=None, criterion='gini', max_depth=2,
            max_features=None, max_leaf_nodes=None,
            min_impurity_decrease=0.0, min_impurity_split=None,
            min_samples_leaf=5, min_samples_split=20,
            min_weight_fraction_leaf=0.0, presort=False, random_state=None,
            splitter='best'),
          learning_rate=0.8, n_estimators=10, random_state=None)

4.2 可视化
plot_decision_regions(X, y, classifier=adbt)
plt.xlabel('花瓣长度（cm）', fontproperties=font)
plt.ylabel('花瓣宽度（cm）', fontproperties=font)
plt.title('AdaBoost算法代码(鸢尾花分类, n_e=10, l_r=0.8)',
          fontproperties=font, fontsize=20)
plt.legend(prop=font)
plt.show()


print("Score:{}".format(adbt.score(X, y)))

Score:0.9866666666666667

4.3 训练模型(n_estimators=300, learning_rate=0.8)
adbt = AdaBoostClassifier(DecisionTreeClassifier(max_depth=2, min_samples_split=20, min_samples_leaf=5),
                          algorithm="SAMME", n_estimators=300, learning_rate=0.8)
adbt.fit(X, y)
print("Score:{}".format(adbt.score(X, y)))

Score:0.9933333333333333

由于样本太少，可能效果不明显，但是对比上一个模型可以发现，相同步长的情况下，如果弱学习个数越多，拟合效果越好，但如果过多则可能过拟合。
4.4 训练模型(n_estimators=300, learning_rate=0.5)
adbt = AdaBoostClassifier(DecisionTreeClassifier(max_depth=2, min_samples_split=20, min_samples_leaf=5),
                          algorithm="SAMME", n_estimators=300, learning_rate=0.001)
adbt.fit(X, y)
print("Score:{}".format(adbt.score(X, y)))

Score:0.9533333333333334

相同迭代次数的情况下，对比上一个模型可以发现，如果步长越大，则模型效果越好。
4.5 训练模型(n_estimators=600, learning_rate=0.7)
adbt = AdaBoostClassifier(DecisionTreeClassifier(max_depth=2, min_samples_split=20, min_samples_leaf=5),
                          algorithm="SAMME", n_estimators=600, learning_rate=0.8)
adbt.fit(X, y)
print("Score:{}".format(adbt.score(X, y)))

Score:0.9933333333333333

对比第二个模型，可以发现即使增加迭代次数，算法准确率也没有提高，所以n_estimators=300的时候其实算法就已经收敛了。



	

                
                
                内容总结
                
                    
                        以上是互联网集市为您收集整理的04-04 AdaBoost算法代码(鸢尾花分类)全部内容，希望文章能够帮你解决04-04 AdaBoost算法代码(鸢尾花分类)所遇到的程序开发问题。
                        如果觉得互联网集市技术教程内容还不错，欢迎将互联网集市网站推荐给程序员好友。
                    
                
                内容备注
                
                    
                        版权声明：本文内容由互联网用户自发贡献，该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容， 请发送邮件至 gblab@vip.qq.com 举报，一经查实，本站将立刻删除。
                    
                
                内容手机端
                
                    
                    
                        扫描二维码推送至手机访问。
                        本文链接：https://qyyshop.com/info/617675.html
                    
                
                
                
                来源：【匿名】


        


    
    【上一篇】排序算法之归并排序（递归方式实现）——c++【下一篇】浅谈php实现映射的两种方法（链表和二叉树）

            
                
                    更多 ► 
                    【04-04 AdaBoost算法代码(鸢尾花分类)】教程文章相关的互联网学习教程文章
                
                

算法学习#03--详解最小二乘法原理和代码【代码】【图】
最小二乘法原理最小二乘法的目标：求误差的最小平方和，对应有两种：线性和非线性。线性最小二乘的解是closed-form（如下文），而非线性最小二乘没有closed-form，通常用迭代法求解（如高斯牛顿迭代法，本文不作介绍）。【首先得到线性方程组】1.概念最小二乘法（又称最小平方法）是一种数学优化技术。它通过最小化误差的平方和寻找数据的最佳函数匹配。利用最小二乘法可以简便地求得未知的数据，并使得这些求得的数据与实际数据之...
编程算法 - K路归并排序(k-way merge sort) 代码(C++)【图】
K路归并排序(k-way merge sort) 代码(C++)本文地址: http://blog.csdn.net/caroline_wendyK路归并排序作为经典的外部排序算法, 是程序员必须要掌握的.知识概念参考: <数据结构>主要思想: 在k个已排序的文件中, 选择第一个值, 采用败者树, 更新二叉树结构, 最终选择最优值.代码仅供参考, 如最小值用(-1)代替, 最大值用(100)代替./** main.cpp**  Created on: 2014年9月11日*      Author: Spike*/#include <fstream>
#include <iost...
ID3决策树算法原理及C++实现(其中代码转自别人的博客)【图】
分类是数据挖掘中十分重要的组成部分.分类作为一种无监督学习方式被广泛的使用.之前关于"数据挖掘中十大经典算法"中,基于ID3核心思想的分类算法C4.5榜上有名.所以不难看出ID3在数据分类中是多么的重要了.ID3又称为决策树算法,虽然现在广义的决策树算法不止ID3一种,但是由于ID3的重要性,习惯是还是把ID3和决策树算法等价起来.另外无监督学习方式我还要多说两句.无监督学习方式包括决策树算法,基于规则的分类,神经网络等.这些分类方式...
JAVA的六大经典算法，代码案例简化分析【图】
java八大经典算法：冒泡、选择、快速、插入、希尔、堆、归并、基数1.算法实现类package com.algorithm;/*** * @Title: BubbleSort.java* @Copyright: Copyright (c) 2005* @Description: <br>* <br>*               JAVA六大经典算法<br>*               冒泡、选择、快速、插入、希尔、堆* @Created on 2015年6月29日 下午12:48:14* @author yangkai*/
public class AlgorithmClassic {/*** 冒泡排序* * @return*/public static i...
图像锐化算法(Image sharpening):拉普拉斯增强和Unsharp Masking(附代码)【代码】【图】
图像锐化算法(Image sharpening):拉普拉斯增强和Unsharp Masking(附代码)\(y(m,n)=x(m,n)+\lambda*z(m,n)\)
其中\(x(m,n)\)是处理前图片,\(y(m,n)\)是锐化后，\(z(m,n)\)代表增强图像的边缘和细节(高频部分),\(\lambda\)是增强因子,如下图所示:1.laplacian 增强def laplacianSharpen(im, alpha):k = np.array([[0, 0, 0, ], [0, 1, 0], [0, 0, 0]])+alpha *         np.array([[0, -1, 0], [-1, 4, -1], [0, -1, 0]])# k = np.arra...
一些算法的实现代码【代码】
1.斐波那契数列 Fibonacci
class fab{
        public static void main(String args[]){
// fab(47) int 溢出
                for(int i=0;i<47;i++)
                        System.out.print(fab(i)+" ");
                System.out.println();        }
        public static int fab(int n){
                if(n==0) return 0;
                if(n==1) return 1;
                int fa=0;
                int fb=...
编程算法 - 食物链 并查集 代码(C)【图】
食物链 并查集 代码(C)本文地址: http://blog.csdn.net/caroline_wendy题目: 有N只动物, 分别编号为1,2,...,N. 所有动物都属于A,B,C中的一种. 已知A吃B, B吃C, C吃A.按顺序给出两种信息K条.第一种: x和y属于同一类.第二种: x吃y. 信息之间可能会出错和矛盾, 求不正确的信息数.例如:有N=10只动物, 给定K=7条信息.(1) 1: x=101, y=1; 出错:没有101的动物.(2) 2: x=1, y=2; 动物1吃动物2.(3) 2: x=2, y=3; 动物2吃动物3.(4) 2: x=3, y...
k-means算法MATLAB和opencv代码【代码】【图】
上一篇博客写了k-means聚类算法和改进的k-means算法，这篇博客就贴出对应的MATLAB和C++代码。以下是MATLAB代码，实现用k-means进行分割：%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%功能：实现如何利用Kmeans聚类实现图像的分割；时间：2015-07%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%functionkmeans_segmentation()clear;close all;clc;%% 读取测试图像im = imread(‘city.jpg‘);imshow(im), title(‘Imput image‘); ...
编程算法 - 背包问题(记忆化搜索) 代码(C)【图】
背包问题(记忆化搜索) 代码(C)本文地址: http://blog.csdn.net/caroline_wendy题目参考: http://blog.csdn.net/caroline_wendy/article/details/37912949使用记忆化搜索, 需要存储每组的值, 下次不需要进行继续迭代, 可以降低至时间复杂度O(nW).代码:/** main.cpp**  Created on: 2014.7.17*      Author: spike*//*eclipse cdt, gcc 4.8.1*/#include <stdio.h>
#include <memory.h>
#include <limits.h>#include <utility>
#inclu...
编程算法 - 最好牛线(Best Cow Line) 代码(C)【图】
最好牛线(Best Cow Line) 代码(C)本文地址: http://blog.csdn.net/caroline_wendy题目: 给定长度为N的字符串S, 要构造一个长度为N的字符串T. 反复进行如下任意操作.从S的头部删除一个字符, 放入T的尾部;从S的尾部删除一个字符, 放入T的尾部;目标是要构造字典序尽可能小的字符串T.使用贪心算法, 不断选取S首尾最小的字符, 放入T, 如果相等, 则再次向内查找, 找到内部最小的.代码:/** main.cpp**  Created on: 2014.7.17*      Autho...
c++几种排序算法代码【代码】【图】
1 #include <iostream>2 #include <vector>3usingnamespace std;4  5//交换int  6void swap(int& a, int& b){7int temp = a;8     a = b;9     b = temp;    10}11 12//冒泡 13void BulletSort(vector<int>& nums){14int n = nums.size();15for (int i = 0; i < nums.size()-1; i++){16for (int j = 0; j < nums.size() - i -1; j++){17if (nums[j] > nums[j+1]){18                 swap(nums[j], nums[j+1]);19            }20  ...
第七篇：Logistic回归分类算法原理分析与代码实现【代码】【图】
前言       本文将介绍机器学习分类算法中的Logistic回归分类算法并给出伪代码，Python代码实现。       (说明：从本文开始，将接触到最优化算法相关的学习。旨在将这些最优化的算法用于训练出一个非线性的函数，以用于分类。)算法原理       首先要提到的概念是回归。       对于回归这个概念，在以后的文章会有系统而深入的学习。简单的说，回归就是用一条线对N多数据点进行一个拟合，这个拟合的过程就叫做回归。       Logistic...
KNN算法java实现代码注释【代码】【图】
K近邻算法思想非常简单，总结起来就是根据某种距离度量检测未知数据与已知数据的距离，统计其中距离最近的k个已知数据的类别，以多数投票的形式确定未知数据的类别。 一直想自己实现knn的java实现，但限于自己的编程水平，java刚刚入门，所以就广泛搜索网上以实现的java代码来研习。下面这个简单的knn算法的java实现是在这篇博客中找到的：http://blog.csdn.net/luowen3405/article/details/6278764 下面给出我对代码的注释，如果有...
遗传算法解决3SAT问题（C++实现代码）【代码】【图】
1 SAT问题描述命题逻辑中合取范式 (CNF) 的可满足性问题 (SAT)是当代理论计算机科学的核心问题, 是一典型的NP 完全问题.在定义可满足性问题SAT之前，先引进一些逻辑符号。 
一个 SAT 问题是指: 对于给定的 CNF 是否存在一组关于命题变元的真值指派使A为真. 显然,如A为真,则CNF的每个子句中必有一个命题变元为1(真)。2   遗传算法遗传算法类似于自然进化，通过作用于染色体上的基因寻找好的染色体来求解问题。与自然界相似，遗传算法...
协同过滤算法参考代码
代码有问题，运行出错，寻找解决办法，是不是数据集的错误呢？ #include<iostream>#include<queue>#include<cmath>#include<cassert>#include<cstdlib>#include<fstream>#include<sstream>#include<vector>#include<algorithm>using namespace std;const int ITERM_SIZE=1682;const int USER_SIZE=943;const int V=15;        //ITERM的最近邻居数const int S=10;        //USER的最近邻居数struct MyPair{    int id;    double v...


    

算法 - 相关标签
算法笔记算法导论算法的时间复杂度算法第四版算法分析算法分析与设计算法复杂度算法工程师算法竞赛入门经典算法面试算法面试题算法模型算法设计与分析算法时间复杂度算法题算法图解算法学习算法与数据结构




    
        算法 - 最新教程
    
树，二叉树和算法总结各种加密算法比较HMAC-SHA1算法签名及Authorization头认...python实现排序算法（一）——插入排序...C/C++算法竞赛入门经典Page15 习题1-1 ...LeetCode面试题 08.12. 八皇后---回溯算...十大经典排序算法记一道有意思的算法题Rotate Image（旋...基础算法之选择排序SEO优化：浅析搜索引擎算法如何判断一个...



    算法 - 最热教程
    浅谈SQLServer查询优化器中的JOIN算法有没那种可逆算法是密文比明文短的呢？...javascript-类似Excel里面的NORMDIST函...C++中的分治算法及常见题目汇总压缩感知重构算法综述-学习笔记c++中内置函数qsort（快速排序）和bsea...一、fpga图像处理算法整合基于遗传算法（deap）的非线性函数寻优...集成学习-Bagging集成学习算法随机森林...机器学习笔记（九）聚类算法及实践（K-...