机器学习实战

以下是为您整理出来关于【机器学习实战】合集内容,如果觉得还不错,请帮忙转发推荐。

【机器学习实战】技术教程文章

机器学习day16 机器学习实战Apriori算法进行关联分析【图】

上一章学习了非监督学习的聚类,聚类算法可以将不同性质的分类分开。这两天学习了apriori算法进行关联分析,感觉是目前最难理解的一章了,并且书中还有个很坑爹的错误,作者存在很大的疏忽。Apriori算法关联分析:从大规模数据集中寻找物品间的隐含关系被称作关联分析或者关联规则学习。关联分析应用1:我们以前学习的是根据特性进行分类或者回归预测,并没有挖掘特性之间的关系,关联分析可以用于分析数据集中特性之间的关系,可以...

《机器学习实战》学习笔记第十二章 —— FP-growth算法【代码】

# coding:utf-8class treeNode: #树结点def__init__(self, nameValue, numOccur, parentNode):self.name = nameValue #这个结点所存的字母self.count = numOccur #结点计数器self.nodeLink = None #指向下一个同字母的结点的指针self.parent = parentNode # 指向父节点的指针,用于上溯self.children = {} #儿子结点的指针集def inc(self, numOccur): #更新结点计数器self.count += numOccurdef creat...

NBC朴素贝叶斯分类器 ————机器学习实战 python代码【代码】

# -*- coding: utf-8 -*- """ Created on Mon Aug 07 23:40:13 2017@author: mdz """ import numpy as np def loadData():vocabList=[[‘my‘, ‘dog‘, ‘has‘, ‘flea‘, ‘problems‘, ‘help‘, ‘please‘],[‘maybe‘, ‘not‘, ‘take‘, ‘him‘, ‘to‘, ‘dog‘, ‘park‘, ‘stupid‘],[‘my‘, ‘dalmation‘, ‘is‘, ‘so‘, ‘cute‘, ‘I‘, ‘love‘, ‘him‘],[‘stop‘, ‘posting‘, ‘stupid‘, ‘worthless...

【机器学习实战之三】:C++实现K-均值(K-Means)聚类算法【图】

聚类是一种无监督的学习,它将相似的对象归到同一个簇中。它有点像全自动分类(类别体系是自动构建的)。聚类方法几乎可以应用于所有对象,簇内的对象越相似,聚类的效果越好。本文要介绍一种称为K-均值(K-means)聚类的算法。之所以称之为K-均值是因为它可以发现k个不同的簇,且每个簇的中心采用簇中所含值的均值计算而成。在介绍K-均值之前,先讨论一席簇识别(cluster identification)。簇识别给出聚类结果的含义。假定有一些...

机器学习实战(2)—— k-近邻算法【代码】【图】

老板:来了,老弟!我:来了来了。老板:今天你要去看看KNN了,然后我给你安排一个工作!我:好嘞!就是第二章吗?老板:对!去吧!可恶的老板又给我安排任务了!《机器学习实战》这本书中的第二章为我们介绍了K-近邻算法,这是本书中第一个机器学习算法,它非常有效而且易于掌握,所以可以算是入门级算法了。那我们现在就一起去学习一下!2.1 k-近邻算法概述简单的说,k-近邻算法采用测量不同特征值之间的距离进行分类。其工作原理...

《机器学习实战(基于scikit-learn和TensorFlow)》第七章内容学习心得【图】

本章主要讲述了“集成学习”和“随机森林”两个方面。重点关注:bagging/pasting、boosting、stacking三个方法。首先,提出一个思想,如果想提升预测的准确率,一个很好的方法就是用集成的方法。让多种预测器尽可能相互独立,使用不同的算法进行训练。最后以预测器中的预测结果的多数作为最终结果或者将平均概率最高的结果作为最后的结果。还有没有其他的方法呢,有的。Bagging/Pasting方法:每个预测器使用的算法相同,但是在不同...

机器学习实战------利用logistics回归预测病马死亡率【图】

大家好久不见,实战部分一直托更,很不好意思。本文实验数据与代码来自机器学习实战这本书,倾删。一:前期代码准备1.1数据预处理还是一样,设置两个数组,前两个作为特征值,后一个作为标签。当然这是简单的处理,实际开发中特征值都是让我们自己选的,所以有时候对业务逻辑的理解还是很重要的。 1.2 sigmoid函数设置1.3固定步长梯度上升算法这段代码见一面1.4节。Alpha表示步长,maxcycles表示最大的迭代次数,其中weights=ones(...

《Python数据分析与机器学习实战-唐宇迪》读书笔记第19章--卷积神经网络【代码】

python数据分析个人学习读书笔记-目录索引 19章卷积神经网络   本章介绍现阶段神经网络中非常火的模型——卷积神经网络,它在计算机视觉中有着非常不错的效果。不仅如此,卷积神经网络在非图像数据中也有着不错的表现,各项任务都有用武之地,可谓在机器学习领域遍地开花。那么什么是卷积呢?网络的核心就在于此,本章将带大家一步步揭开卷积神经网络的奥秘。 19.1卷积操作原理   卷积神经网络也是神经网络的一种,本质上来说都...

机器学习实战(七)【代码】【图】

title: 机器学习实战(七) date: 2020-04-07 09:20:50 tags: [AdaBoost, bagging, boosting, ROC] categories: 机器学习实战 更多内容请关注我的博客 利用AdaBoost元算法提高分类性能 在做决定时,大家可能会吸取多个专家而不是一个人的意见,机器学习也有类似的算法,这就是元算法(meta-algorithm)。 元算法是对其他算法进行组合的一种方式。 基于数据集多重抽样的分类器 前面已经学习了五种不同的分类算法,它们各有优缺点,我...

机器学习实战源码第二章KNN算法2.1

from numpy import * import operator from os import listdir import matplotlib.pyplot as plt"""程序清单2-1 K近邻算法""" def classify0(inX, dataSet, labels, k): dataSetSize = dataSet.shape[0] diffMat = tile(inX, (dataSetSize, 1)) - dataSet sqDiffMat = diffMat**2 sqDistances = sqDiffMat.sum(axis=1) distances = sqDistances**0.5 sortedDistIndicies = distances.argsort() classC...