数据挖掘相关学习资源源码的下载及资源代码的在线浏览

数据挖掘

以下是为您整理出来关于【数据挖掘】合集内容，如果觉得还不错，请帮忙转发推荐。

【数据挖掘】技术教程文章

大数据时代：基于微软案例数据库数据挖掘知识点总结（Microsoft 时序算法）【图】

原文:（原创）大数据时代：基于微软案例数据库数据挖掘知识点总结（Microsoft 时序算法）前言本篇文章同样是继续微软系列挖掘算法总结，前几篇主要是基于状态离散值或连续值进行推测和预测，所用的算法主要是三种：Microsoft决策树分析算法、Microsoft聚类分析算法、Microsoft Naive Bayes 算法,当然后续还补充了一篇结果预测篇，所涉及的应用场景在前几篇文章中也有介绍，有兴趣的同学可以点击查看，本篇我们将总结的算法为Micros...

大数据时代：基于微软案例数据库数据挖掘知识点总结（Microsoft 决策树分析算法）【图】

原文:（原创）大数据时代：基于微软案例数据库数据挖掘知识点总结（Microsoft 决策树分析算法）随着大数据时代的到来，数据挖掘的重要性就变得显而易见，几种作为最低层的简单的数据挖掘算法，现在利用微软数据案例库做一个简要总结。应用场景介绍其实数据挖掘应用的场景无处不在，很多的环境都会应用到数据挖掘，之前我们没有应用是因为还没有学会利用数据，或者说还没有体会到数据的重要性，现在随着IT行业中大数据时代的到来，让...

数据挖掘经典算法——先验算法【代码】【图】

算法描述　　先验算法是实现频繁项挖掘的一种经典算法，利用关联式规则不断扩展频繁项子集以获得全部的频繁项集合。解释一下关联式规则，所谓关联式是指在大量的数据中找出的项与项之间的关系。例如消费者购买了产品A，一般都会购买产品B，这就是一条关联式。　　先验算法被设计用来处理包含事务的数据库，这里的每一个事务都被当成是一组项集，给定一个阈值C，我们需要找出至少出现C次的事务子集（即子项）。这边这个C值就是最小支...

python 第二周（第八天）我的python成长记一个月搞定python数据挖掘！(15)

scrapy爬虫企业级爬虫：python开发的一个快速，高层次的web抓取框架，用于抓取web站点并从页面提取结构化的数据。scrapy用途广泛，可用于数据挖掘，数据监测和自动化测试 http://scrapy.org/ scrapy startproject proNamescrapy genspider nameSpider "startURL"scrapy crawl nameSpider 原文：http://www.cnblogs.com/yugengde/p/7260002.html

数据挖掘笔试面试（5）【图】

前言：　　找工作时（IT行业），除了常见的软件开发以外，机器学习岗位也可以当作是一个选择，不少计算机方向的研究生都会接触这个，如果你的研究方向是机器学习/数据挖掘之类，且又对其非常感兴趣的话，可以考虑考虑该岗位，毕竟在机器智能没达到人类水平之前，机器学习可以作为一种重要手段，而随着科技的不断发展，相信这方面的人才需求也会越来越大。　　纵观IT行业的招聘岗位，机器学习之类的岗位还是挺少的，国内大点的公司里...

数据挖掘之clara算法原理及实例(代码中有bug)

继上两篇文章介绍聚类中基于划分思想的k-means算法和k-mediod算法本文将继续介绍第二种基于划分思想的k-mediod算法-----clara算法clara算法能够说是对k-mediod算法的一种改进,就如同k-mediod算法对k-means算法的改进一样.clara(clustering large application)算法是应用于大规模数据的聚类.而其核心算法还是利用k-mediod算法.仅仅是这样的算法弥补了k-mediod算法仅仅能应用于小规模数据的缺陷.clara算法的核心是,先对大规模数据进行...

MapReduce 支持的部分数据挖掘算法【图】

MapReduce 支持的部分数据挖掘算法MapReduce 能够解决的问题有一个共同特点：任务可以被分解为多个子问题，且这些子问题相对独立，彼此之间不会有牵制，待并行处理完这些子问题后，任务便被解决。在实际应用中，这类问题非常庞大，谷歌在论文中提到了MapReduce 的一些典型应用，包括分布式grep、URL 访问频率统计、Web 连接图反转、倒排索引构建、分布式排序等，这些均是比较简单的应用。下面介绍一些比较复杂的应用。（1）TopK...

[Python数据挖掘]第4章、数据预处理【代码】【图】

数据预处理主要包括数据清洗、数据集成、数据变换和数据规约，处理过程如图所示。一、数据清洗 1.缺失值处理：删除、插补、不处理 ## 拉格朗日插值代码（使用缺失值前后各5个未缺失的数据建模）import pandas as pd #导入数据分析库Pandasfrom scipy.interpolate import lagrange #导入拉格朗日插值函数 inputfile = ‘../data/catering_sale.xls‘#销量数据路径 outputfile = ‘../tmp/sales.xls‘#输出数据路径...

数据挖掘算法之关联规则挖掘（二）FPGrowth算法【图】

之前介绍的apriori算法中因为存在许多的缺陷，例如进行大量的全表扫描和计算量巨大的自然连接，所以现在几乎已经不再使用在mahout的算法库中使用的是PFP算法，该算法是FPGrowth算法的分布式运行方式，其内部的算法结构和FPGrowth算法相差并不是十分巨大所以这里首先介绍在单机内存中运行的FPGrowth算法还是使用apriori算法的购物车数据作为例子，如下图所示：TID为购物车项的编号，i1-i5为商品的编号FPGrowth算法的基本思想是，首先...

数据挖掘与算法第三次作业【代码】【图】

练习一：总结列表，元组，字典，集合的联系与区别列表：是Python中最基本的数据结构，序列中的每个元素都分配一个数字- 它的位置，或索引，第一个索引是0，第二个索引是1，依此类推。列表元素可以修改，允许重复项存在，它是有序的：排列顺序不同，两个列表就判定为不相等集合：1.set()为可改集合，frozenset() 是不可改集合 2.不同类型的变量组合 3.不允许重复项 4.无序的：排列顺序不同，只要包含内容相同，就判定为两集合...

1
2
3
4
5
6
7
8
...
21
下一页
共 21 页
共 202 条

数据挖掘 - 相关标签

数据挖掘数据挖掘导论数据挖掘的算法数据挖掘入门数据挖掘十大算法数据挖掘算法