首页 / PYTHON / [Python数据挖掘]第2章、Python数据分析简介

[Python数据挖掘]第2章、Python数据分析简介

内容导读

互联网集市收集整理的这篇技术教程文章主要介绍了[Python数据挖掘]第2章、Python数据分析简介，小编现在分享给大家，供广大互联网技能从业者学习和参考。文章包含2652字，纯文字阅读大概需要4分钟。

内容图文

1、Python数据结构

技术分享图片

2、Numpy数组

            import numpy as np #一般以np作为numpy的别名

a = np.array([2, 0, 1, 5]) #创建数组print(a) #输出数组print(a[:3]) #引用前三个数字（切片）print(a.min()) #输出a的最小值
a.sort() #将a的元素从小到大排序，此操作直接修改a，因此这时候a为[0, 1, 2, 5]
b= np.array([[1, 2, 3], [4, 5, 6]]) #创建二维数组print(b*b) #输出数组的平方阵，即[[1, 4, 9], [16, 25, 36]]

[2 0 1 5]
[2 0 1]
0
[[ 1  4  9]
 [16 25 36]]

3、Scipy矩阵

            from scipy.optimize import fsolve #导入求解方程组的函数from scipy import integrate #导入积分函数def f(x): #定义要求解的方程组
  x1 = x[0]
  x2 = x[1]
  return [2*x1 - x2**2 - 1, x1**2 - x2 -2]
result = fsolve(f, [1,1]) #输入初值[1, 1]并求解print(result) #输出结果，为array([ 1.91963957,  1.68501606])#数值积分def g(x): #定义被积函数return (1-x**2)**0.5
pi_2, err = integrate.quad(g, -1, 1) #积分结果和误差print(pi_2 * 2) #由微积分知识知道积分结果为圆周率pi的一半

[ 1.91963957  1.68501606]
3.141592653589797

4、Matplotlib可视化

            import
             numpy as np

            import matplotlib.pyplot as plt #导入Matplotlib
x = np.linspace(0, 10, 1000) #作图的变量自变量
y = np.sin(x) + 1 #因变量y
z = np.cos(x**2) + 1 #因变量z
plt.figure(figsize = (8, 4)) #设置图像大小
plt.plot(x,y,label = ‘$\sin x+1$‘, color = ‘red‘, linewidth = 2) #作图，设置标签、线条颜色、线条大小
plt.plot(x, z, ‘b--‘, label = ‘$\cos x^2+1$‘)  #作图，设置标签、线条类型
plt.xlabel(‘Time(s) ‘) # x轴名称
plt.ylabel(‘Volt‘) # y轴名称
plt.title(‘A Simple Example‘) #标题
plt.ylim(0, 2.2) #显示的y轴范围
plt.legend() #显示图例
plt.show() #显示作图结果

技术分享图片

5、Pandas数据分析和探索

Pandas基本数据结构是Series和DataFrame

s = pd.Series([1,2,3], index=[‘a‘, ‘b‘, ‘c‘]) #创建一个序列s
d = pd.DataFrame([[1, 2, 3], [4, 5, 6]], columns = [‘a‘, ‘b‘, ‘c‘]) #创建一个表
d2 = pd.DataFrame(s) #也可以用已有的序列来创建表格

技术分享图片

            #
            读取文件，注意文件的存储路径不能带有中文，否则读取可能出错。
pd.read_excel(‘data.xls‘) #读取Excel文件，创建DataFrame。
pd.read_csv(‘data.csv‘, encoding = ‘utf-8‘) #读取文本格式的数据，一般用encoding指定编码。#d.head() #预览前5行数据
d.describe() #数据基本统计量

技术分享图片

6、Keras神经网络

构建一个MLP(多层感知器),　　无法运行，需要适配相应的数据

            from keras.models import Sequential
from keras.layers.core import Dense,Dropout,Activation
from keras.optimizers import SGD

model=Sequential()                    #模型初始化
model.add(Dense(64,input_dim=20))     #添加输入层（20节点）、第一隐藏层（64节点）的连接
model.add(Activation(‘tanh‘))         #第一隐藏层用tanh作为激活函数
model.add(Dropout(0.5))               #使用Dropout防止过拟合
model.add(Dense(64,input_dim=64, init=‘uniform‘))        #添加第一隐藏层（64节点）、第二隐藏层（64节点）的连接
model.add(Activation(‘tanh‘))         #第二隐藏层用tanh作为激活函数
model.add(Dropout(0.5))
model.add(Dense(1,input_dim=64))      #添加第二隐藏层（64节点）、输出层（1节点）的连接
model.add(Activation(‘sigmoid‘))      #输出层用sigmoid作为激活函数 
sgd = SGD(lr=0.1, decay=1e-6, momentum=0.9, nesterov=True)        #定义求解算法
model.compile(loss=‘mean_squared_error‘, optimizer=sgd)           #编译生成模型，损失函数为mean_squared_error 
model.fit(X_train, y_train, nb_epoch=20, batch_size=16)           #训练模型
score=model.evaluate(X_test,y_test,batch_size=16)                 #测试模型

原文：https://www.cnblogs.com/little-monkey/p/10022623.html

内容总结

以上是互联网集市为您收集整理的[Python数据挖掘]第2章、Python数据分析简介全部内容，希望文章能够帮你解决[Python数据挖掘]第2章、Python数据分析简介所遇到的程序开发问题。如果觉得互联网集市技术教程内容还不错，欢迎将互联网集市网站推荐给程序员好友。

内容备注

版权声明：本文内容由互联网用户自发贡献，该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容，请发送邮件至 gblab@vip.qq.com 举报，一经查实，本站将立刻删除。

内容手机端

扫描二维码推送至手机访问。

本文链接：https://qyyshop.com/info/1109533.html

来源：【匿名】

【上一篇】python基础_类型_dict 【下一篇】浅谈PHP运行Python脚本的方法

更多 ►

【[Python数据挖掘]第2章、Python数据分析简介】教程文章相关的互联网学习教程文章

【Python数据挖掘课程】三.Kmeans聚类代码实现、作业及优化【图】

这篇文章直接给出上次关于Kmeans聚类的篮球远动员数据分析案例，同时介绍这次作业同学们完成的图例，最后介绍Matplotlib包绘图的优化知识。前文推荐：【Python数据挖掘课程】一.安装Python及爬虫入门介绍【Python数据挖掘课程】二.Kmeans聚类数据分析及Anaconda介绍希望这篇文章对你有所帮助，尤其是刚刚接触数据挖掘以及大数据的同学，同时准备尝试以案例为主的方式进行讲解。如果文章中存在不足或...

萌新向Python数据分析及数据挖掘第一章 Python基础第三节列表简介第四节操作列表【代码】【图】

第一章 Python基础第三节列表简介列表是是处理一组有序项目的数据结构，即可以在一个列表中存储一个序列的项目。列表中的元素包括在方括号（[]）中，每个元素之间用逗号分割。列表是可变的数据类型，可以添加、删除或是搜索列表中的元素。列表可以理解为你用铅笔在笔记本里记录内容，内容可以修改，每一行用逗号隔开。 3.1访问元素访问列表元素可以通过索引方括号的形式，记住，索引从0而不是1开始！代码：1 shoplist = [‘appl...

【Python数据挖掘课程】九.回归模型LinearRegression简单分析氧化物数据【图】

这篇文章主要介绍三个知识点，也是我《数据挖掘与分析》课程讲课的内容。同时主要参考学生的课程提交作业内容进行讲述，包括： 1.回归模型及基础知识； 2.UCI数据集； 3.回归模型简单数据分析。前文推荐：【Python数据挖掘课程】一.安装Python及爬虫入门介绍【Python数据挖掘课程】二.Kmeans聚类数据分析及Anaconda介绍【Python数据挖掘课程】三.Kmeans聚类代码实现、作业及优化...

python 第一周（第一天）我的python成长记一个月搞定python数据挖掘！

python代码的组织方式： .py 文件模块文件样式：#!/usr/bin/python#-*-coding:utf8-*- """@author: yugengde@contact: yugengde@163.com@file : ${NAME}.py@time: ${DATE} ${TIME}"""def fun(): passclass a(object): passif __name__ == ‘__main__‘: pass 2. __name__ 的作用python模块的执行方法　　python ***.py　　import ***主模块，非主模块 __name__ == ‘__main__‘ 直接python运行的模块为主模块，import的...

Python数据挖掘—回归—贝叶斯分类【代码】【图】

pandas之get_dummies方法：pandas.get_dummies(data,prefix=None,prefix_sep="_",dummy_na=False,columns=None,sparse=False,drop_first=False)该方法可以将类别变量转换成新增的虚拟变量/指示变量参数说明：data：array-like、Series 、 DataFrame ，输入数据prefix：string、list of strings、dict of strings ，default为None，get_dummies转换后，列名的前缀columns：list-like， default为False，指定需要实现类别转换的列名...

[Python数据挖掘]第2章、Python数据分析简介【代码】【图】

1、Python数据结构2、Numpy数组import numpy as np #一般以np作为numpy的别名 a = np.array([2, 0, 1, 5]) #创建数组print(a) #输出数组print(a[:3]) #引用前三个数字（切片）print(a.min()) #输出a的最小值 a.sort() #将a的元素从小到大排序，此操作直接修改a，因此这时候a为[0, 1, 2, 5] b= np.array([[1, 2, 3], [4, 5, 6]]) #创建二维数组print(b*b) #输出数组的平方阵，即[[1, 4, 9], [16, 25, 36]][2 0 1 5] [2 0 1] 0 [[ 1 ...

python 第二周（第十天）我的python成长记一个月搞定python数据挖掘！(18) -mongodb【代码】

1. 首先导入工具from scrapy.selector import Selector2. selectors的使用实例：response.selector.xpath(‘//span/text()‘).extract() (1)选择title标签中text的文本内容 response.selector.xpath(‘//title/text()‘) 提供两个更简单的方法 response.xpath(‘//title/text()‘) response.css(‘title::text‘) 例子： response.css(‘img‘).xpath(‘@src‘).extract...

数据挖掘——回归分析2——简单神经网络的python实现【代码】【图】

? 神经网络(Artificial Neural Network)：全称为人工神经网络（ANN），是一种模仿生物神经网络（动物的中枢神经系统，特别是大脑）的结构和功能的数学模型或计算模型。 ? 部分原理：下面是单个神经元的数学模型： +1代表偏移值(偏置项, Bias Units)；X1,X2,X2代表初始特征；w0,w1,w2,w3代表权重(Weight)，即参数，是特征的缩放倍数；特征经过缩放和偏移后全部累加起来，此后还要经过一次激活运算然后再输出。最常见的激活函数是...

Python,用于频繁模式的Web日志数据挖掘

我需要开发一个用于Web日志数据挖掘的工具. 在特定用户会话中请求的许多网址序列(从网络应用程序日志中检索),我需要弄清楚网站用户的使用模式和组(群集). 我是Data Mining的新手,现在正在检查Google.找到一些有用的信息,即查询Frequent Pattern Mining in Web Log Data似乎指向几乎完全相似的研究. 所以我的问题是： >是否有任何基于python的工具可以满足我的需要或者至少相似？> Orange toolkit可以提供任何帮助吗？>可以阅读这本...

首页 / PYTHON / [Python数据挖掘]第2章、Python数据分析简介

[Python数据挖掘]第2章、Python数据分析简介

内容导读

内容图文

1、Python数据结构

2、Numpy数组

3、Scipy矩阵

4、Matplotlib可视化

5、Pandas数据分析和探索

6、Keras神经网络

内容总结

内容备注

内容手机端

【[Python数据挖掘]第2章、Python数据分析简介】教程文章相关的互联网学习教程文章

【Python数据挖掘课程】三.Kmeans聚类代码实现、作业及优化【图】

萌新向Python数据分析及数据挖掘第一章 Python基础第三节列表简介第四节操作列表【代码】【图】

【Python数据挖掘课程】九.回归模型LinearRegression简单分析氧化物数据【图】

python 第一周（第一天）我的python成长记一个月搞定python数据挖掘！

Python数据挖掘—回归—贝叶斯分类【代码】【图】

[Python数据挖掘]第2章、Python数据分析简介【代码】【图】

python 第二周（第十天）我的python成长记一个月搞定python数据挖掘！(18) -mongodb【代码】

数据挖掘——回归分析2——简单神经网络的python实现【代码】【图】

Python,用于频繁模式的Web日志数据挖掘

Python在网页爬虫、数据挖掘、机器学习和自然语言处理领域的应用情况如何？

python数据挖掘需要学什么【图】

python数据挖掘需要学什么【图】

深入分析python数据挖掘Json结构分析【图】

目前创办一家数据挖掘的公司难点在哪里？【图】

如何从拉勾网往里面来看互联网企业里面的数据挖掘现状如何？【图】

数据挖掘 - 相关标签

数据分析 - 相关标签

PYTHON - 技术教程分类

PYTHON - 最新教程

PYTHON - 最热教程