首页 / PYTHON / Python机器学习：波斯顿房价预测

Python机器学习：波斯顿房价预测

内容导读

互联网集市收集整理的这篇技术教程文章主要介绍了Python机器学习：波斯顿房价预测，小编现在分享给大家，供广大互联网技能从业者学习和参考。文章包含2962字，纯文字阅读大概需要5分钟。

内容图文

波士顿房价预测

导入模块

import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
import seaborn as sns
from matplotlib.font_manager import FontProperties
from sklearn.linear_model import LinearRegression
%matplotlib inline
font = FontProperties(fname='/Library/Fonts/Heiti.ttc')

获取数据

??housing-data.txt文件可以加我微信获取：nickchen121

打印数据

df = pd.read_csv('housing-data.txt', sep='\s+', header=0)
df.head()

	CRIM	ZN	INDUS	NOX	RM	AGE	DIS	RAD	TAX	PTRATIO	B	LSTAT	MEDV
0	0.00632	18.0	2.31	0.538	6.575	65.2	4.0900	1	296.0	15.3	396.90	4.98	24.0
1	0.02731	0.0	7.07	0.469	6.421	78.9	4.9671	2	242.0	17.8	396.90	9.14	21.6
2	0.02729	0.0	7.07	0.469	7.185	61.1	4.9671	2	242.0	17.8	392.83	4.03	34.7
3	0.03237	0.0	2.18	0.458	6.998	45.8	6.0622	3	222.0	18.7	394.63	2.94	33.4
4	0.06905	0.0	2.18	0.458	7.147	54.2	6.0622	3	222.0	18.7	396.90	5.33	36.2

特征选择

散点图矩阵

??使用sns库的pairplot()方法绘制的散点图矩阵可以查看数据集内部特征之间的关系，例如可以观察到特征间分布关系以及离群样本。

??本文只绘制了三列（RM、MEDV(标记)、LSTAT）特征和标记之间的联系，有兴趣的可以调用该方法查看其它特征之间的关系。

# 选择三列特征
cols = ['RM', 'MEDV', 'LSTAT']
# 构造三列特征之间的联系即构造散点图矩阵
sns.pairplot(df[cols], height=3)
plt.tight_layout()
plt.show()

Python机器学习：波斯顿房价预测 - 文章图片

上图可以看出第一行(RM)第二列(MEDV)的特征与标记存在线性关系；第二行(MEDV)第二列(MEDV)即MEDV值可能呈正态分布。

关联矩阵

??使用sns.heatmap()方法绘制的关联矩阵可以看出特征之间的相关性大小，关联矩阵是包含皮尔森积矩相关系数的正方形矩阵，用来度量特征对之间的线性依赖关系。

# 求解上述三列特征的相关系数
'''
对于一般的矩阵X，执行A=corrcoef(X)后，A中每个值的所在行a和列b，反应的是原矩阵X中相应的第a个列向量和第b个列向量的
相似程度（即相关系数）
'''
cm = np.corrcoef(df[cols].values.T)
# 控制颜色刻度即颜色深浅
sns.set(font_scale=2)
# 构造关联矩阵
hm = sns.heatmap(cm, cbar=True, annot=True, square=True, fmt='.2f', annot_kws={
                 'size': 20}, yticklabels=cols, xticklabels=cols)
plt.show()

Python机器学习：波斯顿房价预测 - 文章图片

??上图可以看出特征LSTAT和标记MEDV的具有最高的相关性-0.74，但是在散点图矩阵中会发现LSTAT和MEDV之间存在着明显的非线性关系；而特征RM和标记MEDV也具有较高的相关性0.70，并且从散点矩阵中会发现特征RM和标记MEDV之间存在着线性关系。因此接下来将使用RM作为线性回归模型的特征。

训练模型

X = df[['RM']].values
y = df['MEDV'].values

lr = LinearRegression()
lr.fit(X, y)

LinearRegression(copy_X=True, fit_intercept=True, n_jobs=None,
         normalize=False)

可视化

plt.scatter(X, y, c='r', s=30, edgecolor='white',label='训练数据')
plt.plot(X, lr.predict(X), c='g')
plt.xlabel('平均房间数目[MEDV]', fontproperties=font)
plt.ylabel('以1000美元为计价单位的房价[RM]', fontproperties=font)
plt.title('波士顿房价预测', fontproperties=font, fontsize=20)
plt.legend(prop=font)
plt.show()
print('普通线性回归斜率:{}'.format(lr.coef_[0]))

Python机器学习：波斯顿房价预测 - 文章图片

普通线性回归斜率:9.10210898118031

??使用RANSAC算法之后可以发现线性回归拟合的线与未用RANSAC算法拟合出来的线的斜率不同，可以说RANSAC算法降低了离群值潜在的影响，但是这并不能说明这种方法对未来新数据的预测性能是否有良性影响。

内容总结

以上是互联网集市为您收集整理的Python机器学习：波斯顿房价预测全部内容，希望文章能够帮你解决Python机器学习：波斯顿房价预测所遇到的程序开发问题。如果觉得互联网集市技术教程内容还不错，欢迎将互联网集市网站推荐给程序员好友。

内容备注

版权声明：本文内容由互联网用户自发贡献，该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容，请发送邮件至 gblab@vip.qq.com 举报，一经查实，本站将立刻删除。

内容手机端

扫描二维码推送至手机访问。

本文链接：https://qyyshop.com/info/826751.html

来源：【匿名】

【上一篇】Python实现栈和队列【下一篇】浅谈PHP运行Python脚本的方法

更多 ►

【Python机器学习：波斯顿房价预测】教程文章相关的互联网学习教程文章

如何用Python实现常见机器学习算法-1【代码】【图】

最近在GitHub上学习了有关python实现常见机器学习算法目录一、线性回归　　　　1、代价函数　　　　2、梯度下降算法　　　　3、均值归一化　　　　4、最终运行结果　　　　5、使用scikit-learn库中的线性模型实现二、逻辑回归　　　　1、代价函数　　　　2、梯度　　　　3、正则化　　　　4、S型函数　　　　5、映射为多项式　　　　6、使用的优化方法　　　　7、运行结果　　　　8、使用scikit-learn库中的逻辑回归模型实现逻辑回...

Python机器学习实战<二>：机器学习概述【图】

1.机器学习的真实含义是利用数据来彰显数据背后的真实含义。2.机器学习的一般用例：人脸识别、手写数字识别、垃圾邮件过滤、产品推荐等等。3.机器学习的主要任务是分类，即将实例数据划分到合适的分类中。另一项任务是回归，主要用于预测数值型数据。分类和回归属于监督学习，之所以称为监督学习，是因为这类算法必须知道预测什么，即目标的分类信息。另一种机器学习方式是无监督学习，此时数据没有类别信息，也没有给定的目标。在...

【机器学习】K-邻近算法的python 实现【代码】【图】

#!/usr/bin/python # -*- coding: utf-8 -*-from numpy import * import operatordef createDataSet():‘创建数据集‘group=array([[1.0,1.1],[1.0,1.0],[0,0],[0,1.1]])labels=["A","A","B","B"]return group,labelsdef classify(inX,dataSet,labels,k):# 获取维度dataSetSize=dataSet.shape[0] # 训练数据集数量print dataSetSizeprint tile(inX,(dataSetSize,1))diffMat=tile(inX,(dataSetSize,1))-dataSet # 测试样本的各维...

GitHub热榜第四！这套Python机器学习课，免费获取还易吸收 | 资源【图】

全文：https://mp.weixin.qq.com/s/tIsJr5br3D13-Lgc6w2ntg 刚刚，又一个机器学习人气课程冲上GitHub热榜，一天之内新增了近700 star，一下子登上热榜第四。这套课程名为A Machine Learning Course with Python（Python机器学习课程），其介绍中只有一句话：这是一套容易理解并且简单的Python机器学习课。入门级资源、门槛降到最低，这在不少网友心里种了草，推特网友纷纷转推，表示期待着有空好好学习一下。里面都有啥？“容易理解...

吴裕雄 python 机器学习——人工神经网络感知机学习算法的应用【代码】【图】

import numpy as npfrom matplotlib import pyplot as plt from sklearn import neighbors, datasets from matplotlib.colors import ListedColormap from sklearn.neural_network import MLPClassifier## 加载数据集np.random.seed(0) # 使用 scikit-learn 自带的 iris 数据集 iris=datasets.load_iris() # 使用前两个特征，方便绘图 X=iris.data[:,0:2] # 标记值 Y=iris.target data=np.hstack((X,Y.reshape(Y.size,1))) # ...

基于python的机器学习实现日元币对人民币汇率预测

## 导入所需的包import pandas as pdimport numpy as npimport matplotlib.pyplot as pltimport tensorflow as tf tf.reset_default_graph()plt.rcParams[‘font.sans-serif‘] = ‘SimHei‘ ##设置字体为SimHei显示中文plt.rcParams[‘axes.unicode_minus‘] = False ##设置正常显示符号 ## 导入所需数据df = pd.read_csv(‘日元-人民币.csv‘,encoding=‘gbk‘,engine=‘python‘)df[‘时间‘] = pd.to_datetime(df[‘时间‘],fo...

Python机器学习（十六）KNN原理与代码实现【代码】【图】

1. KNN原理KNN（k-Nearest Neighbour）：K-近邻算法，主要思想可以归结为一个成语：物以类聚1.1 工作原理给定一个训练数据集，对新的输入实例，在训练数据集中找到与该实例最邻近的 k （k <= 20）个实例，这 k 个实例的多数属于某个类，就把该输入实例分为这个类。https://www.cnblogs.com/ybjourney/p/4702562.html给出的例子很形象，这里借用一下。如下图，绿色圆要被决定赋予哪个类，是红色三角形还是蓝色四方形？如果K=3，由于...

机器学习-Python 01【代码】【图】

机器学习中最常用最流行的语言工具现阶段应该是Python, 这篇文章主要介绍一些常用的Python语法知识。本篇博文适合那些有其他语言基础的程序员们，如果一点基础都没有，我建议先跳过。博主以前是做移动端开发的，所以本篇文章主要是为那些准备知识提升或者转行的程序员们准备的，可以让你们以最快的速度进入到Python的开发环境。好了，首先在正式介绍Python的开发之前，大家都知道需要配置开发环境和IDE. 这里我介绍一下我常用的，叫...

[Machine Learning]Python机器学习库【代码】

Numpy:numpy提供两种基本的对象：ndarray和ufunc，ndarray是存储单一数据类型的多为数组，ufunc是能够对数组进行操作的函数。创建数组：a = numpy.array([1, 2, 3, 4])b = np.array([[1, 2, 3, 4], [4, 5, 6, 7]])数组的形状可以通过其shape属性获得，它是一个描述数组各个轴长度的元组：1a.shape 2# 结果: (4,)3b.shape 4# 结果: (2, 4)在保持数组元素个数不变的情况下，可以通过改变数组shape属性，改变数组每个轴的大小：(数组元...

机器学习代码基础（1）--Python速成【代码】

1.1python速成1.1.1基本数据类型和赋值运算字符串data =‘hello world!‘print(data[0]) print(data[1:5]) print(len(data)) print(data)数值value=523 print(value) value=6.18 print(value)布尔类型true = True false = False print(true) print(false)多变量赋值a,b,c=1,‘hello‘,True print(a,b,c) print(a) print(b) print(c)空值：在python中，每一种数据类型都是对象，空值是python中的一个特殊值，用None表示，表示该值是...

Python相关机器学习

Python机器学习库Python的机器学习库汇总与梳理机器学习之开源库大总结原文：http://www.cnblogs.com/SFMing/p/4590261.html

菜鸟入门_Python_机器学习（4）_PCA和MDA降维和聚类【代码】【图】

@sprt *写在开头：博主在开始学习机器学习和Python之前从未有过任何编程经验，这个系列写在学习这个领域一个月之后，完全从一个入门级菜鸟的角度记录我的学习历程，代码未经优化，仅供参考。有错误之处欢迎大家指正。系统：win7-CPU; 编程环境：Anaconda2-Python2.7，IDE：pycharm5; 参考书籍：《Neural Networks and Learning Machines(Third Edition)》- Simon Haykin; 《Machine Learning in Action》- Peter Harringto...

吴裕雄 python 机器学习——数据预处理字典学习模型【代码】【图】

from sklearn.decomposition import DictionaryLearning#数据预处理字典学习DictionaryLearning模型def test_DictionaryLearning():X=[[1,2,3,4,5],[6,7,8,9,10],[10,9,8,7,6,],[5,4,3,2,1]]print("before transform:",X)dct=DictionaryLearning(n_components=3)dct.fit(X)print("components is :",dct.components_)print("after transform:",dct.transform(X))# 调用 test_DictionaryLearning test_DictionaryLearning() from skl...

NBC朴素贝叶斯分类器 ————机器学习实战 python代码【代码】

# -*- coding: utf-8 -*- """ Created on Mon Aug 07 23:40:13 2017@author: mdz """ import numpy as np def loadData():vocabList=[[‘my‘, ‘dog‘, ‘has‘, ‘flea‘, ‘problems‘, ‘help‘, ‘please‘],[‘maybe‘, ‘not‘, ‘take‘, ‘him‘, ‘to‘, ‘dog‘, ‘park‘, ‘stupid‘],[‘my‘, ‘dalmation‘, ‘is‘, ‘so‘, ‘cute‘, ‘I‘, ‘love‘, ‘him‘],[‘stop‘, ‘posting‘, ‘stupid‘, ‘worthless...

吴裕雄 python 机器学习——集成学习梯度提升决策树GradientBoostingClassifier分类模型【代码】【图】

import numpy as np import matplotlib.pyplot as pltfrom sklearn import datasets,ensemble from sklearn.model_selection import train_test_splitdef load_data_classification():‘‘‘加载用于分类问题的数据集‘‘‘# 使用 scikit-learn 自带的 digits 数据集digits=datasets.load_digits() # 分层采样拆分成训练集和测试集，测试集大小为原始数据集大小的 1/4return train_test_split(digits.data,digits.target,test_size...

首页 / PYTHON / Python机器学习：波斯顿房价预测

Python机器学习：波斯顿房价预测

内容导读

内容图文

波士顿房价预测

导入模块

获取数据

打印数据

特征选择

散点图矩阵

关联矩阵

训练模型

可视化

内容总结

内容备注

内容手机端

【Python机器学习：波斯顿房价预测】教程文章相关的互联网学习教程文章

如何用Python实现常见机器学习算法-1【代码】【图】

Python机器学习实战<二>：机器学习概述【图】

【机器学习】K-邻近算法的python 实现【代码】【图】

GitHub热榜第四！这套Python机器学习课，免费获取还易吸收 | 资源【图】

吴裕雄 python 机器学习——人工神经网络感知机学习算法的应用【代码】【图】

基于python的机器学习实现日元币对人民币汇率预测

Python机器学习（十六）KNN原理与代码实现【代码】【图】

机器学习-Python 01【代码】【图】

[Machine Learning]Python机器学习库【代码】

机器学习代码基础（1）--Python速成【代码】

Python相关机器学习

菜鸟入门_Python_机器学习（4）_PCA和MDA降维和聚类【代码】【图】

吴裕雄 python 机器学习——数据预处理字典学习模型【代码】【图】

NBC朴素贝叶斯分类器 ————机器学习实战 python代码【代码】

吴裕雄 python 机器学习——集成学习梯度提升决策树GradientBoostingClassifier分类模型【代码】【图】

PYTHON - 相关标签

机器学习 - 相关标签

PYTHON - 技术教程分类

PYTHON - 最新教程

PYTHON - 最热教程