首页 / PYTHON / Python数据挖掘—回归—逻辑回归

Python数据挖掘—回归—逻辑回归

内容导读

互联网集市收集整理的这篇技术教程文章主要介绍了Python数据挖掘—回归—逻辑回归，小编现在分享给大家，供广大互联网技能从业者学习和参考。文章包含4707字，纯文字阅读大概需要7分钟。

内容图文

概念

针对因变量为分类变量而进行回归分析的一种统计方法，属于概率型非线性回归

　　优点：算法易于实现和部署，执行效率和准确度高

　　缺点：离散型的自变量数据需要通过生成虚拟变量的方式来使用

在线性回归中，因变量是连续性变量，那么线性回归能根据因变量和自变量存在的线性关系来构造回归方程，因变量变成分类变量后就不存在这种关系了，需通过对数变换来进行处理（Sigmoid函数）

步骤：

1、读取数据；

import pandas
from pandas import read_csv

data=read_csv(
    "C:\\Users\\Jw\\Desktop\\python_work\\Python数据挖掘实战课程课件\\4.4\\data.csv",
    encoding="utf-8")

data=data.dropna()

dummyColumns=()

data.shape

2、处理字符型和大小无关的字段，如果字段有可比性，可进行大小比较，然后调用map一一映射，将离散型数据转化为数值型数据

　　首先处理字符类型和大小无关的字段

#首先处理字符类型和大小无关的字段
dummyColumns=[
    'Gender','Home Ownership',
    'Internet Connection', 'Marital Status',
    'Movie Selector', 'Prerec Format', 'TV Signal']
    
for column in dummyColumns:
    data[column]=data[column].astype('category')
    

dummiesData=pandas.get_dummies(
        data,
        columns=dummyColumns,
        prefix=dummyColumns,
        prefix_sep=" ",  #列名和属性值之间的分割符号
        drop_first=True)  #根据特征列建模，为避免模型共轭，只选取一列

data.Gender.unique()   #去重

dummiesData.columns   #获取所有列

　　处理字符类型和大小有关的字段，然后使用map一一映射

#有可比性，可进行大小比较
educationLevelDict={
    'Post-Doc': 9,
    'Doctorate': 8,
    'Master\'s Degree': 7,
    'Bachelor\'s Degree': 6,
    'Associate\'s Degree': 5,
    'Some College': 4,
    'Trade School': 3,
    'High School': 2,
    'Grade School': 1
    }
    
#调用map一一映射，将离散型数据转化为数值型数据
dummiesData["Education Level Map"]=dummiesData['Education Level'].map(educationLevelDict)


freqMap={
    'Never':0,
    'Rarely': 1,
    'Monthly': 2,
    'Weekly': 3,
    'Daily': 4}
    
dummiesData['PPV Freq Map']=dummiesData['PPV Freq'].map(freqMap)
dummiesData['Theater Freq Map'] = dummiesData['Theater Freq'].map(freqMap)
dummiesData['TV Movie Freq Map'] = dummiesData['TV Movie Freq'].map(freqMap)
dummiesData['Prerec Buying Freq Map'] = dummiesData['Prerec Buying Freq'].map(freqMap)
dummiesData['Prerec Renting Freq Map'] = dummiesData['Prerec Renting Freq'].map(freqMap)
dummiesData['Prerec Viewing Freq Map'] = dummiesData['Prerec Viewing Freq'].map(freqMap)

3、选取自标量和因变量，县选取所有列，然后一一查看选择

 1 #选取自变量和因变量
 2 dummiesData.columns
 3 
 4 #先选取所有列，然后一一查看选择
 5 dummiesSelect = [
 6     'Age', 'Num Bathrooms', 'Num Bedrooms', 'Num Cars', 'Num Children', 'Num TVs', 
 7     'Education Level Map', 'PPV Freq Map', 'Theater Freq Map', 'TV Movie Freq Map', 
 8     'Prerec Buying Freq Map', 'Prerec Renting Freq Map', 'Prerec Viewing Freq Map', 
 9     'Gender Male',
10     'Internet Connection DSL', 'Internet Connection Dial-Up', 
11     'Internet Connection IDSN', 'Internet Connection No Internet Connection',
12     'Internet Connection Other', 
13     'Marital Status Married', 'Marital Status Never Married', 
14     'Marital Status Other', 'Marital Status Separated', 
15     'Movie Selector Me', 'Movie Selector Other', 'Movie Selector Spouse/Partner', 
16     'Prerec Format DVD', 'Prerec Format Laserdisk', 'Prerec Format Other', 
17     'Prerec Format VHS', 'Prerec Format Video CD', 
18     'TV Signal Analog antennae', 'TV Signal Cable', 
19     'TV Signal Digital Satellite', 'TV Signal Don\'t watch TV'
20 ]
21 
22 inputData=dummiesData[dummiesSelect]   #自变量
23 
24 
25 outputData=dummiesData[["Home Ownership Rent"]]   #因变量

4、建模、训练、评分

1 #建模、训练
2 from sklearn import linear_model
3 
4 lrModel=linear_model.LogisticRegression()
5 
6 lrModel.fit(inputData,outputData)
7 
8 lrModel.score(inputData,outputData)

5、预测（因为逻辑回归所用的参数是经过虚拟变量处理过的，所以新数据也许通过处理才能进行预测）

 1 #因为逻辑回归所用的参数是经过虚拟变量处理过的，需对新的数据进行预测，要先处理新数据
 2 newData=read_csv(
 3     "C:\\Users\\Jw\\Desktop\\python_work\\Python数据挖掘实战课程课件\\4.4\\newData.csv",
 4     encoding="utf-8")
 5 
 6 for column in dummyColumns:
 7     newData[column]=newData[column].astype(
 8         "category",
 9         categories=data[column].cat.categories)
10     
11 newData=newData.dropna()
12 
13 
14 newData['Education Level Map'] = newData['Education Level'].map(educationLevelDict)
15 newData['PPV Freq Map'] = newData['PPV Freq'].map(freqMap)
16 newData['Theater Freq Map'] = newData['Theater Freq'].map(freqMap)
17 newData['TV Movie Freq Map'] = newData['TV Movie Freq'].map(freqMap)
18 newData['Prerec Buying Freq Map'] = newData['Prerec Buying Freq'].map(freqMap)
19 newData['Prerec Renting Freq Map'] = newData['Prerec Renting Freq'].map(freqMap)
20 newData['Prerec Viewing Freq Map'] = newData['Prerec Viewing Freq'].map(freqMap)
21 
22 
23 dummiesNewData=pandas.get_dummies (
24         newData,
25         columns=dummyColumns,
26         prefix=dummyColumns,
27         prefix_sep=" ",
28         drop_first=True)
29 
30 inputNewData = dummiesNewData[dummiesSelect]
31 
32 lrModel.predict(inputData)

内容总结

以上是互联网集市为您收集整理的Python数据挖掘—回归—逻辑回归全部内容，希望文章能够帮你解决Python数据挖掘—回归—逻辑回归所遇到的程序开发问题。如果觉得互联网集市技术教程内容还不错，欢迎将互联网集市网站推荐给程序员好友。

内容备注

版权声明：本文内容由互联网用户自发贡献，该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容，请发送邮件至 gblab@vip.qq.com 举报，一经查实，本站将立刻删除。

内容手机端

扫描二维码推送至手机访问。

本文链接：https://qyyshop.com/info/854410.html

来源：【匿名】

【上一篇】python 之 paramiko 【下一篇】浅谈PHP运行Python脚本的方法

更多 ►

【Python数据挖掘—回归—逻辑回归】教程文章相关的互联网学习教程文章

python实现随机森林、逻辑回归和朴素贝叶斯的新闻文本分类【代码】【图】

实现本文的文本数据可以在THUCTC下载也可以自己手动爬虫生成，本文主要参考：https://blog.csdn.net/hao5335156/article/details/82716923 nb表示朴素贝叶斯 rf表示随机森林 lg表示逻辑回归初学者（我）通过本程序的学习可以巩固python基础，学会python文本的处理，和分类器的调用。方便接下来的机器学习的学习。各个参数直观的含义：# -*- coding: utf-8 -*- """ Created on Thu Nov 29 13:00:46 2018@author: caoqu """ import...

用python实习逻辑回归【代码】【图】

建立一个逻辑回归模型来预测一个学生是否被大学录取# 三大件 import numpy as np import pandas as pd import matplotlib.pyplot as pltimport os path = ‘data‘ + os.sep + ‘LogiReg_data.txt‘ pdData = pd.read_csv(path, header=None, names=[‘Exam1‘, ‘Exam2‘, ‘Admitted‘]) print(pdData.head()) # 看一下数据的维度 print(pdData.shape) # 画图看一下每一个为 0 的数量和为 1 的数量 positive = pdData[pdData[‘A...

详解用TensorFlow实现逻辑回归算法【图】

这篇文章主要介绍了关于详解用TensorFlow实现逻辑回归算法，有着一定的参考价值，现在分享给大家，有需要的朋友可以参考一下本文将实现逻辑回归算法，预测低出生体重的概率。# Logistic Regression # 逻辑回归 #---------------------------------- # # This function shows how to use TensorFlow to # solve logistic regression. # y = sigmoid(Ax + b) # # We will use the low birth weight data, specifically: # y = 0 or 1...

机器学习算法的Python实现（二）：逻辑回归【代码】【图】

机器学习算法笔记（二）：逻辑回归在学习机器学习的过程中，结合数学推导和手写实现，可以加深对相关算法的认识。本部分教程将基于python实现机器学习的常用算法，来加强对算法的理解以及coding能力，仅供学习交流使用，请勿随意转载。本篇继续逻辑回归算法的学习，全文分为三个部分：数学推导 python实现逻辑回归优缺点分析一、逻辑回归的数学推导 ? 逻辑回归（LogisticRegression）名为回归，实为分类。逻辑回归可也可称为对...

0909案例实战：Python实现逻辑回归与梯度下降策略【代码】

根据成绩预测学生录取情况： import numpy as np import pandas as pd import matplotlib.pyplot as plt import numpy.random from sklearn import preprocessing as pp # 数据标准化 import time %matplotlib inline#洗牌 def shuffleData(data):np.random.shuffle(data)cols = data.shape[1]X = data[:, 0:cols-1]y = data[:, cols-1:]return X, y# 定义停止方式 STOP_ITER = 0 STOP_COST = 1 STOP_GRAD = 2def stopCriterion(...

逻辑回归（ROC、AUC、KS）-python实现-内含训练数据-测试数据【代码】【图】

一、逻辑回归理论：关注代码上线 Hypothesis Function（假设函数）：1.0/(1+exp(-inX))Cost Function（代价函数）：通过梯度下降法，求最小值。 weights(系数矩阵)=weights+alpha（固定值）*dataMatrix（特征指标）*error（真实值-预测值）二、运行效果第一组：第二组：第三组：三、python代码实现-梯度上升 import matplotlib.pyplot as plt import numpy as np from numpy import exp from sklearn.metrics import confu...

Python机器学习：逻辑回归002逻辑回归的损失函数【图】

python——sklearn完整例子整理示范（有监督，逻辑回归范例）（原创）【代码】【图】

sklearn使用方法，包括从制作数据集，拆分数据集，调用模型，保存加载模型，分析结果，可视化结果 1 import pandas as pd2 import numpy as np3 from sklearn.model_selection import train_test_split #训练测试集拆分4 from sklearn.linear_model import LogisticRegression #逻辑回归模型5 import matplotlib.pyplot as plt #画图函数6 7 from sklearn.externals import joblib #保存加载模型函数joblib8 9 #以下为sklearn评测...

局部加权之逻辑回归(1) - Python实现【代码】【图】

算法特征:利用sigmoid函数的概率含义, 借助回归之手段达到分类之目的. 算法推导:Part Ⅰsigmoid函数之定义:\begin{equation}\label{eq_1}sig(x) = \frac{1}{1 + e^{-x}}\end{equation}相关函数图像:由此可见, sigmoid函数将整个实数域$(-\infty, +\infty)$映射至$(0, 1)$区间内, 反映了一种良好概率意义下的映射关系. 对该函数进行如下扩展:\begin{equation}\label{eq_2}sig(\theta(x)) = \frac{1}{1 + e^{-\theta(x)}}\end{equati...

Python SKLearn：逻辑回归概率【代码】

我正在使用Python SKLearn模块执行逻辑回归.我有一个因变量矢量Y(从M个类中的1个取值)和独立变量矩阵X(具有N个特征).我的代码是LR = LogisticRegression()LR.fit(X,np.resize(Y,(len(Y))))我的问题是,LR.coef_和LR.intercept_代表什么.我最初以为他们持有的值intercept(i)和coef(i,j)s.t.log(p(1)/(1-p(1))) = intercept(1) + coef(1,1)*X1 + ... coef(1,N)*XN . . . log(p(M)/(1-p(M))) = intercept(M) + coef(M,1)*X1 + ... coef...

python-scikitlearn中的逻辑回归

您如何处理这样的图形：使用scikitlearn的LogisticRegression模型.有没有一种方法可以使用scikitlearn和映射为此类图的标准X,y输入轻松地处理这些类型的问题？解决方法:如果您真的想对这种特定设置使用Logistic回归,那么一种有前途的方法是将坐标从笛卡尔系统转换为极地系统.从可视化来看,似乎在该系统中,您的数据将(几乎)是线性可分离的. 可以按照以下说明进行操作：Python conversion between coordinates

如何使用python和scikit结合两个逻辑回归模型？【代码】

我是Python和Scikit新手.我有两个用Scikit创建的Logistic回归模型,我想将它们结合起来以获得新模型.在我看来是这样的：clf1 = LogisticRegression() clf1.fit(X_set, Y_set) clf2 = LogisticRegression() clf2.fit(X_set, Y_set) combined_clf = clf1 + clf2但是我不知道该怎么做.在此先感谢所有人.解决方法:这里有两种方法可以满足您的需求. 第一个是让您的每个分类器投票给预测的分类.为此,您可以使用sklearn.ensemble.VotingCla...

利用python实现梯度下降和逻辑回归原理(Python详细源码：预测学生是否被录取)【代码】【图】

我们将建立一个逻辑回归模型来预测一个学生是否被大学录取。假设你是一个大学系的管理员，你想根据两次考试的结果来决定每个申请人的录取机会。你有以前的申请人的历史数据，你可以用它作为逻辑回归的训练集。对于每一个培训例子，你有两个考试的申请人的分数和录取决定。为了做到这一点，我们将建立一个分类模型，根据考试成绩估计入学概率。导入函数库 #三大件 import numpy as np import pandas as pd import matplotlib.pyplo...

用户流失预测——基于逻辑回归模型以及Python代码实现【代码】【图】

研究目的有效预测当前用户是否流失，针对高价值的潜在流失用户进行精细化运营以此挽留目标用户。用户流失预测 2.1用户流失定义流失用户：上一个周期有下单而本周期没有下单的用户非流失用户：上一个周期和本周期都有下单的用户 2.2用户流失率以一个季度为周期，用户流失率指的是上一个周期有下单而本周期没有下单的用户数与上一个周期有下单的用户之比。下图为近四个周期的用户流失率，平均流失率为19.76%。2.3 用户流失分布...

python – 如何在sklearn逻辑回归中应用class_weights？【代码】

我对sklearn如何应用我们提供的课程重量感兴趣. documentation没有明确说明应用类权重的位置和方式.阅读源代码也没有帮助(似乎sklearn.svm.liblinear用于优化,我无法读取源代码,因为它是.pyd文件……) 但我想它适用于成本函数：当指定类权重时,相应类的成本将乘以类权重.例如,如果我分别从0级(权重= 0.5)和1级(权重= 1)得到2个观察值,那么成本函数将是：Cost = 0.5*log(…X_0,y_0…) + 1*log(…X_1,y_1…) + penalization有谁知道这...

首页 / PYTHON / Python数据挖掘—回归—逻辑回归

Python数据挖掘—回归—逻辑回归

内容导读

内容图文

概念

步骤：

1、读取数据；

2、处理字符型和大小无关的字段，如果字段有可比性，可进行大小比较，然后调用map一一映射，将离散型数据转化为数值型数据

3、选取自标量和因变量，县选取所有列，然后一一查看选择

4、建模、训练、评分

5、预测（因为逻辑回归所用的参数是经过虚拟变量处理过的，所以新数据也许通过处理才能进行预测）

内容总结

内容备注

内容手机端

【Python数据挖掘—回归—逻辑回归】教程文章相关的互联网学习教程文章

python实现随机森林、逻辑回归和朴素贝叶斯的新闻文本分类【代码】【图】

用python实习逻辑回归【代码】【图】

详解用TensorFlow实现逻辑回归算法【图】

机器学习算法的Python实现（二）：逻辑回归【代码】【图】

0909案例实战：Python实现逻辑回归与梯度下降策略【代码】

逻辑回归（ROC、AUC、KS）-python实现-内含训练数据-测试数据【代码】【图】

Python机器学习：逻辑回归002逻辑回归的损失函数【图】

python——sklearn完整例子整理示范（有监督，逻辑回归范例）（原创）【代码】【图】

局部加权之逻辑回归(1) - Python实现【代码】【图】

Python SKLearn：逻辑回归概率【代码】

python-scikitlearn中的逻辑回归

如何使用python和scikit结合两个逻辑回归模型？【代码】

利用python实现梯度下降和逻辑回归原理(Python详细源码：预测学生是否被录取)【代码】【图】

用户流失预测——基于逻辑回归模型以及Python代码实现【代码】【图】

python – 如何在sklearn逻辑回归中应用class_weights？【代码】

PYTHON - 相关标签

数据挖掘 - 相关标签

PYTHON - 技术教程分类

PYTHON - 最新教程

PYTHON - 最热教程