首页 / 更多教程 / Scorecardbundle评分卡模型的实现

Scorecardbundle评分卡模型的实现

内容导读

互联网集市收集整理的这篇技术教程文章主要介绍了Scorecardbundle评分卡模型的实现，小编现在分享给大家，供广大互联网技能从业者学习和参考。文章包含5889字，纯文字阅读大概需要9分钟。

内容图文

import pandas as pd
import matplotlib.pyplot as plt
from scorecardbundle.feature_discretization import ChiMerge as cm  # ChiMerge特征离散
from scorecardbundle.feature_encoding import WOE as woe  # WOE编码实现
from scorecardbundle.model_training import LogisticRegressionScoreCard as lrsc  # 模型训练-逻辑回归
from scorecardbundle.model_evaluation import ModelEvaluation as me  # 模型评估


# 01读取数据
def read_csv():
    bd_data = pd.read_csv(r‘20200326.csv‘, encoding=‘utf_8‘, low_memory=False)
    bd_data = bd_data.set_index(‘bd_code‘)  # 设置bd_code索引
    # 将object转化为float
    col = list(bd_data.columns)
    bd_data[col] = bd_data[col].apply(pd.to_numeric, errors=‘coerce‘).fillna(0.0)

    # 获取关键字表
    bd_data = bd_data[bd_data[‘con_num‘] > 5]  # 合同数小于0的BD不参与评分
    bd_data = bd_data[[‘amount_char_rate‘, ‘loss_num_rate‘, ‘loss_rate‘]]

    # 归一化
    bd_data = normalized(bd_data, ‘amount_char_rate‘)  # 归一化
    bd_data = normalized(bd_data, ‘loss_num_rate‘)  # 归一化
    bd_data = normalized(bd_data, ‘loss_rate‘)  # 归一化
    bd_data.to_csv(‘01归一化后的样本集.csv‘, header=True, index=True)
    return bd_data


# 归一化
def normalized(X, feature_name):
    max_x = X[feature_name].max()
    min_x = X[feature_name].min()
    X[feature_name] = X[feature_name].apply(lambda x: (x - min_x) / (max_x - min_x))
    return X


def mark_score(train_data, column, flag):
    train_data[column + ‘_num‘] = train_data[column].rank(ascending=flag, method=‘dense‘)
    max_num = max(train_data[column + ‘_num‘])
    train_data[column + ‘_num‘] = train_data[column + ‘_num‘] / max_num * 100
    return train_data



# 03 样本标注
def feature_goal(dataset):
    dataset[‘score_num‘] = dataset[‘amount_char_rate‘] * 0.5 + dataset[
        ‘loss_num_rate‘] * 0.25 + dataset[‘loss_rate‘] * 0.25

    q95 = dataset.score_num.quantile(0.95)
    q05 = dataset.score_num.quantile(0.05)
    # 截尾，避免离群值对数据造成影响
    dataset = dataset.loc[lambda x: x[‘score_num‘] > q05]
    dataset = dataset.loc[lambda x: x[‘score_num‘] < q95]

    # 平均值
    truncated_average = dataset.score_num.quantile(0.5)
    dataset.loc[dataset[‘score_num‘] >= truncated_average, ‘score_num‘] = 1
    dataset.loc[dataset[‘score_num‘] < truncated_average, ‘score_num‘] = 0

    dataset.rename(columns={‘score_num‘: ‘tag‘}, inplace=True)
    dataset.to_csv(‘02标注后的样本集.csv‘, header=True, index=True)

    # 获取训练集
    train_data = dataset.sample(frac=0.75, random_state=0)
    # 获取测试集
    test_data = dataset[~dataset.index.isin(train_data.index)]

    train_data.to_csv(‘03训练集.csv‘, header=True, index=True)
    test_data.to_csv(‘04测试集.csv‘, header=True, index=True)
    # 拆分特征和标签
    train_X, train_y = train_data[[‘amount_char_rate‘, ‘loss_num_rate‘, ‘loss_rate‘]], train_data[‘tag‘]
    test_X, test_y = test_data[[‘amount_char_rate‘, ‘loss_num_rate‘, ‘loss_rate‘]], test_data[‘tag‘]
    X, y = dataset[[‘amount_char_rate‘, ‘loss_num_rate‘, ‘loss_rate‘]], dataset[‘tag‘]
    return train_X, train_y, test_X, test_y, X, y


# 04特征离散化（基于ChiMerge）分箱
def ChiMerge(train_X, train_y):
    trans_cm = cm.ChiMerge(max_intervals=6, min_intervals=5, output_dataframe=True)
    result_cm = trans_cm.fit_transform(train_X, train_y)
    return result_cm


# 05特征编码(基于证据权重WOE)
def woe_fun(result_cm, train_y):
    trans_woe = woe.WOE_Encoder(output_dataframe=True)
    result_woe = trans_woe.fit_transform(result_cm, train_y)  # WOE运行很快，此任务仅需1秒
    return trans_woe, result_woe


# 06模型训练
def model_train(trans_woe, result_woe, train_X, train_y):
    model = lrsc.LogisticRegressionScoreCard(trans_woe, PDO=-5, basePoints=60, verbose=True)
    model.fit(result_woe, train_y)
    model.woe_df_.to_csv(r‘05模型详情.csv‘, header=True, index=False)
    return model


def predict_result(model, X):
    result = model.predict(X)  # 得出训练集的结果分数
    result.index = X.index  # 使结果对应BD号
    result.to_csv(r‘06预测结果.csv‘, header=True, index=True)
    return result


# 08模型评估
def model_evaluation(y, result):
    evaluation = me.BinaryTargets(y, result[‘TotalScore‘])
    print("模型评估结果：")
    print(evaluation.ks_stat())
    print(evaluation.plot_all())


# 09分数校正
def correction_score(result_score):
    min_score = min(result_score[‘TotalScore‘])
    max_score = max(result_score[‘TotalScore‘])

    print("#####模型分数概况：######")
    print(‘最小值:‘ + str(min_score))
    print(‘最大值:‘ + str(max_score))
    print(‘平均值:‘ + str(result_score[‘TotalScore‘].mean()))
    print(‘中位数:‘ + str(result_score[‘TotalScore‘].median()))

    q5 = result_score.TotalScore.quantile(0.5)
    q7 = result_score.TotalScore.quantile(0.7)
    q9 = result_score.TotalScore.quantile(0.9)

    # D:70以下  C:70-80  B:80-90  A:90-100
    result_score[‘level‘] = result_score[‘TotalScore‘].apply(lambda x: get_level(x, q5, q7, q9))
    result_score.to_csv(r‘07划分等级后的结果.csv‘, header=True, index=True)

# 等级划分函数
def get_level(score, q5, q7, q9):
    if score > q9:
        return ‘A‘
    elif score > q7:
        return ‘B‘
    elif score > q5:
        return ‘C‘
    else:
        return ‘D‘


# 数据结果分布展示
def display(data_df):
    data_df.TotalScore.hist(bins=50)
    # 构建图像
    plt.ylabel(‘BD数量‘)
    plt.xlabel(‘BD信用分‘)
    plt.show()


# 主程序入口
if __name__ == ‘__main__‘:
    # 读取csv,数据处理
    bd_data = read_csv()
    # 样本标注 划分训练集和测试集
    train_X, train_y, test_X, test_y, X, y = feature_goal(bd_data)
    # 离散化处理
    result_cm = ChiMerge(train_X, train_y)
    # 计算woe
    trans_woe, result_woe = woe_fun(result_cm, train_y)
    # 训练模型
    model = model_train(trans_woe, result_woe, train_X, train_y)
    # 预测训练集
    train_result = predict_result(model, train_X)
    # 训练集评估
    model_evaluation(train_y, train_result)
    # 预测测试集
    test_result = predict_result(model, test_X)
    # 测试集评估
    model_evaluation(test_y, test_result)
    # 预测总体
    X_result = predict_result(model, X)
    # 分数简单统计 等级划分
    correction_score(X_result)

Scorecardbundle评分卡模型的实现

标签：ati truncated zed set truncate play fill orm woe

本文系统来源：https://www.cnblogs.com/2sheep2simple/p/13493941.html

内容总结

以上是互联网集市为您收集整理的Scorecardbundle评分卡模型的实现全部内容，希望文章能够帮你解决Scorecardbundle评分卡模型的实现所遇到的程序开发问题。如果觉得互联网集市技术教程内容还不错，欢迎将互联网集市网站推荐给程序员好友。

内容备注

版权声明：本文内容由互联网用户自发贡献，该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容，请发送邮件至 gblab@vip.qq.com 举报，一经查实，本站将立刻删除。

内容手机端

扫描二维码推送至手机访问。

本文链接：https://qyyshop.com/info/526409.html

来源：【匿名】

【上一篇】数据库如何备份与恢复【下一篇】关于IE的RegExp.exec的问题

更多 ►

【Scorecardbundle评分卡模型的实现】教程文章相关的互联网学习教程文章

Scorecardbundle评分卡模型的实现【代码】

import pandas as pd import matplotlib.pyplot as plt from scorecardbundle.feature_discretization import ChiMerge as cm # ChiMerge特征离散 from scorecardbundle.feature_encoding import WOE as woe # WOE编码实现 from scorecardbundle.model_training import LogisticRegressionScoreCard as lrsc # 模型训练-逻辑回归 from scorecardbundle.model_evaluation import ModelEvaluation as me # 模型评估# 01读取数据 ...

跟踪LinkedList源码，通过分析双向链表实现原理，自定义一个双向链表【代码】

1.LinkedList实现的基本原理 LinkedList是一个双向链表，它主要有两个表示头尾节点的成员变量first 、last，因为有头尾两个节点，使其很方便分别从头尾操作数据。LinkedList通过内部类Node来保存元素 ,一个Node对象表示一个链表的节点，有多少个元素就需要同样个Node节点。如果要添加元素，则新建一个Node节点，保存这个元素，同时指定其前驱节点和后继节点的引用。若要删除一个元素，则将取消此元素对应的Node节点在链表中的前驱...

vector类的简单实现【图】

vector支持很多种数据类型，故要定义成模板类 0、数据成员长度 theSize 容量 theCapacity 指针 T* array 另外还要指定容量的增长步长int theSize;int theCapacity;T* array;#define WALK_LENGTH 64;1、构造函数无参数构造函数用几个相同值初始化的构造函数拷贝构造函数析构函数myVector():theSize(0),theCapacity(0),array(NULL){}myVector(const T& target , int num):theSize(0),theCapacity(0),array(NULL){while( num-- )...

完整实现 Github Actions 持续部署【代码】

实现代码如下： # 文件路径 .github/workflows/deployment.yml name: Deploymenton:push:branches: [main] # only push events on source branch trigger deploymentjobs:hexo-deployment:runs-on: ubuntu-latestenv:TZ: Asia/Shanghaisteps:- name: Checkout sourceuses: actions/checkout@v2with:submodules: true- name: Setup Node.jsuses: actions/setup-node@v1with:node-version: '12.x'- name: Install dependencies & Ge...

tinyhttpd ------ C 语言实现最简单的 HTTP 服务器【代码】

工作流程：1>服务器启动，在指定端口或随机选取端口绑定httpd服务。2>收到一个http请求时(其实就是listen端口accept的时候)，派生一个线程运行accept_request函数。3>取出http请求中method(get或post)和url,对于get方法，如果有携带参数，则query_string指针指向url中?后面的get参数。4>格式化url到path数组，表示浏览器请求的文件路径，在tinyhttpd中服务器文件是在htdocs文件夹下。当url以/结尾，或者url是个目录，则默认在path中...

MVP带你入门实现登录【代码】

首先MVP是一种写代码的模式，因为我们用MVC的时候很难让自己的代码分离，耦合度非常高，这样就有了MVP有了P层并且，M层和V层的交互只能通过P层，这样就让我们在写代码的时候不得不降低耦合度了；创建包非常简单： Activity属于View层所以就把它放在了View下面；创好包之后就需要在view和model里面定义接口了，那么问题来了，要怎么定义接口，里面写什么，其实这个非常好写，只要知道自己要干什么就行。我们今天写的是登录功能，那么...

00311_预处理对象executeUpdate方法（实现数据库的增、删、改）【代码】【图】

import java.sql.Connection;2 import java.sql.DriverManager;3 import java.sql.PreparedStatement;4 5 public class Demo01 {6 public static void main(String[] args) throws Exception {7 // 1注册驱动8 Class.forName("com.mysql.jdbc.Driver");9 // 2获取连接 10 Connection conn = DriverManager.getConnection( 11 "jdbc:mysql://localhost:3306/mybase", "root", ...

仿联通首页搜索框上推，多级(个)分类悬停的简单实现【图】

仿联通首页搜索框上推，多级(个)分类悬停的简单实现前言之前讲了三篇嵌套滑动相关的文章了，今天这个是最后一个嵌套滑动相关的文章了，这四篇文章基本涵盖了市面所有的嵌套滑动类型，一般也不会有比这更难搞的了。所以后面基本不会再出相关的文章了，如果有可能也只会有原理性的文章了。今天这篇是仿联通首页的搜索框上推（还有美团外卖等，如图），且有2个悬停项的多级联动嵌套。初看一下是非常难搞的嵌套滑动，因为这里有两个悬...

Druid：数据库连接池实现技术【代码】【图】

Druid：数据库连接池实现技术，由阿里巴巴提供的 1. 步骤： 1. 导入jar包 druid-1.0.9.jar 2. 定义配置文件： * 是properties形式的 * 可以叫任意名称，可以放在任意目录下 3. 加载配置文件。Properties 4. 获取数据库连接池对象：通过工厂来来获取 DruidDataSourceFactory 5. 获取连接：getConnection( )2. 定义工具类 1. 定义一个类 JDBCUtils ...

shell下实现echo彩色输出【代码】

需求编写脚本有大量输出信息，希望通过彩色文字突出关键内容。实现网上很多方法通过echo转义字符实现彩色输出，代码如下 echo -e "\e[1;31m This is red text \e[0m"过于晦涩，考虑更简洁的方法：调用put命令 tput 命令会利用 terminfo 数据库中的信息，来控制和更改我们的终端，比如控制光标、更改文本属性、控制屏幕，以及为文本涂色。其中，为文本涂色的方法是：tput setab：用于设置背景色； tput setaf：用于设置前景色。...

词法分析程序的设计与实现（第五次作业）【图】

词法分析程序（Lexical Analyzer）要求： - 从左至右扫描构成源程序的字符流 - 识别出有词法意义的单词（Lexemes） - 返回单词记录（单词类别，单词本身） - 滤掉空格 - 跳过注释 - 发现词法错误程序结构：输入：字符流（什么输入方式，什么数据结构保存）处理： –遍历（什么遍历方式） –词法规则输出：单词流（什么输出形式） –二元组单词类别： 1.标识符（10） 2.无符号数（11） 3.保留字（一词一码） 4.运算符...

用 Go + WebSocket 快速实现一个 chat 服务【代码】【图】

前言在 go-zero 开源之后，非常多的用户询问是否可以支持以及什么时候支持 websocket，终于在 v1.1.6 里面我们从框架层面让 websocket 的支持落地了，下面我们就以 chat 作为一个示例来讲解如何用 go-zero 来实现一个 websocket 服务。整体设计我们以 zero-example 中的 chat 聊天室为例来一步步一讲解 websocket 的实现，分为如下几个部分：多客户端接入消息广播客户端的及时上线下线全双工通信【客户端本身是发送端，也是接...

JdbcTemplate实现增删改查操作【代码】【图】

为了使 JDBC 更加易于使用,Spring 在 JDBCAPI 上定义了一个抽象层, 以此建立一个JDBC存取框架，Spring Boot Spring Data-JPA。作为 SpringJDBC 框架的核心, JDBC 模板的设计目的是为不同类型的JDBC操作提供模板方法. 每个模板方法都能控制整个过程,并允许覆盖过程中的特定任务。通过这种方式,可以在尽可能保留灵活性的情况下,将数据库存取的工作量降到最低。 JdbcTemplate方法介绍 JdbcTemplate主要提供以下五类方法: 1、execute...

分析spring aop的源码实现【代码】【图】

AOP就是面向切面编程，我们可以从几个层面来实现AOP。在编译器修改源代码，在运行期字节码加载前修改字节码或字节码加载后动态创建代理类的字节码，以下是各种实现机制的比较。 spring AOP是Spring框架面向切面的编程思想，AOP采用一种称为“横切”的技术，将涉及多业务流程的通用功能抽取并单独封装，形成独立的切面，在合适的时机将这些切面横向切入到业务流程指定的位置中。AOP到底能做什么呢？ AOP能做的事情非常多。性能...

使用牛顿迭代法实现开平方【代码】【图】

前言牛顿迭代法（Newtons method）又称为牛顿-拉夫逊方法（Newton-Raphson method），它是牛顿在17世纪提出的一种在实数域和复数域上近似求解方程的方法。多数方程不存在求根公式，因此求精确根非常困难，甚至不可能，从而寻找方程的近似根就显得特别重要。方法使用函数f(x)的泰勒级数的前面几项来寻找方程f(x) = 0的根。牛顿迭代法是求方程根的重要方法之一，其最大优点是在方程f(x) = 0的单根附近具有平方收敛，而且该法还可以用...

首页 / 更多教程 / Scorecardbundle评分卡模型的实现

Scorecardbundle评分卡模型的实现

内容导读

内容图文

内容总结

内容备注

内容手机端

【Scorecardbundle评分卡模型的实现】教程文章相关的互联网学习教程文章

Scorecardbundle评分卡模型的实现【代码】

跟踪LinkedList源码，通过分析双向链表实现原理，自定义一个双向链表【代码】

vector类的简单实现【图】

完整实现 Github Actions 持续部署【代码】

tinyhttpd ------ C 语言实现最简单的 HTTP 服务器【代码】

MVP带你入门实现登录【代码】

00311_预处理对象executeUpdate方法（实现数据库的增、删、改）【代码】【图】

仿联通首页搜索框上推，多级(个)分类悬停的简单实现【图】

Druid：数据库连接池实现技术【代码】【图】

shell下实现echo彩色输出【代码】

词法分析程序的设计与实现（第五次作业）【图】

用 Go + WebSocket 快速实现一个 chat 服务【代码】【图】

JdbcTemplate实现增删改查操作【代码】【图】

分析spring aop的源码实现【代码】【图】

使用牛顿迭代法实现开平方【代码】【图】

更多教程 - 最新教程

更多教程 - 最热教程