Python银行授信响应模型实战

2024-02-18 11:04

本文主要是介绍Python银行授信响应模型实战,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

        

目录

一、数据介绍及预处理

1、数据介绍

数据说明

2、数据分析

二、模型构建及评估

1、模型训练

三、划重点

少走10年弯路


        在金融信贷领域中,授信、定价等产品信息会直接影响客户是否用信,此外客户自身的需求程度、竞品授信定价信息、自身经济能力、家庭环境等等因素都会影响用信行为。对于放贷机构而言,在授信额度/定价允许的范围内(如额度越高、风险也会越高),希望能提高整体用信率、从而增加业务规模,那么如果能提前预测出用户的用信概率,就可以用于指导运营活动、授信定价策略,促进业务增长。

一、数据介绍及预处理

1、数据介绍

        数据来源某比赛网站(下图仅为部分字段),数据相对简单,除了地址编码外均为数值型变量,包括年龄、收入水平、家庭地址、学历等个人基本信息,以及是否有信用卡、是否有网银、信用卡指支出额等银行信息,Y标签为是否接受金融机构提供的个人贷款 文末获取数据集

图片

数据说明
ID客户ID
Age客户年龄(以完成年份计)
Experience工作经验/年
Income客户年收入(000美元)
ZIPCode家庭地址邮政编码。
Family客户的家庭规模
CCAvg每月平均信用卡支出(/1000美元)
Education教育水平。1:本科生;2:高中;3:专科
Mortgage房屋抵押价值。(/1000美元)
Securities Account客户在银行是否有证券账户
CD Account客户在银行是否有存款证明(CD)账户
Online客户是否使用网上银行设施
CreditCard客户是否使用环球银行发行的信用卡
Personal Loan该客户是否接受了提供的个人贷款

2、数据分析

(1)Y变量分布统计

        统计是否接受贷款的标签分布如下,可以看到5000样本中仅有9.6%接受贷款,即用信率仅有9.6%

图片

(2)IV统计

        首先针对是否接受贷款的标签计算特征IV值如下图,收入、月度信用卡支出的IV值明显高于其他特征,因此可以查看一下变量分布情况。

图片


import toad
def iv_miss(df,var_list,y):df_tmp=df[df[y].notnull()].copy()iv_all=toad.quality(df_tmp[var_list+[y]], target=y, indicators = ['iv','unique'])[['unique','iv']]miss_per=pd.DataFrame(df[var_list].isnull().sum()/(df.shape[0]))miss_per.columns=['缺失率']result=pd.concat([miss_per,iv_all],axis=1)return result.sort_values('iv',ascending=False)df_iv=iv_miss(df,fea_list,'Personal Loan')
df_iv

(3)变量分布分析

        对收入、月度信用卡支出两个特征统计频数分布分别如下,可以看到在特征分布上的区分比较明显,尤其是接受/拒绝对应收入的分布很大。

图片

图片

二、模型构建及评估

1、模型训练

        使用lightGBM构建二分类模型,按照8:2的比例划分训练集、测试集,然后使用ks、auc进行效果评估,结果如下、auc轻松达到0.99

图片

def init_params():params_lgb={'boosting_type': 'gbdt','objective': 'binary','metric':'auc','n_jobs': 8,'n_estimators':1300,'learning_rate': 0.03,'max_depth':4,'num_leaves': 12,'max_bin':255, 'subsample_for_bin':100000, 'min_split_gain':3,'min_child_samples':300,'colsample_bytree': 0.8,'subsample': 0.8,'subsample_freq': 1,   'feature_fraction_seed':2,'bagging_seed': 1,'reg_alpha':2,'reg_lambda':2,'scale_pos_weight':1,'silent':True,'random_state':1,'verbose':-1, # 控制模型训练过程的输出信息,-1为不输出信息}return params_lgbdef ks_auc_value(y_true,df,model):y_pred=model.predict_proba(df)[:,1]fpr,tpr,thresholds= roc_curve(list(y_true),list(y_pred))ks=max(tpr-fpr)auc= roc_auc_score(list(y_true),list(y_pred))return ks,aucdef model_train_sklearn(train,y_name,fea_list):params=init_params()x_train,x_test, y_train, y_test =train_test_split(train[fea_list],train[y_name],test_size=0.2, random_state=123)model=lgb.LGBMClassifier(**params)model.fit(x_train,y_train,eval_set=[(x_train, y_train),(x_test, y_test)])train_ks,train_auc=ks_auc_value(y_train,x_train,model)test_ks,test_auc=ks_auc_value(y_test,x_test,model)dic={'train_good':(y_train.count()-y_train.sum()),'train_bad':y_train.sum(),'test_good':(y_test.count()-y_test.sum()),'test_bad':y_test.sum(),'train_ks':train_ks,'train_auc':train_auc,'test_ks':test_ks,'test_auc':test_auc,}return dic,modelmodel_result,model=model_train_sklearn(df,'Personal Loan',fea_list)
model_result

三、划重点

少走10年弯路

        关注威信公众号 Python风控模型与数据分析,回复 银行授信响应实战 获取本篇数据及代码

        还有更多理论、代码分享等你来拿

这篇关于Python银行授信响应模型实战的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!


原文地址:
本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.chinasem.cn/article/720951

相关文章

利用Python实现Excel文件智能合并工具

《利用Python实现Excel文件智能合并工具》有时候,我们需要将多个Excel文件按照特定顺序合并成一个文件,这样可以更方便地进行后续的数据处理和分析,下面我们看看如何使用Python实现Exce... 目录运行结果为什么需要这个工具技术实现工具的核心功能代码解析使用示例工具优化与扩展有时候,我们需要将

Python+PyQt5实现文件夹结构映射工具

《Python+PyQt5实现文件夹结构映射工具》在日常工作中,我们经常需要对文件夹结构进行复制和备份,本文将带来一款基于PyQt5开发的文件夹结构映射工具,感兴趣的小伙伴可以跟随小编一起学习一下... 目录概述功能亮点展示效果软件使用步骤代码解析1. 主窗口设计(FolderCopyApp)2. 拖拽路径

Python使用Reflex构建现代Web应用的完全指南

《Python使用Reflex构建现代Web应用的完全指南》这篇文章为大家深入介绍了Reflex框架的设计理念,技术特性,项目结构,核心API,实际开发流程以及与其他框架的对比和部署建议,感兴趣的小伙... 目录什么是 ReFlex?为什么选择 Reflex?安装与环境配置构建你的第一个应用核心概念解析组件

Python将字符串转换为小写字母的几种常用方法

《Python将字符串转换为小写字母的几种常用方法》:本文主要介绍Python中将字符串大写字母转小写的四种方法:lower()方法简洁高效,手动ASCII转换灵活可控,str.translate... 目录一、使用内置方法 lower()(最简单)二、手动遍历 + ASCII 码转换三、使用 str.tr

Python处理超大规模数据的4大方法详解

《Python处理超大规模数据的4大方法详解》在数据的奇妙世界里,数据量就像滚雪球一样,越变越大,从最初的GB级别的小数据堆,逐渐演变成TB级别的数据大山,所以本文我们就来看看Python处理... 目录1. Mars:数据处理界的 “变形金刚”2. Dask:分布式计算的 “指挥家”3. CuPy:GPU

Python多进程、多线程、协程典型示例解析(最新推荐)

《Python多进程、多线程、协程典型示例解析(最新推荐)》:本文主要介绍Python多进程、多线程、协程典型示例解析(最新推荐),本文通过实例代码给大家介绍的非常详细,对大家的学习或工作具有一定... 目录一、multiprocessing(多进程)1. 模块简介2. 案例详解:并行计算平方和3. 实现逻

Spring Boot拦截器Interceptor与过滤器Filter深度解析(区别、实现与实战指南)

《SpringBoot拦截器Interceptor与过滤器Filter深度解析(区别、实现与实战指南)》:本文主要介绍SpringBoot拦截器Interceptor与过滤器Filter深度解析... 目录Spring Boot拦截器(Interceptor)与过滤器(Filter)深度解析:区别、实现与实

Python对PDF书签进行添加,修改提取和删除操作

《Python对PDF书签进行添加,修改提取和删除操作》PDF书签是PDF文件中的导航工具,通常包含一个标题和一个跳转位置,本教程将详细介绍如何使用Python对PDF文件中的书签进行操作... 目录简介使用工具python 向 PDF 添加书签添加书签添加嵌套书签Python 修改 PDF 书签Pytho

利用Python实现可回滚方案的示例代码

《利用Python实现可回滚方案的示例代码》很多项目翻车不是因为不会做,而是走错了方向却没法回头,技术选型失败的风险我们都清楚,但真正能提前规划“回滚方案”的人不多,本文从实际项目出发,教你如何用Py... 目录描述题解答案(核心思路)题解代码分析第一步:抽象缓存接口第二步:实现两个版本第三步:根据 Fea

Python中CSV文件处理全攻略

《Python中CSV文件处理全攻略》在数据处理和存储领域,CSV格式凭借其简单高效的特性,成为了电子表格和数据库中常用的文件格式,Python的csv模块为操作CSV文件提供了强大的支持,本文将深入... 目录一、CSV 格式简介二、csv模块核心内容(一)模块函数(二)模块类(三)模块常量(四)模块异常