智能风控体系之Y定义与样本选择(A卡)

2024-02-20 21:36

本文主要是介绍智能风控体系之Y定义与样本选择(A卡),希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

评分卡模型设计里面,最重要的一环就是Y的定义和好坏样本的选择,即样本范围选择和Y变量确定。一般来说,产品评分卡开发需要有需求、设计、开发、测试、部署上线等过程。需要思考几个问题:

1.需要做几个评分卡模型,根据贷款产品的类型、场景、客群分类、数据可用性进行模型细分。

2.业务目标是什么?例如预测客群贷款后6个月内违约的概率,对违约高风险客户进行拦截。

3好坏客户如何定义,样本如何选择等问题。

为了解决以上的这些问题,需要确定几个内容(业务目标、表现期、观察点、观察期、逾期表现),主要通过滚动率矩阵、vintage曲线、产品制度来最终确定。

▍Y定义

业务目标:预测客群贷款后未来一段时间内可能逾期的概率,拦截逾期概率较高的客群。

好坏定义:通过滚动率矩阵分析,可以确认客群逾期到什么程度再还款的概率极低,一般客群逾期M2+就不再还款。定义坏客户为M2+,好客户为逾期0天。逾期在0~M2之间的客群就是灰客户。

图片

表现期定义:表现期就是vintage曲线未来一段时间内趋于稳定的长度,表现期就是业务放款后客群还款一段时间后,会完全暴露出好坏逾期情况,即需要多久后客群会暴露出好坏表现。例如12期的贷款产品,一般表现期为9期。业务目标就是预测客群贷款后还款9个月内可能逾期的概率。那表现期不足9期的客户就是灰样本。

图片

观察点定义:贷款A卡评分模型的观察点一般就是贷款申请时点。

图片

观察期定义:观察期一般用来提取样本的预测特征变量,观察期一般要长些,一般是近2年,例如部分征信指标为近24个月银行贷款查询次数等。

▍剔除灰样本

1.剔除被前置风控规则命中的样本;

2.剔除表现期特殊客群的样本

3.剔除未提款客群的样本

4.剔除表现期不足9个月客群的样本

5.剔除逾期状态不足M2+客群的样本

注释:另外需要考虑客群是否需要分群建模。

▍样本选择与Y定义

样本一般分为训练集、测试集、时间外验证集,进行模型的训练、参数选择、验证。对于Y目标变量的定义不同,建设出来的A卡评分模型应用场景就会不同,那么选择样本客群就会不一样。评分模型建设前提,就是未来客群样本分布与历史进件的客群样本分布保持一致且独立。评分模型才会有效地准确预测未来进件客群的违约概率。

常见的Y定义,例如A卡根据Y的表现期分前3期(偏欺诈)和前6期、前9期去做不同的组合A卡;坏客户定义历史最大逾期天数15+或30+;基于组合矩阵来进行客户综合的风险评级。对Y变量给予不同的短中长期的表现期,建设不同组合的A卡评分,建设A卡评分矩阵,可以更加精细化管理进件客群。建设评分卡模型主要基于逻辑回归、Xgboost和LightGBM机器学习模型。

图片

这篇关于智能风控体系之Y定义与样本选择(A卡)的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/729606

相关文章

基于Python打造一个智能单词管理神器

《基于Python打造一个智能单词管理神器》这篇文章主要为大家详细介绍了如何使用Python打造一个智能单词管理神器,从查询到导出的一站式解决,感兴趣的小伙伴可以跟随小编一起学习一下... 目录1. 项目概述:为什么需要这个工具2. 环境搭建与快速入门2.1 环境要求2.2 首次运行配置3. 核心功能使用指

C 语言中enum枚举的定义和使用小结

《C语言中enum枚举的定义和使用小结》在C语言里,enum(枚举)是一种用户自定义的数据类型,它能够让你创建一组具名的整数常量,下面我会从定义、使用、特性等方面详细介绍enum,感兴趣的朋友一起看... 目录1、引言2、基本定义3、定义枚举变量4、自定义枚举常量的值5、枚举与switch语句结合使用6、枚

Python实现word文档内容智能提取以及合成

《Python实现word文档内容智能提取以及合成》这篇文章主要为大家详细介绍了如何使用Python实现从10个左右的docx文档中抽取内容,再调整语言风格后生成新的文档,感兴趣的小伙伴可以了解一下... 目录核心思路技术路径实现步骤阶段一:准备工作阶段二:内容提取 (python 脚本)阶段三:语言风格调

使用Python实现表格字段智能去重

《使用Python实现表格字段智能去重》在数据分析和处理过程中,数据清洗是一个至关重要的步骤,其中字段去重是一个常见且关键的任务,下面我们看看如何使用Python进行表格字段智能去重吧... 目录一、引言二、数据重复问题的常见场景与影响三、python在数据清洗中的优势四、基于Python的表格字段智能去重

Spring AI集成DeepSeek三步搞定Java智能应用的详细过程

《SpringAI集成DeepSeek三步搞定Java智能应用的详细过程》本文介绍了如何使用SpringAI集成DeepSeek,一个国内顶尖的多模态大模型,SpringAI提供了一套统一的接口,简... 目录DeepSeek 介绍Spring AI 是什么?Spring AI 的主要功能包括1、环境准备2

Spring AI与DeepSeek实战一之快速打造智能对话应用

《SpringAI与DeepSeek实战一之快速打造智能对话应用》本文详细介绍了如何通过SpringAI框架集成DeepSeek大模型,实现普通对话和流式对话功能,步骤包括申请API-KEY、项目搭... 目录一、概述二、申请DeepSeek的API-KEY三、项目搭建3.1. 开发环境要求3.2. mav

基于Python实现多语言朗读与单词选择测验

《基于Python实现多语言朗读与单词选择测验》在数字化教育日益普及的今天,开发一款能够支持多语言朗读和单词选择测验的程序,对于语言学习者来说无疑是一个巨大的福音,下面我们就来用Python实现一个这... 目录一、项目概述二、环境准备三、实现朗读功能四、实现单词选择测验五、创建图形用户界面六、运行程序七、

前端知识点之Javascript选择输入框confirm用法

《前端知识点之Javascript选择输入框confirm用法》:本文主要介绍JavaScript中的confirm方法的基本用法、功能特点、注意事项及常见用途,文中通过代码介绍的非常详细,对大家... 目录1. 基本用法2. 功能特点①阻塞行为:confirm 对话框会阻塞脚本的执行,直到用户作出选择。②

Python3脚本实现Excel与TXT的智能转换

《Python3脚本实现Excel与TXT的智能转换》在数据处理的日常工作中,我们经常需要将Excel中的结构化数据转换为其他格式,本文将使用Python3实现Excel与TXT的智能转换,需要的可以... 目录场景应用:为什么需要这种转换技术解析:代码实现详解核心代码展示改进点说明实战演练:从Excel到

Python 中 requests 与 aiohttp 在实际项目中的选择策略详解

《Python中requests与aiohttp在实际项目中的选择策略详解》本文主要介绍了Python爬虫开发中常用的两个库requests和aiohttp的使用方法及其区别,通过实际项目案... 目录一、requests 库二、aiohttp 库三、requests 和 aiohttp 的比较四、requ