风险管理与巴塞尔协议(第六讲)| 商业银行个人信用评分模型

深圳经建投资有限公司   2018-08-30 本文章155阅读


栏目介绍:结合巴塞尔协议的框架内容,完善宏微观结合的审慎监管体系、加强系统性风险和系统重要性银行监管是中国银行业实现高质量发展的关键。什么是巴塞尔协议?为什么是8%?如何推进实施巴塞尔协议并加强风险管理?推出“风险管理与巴塞尔协议讲堂”专栏,介绍杨军博士的《风险管理与巴塞尔协议十八讲》的相关内容,旨在帮助读者理解巴塞尔协议,促进金融机构风险管理水平的提升。



导 言

个人信用是整个社会信用的基础。因此,加强个人信用管理、建立准确的个人信用衡量标准是商业银行的要务。个人信用评分模型如何开发?评分卡应选用哪些变量?个人信用评分模型该如何构建?本讲中我们关注商业银行的个人信用管理。本文摘自中国金融出版社的《风险管理与巴塞尔协议十八讲》第三讲违约概率,有修改。


微信图片_20180830225046.jpg

《风险管理与巴塞尔协议十八讲》

杨军 著

中国金融出版社


微信图片_20180830225053.jpg


开发信用模型需要大量的连续数据。在美国等发达国家,一般都已经建立了比较完整的个人信用记录。一个人从出生开始,就有了一个社会保障号,个人的行为记录被比较完整地记录下来,尤其是个人支付税费、水费、房租、消费支出等行为,都有比较完整的记录。这就为定量描述个人的信用行为提供了可能。美国的中介机构和商业银行利用这些行为记录开发了个人信用评分模型,运用于银行的日常经营。这些模型比公司类客户的信用模型出现的还要早,应用也更加成熟。根据评分模型应用领域的不同,这些模型分别称为营销评分卡、申请评分卡、催收评分卡、行为评分卡、反欺诈评分卡等等。有的大型银行开发了700多个评分卡模型,应用于银行经营管理的各个方面。下面对评分卡模型开发的一些关键问题进行讨论。

 

一、个人信用评分的变量


开发评分卡需要考虑的变量主要有以下类别:


1. 个人基本信息:主要包括证件号码、性别、民族、国籍、户籍、婚姻、学历、职业、职称、执业资格、行业、工作单位性质、岗位、工作时间、居住时间、联系电话等。


2. 个人经济状况信息:主要包括月收入、家庭月收入、人均月收入、纳税金额、房产宗数、房产总面积、房产价值、其他资产价值。


3. 个人社会信息:主要包括是否拥有信用卡、客户级别、是否参加养老保险、是否参加失业保险、是否享受住房补贴、是否有子女、供养人数等等。


4. 个人信用信息:主要包括是否有房贷、是否有车贷、是否有不良记录、贷款利率、偿还方式等等。


因为法律和风俗习惯的不同,有些国家不允许使用某些变量,比如性别、年龄、婚姻状况等。就中国的情况来看,婚姻、性别、学历、区域、单位性质等往往是比较显著的变量。比如通过对信用卡数据分析发现,女性的信用一般优于男性。一般来讲,高学历者的信用优于低学历者,但硕士以上的群体信用并不比本科学历的群体好;职业为金融、教育、信息技术等领域的信用优于其他职业群体。


传统信用评分模型的数据来源主要包括:客户提交的个人申请信息、内部积累的客户历史数据以及人民银行征信中心等外部机构提供的数据。而互联网时代下,个人信息数据呈井喷式增长,其中不乏可用于商业银行个人信用评分模型中的,如网购消费、移动支付、理财投资,甚至社交等信息。这类数据具备准确性高、时效性好等优点,在合法、合规的前提下,商业银行也可将其用于模型开发。但须注意的是,在选择数据来源、确定模型变量时,要充分考虑法律法规、风俗宗教等因素的禁忌,数据来源上要合法,数据选择上要符合公序良俗。


二、个人信用评分模型的构建


1. 目标选择。评分卡的目的一般是将目标对象划分为两类,比如好与坏,优与差,违约与不违约等等。在开发评分卡之前,首先要确定的就是评分目的,是用于营销还是审批,是用于定价还是催收。要明确分类的具体标准,比如违约,要定义清楚什么是违约。巴塞尔协议要求逾期90天是违约,银行实践中曾将逾期180天作为不良贷款的划分标准,开发模型要关注到这些不同。


2. 模型选择。个人信用评分模型可分为线性分类方法和非线性分类方法两种。线性分类方法就是开发一个多元线性回归模型,线性模型的一般形式是


微信图片_20180830225057.png


线性模型的弊端在于该模型可能出现超过边界的特征值,强制对应到边界上会导致预测结果不准确。因此使用最多的还是非线性分类方法,即Probit模型和Logistic模型。这两个模型的最大特征是自变量可以是任意值,但输出结果在01之间。一个人违约的概率可表示为Pi = 1/(1 + e-(α+ βXi)),违约概率在01之间。


3. 变量转换。对每一个个体而言,其违约概率P是观测不到的,观测到的是结果,即违约还是不违约。如果个体违约,因变量Y = 1;如果不违约,因变量Y = 0


个人信用评分模型用到的变量与公司信用评分有很大的不同,个人评分的变量往往是离散的。比如学历,一般分为研究生及以上、大学本科、大专、中专高中、其他五项。在开发评分卡时,可以根据每一个个体特征将总体分成若干个类别,计算每一类的lnOdds,用这个转变后的数值进行回归分析,即ln P/(1-P) = - (α+ βiXi)X是每个变量的lnOdds。也可以表示为lnOdds = - (α + βiXi)


Odds = PD/(1 - PD),简单理解就是坏好比,即坏样本和好样本的比。将这个值赋予每一个个体,建立相应的模型。


 1 个人违约概率的获得过程示例

微信图片_20180830225100.png


对每一备选变量都要进行上述处理。处理后一般先进行单变量分析,观察变量的显著性。如果不显著,可以适当剔除一部分变量,在此基础上再进行多变量分析。


4. Logit回归。在评分卡开发过程中,经常用到的模型是Logistic函数模型,Logistic模型采用极大似然估计,这个估计方法是无偏的,它能保证每一个个体的违约概率的均值是总体样本的违约概率的无偏估计。


以消费总额、贷款余额、贷款余额/信用额度、还款账期次数为变量,建立logistic函数模型,回归方程可以写为


lnOdds= -0.8811xiaofei – 0.7827daikuan – 0.8747zhanbi –0.7899cishu


 2 参数估计值与假设检验结果

微信图片_20180830225104.png


5. Odds比的调整。在开发评分模型时,建模样本和总体会存在一定差异,这就要进行校准,一般的校准方法如下::


第一步,计算总体的lnOdds


第二步,计算样本的lnOdds


第三步,计算二者的差γ


第四步,将α+γ作为新的常数项放到公式中。


 3 校准距离计算过程举例

微信图片_20180830225108.png


这样新的公式就可以写成


lnOdds= -0.8811xiaofei – 0.7827daikuan – 0.8747zhanbi –0.7899cishu+0.473


6. PD与分数的转换。零售评分模型习惯于用分数表示一个客户信用的好坏,这就需要将违约概率或者Odds转换为一定的分数。这个转换的过程关键是确定两个点,根据这两个点建立转换方程。经验上一般把总体的Odd1确定为分数的均值,以0 ~ 1000分为例,可以将总体的Odd1确定为600分,Odds每增加一倍,分数增加20 ~ 40分,具体步长可以根据银行实践调整。


 4 PD与分数的转换举例

微信图片_20180830225111.png


根据(620, -5.521)(600, -4.820)两个点,可以确定直线斜率和截距分别为-28.5234465,下图就是根据这条直线方程绘制的lnOdds和分数的转换图。


微信图片_20180830225115.png

 1 lnOdds与分数转换图