摘要:研究目标:非均衡样本信用风险的有效预测。研究方法:针对反向传播神经网络BPNN交叉熵损失函数在非均衡样本信用评级中对非违约样本识别过度、违约样本识别不足的现象,利用标签分布交叉熵(Label Distribution Aware Margin Cross Entropy,简记LDAMCE)函数对交叉熵损失函数进行改进,并采用两阶段方式对BPNN模型进行训练,构建基于BPNN-LDAMCE的信用评级模型;基于多模型对比思路,验证BPNN-LDAMCE模型对中国某金融机构1298笔真实贷款数据信用风险预测的有效性;利用UCI公开的A地区、B地区信贷数据,检验BPNN-LDAMCE模型的稳健性。研究发现:BPNN-LDAMCE在保证对非违约样本识别力的同时,提升了对违约样本的预测准确率。研究创新:通过测算非违约、违约样本到分类面的“最优分类间隔”γ1~*、γ2~*,利用γ1~*、γ2~*对交叉熵损失函数进行改进,构建基于“最优分类间隔”的BPNN-LDAMCE信用风险评价模型,既可提升BPNN信用评价模型对违约样本的预测性能,也可缓解直接加权的非均衡评级模型BPNN-WCE对非违约样本识别造成的不利影响。研究价值:为不均衡样本信用评级提供新思路。
文章目录
一、问题的提出
二、现有算法的述评
1.基于数据采样的不均衡样本信用评级研究
2.基于非均衡分类算法的不均衡样本信用评级研究
三、模型设计
1.BP神经网络信用评级的理论基础
(1)信用评级信息正向传播。
(2)违约预测误差反向传播测算。
2.基于BPNN-LDAMCE的信用评级模型
(1)基于“最大分类间隔”γ1、γ2的合页损失函数。
(2)“最优分类间隔”γ1*、γ2*的测算。
(3)基于“最优分类间隔”γ1*、γ2*的LDAM合页损失函数。
(4)基于“最优分类间隔”γ1*、γ2*的LDAMCE函数。
(5)基于LDAMCE的反向传播神经网络BPNN-LDAMCE信用评价模型。
①建模步骤:
②模型有效性检验:
四、模型检验
1.信用评级指标的海选
2.数据来源
3.数据预处理
(1)异常数据处理。
(2)数据归一化。
4.基于1298笔农户贷款数据的信用评级结果分析
(1)模型参数设置。
(2)基于多模型对比的BPNN-LDAMCE模型有效性分析。
5.基于UCI公开A地区、B地区数据集的信用评级结果分析
五、结 论