摘要:研究目标:探讨如何利用大数据和机器学习方法对上市公司财务数据和非财务数据进行分析和挖掘,并应用于上市公司财务舞弊识别和预测。研究方法:提出一种基于机器学习方法的上市公司财务舞弊预测模型Xscore,对上市公司财务舞弊进行预测。研究发现:Xscore模型能够提高模型预测的准确率,在准确率、召回率、AUC指标、KS值、PSI稳定性等方面均优于Fscore模型和Cscore模型,更适合我国上市公司财务舞弊预测。研究创新:基于2000~2020年中国上市公司数据集为观测样本,通过Benford定律、LOF局部异常法、IF无监督学习法,解决了机器学习应用于财务舞弊识别研究时普遍面临的灰色样本问题,甄选兼具领域特性和统计特征的特征变量;首次将XGBoost集成学习方法应用到上市公司财务舞弊预测分析中,有效提高了上市公司财务舞弊准确率。研究价值:本文将XGBoost集成学习方法引入上市公司财务舞弊识别领域,有助于促进人工智能、机器学习在会计学中的研究与应用,为促进上市公司披露高质量的财务信息和维护资本市场秩序提供参考。
文章目录
一、问题的提出
二、文献回顾
1.基于经验推理的财务舞弊特征识别方法
2.基于经典统计模型的财务舞弊动因分析方法
3.基于大数据和机器学习方法的财务舞弊预测方法
三、一种新上市公司财务舞弊预测模型的设计
1.样本筛选与数据集构建
(1)样本选择。
(2)灰色样本剔除。
(3)SMOTE过采样。
2.特征选择与筛选
(1)特征变量选择(3)。
(2)衍生特征变量。
(3)特征变量筛选。
3.Xscore模型构建
(1)Xscore模型结构。
(2)Xscore模型参数学习。
(3)Xscore处理效果。
4.Xscore模型评价
(1)Fscore模型与Cscore模型。
(2)Xscore模型评价指标分析。
四、Xscore上市公司财务舞弊预测模型的应用
1.Xscore模型特征贡献度分析
(1)全局归因分析。
(2)局部归因分析。
2.Xscore评分卡应用分析
(1)Xscore评分卡定义。
(2)Xscore评分卡评价。
(3)Xscore评分卡应用。
五、结 论