摘要:研究目标:运用新兴机器学习的方法预测公司财务舞弊。研究方法:选取11类财务比率指标与文本信息、公司治理、内部控制等非财务指标作为初始输入变量,采用欠采样方法处理训练集样本非平衡的问题,选择轻量梯度提升机算法对公司是否发生舞弊建立分类模型。研究发现:采用轻量梯度提升机算法极大地提升了预测准确性;相对于逻辑回归、支持向量机、随机森林、梯度提升决策树,轻量梯度提升机算法的预测效果最好;使用全部输入变量比仅仅使用有限传统变量的预测能力更强;预测模型在案例分析、行业分析和股价崩盘检测中也展现出很好的预测效果。研究创新:引入新的机器学习算法识别财务舞弊,采用欠采样的方法对训练集样本进行平衡处理,从多个角度进行应用分析。研究价值:有助于实时高效地识别舞弊并及时进行监管,实现对经济运行更为准确的监测、分析、预测、预警,从而提升资本市场的治理效能,促进经济平稳运行。
文章目录
引 言
一、文献回顾
二、算法优选
三、研究设计
1.样本来源与变量选取
2.数据预处理
3.评估方法
四、模型构建与预测结果
1.样本划分
2.非平衡数据处理
3.调参
4.预测与变量重要度分析
五、进一步研究
1.模型比较
2.采用不同输入变量
六、应用分析
1.案例分析
2.行业分析
3.股价崩盘风险检测
七、结论与启示