近日,23级金融科技专业本科生李子易同学、24级金融专硕李宪同学与导师王海军教授、金融科技系苏丹华助理教授合著论文《基于机器学习算法集成的家庭债务风险预测研究——以CFPS的微观样本为据》,在中科院主办的中文期刊《系统科学与数学》官网首发。该刊为CSCD中文核心期刊、FMS管理科学高质量期刊,也是公司期刊目录中A2级期刊。

论文摘要如下:
家庭债务风险是系统性金融风险的重要诱因,影响金融系统安全和社会稳定,因此准确预测家庭债务风险具有重要政策意义。本文基于2012—2022年中国家庭追踪调查数据库(CFPS),构建了包含62个变量、23578个观测值的宏观经济-微观家庭混合数据库,基于传统计量模型、深度学习模型和集成学习模型中的7种机器学习算法,进行了模型风险预测应用效果的对比、评估和融合实验。研究结果表明,第一,与传统模型相比,深度学习模型和集成学习模型预测能力较优,而集成学习模型最优,其预测准确率、精准率、AUC值都达到0.92以上。第二,模型融合集成的结果表明,融合后的集成模型具有复杂数据适配性、强鲁棒性和泛化能力,以及增强决策可解释性的显著优势,克服了传统计量模型在复杂数据场景下的局限性,能够进一步提升家庭债务风险的预测效果。第三,利用SHAP值解释方法对Stacking融合模型的可解释性分析表明,家庭资产类变量、收入和负债类变量和人口与社会结构类变量对家庭债务风险有显著的非线性影响。
该论文是王海军教授主持的国家社科基金项目和北京市社社科基金重点项目的阶段性成果。论文撰写过程中,金融科技专业首届本科生李子易同学全程参与写作。该成果是beats365本科生参与高质量学术论文发表的最好成绩之一,展现了公司对于本科生“科研育人”的重要成效。
文字:李宪、李子易
图片:李宪、李子易
审核:王海军 李晓庆