核心观点 - 从CSMAR数据库筛选2010 - 2021年样本,通讯服务行业造假占比最高,金融和公用事业最低;2010 - 2018年造假公司数量及占比上升,2019年后下降,约58.3%造假行为1 - 2年内暴露或终止;信息披露违规成主流,虚构利润和虚列资产减少 [3] - 基于上市公司定期财务报告,从8个维度构建378个比率型指标,筛选后保留100个指标形成特征池,含5483个财务造假样本和42046个控制样本 [3] - 利用DeepSeek R1模型分析财报文本情感语调,财务造假公司情感语调分数整体低于正常公司,可捕捉风险线索 [3] - 构建Logistic、LightGBM和MLP模型,加入情感语调因子后,三个模型召回率均提升,第二类错误下降;情感语调因子在非线性模型中重要性高,与传统财务指标协同提升预警能力 [3] - 提出基于Zero - Shot的财报文本直接分析模式和基于违规说明的Fine - Tuning模式两种拓展路径 [3] 财务造假上市公司样本整理 造假的违规类型 - 认定财务造假需满足主观故意性、财务数据操纵性、误导利益相关者目的性三个要件;虚构利润、虚列资产等7种为财务造假类违规 [7] 样本筛选 - 数据源于CSMAR数据库“财务违规表”,选2010年1月1日后样本,不研究2023年12月31日后样本;仅保留官方认定案例,排除媒体曝光未认定疑似案例 [10] 行业、造假类型、年份分布 - 通讯服务行业造假公司占比最高(19.4%),金融和公用事业最低(均低于8.5%),行业监管强度、业务复杂性与财务舞弊风险负相关 [18] - 约58.3%造假行为1 - 2年内暴露或终止,系统性舞弊难长期维持,监管纠偏机制中期显效 [18] - 2010 - 2018年造假公司数量及占比从7.5%增至17.9%,2019年后下降,2023年骤降因造假暴露滞后性,反映监管趋严 [18] - 2010 - 2018年通讯服务、能源与金融是违规重灾区,2019年后全行业违规率下行,但2022年房地产仍维持15.5%高违规率 [22] - 信息披露违规取代传统利润操纵成主流,虚构利润和虚列资产大幅萎缩 [22] 基于结构化数据构建财务造假识别模型特征池 数据来源与筛选依据 - 聚焦上市公司定期财务报告,提取标准化财务报表数值信息,以年度报告为核心数据来源,数据源于CSMAR数据库“财务指标分析表” [26] 特征构建原则 - 采用比率型指标,归一化&标准化,处理行业属性,多维度覆盖 [28] 特征池优化机制 - 剔除缺失值超50%的指标,保留p值小于0.1的因子,处理离群值 [28] 最终结果 - 原有378个指标,筛选后保留100个,含5483个财务造假样本和42046个控制样本 [28] DeepSeek辅助构建基于财报文本的情感语调因子 构建流程 - 初始化API密钥等,通过文本截断和情感分析函数处理,经数据加载、批量处理和结果保存阶段得到情感语调分数 [31][32] 情感语调因子作用 - 传统财务指标可能被操纵,文本情感语调反映管理层真实情绪,过度积极或负面情绪有风险;可捕捉情绪矛盾、模糊表述和行业异常等风险线索 [39] - 财务造假公司情感语调分数整体低于正常公司 [39] 情感语调因子在财务造假识别模型中的表现 Logistic模型 - 加入情感语调因子后,测试集召回率从65.27%提升到69.01%,第二类错误下降;情感因子未进前10,通过调整财务指标权重间接优化模型 [55][57] LightGBM模型 - 加入情感语调因子后,测试集召回率从44.48%提升到52.14%,训练/测试集召回率差缩小;情感因子跻身第4重要特征,与财务指标并存实现跨模态验证 [75][76] MLP模型 - 加入情感语调因子后,测试集召回率从60.26%提升到69.19%,训练/测试集召回率差收窄;情感因子跃居第2重要特征,验证神经网络挖掘能力 [92][93] 综合分析 - 情感语调因子在非线性模型中表现突出,与财务指标形成组合预警,可提升综合预警能力 [98][109] AI挖掘财报文本信息的拓展路径 基于Zero - Shot的财报文本直接分析模式 - 利用大模型通用语义理解能力,通过Prompt工程挖掘潜在造假信号,有对比分析、规则嵌入和基础语义分析三层 [100][102] - 相比原情感语调因子,具有动态校准、白盒化和合规性等优势 [103][104] 基于违规说明的Fine - Tuning模式 - 选择DeepSeek - 14B以上基座模型,构建配对语料库,经领域适应预训练和任务精调训练专家模型,用精准匹配率和人工盲测评估 [106]
基于财报文本的情感语调的分析:DeepSeek辅助识别财务瑕疵
国信证券·2025-04-17 22:41