财务造假识别

搜索文档
基于财报文本的情感语调的分析:DeepSeek辅助识别财务瑕疵
国信证券· 2025-04-17 22:41
核心观点 - 从CSMAR数据库筛选2010 - 2021年样本,通讯服务行业造假占比最高,金融和公用事业最低;2010 - 2018年造假公司数量及占比上升,2019年后下降,约58.3%造假行为1 - 2年内暴露或终止;信息披露违规成主流,虚构利润和虚列资产减少 [3] - 基于上市公司定期财务报告,从8个维度构建378个比率型指标,筛选后保留100个指标形成特征池,含5483个财务造假样本和42046个控制样本 [3] - 利用DeepSeek R1模型分析财报文本情感语调,财务造假公司情感语调分数整体低于正常公司,可捕捉风险线索 [3] - 构建Logistic、LightGBM和MLP模型,加入情感语调因子后,三个模型召回率均提升,第二类错误下降;情感语调因子在非线性模型中重要性高,与传统财务指标协同提升预警能力 [3] - 提出基于Zero - Shot的财报文本直接分析模式和基于违规说明的Fine - Tuning模式两种拓展路径 [3] 财务造假上市公司样本整理 造假的违规类型 - 认定财务造假需满足主观故意性、财务数据操纵性、误导利益相关者目的性三个要件;虚构利润、虚列资产等7种为财务造假类违规 [7] 样本筛选 - 数据源于CSMAR数据库“财务违规表”,选2010年1月1日后样本,不研究2023年12月31日后样本;仅保留官方认定案例,排除媒体曝光未认定疑似案例 [10] 行业、造假类型、年份分布 - 通讯服务行业造假公司占比最高(19.4%),金融和公用事业最低(均低于8.5%),行业监管强度、业务复杂性与财务舞弊风险负相关 [18] - 约58.3%造假行为1 - 2年内暴露或终止,系统性舞弊难长期维持,监管纠偏机制中期显效 [18] - 2010 - 2018年造假公司数量及占比从7.5%增至17.9%,2019年后下降,2023年骤降因造假暴露滞后性,反映监管趋严 [18] - 2010 - 2018年通讯服务、能源与金融是违规重灾区,2019年后全行业违规率下行,但2022年房地产仍维持15.5%高违规率 [22] - 信息披露违规取代传统利润操纵成主流,虚构利润和虚列资产大幅萎缩 [22] 基于结构化数据构建财务造假识别模型特征池 数据来源与筛选依据 - 聚焦上市公司定期财务报告,提取标准化财务报表数值信息,以年度报告为核心数据来源,数据源于CSMAR数据库“财务指标分析表” [26] 特征构建原则 - 采用比率型指标,归一化&标准化,处理行业属性,多维度覆盖 [28] 特征池优化机制 - 剔除缺失值超50%的指标,保留p值小于0.1的因子,处理离群值 [28] 最终结果 - 原有378个指标,筛选后保留100个,含5483个财务造假样本和42046个控制样本 [28] DeepSeek辅助构建基于财报文本的情感语调因子 构建流程 - 初始化API密钥等,通过文本截断和情感分析函数处理,经数据加载、批量处理和结果保存阶段得到情感语调分数 [31][32] 情感语调因子作用 - 传统财务指标可能被操纵,文本情感语调反映管理层真实情绪,过度积极或负面情绪有风险;可捕捉情绪矛盾、模糊表述和行业异常等风险线索 [39] - 财务造假公司情感语调分数整体低于正常公司 [39] 情感语调因子在财务造假识别模型中的表现 Logistic模型 - 加入情感语调因子后,测试集召回率从65.27%提升到69.01%,第二类错误下降;情感因子未进前10,通过调整财务指标权重间接优化模型 [55][57] LightGBM模型 - 加入情感语调因子后,测试集召回率从44.48%提升到52.14%,训练/测试集召回率差缩小;情感因子跻身第4重要特征,与财务指标并存实现跨模态验证 [75][76] MLP模型 - 加入情感语调因子后,测试集召回率从60.26%提升到69.19%,训练/测试集召回率差收窄;情感因子跃居第2重要特征,验证神经网络挖掘能力 [92][93] 综合分析 - 情感语调因子在非线性模型中表现突出,与财务指标形成组合预警,可提升综合预警能力 [98][109] AI挖掘财报文本信息的拓展路径 基于Zero - Shot的财报文本直接分析模式 - 利用大模型通用语义理解能力,通过Prompt工程挖掘潜在造假信号,有对比分析、规则嵌入和基础语义分析三层 [100][102] - 相比原情感语调因子,具有动态校准、白盒化和合规性等优势 [103][104] 基于违规说明的Fine - Tuning模式 - 选择DeepSeek - 14B以上基座模型,构建配对语料库,经领域适应预训练和任务精调训练专家模型,用精准匹配率和人工盲测评估 [106]
又又又遇到财务造假,怎么识别出来的?
梧桐树下V· 2024-11-29 21:59
当今时代,无论什么身份, 人人都不可避免地要和财务打交道。 作为一项生存必备的技能,可以说,理解 了财务,掌握了财务知识,具备了财务思维,才能更深入地理解资本市场上各项业务的逻辑和联系,做出更 明智的决定。 如果要问小师姐有什么可以从零开始提升财务技能的方法,那就不得不提到—— 「 投行人财务基础到进阶 学习包」! - 上下滑动查看部分资料 - 投行人财务基础到进阶学习包 扫码领券,立减 50元 /套 学习包内含: 纸质资料《投行财务手册(第三版)》、线上课程《企业上市重点财务问题处理》、电子资 料《会计准则解读与应用》、梧桐定制笔记本。 从多个角度辅助你学习财务知识,掌握财务思维。 例如 线上课程《企业上市重点财务问题处理》, 讲师从企业角度出发,剖析了50个实操案例,帮助我们掌 握财务规范性、成本费用、关联交易、持续经营能力等问题的解决思路,理清IPO财务核查中的重点关注。 再例如 电子资料《会计准则解读与应用》, 内容囊括企业会计准则、会计准则解读、会计准则应用案例、 会计准则实施问题、会计准则实务问答、会计准则趋同等效等,可以下载到电脑永久学习。 接下来,小师姐将带着大家详细了解 纸质资料 《投行财务 ...