根据提供的研报内容,以下是关于量化模型和因子的详细总结: 量化模型与构建方式 1. 模型名称:DeepSeek-V3 - 模型构建思路:基于混合专家(MoE)架构和多头潜在注意力(MLA)技术,采用无辅助损失策略增强负载均衡和模型稳定性[9] - 模型具体构建过程: - 预训练阶段使用14.8万亿优质token - 监督微调和强化学习优化模型能力 - 训练耗时2.788M H800 GPU小时,未出现损失波动[10] - 模型评价:在知识理解、数学推理等领域表现卓越,训练成本低且性价比高[12] 2. 模型名称:基金经理言行一致性判别模型 - 模型构建思路:通过DeepSeek-V3提取基金经理观点,结合持仓数据验证言行一致性[16] - 模型具体构建过程: - 行业维度: 1. 使用DeepSeek-V3提取看好/不看好的行业概念(不超过3个)[18] 2. 匹配中信行业指数计算持仓匹配度[18] 3. 判断逻辑: - 看好行业需在T+1季度持仓>0且减仓不超过阈值[29] - 不看好行业需在T+1季度持仓=0且加仓不超过阈值[29] - 风格维度: 1. 提取大盘/小盘等7类风格观点[31] 2. 根据万得风格指数成分股计算持仓[41] 3. 判断逻辑: - 市值/估值风格需满足持仓或变化量优于同类[46] - 红利/微盘风格需持仓占比优势且变化达标[46] 量化因子与构建方式 1. 因子名称:行业言行一致因子 - 因子构建思路:反映基金经理行业观点与实操的一致性[15] - 因子具体构建过程: - 文本规则:排除历史表现描述,聚焦未来展望表述[20][22] - 计算规则: 阈值根据行业类型动态设定[29] 2. 因子名称:风格言行一致因子 - 因子构建思路:捕捉风格配置与声明的偏离度[31] - 因子具体构建过程: - 采用万得风格指数作为基准(如8888701.WI对应小盘风格)[41] - 复合判断条件: [46] 模型的回测效果 1. DeepSeek-V3模型: - MMLU-Pro准确率75.9%[10] - MATH 500测试显著领先同类模型[10] - 训练成本:180K H800 GPU小时/万亿token[12] 2. 言行一致性模型: - 行业维度: - 言行一致基金占比21.11%,不一致占比7.17%[63] - 2021年行业不一致峰值达8.1%(新能源板块波动)[63] - 风格维度: - 言行一致基金占比8.42%,不一致占比3.54%[63] - 2024年风格不一致率升至5.75%(市场快速轮动)[64] 因子的回测效果 1. 行业言行一致因子: - 全一致组合波动率显著低于不一致组合(N=2回测周期)[70] - 行业不一致基金在2021Q4超额收益波动达15%[63] 2. 风格言行一致因子: - 价值风格因子在2022年判别的准确率78%[53] - 微盘风格因子在持仓变化阈值5%时IC值0.32[46] 注:所有公式参数和阈值均来自原文披露的具体数值[29][41][46]
智能化选基系列之十:如何用DeepSeek精准识别言行一致的基金经理?
国金证券·2025-03-15 15:24