Workflow
克劳德4系列新模型
icon
搜索文档
“复刻”幻方量化打造Deepseek 量化私募基金念空在大模型底层技术研发取得突破
经济观察网· 2025-06-03 14:57
全球大模型技术竞争升级 - 中国深度求索公司完成DeepSeek R1模型小版本升级,显著提升思维深度与推理能力 [2] - 美国Anthropic推出Claude 4系列两款新模型,提升编程、推理和智能体应用标准 [2] - 量化私募基金加入技术竞争,念空科技与上海交大合作开发SASR训练框架 [2] 新型训练框架技术突破 - SASR框架在1.5B参数规模下实现GSM8K任务80%准确率,接近GPT-4o水平 [2] - 在KK逻辑推理任务中准确率超越GPT-4o约9个百分点 [2] - 采用自适应混合训练框架,动态平衡监督微调(SFT)与强化学习(RL) [8][9] 量化投资领域应用成果 - 新框架下大模型预测准确率达传统量化模型80%,相关性低于50% [4][13] - 实现逻辑驱动的新型量化模型构建,与传统统计驱动模型形成互补 [13] - 有望产生1+1>2的效果,提升整体投资策略成效 [4] 产学研协同发展模式 - 高校提供算法理论基础,量化机构贡献工程能力和算力资源 [5][11] - 念空科技成立AllMind公司专注大模型底层算法研究 [9][11] - 通过GSM8K、MATH和KK数据集验证框架优越性 [9] 垂直领域拓展计划 - 优先强化金融场景应用,后续向新材料、医药等领域输出技术 [12] - 需解决金融模型过拟合与欠拟合平衡问题 [14] - 互联网行业面临更大规模数据训练挑战 [14] 行业发展趋势 - 参数量不再是决定性因素,算法优化成为性能突破关键 [10] - 量化私募纷纷设立AI Lab投入大模型底层技术研发 [6] - 训练框架创新提升同等资源下的模型训练效果 [10]