Workflow
凸显底层创新能力,这家量化私募向NIPS投递大模型研究论文
国际金融报·2025-05-21 20:10

公司动态 - 念空科技与上海交大计算机学院合作的大模型研究论文投递至国际顶会NIPS,论文链接于5月20日公布 [1] - 公司成立于2015年,较早将AI应用于金融领域,机器学习覆盖期货、股票等,2019年转向神经网络算法,2020年搭建全流程投研平台,2021年管理规模突破百亿元 [2] - 2025年创始人王啸成立全资公司上海全频思维人工智能科技(AllMind),专注于通用大语言模型底层算法和工程技术研究 [4] 技术突破 - 念空大模型论文提出step by step切换监督微调(sft)和强化学习(rl)的训练方法,灵感来自人类学习经验 [2] - 在三个公开数据集上,新训练框架表现优于单独sft、单独rl及简单混合sft和rl,证明其为更优的后训练方式 [3] - 研究成果可使大模型在同等训练量下提升推理能力,实现"更聪明"的效果 [2][3] 人才战略 - 公司AI工程师团队70%-80%来自高校实习生或应届生,通过内部培养体系筛选人才 [4] - 量化投资需要数学、统计学、金融学、计算机技术复合背景,通过海量数据挖掘规律进行自动决策 [4] 业务布局 - 念空科技主攻金融垂直场景,AllMind则定位大模型基础学术研究,聚焦高质量CoT数据生产和底层技术探索 [4] - AllMind短期不以盈利为目的,研究方向包括不限于金融场景的垂直应用 [4]