多阶段推理 - 财报，业绩电话会，研报，新闻 - Reportify

多阶段推理

搜索文档

晚点独家丨月之暗面探索 o1，跟字节抢来华为刘征瀛

晚点LatePost· 2024-11-28 22:57

月之暗面技术动态 - 月之暗面发布新数学模型k0-math 创始人杨植麟在发布会上23次提到强化学习 17次提到推理 7次提到o1模型[2] - k0-math测评评分与OpenAI的o1模型对比两者均采用强化学习和思维链技术[3] - 公司半年前已开始研发k0-math 内部代号"胖胖" 年初将"多阶段推理"纳入年度规划[5] 技术团队建设 - 引入华为诺亚方舟实验室原AI研究员刘征瀛带队探索o1方向刘曾拒绝字节跳动邀请[3][4] - 刘征瀛专业背景为北大物理数学双学位巴黎萨克雷大学AutoML博士专注AI for Math领域[5] - 公司现有100多人技术团队包括Transformer专家苏剑林微软亚研院多模态专家谭旭等[6] - 创始人杨植麟发表过XLNet等重磅论文联合创始人周昕宇有单篇引用超9000次的CNN论文[6] 模型能力进展 - 10月推出Kimi探索版实现多步思考和深度检索功能[6] - 杨植麟认为o1模型代表范式转换从Next-Token Prediction转向强化学习Scaling[3] 行业竞争态势 - 大模型竞争焦点从算法技术扩展到产品设计投放效率留存转化等综合能力[6] - 字节跳动等大公司在商业化资源和经验方面具有优势[6]

思维链技术

多阶段推理

Artificial Intelligence

思维链技术

多阶段推理

Artificial Intelligence