晚点独家丨月之暗面探索 o1,跟字节抢来华为刘征瀛
晚点LatePost·2024-11-28 22:57
月之暗面技术动态 - 月之暗面发布新数学模型k0-math 创始人杨植麟在发布会上23次提到强化学习 17次提到推理 7次提到o1模型[2] - k0-math测评评分与OpenAI的o1模型对比 两者均采用强化学习和思维链技术[3] - 公司半年前已开始研发k0-math 内部代号"胖胖" 年初将"多阶段推理"纳入年度规划[5] 技术团队建设 - 引入华为诺亚方舟实验室原AI研究员刘征瀛 带队探索o1方向 刘曾拒绝字节跳动邀请[3][4] - 刘征瀛专业背景为北大物理数学双学位 巴黎萨克雷大学AutoML博士 专注AI for Math领域[5] - 公司现有100多人 技术团队包括Transformer专家苏剑林 微软亚研院多模态专家谭旭等[6] - 创始人杨植麟发表过XLNet等重磅论文 联合创始人周昕宇有单篇引用超9000次的CNN论文[6] 模型能力进展 - 10月推出Kimi探索版 实现多步思考和深度检索功能[6] - 杨植麟认为o1模型代表范式转换 从Next-Token Prediction转向强化学习Scaling[3] 行业竞争态势 - 大模型竞争焦点从算法技术扩展到产品设计 投放效率 留存转化等综合能力[6] - 字节跳动等大公司在商业化资源和经验方面具有优势[6]