Ceres
搜索文档
挑战Transformer,前OpenAI研究VP宣布创业,拟融资10亿美元
机器之心· 2026-01-31 12:10
行业趋势:对Transformer架构的反思与新方向探索 - Transformer是当前大语言模型发展的核心基础,但其创造者之一Llion Jones表示正在大幅减少研究Transformer的时间,并明确寻找下一个目标[1][3] - 行业内一个规模虽小但日益壮大的群体认为AI领域需要一场彻底的变革,当前主流技术难以在生物、医学等领域取得重大突破,且无法根除AI常犯低级错误的顽疾[8][9] 公司动态:Core Automation的创立与愿景 - 前OpenAI研究副总裁Jerry Tworek创立新公司Core Automation,公司刚成立几周,正寻求5亿至10亿美元的融资[6] - 公司计划采用与OpenAI、Anthropic等大厂截然不同的路径开发AI模型,目标是打造具备持续学习能力的模型,能够从现实世界的实践中即时获取知识[6] - 公司仍会使用大型神经网络,但将重新审视模型开发的每一个环节,包括训练神经网络的最基本方法梯度下降[11] - 公司计划开发一种对数据量和计算资源需求更低的模型,通过构建全新的架构来取代Transformer架构,并将原本割裂的模型训练步骤整合为单一流程[11] - 按照目标,这款模型所需的数据量将比现有最先进模型少100倍[16] 技术路径:持续学习与单一模型构想 - Core Automation与由前OpenAI首席科学家Ilya Sutskever共同创立的Safe Superintelligence,以及从Meta离职的Yann LeCun,均在探索让模型能够通过在现实世界中部署来不断进化的类似方向[13] - 在Tworek的构想中,Core Automation的研究团队将围绕一个名为Ceres的单一算法和模型展开工作,这与主流厂商将训练分为预训练、中期训练和后期微调的做法大相径庭[15] - 模型研发成功后,公司将开发AI智能体来自动化生产自己的产品,远景规划包括工业自动化、建造自我复制工厂、研制自动生成定制设计的生物机器,乃至改造地外行星的生态[16] 市场环境:资本市场对AI新实验室的狂热 - Tworek宏大的融资目标反映了资本市场对新实验室的持续狂热,近几个月来,许多此类公司尚无收入甚至没有产品,但动辄就能拿到数亿美元的投资[15] - 例如,初创公司Humans&本月以44.8亿美元的估值拿下了4.8亿美元种子轮融资[15] - Mira Murati的Thinking Machines Lab最近也在洽谈一笔40亿至50亿美元的融资,投后估值预计超过500亿美元,该公司去年已推出了模型定制产品并产生了部分收入[15]