AI输出的可预测性和可重复性
搜索文档
三个人、一篇论文,估值850亿
36氪· 2025-09-17 16:40
公司概况与融资亮点 - 公司为人工智能研究公司Thinking Machines Lab,由前OpenAI首席技术官Mira Murati于2025年2月牵头创立,聚焦多模态基础模型与下一代人机协作 [1][3] - 公司成立仅七个月,在尚未推出正式产品、没有实际用户的情况下,以120亿美元(折合人民币850亿元)的估值完成20亿美元种子轮融资 [1][3] - 核心团队约30人,其中三分之二成员来自OpenAI,涵盖AI产品落地与核心技术研发等关键领域的顶尖人才,被视为“全明星期权”团队 [1][3][4] - 种子轮融资由Andreessen Horowitz领投,行业巨头英伟达和AMD争相跟投,并已与Google Cloud达成算力合作 [1][3] 高估值驱动因素分析 - 高估值源于“人、卡、势”三重优势:顶级团队构成“人才”优势;获得英伟达和AMD投资意味着锁定了数万张高端H100/H200 GPU的配额,构成“算力”优势;公司被视为全球能从头训练GPT-4级稠密模型的不足5家团队之一,是最后一个由“原OpenAI核心决策层”整体出走的投资标的,构成“叙事”优势 [3][4][5] - 120亿美元估值被解读为“叙事+算力+人才”三位一体的看涨期权定价,而非传统的基于收入的估值 [5][6] - 英伟达和AMD的投资战略意在“买入口、锁需求、抢话语权”,通过入股锁定未来可能高达3-4万颗高端GPU的确定性需求,并抬高竞争对手的拿卡门槛 [6] 技术研究进展与方向 - 公司选择以技术研究成果为“名片”,通过发布研究博客和学术论文向行业传递其布局,开辟了研究博客专栏「Connectionism」 [2][7] - 公司发表了首篇技术博客文章,研究如何提升大型语言模型推理输出的稳定性和可预测性,挑战了行业内关于LLM输出非确定性源于“并发+浮点数”的流行假说 [7][8][9] - 论文指出,LLM推理中的非确定性主要源于服务器负载变化导致的批大小不同,并提出需要通过确保关键计算内核具备“批不变性”来解决此问题 [8][12] 行业影响与未来趋势启示 - 公司案例提示AI行业,在追求模型性能的同时,必须高度重视输出的可预测性和可重复性,这是赢得用户信任、确保系统可靠性的关键,尤其在医疗、金融等高风险管理领域 [10][11][12] - “确定性AI”可能成为商业化分水岭,行业将加速推进批不变性内核等工程手段,确保关键场景的输出可复现 [12][13] - AI大模型行业的发展将开启新篇章,从“暴力计算”转向“精密工程”,未来趋势包括模型架构更注重效率与可解释性、训练推理一体化、多模态融合进入2.0阶段、能源效率成为核心指标等 [13][14]