Tinker
搜索文档
达沃斯科技CEO展现AI全球扩张愿景
搜狐财经· 2026-01-28 22:39
达沃斯世界经济论坛上的AI热潮与讨论 - 论坛上科技公司积极展示AI前景,微软CEO萨提亚·纳德拉将数据中心称为"Token工厂",并认为其需要分布全球、连接电网与电信网络以推动AI规模化发展 [2] - 谷歌在论坛上展示其最新迭代的谷歌眼镜,会议中心举办了多场关于AI潜在好处的会议 [2] 对AI投资泡沫的担忧 - DeepMind负责人德米斯·哈萨比斯警告AI投资的某些方面看起来"像泡沫",但认为谷歌能承受泡沫破裂 [3] - 微软CEO萨提亚·纳德拉提出,如果讨论都集中在科技公司身上,则是泡沫的明显迹象 [3] 硅谷AI初创公司的融资与动态 - 由前OpenAI首席技术官米拉·穆拉蒂创立的Thinking Machines Lab解雇了其首席技术官巴雷特·佐夫,随后多名员工及一位联合创始人转投OpenAI [4][5] - Thinking Machines Lab自2024年2月成立以来已筹集20亿美元风险资本,公司估值为120亿美元 [5] - 该公司于2024年10月发布产品Tinker,旨在简化大语言模型的定制 [5] - 初创公司Humans&由来自谷歌、Anthropic和xAI的研究人员在三个月前创立,目标是促进人机协作,但尚未推出产品 [6] - Humans&已从英伟达、杰夫·贝佐斯和谷歌筹集4.8亿美元,公司估值为44.8亿美元 [6] 自动驾驶领域的监管差异与发展 - 特斯拉宣布在德克萨斯州奥斯汀的Robotaxi车队中移除了人类安全监督员,但澄清仅部署了少数无监督车辆 [7] - 德克萨斯州对自动驾驶车辆监管宽松,机动车部门无监管权限,车辆仅需遵守交通法规即可运营,个人非商业用途甚至可无人驾驶 [7][8] - 加利福尼亚州对商业自动驾驶车辆要求严格,需经过三个阶段测试和许可,监管机构正考虑增加新规则 [8] - 特斯拉网站Robotaxi部分仅提及德克萨斯州,去年10月马斯克宣布在湾区提供叫车服务时,监管机构表示其未获授权 [8]
500亿美元估值AI明星初创内讧,创始团队分裂,上演“回归OpenAI”大戏
搜狐财经· 2026-01-26 14:52
公司核心事件与动态 - 人工智能初创公司Thinking Machines Lab陷入严重动荡,创始人团队决裂,多名高管集体出走[3] - 公司由包括OpenAI前CTO米拉·穆拉蒂在内的多名前员工创立,预期估值可能高达500亿美元[3][5] - 领导层裂痕始于去年夏天,主要源于CEO穆拉蒂与CTO巴雷特·佐夫在公司发展方向上的分歧,以及佐夫未公开的办公室恋情[3] - 佐夫在去年6月向穆拉蒂坦白婚外情后,相关员工离职,佐夫休假并于7月下旬返岗后被剥夺行政职责,转为个人技术贡献者[3] - 去年10月,联合创始人安德鲁·图洛克劝说穆拉蒂出售公司,并与Meta、Anthorpic等接洽,但未达成交易,图洛克本人于10月跳槽至Meta[5] - 今年1月矛盾公开化,佐夫、萨姆·舍恩霍尔茨和卢克·梅茨在会议上向穆拉蒂“逼宫”,要求让佐夫全权负责技术决策,否则集体辞职[6] - 穆拉蒂在会议两天后宣布解雇佐夫,随后OpenAI高管菲吉·西莫宣布佐夫、舍恩霍尔茨和梅茨将回归OpenAI[6] - 公司约100名员工中,已有约9人跳槽或被邀请至OpenAI,Meta也在持续高薪挖角[6] - 双方互相猛烈抨击,穆拉蒂指责佐夫业绩糟糕、效率低下、品行有问题,佐夫则称解雇原因从未提及绩效问题,相关说法是虚假诽谤[6] - 公司6名联合创始人目前仅剩一半,500亿美元估值的兑现之路可能遭遇更多难题[9] 公司融资与估值 - 公司在去年夏天完成了20亿美元融资,估值达到120亿美元,且当时没有任何产品面世[4] - 去年10月发布AI开发工具Tinker后,开始筹划40亿至50亿美元的新融资,预期估值可能高达500亿美元[5] 行业竞争格局 - OpenAI持续的人事动荡导致多名核心成员离职创业,并受到业界和风投高度关注,获得高额融资[7] - 离职创业案例包括伊利亚·苏茨克维的SSI、阿拉温德·斯里尼瓦斯的Perplexity、安德烈·卡帕西的Eureka Labs、彼得·阿比尔等的Covariant[7] - 由阿莫代兄妹打造的Anthorpic实力最为强劲,在B端企业市场成绩显著,其Claude系列大模型在编程等领域领先GPT,是估值紧随OpenAI之后的明星公司[7] - 今年以来,OpenAI与Anthorpic在大模型、应用、企业业务等领域展开激烈竞争[8] - OpenAI正全力发力B端市场,已向部分客户预告企业级AI解决方案,以压制快速崛起的Anthorpic[8] - 回归OpenAI的佐夫据称将是B端业务的主要负责人,目标是将公司目前40%的B端收入占比到年底提升至50%[8] 公司历史背景 - 穆拉蒂曾参与罢免OpenAI的萨姆·奥尔特曼,并短暂接任CEO,在奥尔特曼复职后曾表态支持,但一年后离开公司[9] - 穆拉蒂与其他5名OpenAI骨干联合创立Thinking Machines Lab,当时招揽了约20名前OpenAI员工[9]
硅谷真实「无间道」,OpenAI前CTO怒斩泄密联创,奥特曼打包收了
36氪· 2026-01-16 20:42
核心事件概述 - OpenAI成功从竞争对手Thinking Machines Lab“反挖”三名核心技术人员回归,包括前CTO Barret Zoph及另外两名联合创始人Luke Metz和Sam Schoenholz [1][6][8] - Thinking Machines Lab创始人兼前OpenAI CTO Mira Murati解雇了CTO Barret Zoph,指控其存在“不当行为”,并可能涉及向竞争对手泄露公司机密 [3][6][8] - 此次人才流动被形容为硅谷AI领域“挖角”与“反挖角”竞争循环的典型案例 [1][28][30] 对Thinking Machines Lab的影响 - 公司遭遇重大人事地震,两位联合创始人(Barret Zoph与Luke Metz)及核心成员Sam Schoenholz集体离职并回归OpenAI,对这家成立不到一年的初创公司构成沉重打击 [12][27] - 公司正处于融资关键期,核心创始团队成员的“叛逃”被视为釜底抽薪,可能引发外界对其治理能力、团队稳定性和执行能力的担忧 [12][13][27] - 为应对危机,公司迅速任命“PyTorch之父”Soumith Chintala为新任CTO,旨在稳定军心并注入顶级工程化能力与开源社区影响力 [13][15][16] - 公司估值在2025年11月达到约500亿美元,是市场罕见的“超早期高定价”明星独角兽,此次动荡可能影响其市场形象与发展势头 [2][12] 对OpenAI的影响 - 此次回归是一次重大人才胜利,三位回归者均曾深度参与ChatGPT、GPT-4o等核心项目的开发,被称作公司的“秘密武器” [9][17][27] - 他们的回归将直接加强公司在前沿研究和应用AI领域的创新能力,并弥补了本月初研究副总裁Jerry Tworek离职造成的技术空缺 [9][27] - 公司应用CEO Fidji Simo透露,此次招揽行动已筹备数周,并明确表示不认同Mira Murati对Zoph的担忧,完全接纳其回归 [8][9] - 公司为回归者明确了新的汇报线:Barret Zoph将直接向Fidji Simo汇报,Luke Metz和Sam Schoenholz则向Zoph汇报 [8][27] 涉及的关键人物与背景 - **Barret Zoph**:前OpenAI研究副总裁(后训练方向),后成为Thinking Machines Lab联合创始人兼CTO,在Google Brain有近七年研究经验,是ChatGPT后训练与能力打磨的核心人物 [5][17][22] - **Luke Metz**:ChatGPT初始团队成员之一,曾担任GPT-4o的后训练负责人,并深度参与GPT-4评估工作 [17][23][25] - **Sam Schoenholz**:前OpenAI成员,参与早期ChatGPT相关工作 [17][27] - **Soumith Chintala**:新加入Thinking Machines Lab并出任CTO,原Meta员工,作为“PyTorch之父”在深度学习社区拥有巨大影响力 [13][15] - **Mira Murati**:Thinking Machines Lab创始人,前OpenAI CTO,于2025年2月启动该项目 [10][12] 行业竞争态势 - 硅谷AI实验室人才流动频繁,形成“旋转门”效应,此次事件是“挖角”与“反挖角”游戏的典型体现 [1][28][30] - 竞争不仅限于OpenAI与Thinking Machines Lab之间,Anthropic等其他AI公司也在积极从OpenAI挖人,例如近期OpenAI的一位高级安全研究负责人Andrea Vallone已加入Anthropic [28][29] - 随着AI竞赛白热化,顶尖AI人才的争夺战持续升级 [28][30] 公司产品与战略 - Thinking Machines Lab致力于打造“更可理解、更可定制、且更通用”的AI系统,于2025年10月发布首个产品Tinker,这是一个用于语言模型微调的API,旨在降低先进AI的使用门槛 [12] - OpenAI通过此次人才回流,巩固了自身在AI大模型后训练、评估及产品化方面的核心技术实力 [27]
OpenAI前团队创业内乱,CTO泄密竞对遭开除,翁荔火速发文
36氪· 2026-01-16 16:50
核心观点 - 人工智能行业明星初创公司Thinking Machines Lab面临重大人员震荡,三位核心创始成员集体回流至OpenAI,事件折射出顶级AI人才、超级资本与宏大愿景结合时,维持组织共同方向的挑战远大于资金和履历光环[1][7][27] 关键人物与背景 - Thinking Machines Lab由前OpenAI首席技术官Mira Murati于2024年9月离开OpenAI后,与Barret Zoph、Luke Metz等人共同创立[9] - 离职的联合创始人兼CTO Barret Zoph履历显赫,曾为OpenAI研究副总裁及谷歌研究科学家,负责过后训练研究,直接参与ChatGPT等核心模型从研究到产品化的关键工作[11][12] - 同时回流OpenAI的Luke Metz是OpenAI团队创始成员之一,参与了ChatGPT的开发,此前也在Google Brain工作[13] - 第三位回流人员Sam Schoenholz同样有OpenAI和谷歌的工作经历[16][18] 事件经过与官方声明 - Mira Murati在社交媒体宣布与联合创始人兼CTO Barret Zoph分道扬镳,措辞克制未解释原因,并宣布Soumith Chintala为新任CTO[1] - 内部消息指离职原因为Zoph向竞争对手泄漏公司机密,该消息在全体员工大会上宣布[3] - 不到一小时后,OpenAI应用部门CEO Fidji Simo发文宣布欢迎Barret Zoph、Luke Metz及Sam Schoenholz“回归OpenAI”,并表示此安排“已筹备数周”[5] - OpenAI的声明显示,Zoph将向Simo汇报,Metz和Schoenholz将向Zoph汇报[5] 公司状况与市场表现 - Thinking Machines Lab定位为构建通用、可定制、易理解的AI系统,愿景是重塑通用人工智能研究方式[7][19] - 公司成立不到半年,于2025年7月完成20亿美元种子轮融资,由a16z领投,Nvidia、AMD等参投,估值达约120亿美元,成为当时无收入、无明确产品阶段估值最高的AI初创公司之一[19] - 公司首款产品Tinker于2025年10月推出,是一个面向开发者的模型微调工具API,但市场反馈审慎,认为其独特性不足,未成行业爆款[21] - 产品推出时间距融资完成滞后较长,且处于早期,未显现对现有平台的明显替代或补充效应[22] 影响与行业观察 - 此次事件不仅是联合创始人离职,更是一次三位核心技术人员向OpenAI的系统性“回流”,对尚未推出核心产品的初创公司象征意义重大[7] - 事件表明,在高度依赖创始人协作的初创阶段,联合创始人在研究方向、组织节奏或权责边界上的分歧冲击更为直接[27] - 尽管公司拥有20亿美元巨额种子融资,但资金未能消解组织内部的结构性张力,凸显在高密度智力劳动与强价值主张并存的组织中,维持稳定清晰的共同方向是关键[27] - OpenAI方面将此次人员回流视为战略性补强,旨在重新吸纳熟悉公司文化、具备研究深度的技术骨干以降低组织摩擦[27] - 社交媒体热议此事,有观点认为OpenAI凭借资源和品牌影响力能快速重新吸引前员工,也有评论揣测事件背后动机及大公司层级结构问题[28][29]
失去三个联创后,Mira公司危机持续:又有两人要出走
机器之心· 2026-01-16 16:13
事件概述:Thinking Machines Lab 核心团队流失事件 - 前 OpenAI CTO Mira Murati 创办的 Thinking Machines Lab 出现重大人事变动,联合创始人兼 CTO Barret Zoph 被解雇,另一位联创 Luke Metz 以及创始团队成员 Sam Schoenholz 一同离开,三人均回归 OpenAI [3] - 此前已离开的 PyTorch 大神 Andrew Tulloch 使公司失去三位联创,事件继续发酵,基础设施工程师 Ian O'Connell 和研究模型架构的研究员 Lia Guy 也被爆将离开,后者明确回归 OpenAI [4][7] - 多家媒体将事件描述为“OpenAI 对 Thinking Machines Lab 的人才突袭”,据称挖人行动已在 OpenAI 内部筹备数周 [8] 事件原因与各方说法 - 关于 Zoph 被解雇,公司宣称其任职期间曾出现严重不当行为并引发问题,同时内部质疑其是否曾向竞争对手泄露公司机密信息 [10] - OpenAI 应用业务首席执行官 Fidji Simo 在备忘录中表示,Zoph 早在被解雇前就告知 Mira Murati 正考虑离开,且 OpenAI 不认同 Thinking Machines Lab 对 Zoph 职业道德的质疑 [10] - 据知情人士透露,其他人集体出走是公司内部长期讨论的结果,核心原因在于团队在产品定位、技术路线与未来发展方向上存在分歧 [11] 公司面临的质疑与现状 - 公司长期面临没有“产品”的质疑,虽曾推出专注于解决后训练 Infra 复杂性的产品“Tinker”,但成果被认为不足以承载顶级人才的技术理想 [13][14] - 公司没有旗舰模型,没有明确的商业平台,似乎也没有一份与投资规模相匹配的公开路线图 [14] - 此次核心团队流失事件对公司造成打击,甚至有观点认为公司“已经完了” [11] 行业背景与趋势 - 在失去联创方面,Thinking Machines Lab 并非个例,统计显示近年来头部 AI 公司联创出走比印象中更频繁 [16] - 行业分析师表示,此类快速行动,如招聘、离职和迅速回归,已成为 AI 劳动力市场的一个常见特征,并可能改变项目路线图和时间表 [17]
前OpenAI CTO押注的赛道,被中国团队抢先跑通,AI「下半场」入场券人人有份
机器之心· 2026-01-04 11:01
AI行业趋势:从预训练到后训练 - 过去几年AI领域的主旋律是预训练,追求更大的模型、更多的数据和更长的训练周期,但该阶段已趋于饱和[9][10] - 当前大模型部署后存在瓶颈,参数被“冻住”,无法从真实交互中持续学习进化,实际使用效果不稳定[10][23] - 强化学习被视为破局关键,能让模型从“背题”走向“推理”,带来惊人的泛化性和样本效率[11][12] - 2026年的主旋律是后训练,Gemini、DeepSeek V3.2、Kimi K2等多个前沿模型的技术报告都强调后训练仍是一片蓝海[13][14] 后训练基础设施的竞争格局 - 前OpenAI CTO Mira创立的Thinking Machines Lab押注后训练赛道,其产品Tinker定义了后训练API的新范式[16][17] - Thinking Machines在2025年7月完成了硅谷历史上最大的种子轮融资,金额达20亿美元,估值120亿美元[17] - 国内由95后青年科学家组成的Mind Lab推出了对标产品Mind Lab Toolkit,是世界第一家能够对标Thinking Machines Lab的公司[3] - Mind Lab的MinT平台比Thinking Machines更早实现了1T LoRA-RL,是业界在万亿参数模型上进行高效强化学习的第一个成果[3][25] Mind Lab与MinT平台的核心优势 - MinT是一个用CPU机器就能高效训练万亿参数模型的后训练平台,成本优化了十倍,一天即可完成一轮训练[3] - 平台兼容性强大,与Tinker API完全兼容,开发者可几乎零成本迁移[25] - 技术领先,采用LoRA技术,使多个训练和推理任务共享计算资源池,显著降低成本[31] - 在Kimi K2(万亿参数MoE)上实现端到端LoRA强化学习,仅用常规全参RL约10%的GPU资源(64块H800)即可完成训练[36] - 已支持Kimi K2 Thinking、Qwen3-VL系列等前沿开源模型,并优先支持π0等具身VLA模型,体现了中国公司在具身智能上的领先优势[31] MinT解决的核心问题与目标用户 - 核心价值是让用户只需关注数据和算法,平台自动处理集群调度、资源管理等复杂工程问题[31] - 主要解决强化学习普及的三大难题:训练不稳定、小模型难以收敛、算力成本高[35] - 目标用户是Agent领域创业公司和高校顶尖实验室,这些团队常被算力与训练框架限制[41][42] - 平台允许开发者仅用CPU机器进行训练验证,降低算法可行性验证成本[43] - 采用LoRA-RL技术将模型迭代周期从“按周”缩短到“按天”,服务于快节奏的产品开发需求[43] 团队背景与行业影响 - Mind Lab创始团队豪华,创始人Andrew毕业于MIT,首席科学家马骁腾博士毕业于清华大学自动化系[5] - 团队成员来自清华、MIT、CMU等高校,并有OpenAI、DeepMind等顶尖实验室工作经历[5] - 团队累计发表论文超100篇,总引用量超3万次[6] - MinT已获得顶尖高校和多个创业公司认可,应用场景涵盖基础研究到垂直行业[44] - 具体应用案例包括:清华大学黄高副教授团队用于RL研究、瑞铭医疗提升医疗编码准确率并落地数十家三甲医院等[51] - 2026年后训练将是中国AI弯道超车的下一个关键战场,Mind Lab致力于让中国团队在关键技术浪潮中实现自主可控[49][50]
何小鹏:当前没有AI泡沫|首席AI资讯周报
新浪财经· 2025-12-23 12:52
腾讯混元世界模型1.5发布 - 腾讯正式发布混元世界模型1.5(Tencent HY WorldPlay)[1][10] - 该模型支持通过输入文字描述或图片创建专属互动世界[1][10] - 用户可通过键盘、鼠标或手柄实时控制虚拟相机的移动和转向[1][10] 小鹏汽车董事长何小鹏对AI观点 - 小鹏汽车董事长何小鹏认为当前没有AI泡沫,任何科技时代都是阶段或局部有泡沫[2][11] - 他认为市场从混沌到有序的竞争过程是必然的,AI将推动整个社会巨大变革[2][11] 小米自研大模型开源 - 小米集团总裁卢伟冰宣布自研AI大模型Xiaomi MiMo-V2-Flash正式开源上线[2][12] - 该模型被定位为迈向Agent时代的全新语言基座[2][12] OpenAI与苹果合作及人事变动 - OpenAI应用业务CEO宣布Apple Music将加入与ChatGPT集成的合作伙伴阵营[3][12] - OpenAI任命谷歌企业发展主管Albert Lee为公司企业发展副总裁[4][12] 阿里巴巴通义万相模型升级 - 阿里巴巴发布新一代通义万相2.6系列模型[5][12] - 该系列模型面向专业影视制作和图像创作场景进行全面升级,并上线首个角色扮演功能[5][12] xAI组建企业销售团队 - xAI公司已组建企业级人工智能销售团队[6][13] - 该销售团队规模已达十余人[6][13] 商汤科技模型适配与进展 - 商汤科技发布Seko2.0——行业首个多剧集生成智能体[7][14] - 该产品依托商汤自研的日日新Seko系列模型,并已与寒武纪成功适配[7][14] OpenAI前高管创业动态 - 前OpenAI首席技术官Mira Murati离职后创办Thinking Machines Lab[8][14] - 其新产品Tinker宣布接入Kimi K2 Thinking[8][14] - 据多家媒体报道,该公司最新估值将达500亿美元[8][14] 抖音推出AI教育计划 - 抖音正式启动“AI时代前沿学科共建计划”[9][14] - 该计划将联合抖音精选集中上线100门名校公开课[9][14]
何小鹏:当前没有AI泡沫|首席AI资讯周报
首席商业评论· 2025-12-23 12:07
行业动态:AI大模型与生成式AI应用持续迭代与开源 - 腾讯发布混元世界模型1.5,支持通过文字或图片创建可实时控制的互动世界[2] - 小米宣布其自研大模型MiMo-V2-Flash正式开源上线,定位为迈向Agent时代的语言基座[4] - 阿里巴巴发布通义万相2.6系列模型,针对专业影视制作和图像创作场景进行全面升级[7] - 商汤科技发布行业首个多剧集生成智能体Seko2.0,其背后依托自研的日日新Seko系列模型[8] 公司战略:科技巨头加速AI生态布局与人才竞争 - OpenAI宣布Apple Music即将与ChatGPT集成,并聘请谷歌前高管Albert Lee担任企业发展副总裁[5][6] - xAI已组建规模达十余人的企业级AI销售团队,拓展商业化[7] - 前OpenAI首席技术官Mira Murati离职创业,其新公司Thinking Machines Lab最新估值据报达500亿美元[9] 行业观点与生态建设:看好AI长期价值与推动知识普及 - 小鹏汽车董事长何小鹏认为当前没有AI泡沫,AI将推动社会巨大变革[3] - 抖音推出“AI时代前沿学科共建计划”,联合上线100门名校公开课以助推知识普惠[9]
【数智周报】MiniMax和智谱通过港交所聆讯;OpenAI据悉计划以8300亿美元估值筹资至多1000亿美元;寒武纪:拟使用27.78亿元资本公积金弥补亏损
钛媒体APP· 2025-12-21 12:23
行业观点与战略动向 - 埃隆·马斯克公开质疑核聚变发电的经济性,认为建造小型反应堆是浪费,并计划每年部署规模堪比美国全国电力四分之一的100GW太阳能AI卫星 [2] - 腾讯升级大模型研发架构,新成立AI Infra部、AI Data部、数据计算平台部,任命前OpenAI研究员姚顺雨为首席AI科学家并兼任AI Infra部、大语言模型部负责人 [6][7] - TikTok CEO周受资发布内部信,更新美国业务方案:将成立由甲骨文、银湖及MGX等投资者持股45%的新合资公司负责数据安全,字节跳动保留19.9%股份并继续控制电商、广告等商业活动,相关事宜计划在2026年1月22日前完成 [28][29] 国内大模型与AI应用进展 - MiniMax(稀宇科技)已通过港交所聆讯,计划于2026年1月挂牌上市,若成功将成为全球从成立到IPO最快的AI公司,目前服务超200个国家2.12亿用户及超10万企业客户 [5][6] - 智谱华章已通过港交所上市聆讯 [6] - 字节跳动正推进与联想合作,为其AI手机预装AIGC插件 [8] - 豆包大模型1.8发布,面向多模态Agent场景优化,工具调用与复杂指令遵循能力增强 [9] - 千问APP开始接入阿里生态,首站接入高德地图,可调用导航、打车等底层服务 [10] - 阿里发布通义万相2.6系列模型,是国内首个支持角色扮演功能的视频模型,支持音画同步、多镜头生成 [11] - 生数科技推出可商用的一站式AI视频Agent解决方案Vidu Agent,能自动产出15秒/30秒完整广告片 [12] - 百度发布文心健康管家,定位“全能家庭医生”,覆盖全周期健康服务,并推出“原子计划”向行业免费开放100+AI能力 [13][14] - 美团发布并开源SOTA级虚拟人视频生成模型LongCat-Video-Avatar,支持音频、文本、图像生成视频等多种功能 [18] 芯片、算力与基础设施 - 中科曙光发布并真机展出了国产万卡级AI集群系统scaleX万卡超集群 [3] - 紫光国微成立中央研究院,主要研究方向包括面向具身机器人等应用的端侧AI芯片新架构 [3] - 沐曦股份在科创板挂牌上市,发行价104.66元/股,募集资金41.97亿元,开盘后股价大涨,收盘报829.90元/股,涨幅692.95%,总市值突破3300亿元 [17][20] - 壁仞科技通过港交所上市聆讯 [21] - 寒武纪公告拟使用27.78亿元资本公积金弥补亏损 [4] - 商汤日日新Seko系列模型已完成对国产AI芯片寒武纪的适配 [20] - 百度旗下昆仑芯即将完成股改,加速推进冲刺上市步伐 [20] - 小米开源总参数309B(激活15B)的MoE模型MiMo-V2-Flash,其API定价为输入0.7元/百万tokens,输出2.1元/百万tokens,推理价格仅为Claude Sonnet 4.5的2.5% [16] - 上海交通大学科研团队在《科学》杂志发表成果,实现新一代光计算芯片LightGen,实测算力和能效相比顶尖数字芯片提升2个数量级 [19][20] - 日本印刷株式会社(DNP)成功开发出相当于1.4纳米等级的NIL纳米压印技术,计划2027年量产 [29] 海外巨头动态 - 英伟达CEO黄仁勋透露,作为向OpenAI投资1000亿美元计划的一部分,目前尚未支付任何款项 [22] - 英伟达发布采用混合型Mamba-Transformer专家混合架构的Nemotron 3开源模型系列,其Nano版本吞吐量较前代提升4倍 [23] - OpenAI计划以高达8300亿美元估值筹资至多1000亿美元,最早于2025年第一季度末完成 [24] - OpenAI发布新一代图像模型GPT-image-1.5,性能提升最多4倍,成本便宜约20%,并全面接管ChatGPT中的图像生成功能 [25] - 前OpenAI首席技术官Mira Murati创办的Thinking Machines Lab估值达500亿美元,其产品Tinker新增接入万亿参数级推理模型Kimi K2 Thinking [26][27] - 谷歌推出最新人工智能模型双子座3 Flash,性能超越双子座2.5 Pro,速度提升约3倍,运行成本更低 [28] - 甲骨文一个价值100亿美元的密歇根数据中心项目因融资谈判陷入僵局而停滞 [27] - 苹果据称计划到2027年秋季将其iPhone产品线从五款扩展至七款,包括首款可折叠iPhone和20周年纪念版“全屏”iPhone [27] - OpenAI正洽谈从亚马逊融资至少100亿美元,并使用其人工智能芯片 [29] - 英特尔计划以约16亿美元收购AI芯片初创公司SambaNova [30] 融资与并购 - 多模态AI企业智象未来完成A+轮融资,京东集团等参投,已启动B轮融资筹备 [31] - 银河通用机器人完成3亿美元新一轮融资,创具身智能领域单轮融资纪录,由中国移动链长基金领投 [32] - 格蓝若机器人完成数千万元A+轮融资,由湖北省人形机器人产业投资基金领投 [33] - 首形科技完成新一轮融资,由中国互联网投资基金与蚂蚁集团联合领投 [34] - 星源智机器人完成超亿元天使+轮融资,由赛富基金与凯联资本领投 [35] - 云深处科技完成超5亿元C轮融资,由招银国际和华夏基金联合领投 [36] - 众擎机器人完成10亿元A1+及A2轮融资,由黄浦江资本等领投 [37] 合作与生态 - 爱诗科技与阿里云达成全栈AI合作,阿里云将为爱诗科技旗下用户破亿的PixVerse视频生成大模型提供全球化算力及模型服务支持 [15]
深度| 大模型年终观察,如何定义2025年的"好模型"?
Z Potentials· 2025-12-17 20:00
文章核心观点 - 2025年AI行业正经历从追求“跑分”到建立“信任”的深刻范式转变,行业共识是开源模型正从“可选项”成为“默认使用的必选项”[1] - 衡量模型的标准正从“选秀式逐冠军”转向“基建式找伙伴”,模型的基础能力是入场券,而由评测、部署、交付三个维度构成的“信任”是AI融入业务流程的通行证[2][3] - 行业已出现从“技术玩具”到“生产工具”的拐点,驱动力量从“新奇”变为“信任”,未来竞争核心将是业务可靠性、卓越运营、可控性、安全性与可观测性[12][31] 行业趋势:从尝鲜到留存,生产力拐点已现 - 开源模型调用量在关键发布后,首次实现了“峰值后高位平稳”,而非断崖式下跌,标志着真实使用和留存的开始[5][15] - 开源权重模型的token份额在2025年底稳定突破了平台总量的三分之一[5] - 用于复杂推理、规划和代理任务的“推理类模型”调用量爆炸式增长,其token消耗份额从2024年底几乎可忽略不计飙升至超过50%[8] - API调用的平均任务长度显著上升,从2023年后期不足2000 tokens增长到2025年后期超过5400 tokens,表明真实世界的复杂任务正稳定交给AI完成[8][9][12] 评测体系:从分数游戏到多维共识 - 模型发布初期,赢得关键榜单头筹仍是获取关注的“入场券”[13] - Kimi K2 Thinking是2025年典型代表,在Artificial Analysis的Intelligence Index上获得开源模型最高分,并在LMSYS Chatbot Arena开源模型中排名第一,从而获得全球关注[14][18] - 行业正形成多维评测体系,主要包括两类: - **数据驱动型**:以Artificial Analysis为代表,采用“智能指数+成本指数”双轴框架评估“性价比”,涵盖智能度、成本、可控性、生态适配度[20] - **使用实证型**:以OpenRouter为代表,基于其积累的100T tokens真实调用数据,评测模型在生产中的成功率、序列长度、调用失败率等,峰值后的高位调用量是产品力最直接证明[22] - 资深从业者的实际选择成为新维度,如前OpenAI CTO创办的公司在其产品中集成Kimi K2 Thinking以支持复杂推理[18] 部署能力:产业化与成本透明化 - 可部署性是建立信任的第二地基,企业关注“跑得起、跑得稳、跑得久”[24] - 硬件支持取得突破,NVIDIA数据显示Kimi K2 Thinking、Qwen2等MoE模型在GB200 NVL72架构上实现了10倍推理加速,同时每token成本降低90%,证明其大规模产业化部署潜力[24] - 云端推理平台推动部署成本透明化,如Fireworks、Together、OpenRouter公开每百万tokens的精确报价,使模型调用像云计算资源一样“明码标价”[24] 交付保障:治理、观测与复现 - 交付是确保模型在企业环境中“跑得稳”的最后一公里,关乎可治理、可观测、可复现[25] - **可治理**:2025年Q4,AWS、Azure、Google Cloud三大云厂商几乎同时将Claude、Kimi、Mistral等顶级模型纳入其企业级托管服务,使模型可通过统一API调用并享受平台的安全、权限管理和SLA保证,正式进入企业IT治理框架[26] - **可观测**:行业在工具调用可观测性上取得进展,OpenRouter推出的exacto系统能量化和监控模型在工具调用任务上的表现方差,通过遥测数据确保稳定性和一致性[27] - **可复现**:行业迈出关键一步,例如Hugging Face展示的Kimi K2 Thinking应用示例清晰记录了模型执行多步工具链的全过程trace,使模型能力进入“流程可复现、任务可交付”阶段[30] 未来展望:业务可靠性与卓越运营 - 2026年的关键词是“卓越运营”,未来焦点将是任务完成率、生产稳定性以及与真实工作负载的对齐[31] - 未来竞争的核心不再是智能度,而是可控性、安全性与可观测性[31] - 赢得信任的模型才可能成为真正的生产力,信任的建立是工程化的结果[32]