量子位
搜索文档
Meta又一AI大将跟LeCun跑了
量子位· 2026-03-22 14:28
文章核心观点 - Meta人工智能研究部门(FAIR)的资深研究员John Nguyen被其前领导、Meta AI研究创始负责人Yann LeCun新创立的公司AMI挖走,这反映了Meta在人工智能领域面临的人才流失和内部动荡,而LeCun的创业公司因聚焦“世界模型”等前沿方向并获得巨额融资,正吸引着原Meta核心人才[1][6][27][38] 关键人物背景与动向 - John Nguyen在Meta(FAIR)任职6年零3个月,是团队中坚力量,其研究路径完整跟随了Meta从联邦学习、大模型训练到多模态的技术演进主线[3][15][18][20] - John Nguyen拥有加州大学戴维斯分校统计学和计算机双学士及计算机硕士学位,自大学时期起便在亚马逊、Meta等公司实习,毕业后即加入Meta[12][13][14] - 此次挖角事件是LeCun创业后一系列人才追随的延续,此前已有谢赛宁、Mike Rabbat等FAIR前成员加入AMI[6] - 行业中存在顶尖人物创业并带走核心团队的先例,如乔布斯离开苹果、李飞飞创立公司、Ilya离开OpenAI等,这背后是人才对技术方向和方法论的追随[21][22][23][24][25] 技术研究方向与行业趋势 - John Nguyen在Meta的研究始于联邦学习,关注分布式训练效率与隐私保护,相关论文引用量达数百次(如547次、200次、177次)[16][18] - 随着大语言模型兴起,其研究重心转向大规模深度学习训练,解决大模型训练在工程层面的挑战[18][19] - 其后研究方向扩展至多模态模型,关注应用与能力构建[20] - 行业观点认为,当下稀缺的是既懂底层训练、又跨越多模态并能承接“世界模型”的人才,而“预测下一个token”的范式正逼近上限,行业开始转向对现实世界的建模[20][26] - LeCun创立的AMI及其追随者(如谢赛宁)认为,大语言模型主导的现状存在局限,担忧“语言对视觉的污染”,并将“世界模型”视为下一阶段的解决方案[8][9][10] 公司现状与竞争格局 - LeCun创立的AMI成立仅4个月,团队25人,在无产品、无收入、无客户的情况下获得了10.3亿美元(约合人民币71亿元)的种子轮融资,投前估值高达35亿美元(约合人民币241亿元),投资方包括英伟达、三星、丰田、淡马锡等,被称为“AI领域有史以来规模最大的种子轮”[28] - Meta面临内部动荡,FAIR部门被逐渐边缘化,且近期有传闻称其首席AI科学家(亚历山大王)可能被更换,尽管公司已辟谣,但形象已受损[5][31][32] - Meta在新模型开发上进展不顺,原计划去年底发布的新模型“牛油果”已推迟至2026年第一季度,截至3月底仍无正式消息[33][34][35] - Meta在追赶行业热点(文中喻为“龙虾”)时出现运营问题,包括高管邮件被误删以及内部数据未经授权泄露两小时,进一步强化了公司当前“不顺”的印象[36][37]
大厂抢郭达雅进行时!DeepSeek核心成员还是个“综艺巨佬”
量子位· 2026-03-22 14:28
核心事件与人物 - 核心研究员郭达雅被曝从DeepSeek离职,其深度参与了公司V2、V3、R1等一系列核心模型的研发 [1][7] - 郭达雅于2023年博士毕业后加入DeepSeek,专注于代码智能和大语言模型推理,离职前其个人主页仍显示为DeepSeek研究员 [8][11] 人物背景与成就 - 郭达雅拥有传奇的学术与竞赛履历,博士入学第三天即完成毕业所需的论文发表要求 [3][35] - 在顶级AI会议(NeurIPS、ACL、EMNLP等)发表论文十余篇,谷歌学术引用量超过1300次 [43] - 多次在重要算法竞赛中夺冠,包括连续两年(2019-2021)获得腾讯广告算法大赛冠军,2021、2022年蝉联ATEC科技精英赛冠军,并在2022年微信大数据挑战赛(3200支队伍参赛)中带队夺冠 [4][44][46][47] 在DeepSeek的核心贡献 - 作为核心贡献者,参与了DeepSeek从代码、数学到推理模型的完整研发链条,包括DeepSeek-Coder、DeepSeek-Math、DeepSeek-Prover以及V2、V3、R1等模型 [13][24] - 在DeepSeek-Math项目中提出的GRPO强化学习方法,后来成为R1推理模型的关键技术 [18] - DeepSeek-R1的相关论文登上Nature封面,披露其训练成本仅约29.4万美元(约合人民币208万元) [25] 技术成果与突破 - 其参与的DeepSeek-Prover项目在Lean 4定理证明上取得突破,在miniF2F基准上whole-proof generation准确率达到46.3%(64个样本),累计达52%,显著高于GPT-4的23.0% [21] - 在FIMO基准上证明了148题中的5题,而GPT-4得分为0 [21] - 研发过程证明了不依赖人工标注的推理轨迹,仅通过纯强化学习即可激发大模型的推理能力,并涌现出自反思、验证等行为模式 [24] 教育背景与早期研究 - 本科与直博均就读于中山大学计算机学院,博士论文获评2023年中山大学优秀博士学位论文 [31][41] - 博士期间在微软亚洲研究院实习,完成了CodeBert和GraphCodeBert的研究,分别发表在EMNLP 2020 Findings和ICLR 2021上 [36][37] - CodeBert首次实现了自然语言与编程语言的双模态预训练,GraphCodeBert则首次将代码的数据流结构纳入预训练 [37][39]
上海凭什么敢自封“开发者之城”?看完这场大会议程我悟了
量子位· 2026-03-22 12:18
大会概览 - 2026全球开发者先锋大会定于3月27日至29日在上海徐汇举办,是一场面向开发者、创业者和AI爱好者的综合性AI盛会 [3] - 大会内容涵盖1场开幕式、3+赛事、50+工作坊、100+互动体验及N场嘉年华,旨在提供通往AGI时代的入口 [5] - 上海正被塑造为“开发者之城”,拥有极致的AI应用场景,并正在构建覆盖上中下游的AI产业集群 [1][2][27] 核心活动与体验 - 现场提供“千万Token免费送”活动,商汤、中国电信、阶跃、阿里云无影、六联智能等厂商将提供“一站式养虾”服务,指导参与者半小时内部署并体验OpenClaw [6][9][10] - 设立AIGC创新创作训练营,由极顶数创、智灵新境等公司专家指导实操Seedance 2.0、OpenClaw等工具,优秀学员可获得结业证书及路演机会 [12][13] - 设置“AI for fun”互动体验区,可体验商汤“办公小浣熊”、萝博派对双足机器人(奔跑速度达3m/s)、讯飞AI耳机等前沿产品 [21][22] 创业与商业赋能 - 大会探讨“一人公司”模式,金珵科技、萝博派对、小山闭门会等创始人将分享如何用AI打造个人IP及实现商业落地 [14][15][16] - 举办SE超级创业者创新大赛,聚焦数字文娱、数字金融、生命健康、智能制造四大赛道,从近300支队伍中筛选优胜项目,提供万元奖金及入驻模速空间等社区的支持 [17] - 主论坛“科创共生聚力向新”邀请著名经济学家黄奇帆、上海交通大学葛冬冬等,探讨AI创业机遇与“学界-产业-开发者”全链路协同 [18] - 开设AI产品出海讲坛,以私董会形式邀请香港美高域集团、FunPlus、赞奇科技、星图比特等公司高层分享出海实战案例与避坑指南 [20] 产业生态与资源链接 - 大会作为WAIC全球创新项目路演的深度链接平台,将吸引近百家国内外投资机构,为优秀项目提供展示机会并全年开放资源链接 [24][25][26] - 上海已集聚以稀宇、商汤、沐曦、壁仞、天数、英矽等为代表的AI上市企业,以及创智学院、上海人工智能实验室、模速空间等研发机构与创新社区 [27][28]
一年一度最值得关注的AI榜单来啦!申报即日启动
量子位· 2026-03-22 12:18
AIGC产业现状与发展阶段 - 中国生成式AI正在从技术探索进入产业深度应用阶段 从“新技术”转变为“新工具” 并正成为企业必须面对的现实[1] - AI的影响范围广泛 不仅改变内容生产 还影响研发效率、营销方式、团队协作乃至决策流程[1] - AI发展已跨越分水岭 从论文参数和发布会概念 转变为短视频创作工具、手机常驻助手等日常应用 标志着其从“观望期”迈入“全民参与期”[16][17] 2026中国AIGC产业峰会 - 峰会将于2026年5月在北京举办 主题为“@所有人,马上AI起来”[17] - 峰会聚焦于“如何用好AI” 旨在邀请AI创业者、开发者及资深玩家共同探讨 推动AI技术的理解、应用与实践[17] - 峰会将公布“2026年度值得关注的AIGC企业”及“2026年度值得关注的AIGC产品”评选结果[1][4][10] 2026年度值得关注的AIGC企业评选 - 评选旨在发掘拥有最创新、最前瞻或最具规模落地潜力的AI企业[4] - **参选条件**:公司主体或主营业务在中国 主营业务为生成式AI及相关 或已将AI广泛应用于主营业务 且近一年在技术/产品或商业化方面有出色表现[7] - **评选维度**: - 技术维度:关注公司技术实力、研发能力与创新性 包括技术成果、研发投入及人才储备[12] - 产品维度:关注核心产品的创新性、市场适配性与用户体验 包括产品创新性、用户规模及体验[12] - 市场维度:关注公司市场表现与增长机会 包括商业模式、市场规模、营收情况及合作生态[12] - 潜力维度:关注核心团队实力与品牌潜力 包括核心团队、投融资进展及品牌影响力[12] 2026年度值得关注的AIGC产品评选 - 评选旨在发掘拥有最创新、最实用、最热门或最具应用潜力的AI产品[10] - **参选条件**:产品主要功能基于生成式AI能力 已具备成熟技术并投放市场 拥有一定用户规模 且近一年有重要的技术创新或功能迭代 推动了应用落地并对行业产生影响[13] - **评选维度**: - 产品技术力:关注产品技术的先进性、成熟度与高效性 包括技术架构、技术成果及产品效果[13] - 产品创新力:关注产品在功能、体验和应用场景方面的创新性与独特性 包括核心功能、应用场景、解决的痛点及趣味性[13] - 产品表现力:关注产品的用户反馈与市场表现 包括用户规模、留存率、用户反馈及产品影响力[13] - 产品潜力:关注产品未来发展与市场扩展潜力 包括产品生态、市场潜力及战略规划[13] 评选参与信息 - 评选报名即日启动 截止日期为4月27日 最终结果将于5月峰会公布[14] - 企业可通过指定网页链接或扫描二维码进行报名[14][16] - 评选过程将结合对公司的深入调研及数十位行业知名专家的意见[1] - 结果公布时 将邀请数百万行业从业者共同见证[2]
量子位编辑作者招聘
量子位· 2026-03-22 12:18
公司概况 - 公司是一家以追踪AI新进展为核心的内容平台,拥有8年积累,在AI及前沿科技行业具有顶流影响力和广泛产业资源[1] - 截至2025年,公司在微信公众号拥有超240万订阅用户,全网用户超700万,日均阅读量200万以上[12] - 公司在新榜和清博等第三方数据平台是AI及前沿科技行业TOP1新媒体[12] 招聘岗位方向 - 公司正在招聘三大方向的内容专家,岗位均为全职,工作地点在北京中关村[2] - AI产业方向:关注基建层创新,包含芯片、AI基础设施和云计算[6] - AI财经方向:关注AI领域创投和财报,跟踪产业链资本动向[6] - AI产品方向:关注AI在应用和硬件终端方向的进展[6] 岗位面向与职级 - 社招岗位覆盖编辑、主笔、主编各个层级,按能力匹配[6] - 校招面向应届毕业生,接受实习且可转正[6] 岗位职责详情 - AI产业方向岗位职责:跟进AI基建层新进展,包括芯片、AI基础设施、云计算领域动态及核心玩家[6];对前沿论文、开源社区、技术大会报告进行大众化解读[6];参与核心采访,对话产业专家并撰写案例[7] - AI财经方向岗位职责:聚焦创投、AI创业公司、上市公司、商业模式及产业链资本动向[11];产出创投融资、招股书财报解析、公司战略分析等稿件[11];访谈对话投资人、创业者及产业分析人士[11] - AI产品方向岗位职责:关注AI在终端的落地,包括软件应用产品和硬件方向[11];撰写AI应用产品深度评测,跟踪多终端新品发布[11];对话访谈AI应用创业者、产品专家及终端技术专家[11] 任职要求 - AI产业方向任职要求:对芯片、GPU、NPU、服务器、模型训练架构、云计算等有基本理解[11];熟悉AI行业的供应链与生态[11];能把复杂技术内容结构化表达[11];有技术背景、理工或CS/EE方向优先[11] - AI财经方向任职要求:对数据敏感,对财报、股权结构、战略规划感兴趣[11];逻辑结构强,对商业叙事敏感[11];热爱对话采访,社交型人格[11] - AI产品方向任职要求:对智能硬件、AI终端趋势敏锐,是重度AI产品体验人士[11];熟悉各大终端厂商业态、体验方法论[11];有强逻辑、体验表达和结构化能力[11] - 主编需具备选题和带队能力及经验[6] - 主笔需具备原创深度稿件能力[6] - 编辑需热爱表达,喜欢挖掘信息,能够用通俗语言解读AI进展[6] 员工福利与发展 - 员工可第一时间接触AI领域最新技术和产品,构建完整AI认知体系[6] - 员工可将各种AI新工具应用于工作,提升效率和创造力[6] - 员工通过撰写独家原创内容,可建立个人知名度,成为AI领域意见领袖[6] - 员工可与AI领域大咖零距离接触,参与重要科技活动,拓展行业视野[6] - 应届新人会由主编级编辑担任导师,提供一对一指导[6] - 团队氛围扁平、简单、开放,奉行多劳多得、能者上位的原则[6] - 提供行业TOP薪资待遇,五险一金、餐补、项目绩效、商务绩效、加班补助等福利[6] 应聘方式 - 应聘者需将个人简历发送至指定邮箱,邮件主题需注明应聘方向及姓名[11] - 需随简历附上科技行业代表作品或能展现个人写作水平和风格的作品[11]
浙大团队破解多模态模型「盲目自信」:先校准置信度,再分配算力丨CVPR'26
量子位· 2026-03-22 12:18
文章核心观点 - 多模态大模型存在“感知钝化”问题,即在视觉输入质量严重退化时,模型准确率大幅下降但置信度仍维持在高位,这是其产生幻觉和误判的重要根源 [1][2][4] - 针对此问题,研究团队提出了CA-TTS框架,通过置信度驱动的强化学习校准模型的自我评估能力,并将校准后的置信度转化为推理阶段的资源分配信号,实现了从“先推理后感知”到“先感知后推理”的范式转变 [4][7][28] - 该方法在四个主流视觉推理基准上全面达到SOTA,平均超越现有最优方法8.8%,并显著提升了测试时间扩展的效率,表明置信度校准能重新定义算力投入的效率上限 [4][18][27] 研究背景与问题定义 - 多模态大模型在复杂视觉推理中存在“盲目自信”问题,当输入图像从清晰状态一路加噪到接近不可辨认时,模型准确率断崖式下跌,但置信度几乎不动 [1][2] - 研究团队将这种现象定义为“感知钝化”,即模型对视觉信息质量的变化缺乏敏感性,视觉证据已明显退化,但置信度仍维持在高位 [7] - 该问题的核心是模型是否真的知道自己“不知道”,这在多模态场景下是一个长期被忽视的问题 [6] 解决方案:CA-TTS框架 - CA-TTS框架分为两个阶段:训练阶段的置信度校准,以及推理阶段的置信度感知扩展 [7] - **训练阶段(CDRL)**:核心是置信度驱动的强化学习,目标不是单纯提升答题准确率,而是让模型在“看得清”和“看不清”两种情况下,给出与视觉证据相匹配的置信度 [9] - 通过双重奖励机制进行优化:感知敏感性奖励鼓励模型对视觉退化保持敏感;校准一致性奖励鼓励模型对自身判断保持诚实 [10][11] - 训练数据来自6个公开基准的1936个高质量样本,并使用CLIP注意力图定位关键视觉区域以生成针对性扰动 [12] - 训练后,模型面对噪声图像时置信度下降幅度是训练前的4.3倍;面对遮挡条件时,这一比值达到4.7倍,且所有视觉扰动条件下的置信度都转为显著下降 [13][14] - **推理阶段(CA-TTS)**:将校准后的置信度转化为推理调度信号,包含三个协同工作模块 [15] - **Self-Consistency**:采用置信度加权投票,并引入专家模型作为外部校准器对候选答案进行二次评估 [15] - **Self-Reflection**:当初步结果置信度不足时,专家模型以Critic角色生成批评意见,引导基础模型重新推理 [15] - **Self-Check**:在视觉层面验证答案,通过对比解码比较原始图像与噪声图像下的输出概率分布 [15] - 与Tree-of-Thoughts不同,CA-TTS建立了一个多阶段验证闭环,即使前一阶段给出错误候选,后续模块仍有机会纠正 [17] 实验结果与性能表现 - **整体性能**:在四个主流视觉推理基准上,CA-TTS全面达到SOTA,平均超越现有最优方法8.8% [4] - 在Math-Vision上,准确率从基线的23.0%提升到42.4% [4][18] - 在MMMU上达到66.3%,相较基线提升17.5个百分点 [18][19] - **消融实验**:揭示了CDRL与CA-TTS的分工与协同效应 [20] - 单独使用CDRL,在Math-Vision上提升3.4个百分点(从22.96%到26.38%) [21][22] - 单独使用CA-TTS,提升15.0个百分点(从22.96%到37.99%) [21][22] - 两者结合后总提升达到19.4个百分点(从22.96%到42.35%),表明存在明显协同效应 [21][22] - **扩展效率**:CA-TTS的测试时间扩展效率显著高于基线方法 [25][27] - 在Math-Vision上,CA-TTS的扩展斜率β = 3.65,而Majority Voting为1.64,DeepConf为1.19 [27] - CA-TTS的扩展效率分别是Majority Voting和DeepConf的2.2倍和3.1倍 [27] - 当基线方法在35%左右趋于饱和时,CA-TTS仍能继续爬升并最终突破45% [27] - **专家模型依赖**:框架本身不严重依赖强专家模型 [23][24] - 即使让Qwen2.5-VL-7B自身充当“专家”,性能(32.57%)也比纯Majority Voting(27.65%)高出接近5个百分点 [23][24] 研究意义与范式转变 - 该研究提出了一种新的问题解决顺序,即从传统的“先推理后感知”转向“先感知后推理”的Perceive-then-Reason范式 [28] - 研究指出,若模型未能真正“看懂”图像却高度自信的前提未被修正,后续复杂的推理链条可能建立在不可靠的感知基础上 [29] - CA-TTS的思路是先通过CDRL建立对视觉证据敏感且与准确性一致的置信度,再用这种置信度指导推理资源的分配 [29] - 该方法为让多模态大模型在高风险场景中真正做到“知道自己什么时候不该太自信”提供了一个有说服力的起点,尽管会带来额外的推理成本 [29]
精准识别「界门纲目科属种」!北大彭宇新团队用细粒度树先验提升泛化,破解生物类别分层识别难题
量子位· 2026-03-21 17:32
MIPL 团队 投稿 量子位 | 公众号 QbitAI 一张蓝锥嘴雀的图片,你能认出它是"鸟",但能认出它是 "鸟纲-雀形目-唐纳雀科-锥嘴雀属-蓝锥嘴雀"吗? 像大多数人一样,现在的多模态大模型也认不出来。 真实世界中的对象通常包含极其丰富的类别层次,形成 类别树 结构。比如蓝锥嘴雀是:动物界-脊索动物门-鸟纲-雀形目-唐纳雀科-锥嘴雀属- 蓝锥嘴雀 (界-门-纲-目-科-属-种) 。 区别于传统的细粒度视觉识别, 分层视觉识别 旨在预测所属的所有类别层次,而不仅仅预测最终的细粒度类别。尽管现有Finedefics、Fine- R1等生成式大模型在细粒度视觉识别任务上表现出色,但由于缺乏类别树知识, 无法从粗到细实现每一层的精准识别 。 同时,采用分层类别标签对比学习得到的判别式大模型 (如BioCLIP、BioCLIP2、BioCAP等) ,其表征空间已能充分编码类别树中的类间 关系与类内关系。基于上述发现,本文 利用判别式大模型的表征指导生成式大模型的学习 ,为多模态大模型学习类别树提供了新路径。 本文是 北京大学彭宇新教授团队 在细粒度多模态大模型领域的最新研究成果, 相关论文已被CVPR 2026接 ...
量子位编辑作者招聘
量子位· 2026-03-21 17:32
公司概况 - 公司是一家以追踪AI新进展为核心的内容平台,拥有8年积累[1] - 公司在微信公众号拥有超240万订阅用户,全网用户超700万,日均阅读量200万以上[12] - 公司在新榜和清博等第三方数据平台是AI及前沿科技行业的TOP1新媒体[12] 招聘岗位方向 - AI产业方向:关注芯片、AI Infra、云计算等基建层创新[6] - AI财经方向:关注AI领域创投和财报,跟踪产业链资本动向[6] - AI产品方向:关注AI在软件应用和硬件终端方向的进展[6] 岗位层级与类型 - 社招岗位覆盖编辑、主笔、主编各个层级,按能力匹配[6] - 校招面向应届毕业生,接受实习且可转正[6] 岗位职责详情 - AI产业方向:跟进芯片、AI Infra、云计算领域新进展及核心玩家动态,解读前沿论文、开源社区及技术大会报告,参与产业专家采访并撰写案例[6][7] - AI财经方向:聚焦创投、AI创业公司、上市公司及产业链资本动向,产出融资、财报解析、战略分析等稿件,访谈投资人及创业者[11] - AI产品方向:关注AI在软件和硬件的终端落地,撰写产品深度评测、跟踪多终端新品发布,访谈应用创业者及产品专家[11] 任职要求 - AI产业方向:需对芯片、GPU、NPU、服务器、模型训练架构、云计算有基本理解,熟悉AI行业供应链与生态,具备技术背景及结构化表达能力[11] - AI财经方向:需对数据敏感,对财报、股权结构、战略规划感兴趣,逻辑结构强且对商业叙事敏感,热爱采访[11] - AI产品方向:需对智能硬件及AI终端趋势敏锐,是重度AI产品体验者,熟悉终端厂商生态及体验方法论,具备强逻辑和结构化表达能力[11] 员工福利与发展 - 员工可第一时间接触AI领域最新技术和产品,构建完整认知体系[6] - 员工可将AI新工具应用于工作以提升效率和创造力[6] - 员工可通过撰写原创内容建立个人知名度,成为领域意见领袖[6] - 员工可与AI领域大咖零距离接触,参与重要科技活动以拓展行业人脉[6] - 应届新人可获得主编级编辑提供的一对一指导[6] - 团队氛围扁平、简单、开放、多劳多得[6] - 提供行业TOP薪资待遇,包含五险一金、餐补、项目绩效、商务绩效、加班补助等福利[6]
英伟达GTC现场的隐形AI巨头:老黄机器人demo背后都是它
量子位· 2026-03-21 17:32
GTC 2026行业风向与Physical AI的崛起 - 本届GTC大会热度空前,主会场座无虚席,线下观众达三万人,线上同步观看人数达数百万[2] - 大会核心议题从以往的大模型与机器人本体,转变为AI如何真正进入现实世界,Physical AI首次成为与生成式AI平起平坐的核心主题[3][20] - 英伟达CEO黄仁勋在主题演讲中宣布,2025-2027年,以Blackwell和下一代Rubin为代表的新一代AI计算平台将带来约1万亿美元规模的收入机会[17] Physical AI的核心逻辑与基础设施重要性 - AI发展进入第三阶段Physical AI,目标是从“理解世界”走向“进入世界”,让AI在现实世界中执行任务[23] - Physical AI的底层逻辑是在数字孪生环境中进行“先训练、再落地”,通过仿真生成无限场景、测试策略、积累数据,再将训练好的模型部署到实体机器人[25][27] - 行业竞争焦点已从“谁有最好的模型”转变为“谁有最好的训练场”,决定行业上限的是仿真、数据与评测验证的基础设施[28][29] - 行业竞争的主战场已从“模型层”下沉到了“基础设施层”[77] 光轮智能的行业地位与生态角色 - 光轮智能是一家专注于Physical AI数据与仿真基础设施的具身智能独角兽,在GTC大会多个关键环节反复出现[4][5][10] - 公司构建的面向Physical AI的数据与仿真基础设施,已被国际主要具身智能团队中超过80%的仿真资产与仿真合成数据所采用[31] - 公司在Physical AI生态中已成为“不可替代的存在”,并正在从“用工具的人”变成“定规则的人”[13][42] - 公司创始人兼CEO谢晨博士作为公司代表,加入了由NVIDIA、Google DeepMind、Disney Research联合发起的开源物理仿真引擎Newton的技术指导委员会,参与核心技术决策与标准制定[43][49][50] - 公司是目前唯一同时打通世界建模、数据生成、物理测量、参数校准与评测闭环的公司,正在定义Physical AI时代的基础设施[51][52] 光轮智能在GTC大会的具体展示与布局 - 英伟达CEO主题演讲中演示的多个机器人仿真demo(如机器人叠衣服、拉紧皮带)背后使用了光轮的技术[6][34] - 公司展台位置核心,位于入口处,毗邻三星、美光等存储巨头及多家AI基础设施重量级玩家[8] - 公司在GTC现场通过三个展位,系统展示了Physical AI的三大核心命题:World(世界构建)、Behavior(行为数据)、Eval(能力评测)[55] - **World**:展示“物理测量工厂”,通过机械臂对物体进行精确力学测量,以构建与真实世界对齐的仿真环境[56] - **Behavior**:展示规模化生产驱动模型训练的行为数据,融合仿真遥操与真人第一视角视频数据[58][61] - **Eval**:推出业内首个高难度、具备工业级标准的仿真评测平台RoboFinals,用于衡量机器人基础模型的真实能力[62] - 公司在GTC期间举办了六场主题演讲,系统输出了其构建Physical AI基础设施的方法论,涵盖世界构建、数据生产、能力评测三大方面[66][67][69] - 公司举办了超过350人参与的Physical AI主题派对,展现出强大的行业号召力,正在聚拢并连接仿真、模型、机器人等各方角色,构建行业生态网络[70][72] Physical AI时代的基础设施定义与行业前景 - Physical AI的发展高度依赖于仿真的精度、数据的规模、评测的标准等基础设施的扎实程度[76] - 当一家公司同时出现在技术演示核心、进入仿真引擎治理层、打造完整系统、输出工程方法并构建生态网络时,其角色已演变为行业生态中的一层“基础设施”[80][81] - Physical AI正从概念走向工程、从愿景走向产业,决定其发展上限的底层基础设施正在被重新定义[82] - 这场以基础设施为核心的行业变革才刚刚开始[83]
Cursor套壳Kimi败露,最强「自研」模型被锤!创始人:忘记署名了
量子位· 2026-03-21 13:11
事件核心观点 - 硅谷AI编程工具公司Cursor发布其“自研”模型Composer 2,声称通过持续预训练和强化学习实现高性能低成本,但被揭露其基础模型实为中国公司月之暗面(Moonshot AI)的开源模型Kimi K2.5,涉嫌违反开源协议且未署名 [1][2][10][27] - 月之暗面核心技术人员通过技术证据和公开质询,证实Cursor模型套壳,引发舆论风波;但随后双方发布声明,暗示存在经由第三方平台的授权商业合作,事件以Cursor道歉并承认失误告终 [4][6][25][44][48][51] - 事件反映出在AI模型开发高成本背景下,套用优秀开源模型(尤其是中国模型)进行微调或后训练已成为行业常见做法,但相关公司在宣传透明度与遵守开源协议方面存在争议 [57][63][64][71] 事件经过与关键证据 - **Cursor发布“自研”模型**:Cursor发布Composer 2模型,宣称其通过持续预训练和独特的自我总结强化学习(RL)方法实现低成本高性能,并在自家基准测试中表现优于Claude Opus [10][36][38] - **用户发现套壳证据**:有用户在使用Cursor时,从API日志中发现模型名称直接显示为“Kimi K2.5”,引发社区质疑 [15][17] - **月之暗面技术实锤**:月之暗面预训练负责人通过技术分析指出,Composer 2的tokenizer与Kimi K2.5完全相同,证实其只是在Kimi基础上做了后训练,并公开质问Cursor CEO为何未遵守许可协议及支付费用 [25][26][27][30] - **Cursor的回应与道歉**:Cursor最终承认Composer 2确实基于Kimi K2.5,创始人解释未署名是“疏忽”和“失误”,并对此表示歉意 [11][48][51] 涉及公司与模型详情 - **Cursor公司**:一家硅谷AI编程工具独角兽,估值达500亿美元,年经常性收入(ARR)为20亿美元,月收入约1.67亿美元 [22] - **月之暗面(Moonshot AI)与Kimi模型**:中国AI公司,其开源模型Kimi K2.5采用修改版MIT协议,规定若商业产品月活超1亿或月收入超2000万美元,必须标明使用了Kimi K2.5 [20][21] - **Fireworks AI**:作为第三方托管平台,被指是Cursor获得Kimi模型授权的商业渠道 [44] 行业背景与类似案例 - **行业普遍做法**:由于从零预训练编码模型成本高、风险大,基于现有优秀开源模型进行微调是资源受限公司的常见策略,中国开源模型因此成为热门选择 [63][64][65] - **类似套壳争议**:日本乐天(Rakuten)发布的“自研”模型Rakuten AI 3.0,也被社区发现其配置文件显示模型类型为“deepseek_v3”,结构与深度求索(DeepSeek)的V3模型几乎一模一样,且最初未包含原许可文件 [66][67][68][69] - **过往质疑**:Cursor此前发布的Composer模型就因技术描述含糊、未说明基础模型而受到透明度质疑,且有迹象显示其可能与智谱GLM模型相似,但因智谱采用标准MIT协议而未强制署名,故未引发严重纠纷 [58][59][60][62]