Workflow
量子位
icon
搜索文档
xAI又跑两个华人联创!11走9只剩2人,马斯克承认第一次建错了
量子位· 2026-03-13 16:50
核心观点 - 马斯克旗下人工智能公司xAI正经历剧烈的人员动荡,其11人创始团队中已有9人离职,仅剩2人,同时公司面临企业文化、管理结构、产品竞争力及法律诉讼等多重挑战,马斯克承认公司“第一次没建对”并计划重组[1][2][4][6][17][31] 创始团队与高层人事动荡 - **创始团队几乎清空**:xAI的11位联合创始人中已有9人离开,目前仅剩 Manuel Kroiss 和 Ross Nordeen 两人[2][6][17] - **近期离职关键人员**: - 2026年1月,核心架构师 Greg Yang 退出日常工作,将健康问题归因于长期高强度工作[13] - 2026年2月10日,负责推理研究的前谷歌科学家 Tony Wu 离职[13] - 2026年2月11日,以提出Adam优化算法闻名的 Jimmy Ba 离职,他曾负责AI辅导功能和Grok 4模型研发[13] - 2026年2月底,领导Macrohard项目的 Toby Pohlen 离职[13] - 2026年3月,两位华人联创离职:Zihang Dai(前谷歌员工,卡内基梅隆大学博士)和 Guodong Zhang(直接向马斯克汇报,负责Grok Code和Grok Imagine产品线)[6][7][9] - **历史离职情况**:前谷歌资深科学家 Christian Szegedy 于2025年2月离职;Igor Babuschkin 于2025年8月离职后创立AI安全风投;基础架构主管 Kyle Kosic 于2024年转投竞争对手OpenAI[14][15][16] 内部管理与文化问题 - **前员工爆料管理问题**:前员工 Benjamin De Kraker 爆料,xAI实际管理文化与宣称的“扁平结构”和鼓励“主动出击”相悖,其因公开征集Grok改进建议而遭到严厉处罚,账号被冻结,并被要求删除内容[18][21][22][25][26] - **管理层被指官僚**:该员工指出公司内部充斥着中层管理者和官僚主义者,扼杀新想法,是其待过“最有大公司病的地方之一”,并称其在xAI认识的所有人都已离开[28][29][30] 公司战略与产品状况 - **马斯克承认战略失误并计划重组**:马斯克表示“xAI第一次没建对,现在要从头再建”,并在2月全员大会上称公司正在进行重组以提高效率,有些人更适合早期而非后期阶段[4][31][32] - **裁员与项目调整**:自2026年1月以来,xAI已裁减数十名员工,波及Macrohard项目和Grok Imagine团队;Macrohard项目在负责人离职后一度停滞,后宣布与特斯拉合作推进[34] - **产品竞争力承认落后**:马斯克公开承认Grok目前在编程方面落后于竞争对手,并召开全员会议制定赶超计划[35] 外部竞争与法律纠纷 - **与OpenAI的人才争夺**:xAI与OpenAI之间存在持续一年多的人才拉锯,包括联合创始人在内的多名关键人员被OpenAI挖走[37][38] - **诉讼被驳回**:xAI于2025年起诉OpenAI,指控其通过挖角前员工窃取Grok商业机密,但该诉讼于2026年2月被加州法院以证据不足为由驳回[39][40] 资本运作与关联方动态 - **特斯拉投资转换**:2026年3月11日文件显示,特斯拉已获准将其对xAI的约20亿美元投资转换为SpaceX的少量股权(对应不足1%持股比例)[42] - **关联公司SpaceX的IPO计划**:SpaceX计划最早于2026年6月启动IPO,募资规模可能高达500亿美元,目标估值超过1.75万亿美元,有望成为史上最大规模IPO[43]
Gemini重塑谷歌地图!一句话搞定出行攻略,网友:垂直应用全完蛋
量子位· 2026-03-13 16:50
文章核心观点 - 谷歌通过将新一代Gemini模型深度整合至其核心产品谷歌地图,推出了“Ask Maps”和“沉浸式导航”两大功能,这被官方称为谷歌地图十多年来的最大升级,旨在显著提升用户体验并巩固其市场竞争力[1][2][4] - 新功能展示了谷歌利用强大基础模型能力为成熟产品注入新活力、并可能重塑相关垂直应用市场格局的战略趋势,引发了对垂直应用公司未来生存空间的讨论[5][35][36] 产品功能升级:Ask Maps - 推出基于对话交互的“Ask Maps”功能,用户可直接用自然语言向地图提出复杂、多条件的现实需求,例如寻找适合家庭周末徒步3小时并能解决午餐的公园,或根据位置、时间、人数和偏好(如素食)推荐餐厅[6][11][14] - 该功能由Gemini模型驱动,能分析谷歌地图平台内的商家评论、照片等数据以提取环境、繁忙度等信息,并可为用户直接完成餐厅预订等操作,旨在替代传统旅行规划和生活信息查询应用[6][14][16][17] - 个性化回复基于用户在谷歌地图及搜索中的历史数据(如搜索记录、收藏地点),但官方强调目前不会整合Gmail等其他应用信息,且当前的付费推广不会影响推荐结果[18][19] 产品功能升级:沉浸式导航 - 推出全新的“沉浸式导航”功能,提供生动的3D视图以更真实地反映用户周围环境,包括建筑物、立交桥、地形和绿植,并高亮显示车道、人行横道、交通信号灯等关键道路细节[6][22][23] - 该功能同样由Gemini模型驱动,通过分析最新的街景和航拍图像来生成精确的沿途地标与路况视图[25] - 导航体验同步升级,包括通过智能缩放和建筑透明化提示复杂路况、每秒更新全球超过500万条交通信息以动态规划最佳路线并告知优缺点,以及在临近目的地时高亮显示建筑物入口和附近停车位以解决停车难题[26][28][30] 发布与市场影响 - 功能发布计划:“Ask Maps”已在美国和印度上线;“沉浸式导航”将率先在美国推出,并在未来几个月内扩展至符合条件的iOS/安卓设备、CarPlay、Android Auto及内置谷歌系统的汽车[32] - 与国内产品对比:文章指出,3D导航、路线规划及多智能体协作制定出行计划等功能,在国内的高德、百度等地图产品中早已实现[33][34] - 行业战略意义:此次更新是谷歌自2024年起将Gemini模型全线接入其产品矩阵(包括Workspace、YouTube、Chrome、搜索、智能家居等)战略的一部分,模型能力与丰富产品线的结合可能对众多SaaS和垂直应用公司构成竞争压力[35][36][39]
一年一度最值得关注的AI榜单来啦!申报即日启动
量子位· 2026-03-13 14:10
行业现状与趋势 - 中国生成式AI正在从“新技术”、“新工具”阶段,进入必须被企业面对的产业深水区,其影响已超越内容生产,扩展至研发效率、营销方式、团队协作及决策流程[1] - AI发展已跨越分水岭,从论文参数和发布会概念,转变为广泛使用的创作工具、手机助手乃至日常聊天工具,标志着行业从“观望期”迈入“全民参与期”[16][17] 2026中国AIGC产业峰会 - 峰会将于2026年5月在北京举办,主题为“@所有人,马上AI起来”,聚焦于“如何用好AI”,旨在邀请创业者、开发者及资深玩家共同推动AI的普及与应用[17] - 峰会将公布“2026年度值得关注的AIGC企业”及“2026年度值得关注的AIGC产品”评选结果,评选基于过去一年的企业表现、产品反馈以及对2026年技术场景的预判[1][4][10] 2026年度值得关注的AIGC企业评选 - **参选条件**:公司主体或主营业务在中国;主营业务为生成式AI及相关,或已将AI广泛应用于主营业务;近一年在技术/产品、商业化方面有出色表现[7] - **评选维度**: - 技术维度:关注技术实力、研发能力、创新性,包含技术成果、研发投入、人才储备[12] - 产品维度:关注核心产品的创新性、市场适配性、用户体验,包含产品创新性、用户规模、用户体验[12] - 市场维度:关注市场表现和增长机会,包含商业模式、市场规模、营收情况、合作生态[12] - 潜力维度:关注核心团队实力和品牌潜力,包含核心团队、投融资进展、品牌影响力[12] 2026年度值得关注的AIGC产品评选 - **参选条件**:主要功能基于生成式AI能力;产品技术成熟且已投放市场,具有一定用户规模;近一年有重要的技术创新或功能迭代,推动了应用落地并对行业有影响力[13] - **评选维度**: - 产品技术力:关注技术先进性、成熟度、高效性,包含技术架构、技术成果、产品效果[13] - 产品创新力:关注功能、体验、应用场景的创新性和独特性,包含核心功能、应用场景、解决的核心痛点、趣味性[13] - 产品表现力:关注用户反馈和市场表现,包括用户规模、留存率、用户反馈、产品影响力[13] - 产品潜力:关注未来发展和市场扩展潜力,包括产品生态、市场潜力、战略规划[13] 评选参与信息 - 评选报名自即日起至4月27日截止,最终结果将于5月的中国AIGC产业峰会上公布[14] - 企业可通过指定网页链接或扫描二维码进行报名,如有疑问可通过添加微信或发送邮件联系量子位工作人员[14][16]
LLM幻觉不只是「胡说八道」?新理论首次拆解幻觉的两大根源丨ICLR'2026
量子位· 2026-03-13 14:10
文章核心观点 - 大语言模型(LLM)的幻觉问题并非单一现象,而是由数据驱动和推理驱动两类机制共同作用并演化形成的复杂问题,这在高风险应用场景中是关键障碍 [2][3] - 研究首次提出了统一的“幻觉风险界”理论框架,从数学上证明整体幻觉风险等于数据误差与推理不稳定误差之和,并揭示了推理误差会随推理步骤指数级放大的机制 [7][8] - 基于该理论开发的HALLUGUARD检测器,首次实现了对两类幻觉的统一检测,且无需外部知识或人工标注,并在实验中显著超越现有主流方法,尤其在推理任务和小模型上提升显著 [10][12][14] - HALLUGUARD不仅能够检测幻觉,还能通过嵌入解码过程来主动引导和稳定模型的推理路径,从而直接提升模型在复杂任务上的性能 [18][19][21] 幻觉的根源与理论 - **两类严格区分的幻觉根源**:数据驱动型幻觉源于预训练/微调阶段的知识缺失、偏差或分布错配,表现为模型自信地给出错误事实;推理驱动型幻觉源于推理时的不稳定解码和多步逻辑放大,表现为推理过程逐渐偏离正确轨道 [5][11] - **幻觉的演化过程**:真实的幻觉往往并非单一类型,而是先由数据误差引发,再被多步推理过程放大,导致“越推理越离谱”的现象 [6][9] - **统一的理论框架“幻觉风险界”**:该框架在数学上量化了幻觉风险,将其分解为数据误差项和推理不稳定误差项,其中推理驱动项会在多步生成中随长度指数级放大,这解释了为何模型在长链条推理中更容易失控 [7][8] HALLUGUARD检测器的原理与特点 - **检测原理**:基于神经切线核(NTK)几何结构设计评分函数,从模型内部结构出发,利用NTK的谱结构判断知识掌握程度,利用解码Jacobian的放大效应衡量推理稳定性,从而统一量化“知识偏差”和“推理漂移” [10][12] - **核心优势**:能够同时覆盖数据驱动和推理驱动两类幻觉;无需依赖外部知识库或人工标注数据,实现零监督检测;在推理阶段实现零额外计算开销,可直接部署 [12] - **技术实现**:将复杂的幻觉问题压缩为一个稳定的分数,其计算公式为:$$\mathrm{{\sf~H A L L U G U a R D}}(u_{h})\;=\;\mathrm{det}({\cal K})\;+\;\log\sigma_{\mathrm{max}}\;-\;\log\kappa^{2}.$$ [10] 实验验证与性能表现 - **广泛的测试基准**:在10个幻觉评估基准、对比11种主流方法、覆盖9个大型语言模型骨干网络上进行了全面测试,任务类型包括事实型问答、多步推理以及指令跟随与开放生成 [13][14] - **全面的性能领先**:实验结果显示HALLUGUARD在所有测试中均达到最先进的(SOTA)性能,显著超越了SelfCheckGPT、Inside、RACE等主流方法 [13][15] - **特定场景优势明显**:在推理型任务上优势最为突出;对于参数量较小的模型(如7B级别)提升最大,部分情况下性能提升超过10个百分点 [14] - **理论与实验对齐**:消融实验证实,在数据型任务中幻觉主要由“数据项”主导,而在推理型任务中主要由“推理项”主导,这与理论预测完全一致 [16] 超越检测的应用价值 - **主动引导推理**:HALLUGUARD不仅可作为事后检测工具,其评分信号能直接嵌入到Beam Search等解码过程中,引导模型选择更稳定的推理路径 [18][19] - **显著提升任务性能**:在MATH-500多步数学推理数据集上,使用HALLUGUARD引导后将准确率从72.7%提升至81.0%;在某个指令任务上性能提升接近16个百分点 [19][20] - **推动行业应用范式转变**:该研究为高风险场景(如医疗、法律)的大模型部署提供了从依赖“经验补丁”转向“理论可控”的潜在路径,具有重要的产业意义 [2][21]
我用10块钱的「熟虾」,搞了个AI编辑部!
量子位· 2026-03-13 14:10
产品概述 - 火山引擎推出网页版AI Agent产品ArkClaw,是一款开箱即用的云上SaaS版OpenClaw [7] - 该产品将AI Agent(文中昵称为“龙虾”)部署于云端,用户无需本地部署,通过浏览器即可使用 [8] - 产品核心定位为“熟虾”,意指其已为用户准备好完整的环境、技能(Skills)和集成(如IM工具),实现即开即用 [13] 核心功能与特性 - 支持创建多AI角色协同工作的“AI编辑部”,包含总编虾、记者虾、编辑虾、校对虾、排版虾、运营虾六个角色,分别负责提纲设计、资料搜集、撰写初稿、内容校对、文章排版和发布运营 [5] - 提供实时可视化的“AI编辑部进度看板”,让用户清晰了解每个AI角色的工作状态和任务进度 [3][30][31] - 深度集成飞书,可无缝操作飞书文档、多维表格、日历、群聊等全生态功能 [14][21] - 提供海量Skills(技能),并联网ClawHub技能库,用户可通过自然语言指令轻松安装所需技能 [14][24] - 自带联网搜索Skill,可精准搜集网络数据 [11] - 提供终端入口,支持偏好极客操作方式的用户 [12] 产品优势与差异化 - **零门槛与易用性**:产品将复杂技术隐藏在后台,用户无需懂代码或配置环境,打开网页即用,飞书集成一键授权,技能一键安装,旨在将AI Agent的使用门槛从技术玩家降低至所有普通职场人 [62] - **多模型支持与能力**:除字节自家擅长推理规划、长程任务处理和多工具协同的Doubao-Seed-2.0系列模型外,还支持Kimi 2.5、MiniMax 2.5、GLM等主流大模型,用户可根据任务场景自由切换,无需自行申请API和做接口适配 [63] - **云端安全加固**:产品运行于火山引擎云端,权限可控,并对OpenClaw源代码的风险点做了定制化修改和安全加固,搭配身份鉴权体系,旨在规避本地部署可能带来的数据泄露风险 [64] - **高性价比与成本优势**:最低仅需8.91元即可使用,邀请好友可再享9折优惠 [8],用户仅需支付较低成本即可享受AI Agent的7x24小时云端不间断运行,无需承担本地部署的硬件、电力和运维成本 [65] 应用场景展示 - **自动化内容生产**:通过配置好的“AI编辑部”,用户仅需提供一个文章主题或标题,即可自动完成从提纲设计到排版发布的全流程内容创作 [2][43] - **群聊管理与信息整理**:通过配置“群管虾”角色,可在飞书群聊中自动整理聊天内容,提取任务、责任人、截止时间等关键信息并生成结构化表格 [48][49][50] - **资料搜集**:通过配置“搜索虾”角色,可执行特定指令,如搜集指定日期在特定平台的相关文章 [55] - **社交媒体内容生成**:通过配置“小红虾”角色并安装相应技能,可专门负责生成小红书平台的图片和文案内容 [56] 定价与市场活动 - 产品提供订阅制服务,新用户专享“Lite版9.9元/月”和“Pro版49.9元/月”的首购福利 [67] - 由于优惠活动火爆,为保障体验,自文章发布日起,新用户首购福利调整为每日10:30限量开放,优惠力度不变,老用户权益不受影响 [67]
量子位编辑作者招聘
量子位· 2026-03-13 14:10
公司概况与市场地位 - 公司是一家以追踪AI新进展为核心的内容平台,拥有8年行业积累[1] - 公司在微信公众号拥有超240万订阅用户,全网用户超700万,日均阅读量200万以上[12] - 公司在AI及前沿科技新媒体领域被第三方数据平台评为行业TOP1[12] 招聘岗位与方向 - 公司开放三大方向的全职岗位招聘,工作地点位于北京中关村[2][4] - AI产业方向关注芯片、AI Infra、云计算等基建层创新[6] - AI财经方向关注AI领域创投、财报及产业链资本动向[6] - AI产品方向关注AI在软件应用和硬件终端的落地进展[6] - 社招岗位覆盖编辑、主笔、主编各个层级,校招面向应届毕业生并接受实习转正[6] 岗位职责与要求 - AI产业方向岗位需跟进芯片、AI Infra、云计算等领域新进展及核心玩家动态[6] - AI产业方向需对前沿论文、开源社区及技术大会报告进行大众化解读[6] - AI产业方向需参与核心采访,对话产业专家并撰写AI云落地案例[7] - AI产业方向任职要求包括对芯片、GPU、服务器、云计算等有基本理解,熟悉AI行业供应链与生态,并具备技术背景者优先[11] - AI财经方向岗位职责包括产出创投融资、财报解析、公司战略分析稿件,并访谈投资人、创业者等[11] - AI财经方向任职要求包括对数据敏感、逻辑结构强、热爱对话采访[11] - AI产品方向岗位职责包括撰写AI应用产品深度评测、跟踪多终端新品发布,并对话产品专家[11] - AI产品方向任职要求包括对智能硬件趋势敏锐、熟悉终端厂商、具备强逻辑和体验表达能力[11] 员工福利与发展 - 员工可第一时间接触AI领域最新技术,构建完整的AI认知体系[6] - 员工可将AI新工具应用于工作以提升效率和创造力[6] - 员工可通过撰写原创内容建立个人知名度,成为AI领域意见领袖[6] - 员工可与AI领域大咖零距离接触,参与重要科技活动以拓展行业人脉[6] - 应届新人可获得主编级编辑提供的一对一指导[6] - 公司提供行业TOP薪资待遇,福利包括五险一金、餐补、项目绩效、商务绩效、加班补助等[6] - 公司团队氛围扁平、简单、开放,奉行多劳多得、能者上位的原则[6]
马斯克从Cursor挖走两位天才少年
量子位· 2026-03-13 14:10
xAI最新人事变动与战略方向 - 马斯克旗下人工智能公司xAI从AI编程工具Cursor挖来两名资深高管Andrew Milich和Jason Ginsberg,两人将直接向马斯克汇报[5][6][7] - 两位新高管的加盟正值xAI联合创始人持续流失之际,近期又有两位华人联创Zihang Dai和Guodong Zhang离职,使得除马斯克外的11位联创中仅剩两人留守[52][53][54] - 马斯克对近期的人员流失做出回应,暗示将“重新造一个xAI”[8] 新加盟高管的背景与动机 - Andrew Milich是马斯克的长期追随者,曾于2017年在SpaceX实习,此次以产品与工程负责人身份回归SpaceX并加入xAI[11][13] - Jason Ginsberg对技术变革更感兴趣,他认为软件行业正迎来巨大变革,人们开始自己构造工具,不再依赖SaaS打包的工作流,这意味着重做所有软件的机会[14] - 两人是长期的工作搭档,曾共同创办加密通讯软件Skiff(后被Notion收购),后又一同加入Cursor负责Agent相关工作,此次再次共同跳槽至xAI[30][31][32][36][37] 新高管的技术专长与xAI战略关联 - 两位高管在Cursor负责网页版Cursor Agent的开发,其产品思路包括支持移动设备随时随地“vibe coding”以及通过Slack等通讯软件主动汇报进度,这些是一年前提出的Agent产品化思路[22][25][27] - 他们的专长与马斯克近期披露的“数字擎天柱”项目目标高度契合,该项目旨在将依赖键盘、鼠标、屏幕的决策型工作数字化,并模拟完整公司的运作[17][19][21] - 此次人事变动可能预示着xAI将加速开发类似“Grok Claw”的AI Agent或数字员工产品[29][30] Cursor的现状与行业竞争 - Cursor曾是炙手可热的AI编程助手,从上线到实现1亿美元年度经常性收入(ARR)用时不到两年,到2025年11月ARR达到惊人的10亿美元[40][41] - 然而,随着Anthropic和ChatGPT等基础模型公司下场推出Claude Code和Codex等应用,Cursor面临巨大竞争压力,市场份额迅速流失,其“大模型套壳”模式的护城河受到质疑[43][44][45] xAI的吸引力与内部挑战 - 对于人才而言,xAI具备强大吸引力:拥有SpaceX作为后盾,资金充足;具备自研基础模型和算力资源;同时保留了创业公司般的“闪电文化”,能让新员工快速获得资源开展工作[47][48][49] - 但xAI内部存在显著挑战:马斯克追求极致“硬核”和扁平化的管理风格导致工作强度极高,员工疲于奔命;也有前员工指责公司存在严重官僚主义[55][56][58][59] - 公司呈现出“围城”现象,内部资深员工不断离职,外部仍有大量人才怀揣抱负希望加入[60][62]
吃够了全自动的龙虾,我决定把AI的方向盘抢回来
量子位· 2026-03-13 11:51
文章核心观点 - 当前主流AI产品存在“黑箱”问题,用户缺乏控制感,过程不透明,难以干预和纠偏[1] - MorphMind是全球首个可操控AI平台,旨在解决上述问题,将AI从一个黑箱对话框改造为可被人随时干预的工作系统[2] - 该平台的核心设计理念是构建一个人与AI专家团队协作的系统,让用户成为“主理人”或“管理者”,而非被动的提问者,实现“来源可查、逻辑可审”[51][77][83] 产品功能与设计理念 - 平台将复杂任务拆解为具有先后顺序的步骤,并以思维导图等形式可视化呈现,工作过程全透明[4][14][75] - 用户拥有“监督每步”和“自动完成”两种模式选择,可随时暂停、修改或回滚特定步骤,无需因小问题重新生成整个答案[10][80] - 系统将AI组织成一个具有明确分工的专家团队,不同专家角色在能力边界上真正分工,调用不同的底层模型、信息和工具[57][72] - 专家可在不同项目间“串门”协作,用户可培养并分享优秀专家,未来可能支持打赏等创作者经济模式[58][61] 核心技术能力 - 底层建立在三类核心能力之上:单调性(用户纠正过的错误和标准会在后续任务中持续约束系统)、共生式运行(用户在任务运行过程中持续参与系统能力塑形)、即时学习(AI在任务执行中识别知识缺口并主动寻求信息或确认)[66][67][69] - 任务被组织成有方向的协作图,专家协作像接力而非混战,确保每个关键结论可回溯到原始资料和中间步骤[75][76][77] - 系统明确标注信息的不确定性,而非替用户“糊弄过去”[79] 团队背景与行业洞察 - 联合创始人刘嘉是哈佛大学工程与应用科学学院助理教授,拥有超18年脑机接口前沿领域研究经验,认为真正的智慧存在于人与世界的交互中,AI需与人类直觉和创造性协作[84][85][88][91] - CEO丁杰是清华大学校友、哈佛大学博士,美国国家科学基金会杰出青年职业奖获得者,现任明尼苏达大学统计学终身教授,长期研究生成式AI及人机协作系统,其观察到的用户痛点与产品方向高度一致[96][98] - 团队认为当前AI行业的问题根源在于系统架构和工作方式,而非单一模型参数,主流的一问一答模式将检索、分析、写作等不同标准的工作揉成一个黑箱答案[53][54][92] - 团队早期在实验室内部开发用于科研流程自动化的AI Agent,经历AI擅自占用8张A100 GPU数小时算力等失控事件后,意识到需要构建让人保留主导权的系统[99][100][102][105] 市场定位与行业趋势 - 产品形态被类比为“Agent领域的油管或者B站”,旨在将AI产品发展为创作者社区[62][63] - AI产品形态正经历从聊天机器人、工具型AI、单智能体到Agent系统的演变,在Agent系统阶段,AI开始承担完整流程,正在从工具演化为新的组织结构[113][114] - MorphMind选择的路径是构建人与AI团队协作、并能随人的反馈不断调整成长的系统,与专注于提升单个Agent能力或构建复杂自动化流程的其他公司形成差异[116][117] - 该平台旨在成为一种新的基础设施,让人的思考能力被持续放大、沉淀并协作,使得一个人借助AI就能完成以往需要一个团队才能完成的复杂工作[118][119][124] - 未来工作的基本单位可能转变为“一个人和Ta管理的一群Agent”[122]
华人博士4个月干出具身独角兽!斯坦福家务机器人再融11亿,开建中国团队
量子位· 2026-03-13 11:51
融资与估值 - 公司完成1.65亿美元B轮融资,估值达到11.5亿美元,正式成为独角兽 [1][2] - B轮融资由Coatue Management领投,Bain Capital Ventures、Tiger Global跟投,老股东Benchmark与Conviction Partners继续加码,Coatue创始人Thomas Laffont将加入董事会 [14][17] - 自去年11月发布产品以来,公司在四个多月内累计融资额已达约2亿美元 [4][18] 资金用途与公司战略 - 融资核心目的是让机器人“从Demo走向真实家庭”,不再只做演示 [1][6] - 2026年公司重点聚焦于两件事:部署(deployment)和研究(research) [5][19] - 部署方面,计划启动机器人Beta测试计划,将机器人放入真实家庭环境进行大规模测试与早期交付 [21] - 研究方面,继续加大对机器人基础模型的投入,预计到今年年底训练数据规模将增长至现在的5倍 [28] 产品与硬件 - 公司首款产品为轮式升降机器人Memo,身高约1.7米,体重约77公斤,最高可伸展到2.1米 [31] - Memo硬件配置:每条手臂7个自由度、手部4个自由度、腕部1个自由度、下半身4个自由度 [33] - 产品官方定价为2万美元(约14万元人民币),与竞争对手1X Technologies的家用机器人NEO价格相当 [34] - 产品已能完成收拾餐桌、叠衣服、冲咖啡等长程任务和灵巧操作 [30] 核心技术:数据采集与模型 - 公司认为机器人行业的真正瓶颈是数据,而非机械结构 [36][64] - 核心创新是“技能捕捉手套”,其结构与机器人手部一致,成本仅400美元,远低于传统几万美元的遥操作系统,用于规模化采集人类操作数据 [37][40][42] - 已向全球开发者寄出超过2000副手套,持续收集人类操作数据 [43] - 数据用于训练公司的端到端机器人基础模型ACT-1,该模型能根据视觉或传感器输入直接输出全身动作控制 [44][45] - 数据来源包括手套采集的人类示范数据和机器人进入真实家庭后产生的运行数据 [47] 商业模式与进展 - 构建了完整的具身模型闭环:手套采集数据→训练ACT-1模型→部署到Memo→进入真实家庭产生新数据→反馈训练→模型持续优化 [48] - Beta测试计划于2025年11月19日启动,旨在验证机器人在面对孩子、宠物、杂乱环境及不完整指令等复杂现实场景中的可靠性 [23] - 过去三个月中,已收到数千份机器人Beta测试申请 [27] - 真实家庭场景将提供实验室难以模拟的数据,加速模型收敛 [49] 团队与运营 - 公司由斯坦福具身智能领域的赵子豪与迟宬联合创立 [1] - 创始人背景为斯坦福具身系+一线AI公司(如DeepMind, Tesla)经历,是多项具身明星研究工作的核心作者 [52][56][62] - 过去几个月员工人数从35人增长到70人,翻了一倍 [7] - 工程团队规模已扩大到原来的3倍,研究团队扩大到4倍 [28] - 赵子豪已开通小红书账号,并计划在中国组建团队 [8][63]
统计学最高荣誉回归华人!苏炜杰:AI需要一门新的数学语言
量子位· 2026-03-12 17:37
苏炜杰教授获奖与核心研究贡献 - 宾夕法尼亚大学苏炜杰教授于2026年荣获统计学界最高荣誉考普斯会长奖,这是时隔14年后该奖项再次由华人学者获得 [1][2] - 其获奖基于在AI可信部署、隐私保护及AI学术评审机制等多个方向的突破性贡献 [1][7] - 苏教授坚信在AI时代,统计学将扮演越来越重要的角色,因其能通过概率分布为复杂黑盒系统找到最优解 [4][6] AI可信部署与稳健性研究 - 将AI生成内容的可追溯性、人类偏好对齐等问题形式化为严谨的统计框架,为AI应用提供理论支撑 [9] - 提出“剥洋葱”式研究思路,将神经网络视为多层结构,无需完全理解内部机制,可通过逐层分析并结合行为表现来优化和控制风险 [58][59][62] - 在偏好对齐工作中,将Transformer视为黑盒概率输出器,通过设计损失函数引导概率分布趋向目标,无需理解其内部结构 [57] 隐私保护的前沿观点与框架 - 提出高斯差分隐私框架,该框架已应用于2020年美国十年一次的人口普查,提升了隐私数据的效用 [9] - 指出在神经网络时代,由于训练数据与模型输出关系难以刻画,传统差分隐私理论面临挑战,常需添加过大噪音导致模型能力下降 [65][67] - 建议设计类似区块链的激励结构,将隐私保护从外部要求转化为公司追求自身利益最大化的内生动力 [72][73][74] - 主张采用更分层、分级的隐私目标,而非一刀切,并在社会层面持续强调隐私的重要性 [70][71] AI对齐、偏好聚合与社会影响 - 指出人类偏好不存在唯一最优解,但需明确底线,即“哪些偏好我们绝对不想要”,避免AI收敛到有害的均衡点 [19][30][33] - 现有基于奖励模型和强化学习的对齐方案,其简单的统计模型可能无法完美表达复杂、有时存在循环(如投票悖论)的真实人类偏好 [29][30] - AI由人类数据训练而来,会继承人类偏好,同时其价值观也在反向影响年轻用户,形成了一个双向塑造的过程 [28] - AI对社会整体结构的影响和演化,更接近经济学的研究范畴,需要从更宏观的视角进行审视 [26][27] AI可解释性的根本挑战与替代路径 - 认为将AI彻底“白盒化”极不现实,因为人类连自身大脑都未完全理解,理解更复杂且不断增长的“硅基大脑”难度更大 [5][53] - 模型能力(Scaling)的增强往往以可解释性减弱为代价,因为AI的发展目标并非可解释性本身 [52] - 可解释性研究可能需要重新定义“理解”的概念,未来可在“有限黑盒”条件下,结合机制证据与行为表现寻找平衡方案 [49][62] AI学术生态与评审机制 - 提出并推动了一项AI学术评审新机制:要求作者对自己的多篇投稿进行质量排序,该机制已于2026年在ICML会议上正式投入使用 [9][20] - 指出当前学术审稿存在滑向低质量均衡的风险:因投稿量激增、审稿人疲劳,导致审稿质量下降的恶性循环 [34] - 认为AI审稿在“信息抓取”类任务上优于人类,但若普遍使用少数几个主流AI,将导致审稿意见缺乏多样性,失去其核心价值 [36][39][40] - 对AI生成学术论文中的“幻觉”问题发出严重警告,虚假引用一旦进入知识体系并被多次引用,将对人类知识传承造成巨大危害 [42][43][44] 对AI理论发展的根本性判断 - 提出一个核心论断:AI需要一套全新的数学语言,因为现有数学体系(伴随物理学发展而来)可能从根本上就不适合描述AI [12][83] - 将AI类比为一种“新的物理”,但其结构与经典物理相反:物理学是“从小到大”(从底层机制推导宏观行为),而AI是“从大到小”(先定宏观框架,再训练确定参数) [13][82] - 呼吁更多受过纯数学训练的人才进入AI领域,共同创造一套更优美、更适合AI的数学框架,其意义不亚于经典力学或相对论的创立 [14][15][84][85] AI时代的教育与人才培养 - 认为大学教育体系依然重要,其中的老师指导和考试反馈机制有助于打牢基础,这是完全自学或仅靠AI对话难以替代的 [19][96][97] - 指出AI领域“结果至上”,独立研究者可能在GitHub上做出有影响力的项目,但其成果有时错误较多、质量波动大,凸显了系统训练和反馈机制的价值 [91][94][95] - 建议学生主动学习、积极利用AI进行探索和创造,因为在AI时代,被动学习与主动探索者之间的能力差距可能会被拉大到数个数量级 [108][109] - 对于高等教育路径,建议美国学生先完成学业,而国内学生若准备充分也可勇敢尝试,同时指出大厂内部的算力资源也并非无限 [100][99][101] 跨学科思维与AI研究 - 苏教授的经济学双学位背景(源于偶然)为其提供了关键思维方式:认识到真实世界是混沌的,许多问题只能近似描述,终极理性可能并不存在 [22][24] - 这种经济学思维使其更关注“人”的共同体以及社会结构,从而将AI对齐问题置于更广阔的人类社会互动背景中进行研究 [25][26] - 强调在AI这样由数千万人参与的宏大系统中,计算机、数学、经济学等不同背景的参与者从各自角度推进,没有孰优孰劣之分 [77] AI工具的应用与学术界前景 - 苏教授本人在研究工作中深度使用AI,将其视为“随身合作者”,在思路形成早期即进行交流,AI的反馈有时甚至会改变其原有研究方向 [102][103] - 认为当前学术界人才流向产业界可能是短期现象,随着Scaling Law边际收益下降,业界将更关注如何在资源受限下提升效率,而这正是学术界擅长的范式 [104][105] - 指出现有的大学培养模式大多不适合AI时代,导致学生就业受冲击,并引用陶哲轩的观点,认为数学等学科的教学方式两百年未变,AI将迫使这一局面改变 [105][106][107]