量子位
搜索文档
不读博士,照样进OpenAI!o1核心成员现身说法了
量子位· 2026-01-25 11:34
文章核心观点 - 前沿AI研究机构(如OpenAI、DeepMind、Anthropic)招聘研究员时,博士学位并非必需,更看重候选人的主动性、公开研究实践、工程能力以及实际成果[1][5][75][79] - 通过主动联系研究者、在公开平台(如GitHub、推特)持续展示研究过程与成果、产出有影响力的工作(如博客、优化器、顶会最佳论文),是非典型背景人才进入顶尖AI实验室的有效路径[6][19][26][27][70] - 相比攻读博士学位,尽早进入工业界从事AI研究可能更具优势,因为能更快接触真实世界的问题与系统,且当前许多AI实验室亟需工程能力极强的人才[83][85][86] 非典型研究员进入顶尖AI实验室的路径与特质 - **路径一:主动“套瓷”与公开研究** - Keller Jordan(本科学历,无论文)通过主动联系谷歌研究员Behnam Neyshabur,对其论文提出改进想法,最终合作完成入选ICLR 2023的论文[12][15][17] - 他通过撰写关于Muon优化器的博客和持续更新NanoGPT speedrun实验,在GitHub和推特公开研究,吸引了Andrej Karpathy的关注,最终加入OpenAI[20][22][24][26] - **路径二:业余时间高强度投入与社区互动** - Sholto Douglas(本科学历)在麦肯锡工作期间,每晚10点至凌晨2点及周末每天至少6-8小时进行AI研究,通过在GitHub提问和展示项目,吸引了谷歌研究员James Bradbury的注意,获得面试并加入Google DeepMind[34][36][38][39][40] - **路径三:独立研究并自费推动成果** - Andy Jones(数学硕士,前量化分析师)自费租赁算力、自费发表论文,其关于测试时计算扩展的研究在成为热门概念前就已开展,该工作直接推动了如o1等模型的范式,并助其加入Anthropic[45][46][48][50][58] - **路径四:以突出论文成果直接获得青睐** - Kevin Wang(本科生)凭借在NeurIPS 2025的5290篇论文中极为突出的研究,即获得最佳论文奖的《1000 Layer Networks for Self-Supervised RL: Scaling Depth Can Enable New Goal-Reaching Capabilities》,在导师强力推荐下,本科毕业后直接加入OpenAI[66][69][70][71][72] 顶尖AI实验室的招聘趋势与人才观 - **招聘标准多元化**:OpenAI、DeepMind、Anthropic等实验室招聘时,不唯学历论文,更看重实际能力、热情和已证明的成果[5][6][87] - **工程能力需求迫切**:许多AI实验室真正短缺的是工程能力极强的人才,能否加入及从事的工作取决于实验室当前需求与个人能力的匹配度[86][87] - **行业实践优于学术训练**:有观点认为,相比攻读博士学位,尽早进入工业界更好,因为博士研究可能面对“玩具基准”且研究范式迭代迅速,而工业界能接触真实系统[83][85] - **代表性案例广泛存在**:除上述案例外,GPT论文一作Alec Radford、OpenAI首席研究员Mark Chen均为本科学历;Stability AI的80名研究员和工程师中仅16位拥有PhD;OpenAI核心成员翁家翌也仅有硕士学位[76][77][81][83] 公开研究与个人品牌(PR)的重要性 - **研究可见性关键**:将研究过程与结果持续公开在GitHub、推特等平台,能让工作不被海量论文淹没,更容易被圈内人看见和衡量,从而获得机会[26][27][81] - **影响力不依赖传统论文**:Keller Jordan的Muon优化器仅通过一篇博客和公开实验传播,现已被OpenAI、Kimi、DeepSeek等公司使用,证明了公开实践的影响力[20][81] - **社区互动带来机遇**:在GitHub上提问、发帖等互动行为,能吸引资深研究者的注意,从而获得指导或面试邀请[4][38][39]
量子位编辑作者招聘
量子位· 2026-01-25 11:34
公司概况与市场地位 - 公司是一家以追踪AI新进展为核心的内容平台,拥有8年行业积累[1] - 公司在微信公众号拥有超240万订阅用户,全网用户超700万,日均阅读量200万以上[12] - 公司在第三方数据平台被认定为AI及前沿科技行业TOP1新媒体[12] 招聘岗位与方向 - 公司开放三大方向的岗位招聘:AI产业方向、AI财经商业方向、AI产品方向[2][6] - 岗位面向社招和校招,社招覆盖编辑、主笔、主编各个层级,校招接受应届毕业生及实习生[4][6] - 所有岗位工作地点均为北京中关村[2] AI产业方向岗位详情 - 岗位职责包括跟进AI基建层新进展,涵盖芯片、AI Infra、云计算领域及核心玩家动态[6] - 职责还包括对前沿论文、开源社区、技术大会报告进行大众化解读[6] - 需要参与核心采访,对话产业专家、技术大牛,并撰写AI云落地案例[7] - 任职要求包括对芯片、GPU、NPU、服务器、模型训练架构、云计算等有基本理解[11] - 要求熟悉AI行业供应链与生态,并能将复杂技术内容结构化表达,有技术背景者优先[11] AI财经商业方向岗位详情 - 岗位职责聚焦创投、AI创业公司、上市公司、商业模式及产业链资本动向[11] - 需要产出创投融资、招股书财报解析、公司战略分析等稿件[11] - 需要访谈对话投资人、创业者、产业分析人士[11] - 任职要求对数据敏感,对财报、股权结构、战略规划感兴趣[11] - 要求逻辑结构强,对商业叙事敏感,并热爱对话采访[11] AI产品方向岗位详情 - 岗位职责关注AI在终端的落地,包括软件应用产品和硬件方向[11] - 需要撰写AI应用产品深度评测,并跟踪多终端新品发布[11] - 需要对话访谈AI应用创业者、产品专家、终端技术专家[11] - 任职要求对智能硬件、AI终端趋势敏锐,是重度AI产品体验人士[11] - 要求熟悉各大终端厂商业态和体验方法论,并有强逻辑与结构化表达能力[11] 加入公司的潜在收益 - 员工可第一时间接触AI领域最新技术和产品,构建完整的AI认知体系[6] - 可将各种AI新技术、新工具应用于工作,提升效率和创造力[6] - 通过撰写独家原创内容,可建立个人知名度,成为AI领域意见领袖[6] - 可与AI领域大咖零距离接触,参与重要科技活动,拓展行业人脉[6] - 应届新人可获得主编级编辑的一对一指导[6] - 可加入扁平、简单、开放、多劳多得的团队氛围[6] - 可获得行业TOP薪资待遇及五险一金、餐补、绩效、加班补助等福利[6]
中科院AI芯片新路径登Science!铁电材料新结构突破存储密度极限
量子位· 2026-01-24 15:33
核心观点 - 中国科研团队在铁电材料领域取得重大突破,于萤石结构氧化锆中发现并证实了原子级尺度的“一维带电畴壁”,该发现突破了传统二维畴壁的存储密度极限,并揭示了其独特的“极化-离子”耦合传输特性,为构建高能效的类脑计算芯片与人工智能器件开辟了全新的物理路径[1][3][4] 技术突破与发现 - 研究团队打破了畴壁是二维面状拓扑缺陷的经典认知,在氧化锆中发现畴壁被限制在极性层内部,物理压缩成了原子级尺度的一维“线”[9][10][11] - 这些一维结构是特殊的“头对头”和“尾对尾”带电畴壁,其宽度和厚度仅为一个晶胞大小,具体尺寸为厚2.55Å、宽2.7Å,达到了物理尺寸的极限[3][12][15] - 电子束诱导实验证实,在电场驱动下,这些一维畴壁可以像滑块一样在晶格中独立移动,并伴随着氧离子的迁移,表现为极化-离子的强耦合效应[18][19][21] 材料特性与性能 - 该材料中的一维畴壁结构具有高度活性,变身为一条高效的“离子传输高速公路”,其室温下的氧离子电导率甚至优于钇稳定氧化锆等传统固体电解质[22] - 利用这种原子级一维畴壁进行数据存储,其理论存储密度可达每平方厘米20TB,相当于在一张邮票大小的设备中存储1万部高清电影[24] - 极高的存储密度结合独特的离子传输特性,契合了类脑计算对高能效、多级存储及突触行为模拟的需求[24] 稳定机制与微观机理 - 研究团队利用多层电子叠层成像技术进行观测,该技术将空间分辨率提升到了约28皮米,突破了传统透射电镜对轻元素成像的瓶颈[27][28] - 高能畴壁的稳定存在依赖于晶格内部自发的非化学计量比电荷补偿机制,即通过局部引入高浓度的点缺陷作为“电荷胶水”来维持结构平衡[29][34] - 在带正电的“头对头”交界处,晶格容纳了大量过量的间隙氧离子,实验观测到典型区域每个亚晶胞中额外“挤”入的氧原子数量达到0.771个[30] - 在带负电的“尾对尾”交界处,晶格表现为氧空位的聚集,典型区域每个亚晶胞中的氧空位数量高达0.8个左右[31][32] - 氧离子占据率在几个埃米的范围内发生剧烈突变,这种高浓度的缺陷聚集不仅屏蔽了极化电荷使结构稳定,也提供了可自由流动的电荷载体,使材料成为优异离子导体[36] 研究团队与发表 - 该研究由北京凝聚态物理国家研究中心主导,共同第一作者为中科院物理所出站博士后、鲁东大学副教授钟海以及中科院物理所博士生王诗雨[37] - 通讯作者由金葵娟院士、葛琛研究员和张庆华副研究员共同担任[38] - 研究成果论文发表于最新一期《Science》期刊[1][41]
量子位编辑作者招聘
量子位· 2026-01-24 13:19
公司业务与市场地位 - 公司是一家以追踪AI新进展为核心的内容平台,拥有8年积累[1] - 公司在微信公众号平台拥有超过240万订阅用户,全网用户超过700万,日均阅读量超过200万[12] - 公司在第三方数据平台(如新榜、清博)是AI及前沿科技行业的TOP1新媒体[12] 招聘岗位概览 - 招聘岗位均为全职,工作地点位于北京中关村[2] - 招聘面向社招和校招,社招覆盖编辑、主笔、主编各个层级,校招面向应届毕业生,接受实习且可转正[6] - 公司开放AI产业、AI财经商业、AI产品三个方向的岗位[6] AI产业方向岗位详情 - 岗位职责包括跟进AI基建层(芯片、AI Infra、云计算)新进展与核心玩家动态[6] - 岗位职责包括对前沿论文、开源社区、技术大会(如Hot Chips、NeurIPS、MLSys)报告进行大众化解读[6] - 岗位职责包括参与核心采访,对话产业专家、技术大牛,撰写AI云落地案例[7] - 任职要求包括对芯片、GPU、NPU、服务器、模型训练架构、云计算有基本理解[11] - 任职要求包括熟悉AI行业的供应链与生态(训练-推理、算力-成本、云-芯片关系)[11] - 任职要求包括能把复杂技术内容结构化表达,有技术背景、理工或CS/EE方向优先[11] AI财经商业方向岗位详情 - 岗位职责聚焦创投、AI创业公司、上市公司、商业模式、产业链资本动向[11] - 岗位职责包括产出创投融资、招股书财报解析、公司战略分析等稿件[11] - 岗位职责包括访谈对话投资人、创业者、产业分析人士[11] - 任职要求包括对数据敏感,对财报、股权结构、战略规划感兴趣[11] - 任职要求包括逻辑结构强,对商业叙事敏感[11] - 任职要求包括热爱对话采访,社交型人格[11] AI产品方向岗位详情 - 岗位职责关注AI在终端的落地,包括软件应用产品和硬件方向[11] - 岗位职责包括撰写AI应用产品深度评测,跟踪多终端新品发布(手机、PC、XR、车机等)[11] - 岗位职责包括对话访谈AI应用创业者、产品专家、终端技术专家[11] - 任职要求包括对智能硬件、AI终端趋势敏锐,是重度AI产品体验人士[11] - 任职要求包括熟悉各大终端厂商业态、体验方法论[11] - 任职要求包括有强逻辑、体验表达和结构化能力[11] 员工福利与职业发展 - 员工可以第一时间接触和了解AI领域最新技术和产品,构建完整的AI认知体系[6] - 员工可以将各种AI新技术、新工具应用于工作,提升效率和创造力[6] - 员工可以通过撰写独家原创内容建立个人知名度,成为AI领域的意见领袖[6] - 员工可以与AI领域大咖零距离接触,参与重要科技活动,拓展行业人脉[6] - 应届新人会由主编级编辑出任导师,提供一对一指导[6] - 团队氛围扁平、简单、开放、多劳多得、能者上位[6] - 提供行业TOP薪资待遇,以及五险一金、餐补、项目绩效、商务绩效、加班补助等福利[6] 岗位层级与能力要求 - 主编岗位需具备选题和带队能力及经验[6] - 主笔岗位需具备原创深度稿件能力[6] - 编辑岗位需热爱表达,喜欢挖掘信息,能够用通俗语言解读AI新进展[6] 应聘方式 - 应聘者需将个人简历发送至指定邮箱,邮件主题需注明应聘方向及姓名[11] - 随简历需附上科技行业代表作品或能展现个人写作水平和风格的作品[11]
Meta开年猛投算力,小扎亲征筹建数十GW
量子位· 2026-01-24 13:19
核心观点 - Meta正在通过重塑组织架构、启动顶级算力项目、大幅增加资本支出等方式,将算力提升到前所未有的战略高度,以应对人工智能计算的“闪电战” [1][3][5][39] 组织架构调整 - 公司年初进行组织架构调整,高管队伍从148人增至167人,并让更多人直接向CEO扎克伯格汇报,以降低资源调度和战略推进的阻力 [2][8] - CEO扎克伯格亲自点名Santosh Janardhan和Daniel Gross直接向其汇报,原因是他们共同领导了新的顶级算力项目“Meta Compute” [9][10] - 新增的直接汇报人员还包括总裁兼副董事长Dina Powell McCormick、首席法律官C.J. Mahoney、前CFO兼现任高级研究员Mike Schroepfer以及扎克伯格的长期幕僚长Andrea Besmehn [14] 顶级算力项目“Meta Compute” - “Meta Compute”项目的核心目标是让Meta在本十年内建成数十吉瓦的算力基础设施,并逐步扩展至数百吉瓦乃至更高规模 [12] - 该项目由Santosh Janardhan和Daniel Gross共同领导,他们将与Dina Powell McCormick组成团队,负责促成与各国政府及主权国家的合作,以投资部署算力基础设施 [17] - 扎克伯格强调,如何进行工程设计、投资和合作来建设这些基础设施,将成为公司的战略优势 [15][16] 项目关键负责人 - Santosh Janardhan是Meta的十年老将,此前担任全球基础设施负责人,在“Meta Compute”项目中仍负责设计、建造和运营Meta全球的数据中心帝国 [18][19][20] - Daniel Gross是去年加入Meta的AI领域明星人物,加入前曾与Ilya Sutskever联合创办SSI,在项目中专注于构建和优化算力基础设施的长期战略体系,包括产能规划、供应链建设等 [25][26][29] - 两位负责人一位负责工程技术,一位负责运营规划,且都直接向CEO汇报,体现了公司对该项目的重视 [38] 芯片战略与垂直整合 - 公司最近开始接纳来自AI芯片初创公司Rivos的员工,以加强内部AI芯片开发能力,减少对外部供应商的依赖 [41][43] - 通过将芯片设计团队纳入麾下,公司希望在算力架构定义、芯片设计到系统级优化等关键环节掌握更多主动权,构建更可控的底层算力基础 [47] 资本支出与投资承诺 - 公司2025年的资本支出预计将飙升至700亿至720亿美元,相比2024年约390亿美元的支出几乎翻了一番 [50] - 公司暗示2026年的资本支出增长幅度可能会更大 [51] - 公司已承诺到2028年仅在美国就投入超过6000亿美元用于扩张其数据中心帝国,为数百吉瓦的算力蓝图提供资金底气 [52][53] 人工智能模型进展 - Meta超级智能实验室已于本月在内部交付了首批人工智能模型,新模型展现出巨大潜力,研发工作不到六个月但表现非常出色 [56] - 公司正在研发代号分别为“Project Avocado”(基于文本)以及“Project Mango”(视觉智能)的两款模型,预计将于2026年第一季度推出 [58][59]
马斯克SpaceX背后的她:现实版钢铁侠小辣椒
量子位· 2026-01-24 13:19
SpaceX的“世纪IPO”与关键人物 - 2026年全球资本市场的头号悬念是SpaceX的“世纪IPO” [1] - SpaceX预计在2026年以1.5万亿美元的目标估值和超300亿美元的融资规模,冲击全球最大IPO纪录 [2] 格温·肖特韦尔的角色与特质 - 格温·肖特韦尔是SpaceX真正的操盘手,被称为“The Adult in the Room” [5][6] - 她具备大胆、热情、有趣、凶悍、鼓舞人心的特质,说话直接但能拿捏分寸,能与马斯克有效沟通 [10][11] - 拥有西北大学机械工程学位和应用数学硕士学位,是技术迷,但形象与刻板工程师不同 [15] 格温与马斯克的合作渊源 - 格温曾两次拒绝马斯克:第一次拒绝入职邀请,后成为SpaceX第11号员工 [16][20][22] - 第二次拒绝出任总裁,在马斯克亲自协调后接受,拉开了执掌SpaceX的序幕 [23][24][26] - 她加入时不确定能否成功,但认为若SpaceX失败,自己也不想留在该行业 [21] 格温的关键贡献:拯救公司 - 2008年猎鹰1号连续三次发射失败,公司资金耗尽,处于生死边缘 [29][30] - 猎鹰1号第四次发射成功,使公司转危为安 [30] - 格温积极推动与NASA合作,通过谈判赢得价值16亿美元的国际空间站货运合同,将公司从破产边缘拉回 [32][33] - 马斯克承认,若合同晚几个月,SpaceX将不复存在 [34] 格温与马斯克的合作关系 - 格温是马斯克最倚重的喉舌,对马斯克了解细致入微 [27][39] - 她与马斯克有相同的目标和底层逻辑(第一性原理),虽觉其想法疯狂但常证明是对的 [40][41][42][43] - 她敢于直言、指出马斯克错误,但清楚彼此界限,对外无条件支持马斯克 [44][45] - 在马斯克与外部机构(如NASA)发生矛盾时,她负责斡旋,维护商业关系 [49] - 她调节马斯克与工程师团队的关系,保护员工不被过度压榨,同时落实核心要求 [49] 格温的领导风格与公司价值 - 前SpaceX高管评价她总在公司最需要时挺身而出,是员工遇到问题时的首选处理人 [50] - 她从不居功自傲,强调公司成就是团队努力的结果 [52] - 她选择低调隐身幕后,与马斯克形成一刚一柔、一主一辅的搭档,被比作现实版钢铁侠与小辣椒 [53][54] - 在马斯克面临骚扰指控时,她展现忠诚与果断执行力,强调公司有更重要任务,并承诺调查投诉 [47] - 她认为马斯克不完美,但保持诚实并选择认同的道路是正确的 [48] 格温对当前IPO的意义 - 在SpaceX跨越资本市场的关键节点,格温的存在为动荡的市场注入了最强的定心剂 [55]
微软发布医疗时序基座模型:基于4540亿数据预训练,解决不规则采样难题
量子位· 2026-01-24 13:19
文章核心观点 - 当前医疗AI在理解生命动态演变方面存在关键能力缺失,而医疗时间序列数据是记录生命体征连续轨迹的关键[2][4] - 微软亚洲研究院推出的通用基座模型MIRA,旨在解决真实世界医疗时序数据不规则、异构性的核心难题,并展现出卓越的预测性能和零样本迁移能力[5][6] 行业现状与挑战 - 现有医疗AI(如大模型和计算机视觉)主要处理静态影像(快照)和文本(叙述),但缺乏对连续生命体征轨迹的理解能力[1][4] - 真实医疗场景(尤其是ICU)的时序数据具有多时间尺度交织、采样频率不规则的特点,这是大模型在医疗领域落地的核心障碍[9][10] - 传统方法通过插值强行对齐不规则数据,容易引入人为噪声并丢失时间动力学信息,属于削足适履[12] MIRA模型的技术创新 - 模型基于4540亿个医疗数据点进行大规模预训练,旨在学习跨场景、跨模态的生理动态模式[5][12] - 核心技术一:连续时间旋转位置编码(CT-RoPE),通过将真实连续时间戳代入计算,使模型能精准感知历史记录中的任意时间间隔变化,而非依赖离散的等距索引[14][15][16] - 核心技术二:神经常微分方程(Neural ODE)模块,通过模拟生物体内部的动力学变化,基于离散数据推导出连续时间下的潜在状态演化轨迹,从而对未来进行连续预测[17][18][19] - 模型架构接收不规则时间序列和时间戳,应用CT-RoPE编码后,通过混合专家层路由,最终由Neural ODE模块演化到任意目标时间戳以实现预测[13][14] 模型性能验证 - 在MIMIC-III、MIMIC-IV等权威数据集上评估,MIRA在关键预测任务上表现超越了现有SOTA模型[6][20] - 零样本预测能力突出:在未经过特定目标数据集训练的情况下,于分布外测试集上的表现甚至超越了部分专门训练的全监督模型,表明其学到了生理信号变化的通用规律[21] - 对稀疏数据具有高鲁棒性:无需插值预处理即可原生适配缺失值,在数据极度稀疏(仅保留30%观测点)的条件下,性能依然保持稳健,未出现显著下滑[23] - 性能数据对比:在缺失率从10%到80%的多种条件下,MIRA各版本(small, base, large)的RMSE和MAE指标均显著优于Moirai、Chronos等对比模型[24] 行业影响与未来展望 - MIRA的提出是医疗时序预测向“通用基座”时代迈进的重要探索,为解决不规则采样和异构数据难题提供了方案[25] - 该模型为医疗AI摆脱“烟囱式”开发模式提供了可能,未来医院可利用其作为底座,配合少量本地数据微调,快速获得高精度的定制化模型[25] - 此项技术为构建更智能的ICU早期预警系统、慢病管理以及通用AI助手奠定了坚实基础[25]
将登央视春晚,今年冲击IPO!苏州具身新贵魔法原子联创披露一堆新信息
量子位· 2026-01-24 09:40
公司概况与战略规划 - 具身智能创业公司魔法原子成立于2024年1月,旗下产品包括Magic Bot人形机器人系列及Magic Dog四足机器人系列 [4] - 公司宣布将登上今年央视春晚舞台,并计划在2026年冲击IPO [1][2][3] - 公司认为未来的行业竞争是资源、资金和人才之争,当前阶段的核心任务是快速跑通商业化闭环,以保障未来有强壮稳健的现金流 [10][11] - 公司希望以多元化手段吸引市场资源,支持其实现“走向全球/世界第一”的目标 [13] 产品与技术能力 - 公司产品具备多样化形态,包括人形机器人、足式机器人以及模块化产品(如加装机械臂的割草机器人、双臂咖啡机器人)[24] - Magic Bot可完成复杂动作并具拟人社交能力;Magic Dog能耐受-20℃至55℃极端环境,凭精准定位穿梭复杂场景 [5] - 公司具备软硬件全栈自研能力,调整产品矩阵效率高,一两个月就能推出新形态 [20][26] - 高性能关键模组最大扭矩达525N·m [8] - 公司在末端工具上多路线并行探索,包括两指夹爪、三指夹爪、液压夹爪、五指灵巧手 [42] - 公司判断长期来看更高自由度的末端工具(如灵巧手)是发展方向,但短期因成本过高(如特斯拉擎天柱21自由度全电驱灵巧手)不具备大规模量产条件 [43][44][50] 商业化与成本控制 - 公司已实现数据采集设备和数据本身的交易与收入,具备实际营收能力 [12] - 公司定下“万台规模下整机成本压至1万美元以下”的目标 [8] - 当出货量达到一万台级别,在11自由度的灵巧手配置下,整机成本有机会降到1万美元以内,该价格区间客户接受度较高 [41][52] - 整机降本的关键在于关节模组和核心主控芯片(目前使用英伟达Orin芯片),随着量产规模扩大,核心关键模组将最先实现快速降本 [39][40] 数据与研发优势 - 公司自有数据采集工厂,目前日采集1.6万条数据,训练模型所用数据中真实数据占比超过80% [8][15][19] - 公司强调模型训练是“有的放矢”,由真实场景需求牵引,并已早期进入真实工厂部署,积累了应对光照差异、节拍约束等工程化问题的系统级交付能力 [16][17][18] - 公司认为模型的有效性取决于数据质量而非数量 [20] 全球化布局与市场表现 - 公司从创立之初就定位为全球化品牌,而非简单的“出海”,强调完全本地化,在目标地区搭建完整的本地团队 [54][56][60][62] - 2025年,公司海外业务占比30%以上,单月峰值超过60%,并已在美国硅谷设立办公室 [8] - 公司以全球视角配置资源,预计未来中国市场销售占比将接近中国GDP占全球的比重(约17%)[58] - 不同地区需求差异明显:美国在科研、工业、物流场景落地快;欧洲导览导购类需求突出;日韩和亚太地区也有类似特征 [65][66] - 计划未来1-2年内,在1000个城市推动10000家门店落地 [8] 生产实践与挑战 - 公司团队在2023、2024年已让人形机器人进入追觅科技的洗地机工厂产线工作 [29][30] - 实践表明实验室环境与真实产线存在差距:实验室模型成功率超99%,但在产线会因环境因素(如顶光照射角度变化)导致不稳定 [32][33] - 生产节拍是现实挑战,机器人完成一次上下料需17-18秒,与熟练工人的10秒左右存在差距,直接影响产线效率 [34][35][36] 未来计划与目标 - 公司即将发布新产品,并计划在2026年3月起陆续发布新一代产品 [7][68] - 2026年各产品品类(大人形、小人形、大狗、小狗)的出货量目标均为千台级别 [67]
以最低图像分辨率斩获SOTA!全栈开源具身模型发布:3.5万小时炼出通用大脑
量子位· 2026-01-23 20:09
行业背景与核心问题 - 具身智能行业存在“马太效应”,单一硬件出货量决定数据采集上限,数据规模又直接限制模型表现,形成残酷闭环,中小型本体厂商因缺乏海量数据而面临商业化与融资困境 [1][3] - 行业长期面临数据孤立导致的训练困境,一线厂商凭借高投入建立“数据护城河”,而小厂资产规模限制了其产品专用模型的训练 [1] Being-H0.5模型概述与核心价值 - Being-H0.5是目前训练数据量最大的视觉-语言-动作模型,有望打破行业数据孤立的僵局,成为“通用底座” [2][3] - 该模型首次在复杂人形机器人本体上实现了真正意义上的跨机器人零样本技能迁移 [2] - 其核心价值在于让硬件厂商从枯燥的重复数据采集中解脱,将精力聚焦于形态创新与应用场景 [4] - 模型通过“以人为中心”的学习范式,将人类交互行为定义为物理世界的“母语”,将机器人控制信号视为“方言”,实现了低成本的跨本体泛化 [7] 训练数据:UniHand-2.0数据集 - UniHand-2.0是具身史上最大规模的“通用预训练语料库”,总时长突破3.5万小时,包含1.6万小时人类数据、1.4万小时机器人数据及5000小时通用多模态数据 [8] - 数据集总训练Token数高达1200亿,汇集了超过30种异构硬件的轨迹数据,涵盖了从工业桌面臂到高动态双足机器人在内的所有已知机器人形态 [8][10] - 该数据集在规模和多样性上比现有VLA数据集提升了至少3倍,真正终结了数据的“烟囱式”存储 [9][14] - 团队同步研发了UniCraftor人类数据采集系统,为解决人类视频标注稀缺的行业痛点提供了标准化工具 [14] 关键技术突破:统一动作空间 - 团队创新性地构建了统一动作空间框架,通过高度抽象的特征映射,将双足人形、轮式底盘、机械臂等异构硬件映射至统一的表征空间,以消弭“维度鸿沟” [16] - 这一框架打破了硬件维度的物理限制,为跨本体的联合训练与知识共享奠定了基础 [16][17] - 深度对齐过程验证了将混杂异构数据简单混合训练增益微乎其微,而深度对齐能挖掘出跨本体数据中最具价值的“通用特征” [18][19] 以人为中心的训练范式 - Being-H0.5确立了一套以人为中心的预训练范式,实现了从人类意图到机器人动作的深度对齐 [20] - 采用统一序列化建模,将人类演示、机器人轨迹与视觉文本映射为统一的多模态Token序列 [20] - 实施混合监督,对文本、离散人类动作和连续机器人轨迹分别采用Next-Token Prediction、Masked Token Prediction和Action Prediction进行差异化优化 [20] 模型架构升级 - 团队设计了Mixture-of-Flow架构,将“动作专家”解耦为学习通用“运动原语”的共享专家和负责特定形态精准执行的特化专家,实现了物理共性与硬件特性的完美解耦 [23] - 引入流形保持门控机制,确保模型在感知模糊、传感器噪声等不确定性高时能自动退回到稳健的物理先验分布,提升系统鲁棒性 [23] - 开发通用异步分块技术,使模型能够动态适配各种控制频率和通讯延迟不同的机器人硬件,实现极高兼容性 [23] 性能验证与实验结果 - 在真机测试中,Being-H0.5实现了“同一份模型权重,多本体部署”,操控PND、Unitree-G1、Franka等多种异构机器人完成了如“使用按压式喷壶浇花”等精细操控任务 [27][28] - 在LIBERO仿真评测中,Being-H0.5在仅使用224x224像素RGB图像、不使用任何辅助模态的情况下,取得了平均98.9%的成功率,超越了π‑0.5、GR00T等所有已知VLA模型 [34][35] - 在RoboCasa评测中,仅依靠224x224分辨率RGB图像,Being-H0.5取得了平均53.9%的成功率,显著超过π‑0.5、GR00T等先进VLA模型 [36] - 定量评测显示,Being-H0.5的通用版本与针对特定本体优化的专用版本性能基本持平,实现了近乎“零损耗泛化” [30][31][33] 开源策略与行业影响 - 团队决定实施全栈式深度开源,不仅公开全部模型参数,更提供完整的训练框架、评估工具及详细技术配方,以打破社区复现与创新的壁垒 [37] - 此举旨在将Being-H0.5打造成具身智能领域的公共基础设施,赋能全球开发者共建开放生态 [38] - 该模型为行业提供了一个前瞻性范式,即高质量的物理智能不一定需要堆砌昂贵的机器人集群,从根本上重塑了研发门槛,使本体厂商无需投入天文数字即可获得跨本体的通用能力 [39]
把医疗AI禁锢在严肃区间:百川M3 Plus首创“证据锚定”,幻觉率2.6%刷新全球纪录
量子位· 2026-01-23 20:09
文章核心观点 - AI正悄然成为公众日常寻医问诊的前置入口,但在严肃医疗领域,其落地需克服信任与成本两大障碍[1][5] - 百川智能通过发布循证增强医疗大模型Baichuan-M3 Plus,以极低的幻觉率和引用准确率,并结合大幅降低的成本与免费开放计划,旨在让AI成为医生可信赖的助手并惠及患者[6][7][23][24][61] 行业现状与趋势 - AI已成为普通人就医流程中的常见前置入口[1] - 医疗界对AI发展趋势的判断基本一致,年轻医生群体正积极尝试使用AI[2][4] - 国内有上千家医院和数百亿投入的专项工程正在探索AI应用[54] 百川智能医疗大模型的技术突破 - **幻觉率降至全球最低**:Baichuan-M3 Plus凭借六源循证等技术,将幻觉率降低至**2.6%**,低于业内标杆产品及部分人类医生的平均误判率[6][8][16][19] - **评测表现领先**:其前代M3版本在OpenAI的HealthBench评测集上夺得全球第一,反超GPT-5.2 High,当时幻觉率已压低至**3.5%**[11][14] - **核心技术**:采用Fact-Aware RL(事实感知强化学习)和Citation Reward Model,在训练中引入医学事实硬性约束并惩罚错误引用,让模型对幻觉产生“过敏反应”[12][13] 成本优化与可及性 - **调用成本大幅降低**:通过MoE架构优化、模型量化及Gated Eagle-3投机解码等工程优化,M3 Plus的API调用成本较上一代降低**70%**[21] - **推理效率提升**:Gated Eagle-3相较原始Eagle-3可带来约**15%**的推理吞吐量提升,从而直接压低单位请求成本[22] 创新技术:证据锚定 - **解决行业痛点**:针对医疗大模型常见的“张冠李戴”和“内容冲突”等引用不准确问题(行业常见引用准确率区间为**40%到50%**)[26][27][28] - **技术原理**:引入“证据锚定”技术,约束模型必须为每一句关键医学判断在原始证据中找到精确对应的段落,否则不应说出该结论[32][33] - **效果显著**:将模型的引用准确率从行业普遍的约**75%**提升至**95%**以上[46] - **证据来源广泛**:包括药品说明书、中英文文献、专家共识等[35][37][39] 市场推广与生态建设 - **推出“海纳百川”免费计划**:将M3 Plus以API形式永久免费开放给服务医务工作者的机构,不限Token数量,旨在推动技术普惠与行业验证[47][48][54] - **计划成本估算**:若全国**500万**医学工作者都使用,公司预计一年投入成本约**1亿元**,认为是可以接受的[56] - **用户基础**:公司专业版模型已有约**10万**医生用户,且年轻用户居多[2]