Workflow
量子位
icon
搜索文档
起猛了,追觅的扫地机、割草机、洗护机器人在CES成精了!
量子位· 2026-01-09 09:36
文章核心观点 - 在AI浪潮下,具身智能成为本届CES最火爆的领域之一,其家庭化量产的信号已清晰可见[1] - 追觅公司通过将具身智能技术应用于成熟的家用机器人品类,展示了一条务实且可能最快的家庭化量产路径[3][4][60][67] - 公司的产品正从单一功能工具,演变为能在家庭复杂环境中自主完成多类任务的物理智能体,标志着从清洁工具到家庭服务机器人的转变[48][49][58] 追觅在CES展示的具身智能产品 - **AI具身智能洗护机器人**:能够自主完成从脏衣篓拾取、按材质分类、洗涤到烘干的全流程闭环,无需人工介入,突破了此前人形机器人仅能完成半自动演示的阶段[7][9][12][13] - **具身智能割草机器人**:首次亮相,其能力超越割草,可完成浇水等复杂操作,展示了在移动中协调空间定位和精细操作的能力,该能力可迁移至拾取、整理等多种家务[18][19][22][23][24][25] - **具身智能新物种(四足轮腿机器人)**:拥有四足轮腿、躯干、机械臂和视觉传感器,能跨越门槛台阶、上下楼梯实现全屋清扫,并可承担叠衣、倒垃圾、擦桌及24小时健康监测、药品递送等养老服务[26][28][29][30] - **具身智能泳池机器人Z2 Ultra Cyber**:首次展出,能在水下通过机械臂处理排水口滤网堵塞、池壁顽固污渍等需人工解决的清洁任务,并先进行3D建图再精准清洁[40][41][44][45][46] - **其他智能家电**:包括长出双机械臂的洗地机、可独立调节送风的双机械臂空调等,共同特点是让家电具备智能感知环境、调整行为、自主完成任务的能力[47] 技术路径与产品演进逻辑 - **技术分界线与升级**:行业传统依赖SLAM等经典方法在结构化环境中执行单一任务,而具身智能旨在应对真实开放环境中的复杂多变场景[50][51][52] 追觅将具身智能技术应用于成熟家电,为行业提供了新思路[54] - **实现能力闭环**:产品能力实现不再仅靠传统规则控制,而是融入视觉语言模型与模仿学习等数据驱动方式,初步跑通了“感知环境→理解任务→决定动作→执行落地”的完整行为闭环[53][56][57] - **从工具到服务机器人的规划**:公司将当前状态视为具身智能1.0(能看见但依赖规则),未来将通过数据驱动的算法,使机器人进化到“会自己决定怎么做”,最终成为与家庭场景深度融合的家庭服务机器人[58] 量产落地与工程化优势 - **务实的产品路径**:在通用人形机器人面临技术、成本、量产门槛,而小型具身设备难以承担真实家务的背景下,公司选择对已有成熟需求和出货规模的家用机器人进行能力升维,是更务实可持续的路线[60][61][62] - **核心能力复用**:公司在智能算法、高速数字马达、运动控制、视觉感知、整机工程化上的长期投入,使其伺服电机、关节模组、导航与感知系统可在多个品类间复用[64] - **数据与规模优势**:大规模出货构成了持续运转的数据回路,设备在真实家庭中长期运行积累的反馈数据,为具身能力的工程化迭代提供了坚实的现实基础[65] - **快速的工程化与量产能力**:公司以速度见长,从2024年2月发布全球首创双机械臂X40,到2026年CES展出能爬楼梯的Cyber X,仅用2年时间完成了行业平均3-4年的技术量产闭环[69] 其过往在消费级机器人领域验证的工程化经验、成本控制与量产体系,是推动家用具身设备快速落地的关键[68]
训具身模型遇到的很多问题,在数据采集时就已经注定了丨鹿明联席CTO丁琰分享
量子位· 2026-01-08 20:08
文章核心观点 - 具身智能行业已进入下半场,数据质量成为制约模型训练的关键瓶颈,许多团队模型训练失败的根本原因在于数据生成的起点,而非后续的模型或算力问题[1][7] - 通用操作接口是解决具身智能数据采集问题的新兴前沿方向,其核心在于以与机器人本体解耦的方式记录人类操作,形成通用、可复现的数据[5] - 鹿明机器人作为UMI领域的代表性公司,通过其自研的FastUMI Pro硬件及配套的数据治理体系,致力于提供高质量、100%可复现的轨迹数据,以解决行业数据成本高、效率低、存在孤岛等痛点[9][15][23] 具身智能数据采集的现状与困境 - **数据成本异常高昂**:在美国,采集一小时的训练数据成本约为100-200美元,而训练一个相当于GPT-3规模的具身模型需要约7.9亿小时数据,按当前市价需耗费数百亿美元[19] - **采集效率低下**:2023-2024年间主流的遥操作方式,每小时仅能采集约35条数据,效率极低[21] - **存在严重的数据孤岛问题**:遥操作采集的数据与特定机器人本体强绑定,导致A机器人采集的数据很难应用于B机器人,造成重复建设和资源浪费[21][22] - **行业数据解法多样**:目前行业解决数据难题主要有四种路径,包括遥操作数据、仿真数据、人类视频数据和UMI[8] UMI技术解析与行业现状 - **UMI技术定义**:UMI旨在通过解耦的方式,统一记录“操作意图+运动轨迹+多模态感知”,供不同形态的机器人学习复现[5] - **行业起步较晚**:UMI在2024年2月由斯坦福提出,在2024年9月之前仍属冷门方向[5][6] - **成功案例稀少**:尽管涉足UMI的团队增多,但能成功训练出模型的团队极少,国内外仅有个别公司及高校团队取得成果[26][28][29] - **多数尝试失败**:许多团队即使能跑出演示,其效果也仅能维持3-4秒,且不流畅[30] UMI数据训练失败的根本原因 - **核心问题在于数据源头**:训练失败的主因并非算法或模型规模,而是大量UMI数据从生成之初就不具备进入训练管线的条件,属于“不合格”数据[31][32] - **硬件能力不足是首要瓶颈**:许多UMI设备的核心组件性能差,导致画面覆盖有限、画质差、帧率抖动,破坏了动作与视觉的因果关系,使模型无法学习[43][44] - **系统设计存在缺陷**:部分产品由现成模块拼凑,带宽架构脆弱,易出现掉帧等问题,导致数据质量糟糕且无法稳定复现[46] - **数据质量存在“脏数据”与“废数据”**:“脏数据”指包含大量抖动、漂移和时间错位的低信息密度数据;“废数据”指完全复制人类自然行为、未经任何任务技巧设计的原始数据,两者均难以用于训练出有效的交互策略[51][55][59][62] 高质量UMI数据的核心要求 - **多模态严格对齐**:要求画面与动作、空间位置严格对齐,且不同传感器之间需达到毫秒级同步[39] - **具备物理空间可复现性**:采集的数据必须是高一致性、高密度且可复现的时序数据结构[41] - **需要注入任务技巧**:有效的数据并非简单记录人类行为,而需要根据具体任务注入采集技巧和设计,例如叠衣服任务中的抖动方向与速度控制[60][62] UMI工程范式的特殊性 - **强耦合系统**:UMI场景下,硬件、数据和算法环环相扣,硬件决定数据质量,数据决定算法性能,算法又反向约束硬件与数据设计,传统先硬件后软件的开发范式在此失效[64][65] - **需系统化自洽设计**:成功的UMI工程需要系统性的自洽设计,而非简单的功能拼接[63] 鹿明机器人的解决方案与成果 - **推出核心硬件产品FastUMI Pro**:该产品为无本体数采硬件,重量约600多克,可夹起2-3公斤物品,支持触觉、听觉、六维力等多模态输入,并宣称其空间精度达到全球最高的1毫米[9][10][11][12] - **建立工业级数据质量评估体系**:以“可复现”为第一性原理,建立了8道数据质量评估流程,承诺只交付100%可复现的轨迹数据[15] - **完成多项前沿学术与工程工作**: - **FastUMI**:全球首个将学术界UMI工作升级为工业级系统的工作,于2024年7-8月完成,同年9月被CoRL 2025收录,旨在提升采集效率与数据质量[71][72] - **FastUMI 100K**:团队带领11人在3个月内采集了10万条真机数据,构建了全球首个大型UMI数据集,并积累了大规模数据治理经验[73][74][75] - **Fastumi-MLM**:实现了将UMI技术应用于“狗+机械臂”的新型机器人构型,属大陆地区首创[76][77] - **其他研究**:包括在空间理解模型、大规模数据集构建及异步流匹配框架等方面的创新工作[70][78]
清库存!DeepSeek突然补全R1技术报告,训练路径首次详细公开
量子位· 2026-01-08 20:08
论文更新概览 - DeepSeek在《Nature》封面论文发布近一年后,对DeepSeek-R1的论文进行了大规模更新,新增了64页技术细节,使论文总页数从22页增至86页[1][2][3][5][6] - 新版论文信息量巨大,不仅补充了附录,正文也进行了大幅度翻修,几乎相当于重写[7] - 此次更新在论文即将满一周年之际发布,且未提前透露,由网友自行发现,其时机与详细程度引发市场对DeepSeek后续产品(如R2或V4)的期待[57][59][60][61] 技术细节披露:R1训练路径 - 公司系统性披露了R1完整的四步训练路径,细节详尽如同教科书[11][17] - **第一步:冷启动**。使用数千条体现思考过程的思维链数据对模型进行监督微调[13] - **第二步:推理导向强化学习**。在保持对话思考风格的同时提升模型能力,并引入语言一致性奖励以解决语种混用问题[14] - **第三步:拒绝采样和再微调**。同时加入推理数据和通用数据,旨在让模型兼具推理与写作能力[15] - **第四步:对齐导向强化学习**。专注于打磨模型的有用性和安全性,使其行为更贴近人类偏好[16] 技术细节披露:R1-Zero与“反思”涌现 - 公司对R1-Zero模型中“反思”能力的涌现现象进行了补充分析[18][19] - 分析显示,随着训练推进,反思性词汇的出现次数相比训练初期增长了大约5到7倍[21] - 模型在不同训练阶段的反思习惯不同,例如“wait”一词在训练早期几乎不出现,但在训练步数达到8000步后出现明显的峰值曲线[22][23] 技术细节披露:安全架构与评估 - 为提升开源模型的安全性,公司详细披露了安全强化学习细节及评估方式[25][26] - 团队构建了一个包含10.6万条提示的数据集,并依据安全准则标注模型回复,用于训练安全奖励模型[27] - 风险控制系统包含两个流程:1) 通过关键词匹配过滤潜在风险对话;2) 将不安全对话与预设提示拼接,发送给DeepSeek-V3进行审查评估[29][30] - 引入风险控制系统后,模型安全性显著提升,在多个基准测试中表现与前沿模型水平相近[32] 安全性表现对比 - 根据提供的安全评分表,DeepSeek-R1在SST、BBQ、ART、XSTest、DNA*等多个安全基准上的平均得分与Claude-3.7-Sonnet、GPT-4o等主流模型相当[33] - 唯一的例外是在HarmBench测试集的知识产权相关问题上表现不佳[33] - 公司还构建了内部安全评测数据集,包含4大类、28个子类,总计1120道题目,并采用LLM-as-a-Judge范式(使用GPT-4o)进行评估[34][38] 团队稳定性 - 论文作者栏信息显示,DeepSeek核心团队极其稳定[41] - 在论文发表近一年后,18位核心贡献者全员仍在公司团队中[41] - 总计100多位作者中,仅有5位被标记为已离开团队,而去年的版本中有6位被标记,其中一位作者(Ruiqi Ge)已回归团队[42][43][44][45] - 在AI行业人才竞争激烈的背景下,公司团队不仅未出现明显流失,甚至出现了人才“回流”[47]
AI精准编辑门槛大降:开源框架提升编辑一致性,即插即用
量子位· 2026-01-08 19:07
ProEdit团队 投稿 量子位 | 公众号 QbitAI 想给照片里的猫换个颜色,结果总是编辑失败?想让视频里的人换件衣服,人脸却糊成一片或完全改变? 近日,来自中山大学iSEE实验室、香港中文大学MM Lab、新加坡南洋理工大学、香港大学的研究团队发布了最新研究成果 ProEdit 。 该方法通过对注意力机制和初始噪声潜在分布的"精准手术",实现了超高精度的图像与视频编辑,且完全无需训练、即插即用。 △ 图1. ProEdit在图像和视频编辑上与现有方法的对比 为什么AI编辑总是"改不动"? 目前,基于反演 (Inversion-based) 的编辑方法 (如RF-Solver、FireFlow) 通常采用全局注入策略: 为了保持背景尽量一致,它们 会将原图的大量信息强行"塞"进生成过程 。 在AI视觉编辑领域,如何在修改目标属性的同时,精准保留背景和非编辑属性的一致性,一直是个"鱼和熊掌"的难题。 但研究团队通过文本与图像的注意力可视化发现,这种做法存在严重的 "源图像信息过度注入" 问题: 注意力过度注入: 现有方法通过全局注入了过多的源图像注意力特征,导致模型更听源图像的话,而忽略了用户的编辑指令 ...
开源“裸考”真实世界,国产具身智能基座模型拿下全球第二!
量子位· 2026-01-08 19:07
文章核心观点 - 国产具身智能基础模型WALL-OSS在RoboChallenge真机评测中,以46.43分的总成绩超越美国明星公司Physical Intelligence的pi0模型,位列全球第二 [1] - WALL-OSS是一个彻底开源的端到端具身智能基础模型,其成绩建立在完全透明的代码与参数之上,可被复现和检验,代表了开源模型在推动具身智能前沿发展中的关键作用 [7][9] - 该模型通过创新的“共享注意力+专家分流”架构和“启发→整合”的阶段式训练范式,有效解决了模态解耦和灾难性遗忘等核心挑战,在认知深度与动作精度之间取得了平衡 [41][43][48] - 自变量机器人团队将开源视为对“行业基础设施”的长期投入,旨在通过降低行业创新门槛,在同一个高起点上推动真正的技术创新 [57][60] 模型性能与评测表现 - **总体排名**:在RoboChallenge真机评测榜单上,WALL-OSS以46.43分排名第二,仅次于61.84分的pi0.5,但以微弱优势(0.02分)超越46.41分的pi0 [2] - **单项任务优势**:在叠洗碗巾、挂口杯、按按钮、浇盆栽、移物入盒、开瓶器进抽屉等多个单任务中,WALL-OSS均拿下单项第一 [2] - **具体任务示例**: - “叠抹布”任务:WALL-OSS以41分位列第一,任务成功率为10%,而pi0的成功率为0% [12][13] - “连续按下三个按钮”任务:WALL-OSS得分82.00,成功率为60.00%,显著领先于其他模型(如cogact/hsk得分18.00,成功率0.00%) [22][23] - “将不同形状杂物收纳至筐中”任务:WALL-OSS的得分和成功率均高于pi0 [26][28] - **评测基准特点**:RoboChallenge是首个在真实物理环境中由真实机器人执行操作的大规模、多任务基准测试,其Table 30任务集包含30个真实日常操作任务,远超行业常见的3–5个任务数量 [4][11] 技术架构与训练创新 - **核心挑战应对**:针对VLM向VLA迁移过程中的“灾难性遗忘”和“模态解耦”两大挑战,WALL-OSS在架构和训练上进行了创新 [38] - **模型架构**:采用“共享注意力+专家分流(FFN)”的架构设计,将语言、视觉与动作信息嵌入同一表示空间,实现深度跨模态交互与高效任务分流,形成紧耦合的认知—行动闭环 [41][42] - **训练策略**:设计了“启发阶段→整合阶段”的阶段式训练范式 [43] - 启发阶段:通过具身VQA、指令跟随等任务强化空间推理,结合FAST tokenization离散动作训练,保留原有认知能力并建立空间与动作基础认知 [43] - 整合阶段:先冻结VLM仅训练Action FFN下的流匹配头以精修高频动作生成,最终解冻VLM进行联合优化 [44][45] - 这种“先离散、后连续、再联合”的路径避免了能力塌缩,实现了认知能力向动作层面的无损迁移 [47] - **决策能力增强**:构建了统一的跨层级思维链框架,将思维链能力内化到具身决策过程中,使模型能够自主拆解问题、逐步思考并动态调整策略,从而具备承担长程、复杂具身任务的能力 [49][50][51] 开源属性与行业意义 - **彻底开源**:WALL-OSS不仅开放了预训练模型权重、完整训练代码和数据集接口,还提供了详尽的部署文档,仅需RTX 4090级别的消费级显卡即可完成从训练到推理部署的完整流程 [7] - **榜单开源趋势**:当前RoboChallenge榜单前三名(pi0.5, WALL-OSS, pi0)均来自开源体系,表明具身智能的前沿发展正由开源模型共同推动 [8][9] - **评测透明性**:RoboChallenge平台公开了所有任务演示数据及测试中间结果,包括多视角执行视频、机械臂关节角度与夹爪状态图表等,使评测过程完全透明可追溯 [16][17][19] - **降低行业门槛**:一个可在消费级显卡上训练和部署的开源具身模型,弥补了行业空白,实质性地降低了整个行业的创新门槛,使研究者和创业团队能将精力投入到提升泛化能力、处理复杂任务等更有价值的问题上 [57] - **推动生态创新**:开源生态使行业能在同一个高起点上竞争真正的创新,而非重复进行基础设施建设 [57] 公司背景与融资情况 - **团队背景**:自变量机器人核心团队长期深耕机器人与多模态智能方向,明确以构建“通用具身智能基座”为长期目标 [54] - 创始人兼CEO王潜:清华大学本硕,南加州大学博士,从事Robotics Learning研究,是较早将Attention思想引入神经网络体系的研究者之一 [54] - 联合创始人兼CTO王昊:北京大学计算物理博士,前IDEA研究院大模型团队负责人,曾带领团队发布多个开源大模型 [54] - **融资情况**:公司已完成多轮融资,几个月前宣布了近10亿元A+轮融资,由阿里云、国科投资领投,国开金融、红杉、渶策、美团、联想之星、君联资本等参与 [54] - **发展理念**:公司更关注如何构建一个可被反复验证、持续演化的“机器人通用大脑”,并将WALL-OSS定位为面向真实物理世界、端到端统一的基座模型,而非为特定Demo或任务定制的解法 [55][56]
量子位编辑作者招聘
量子位· 2026-01-08 19:07
公司概况与市场地位 - 公司是一家以追踪AI新进展为核心的内容平台,拥有8年行业积累[1] - 公司在微信公众号拥有超240万订阅用户,全网用户超700万,日均阅读量200万以上[12] - 公司在第三方数据平台被认定为AI及前沿科技行业TOP1新媒体[12] 招聘岗位与方向 - 公司开放三大方向的岗位招聘:AI产业方向、AI财经方向、AI产品方向[2][6] - 招聘面向社招和校招,社招覆盖编辑、主笔、主编各个层级,校招接受应届毕业生及实习生[4][6] - 所有岗位工作地点均为北京中关村[2] AI产业方向岗位详情 - 岗位职责包括跟进AI基建层新进展,涵盖芯片、AI Infra、云计算领域及核心玩家动态[6] - 职责还包括对前沿论文、开源社区、技术大会报告进行大众化解读,并参与产业专家访谈及撰写落地案例[6][7] - 任职要求需对芯片、GPU、NPU、服务器、模型训练架构、云计算有基本理解,并熟悉AI行业供应链与生态[11] - 要求具备将复杂技术内容结构化表达的能力,有技术背景或理工科/CS/EE方向优先[11] AI财经方向岗位详情 - 岗位职责聚焦创投、AI创业公司、上市公司、商业模式及产业链资本动向[11] - 职责包括产出创投融资、招股书财报解析、公司战略分析等稿件,并访谈投资人、创业者等[11] - 任职要求需对数据敏感,对财报、股权结构、战略规划感兴趣,并具备强逻辑和对商业叙事的敏感度[11] - 要求热爱对话采访,具备社交型人格[11] AI产品方向岗位详情 - 岗位职责关注AI在终端的落地,包括软件应用产品和硬件方向[11] - 职责包括撰写AI应用产品深度评测、跟踪多终端新品发布,并对话访谈AI应用创业者、产品专家等[11] - 任职要求需对智能硬件、AI终端趋势敏锐,是重度AI产品体验人士[11] - 要求熟悉各大终端厂商业态和体验方法论,并具备强逻辑、体验表达和结构化能力[11] 加入公司的潜在收益 - 员工可第一时间接触AI领域最新技术和产品,构建完整的AI认知体系[6] - 员工可将各种AI新工具应用于工作,提升效率和创造力[6] - 员工可通过撰写独家原创内容建立个人知名度,成为AI领域意见领袖[6] - 员工可与AI领域大咖零距离接触,参与重要科技活动,拓展行业人脉[6] - 应届新人可获得主编级编辑的一对一指导[6] - 公司提供扁平、简单、开放、多劳多得能者上位的团队氛围[6] - 公司提供行业TOP薪资待遇及五险一金、餐补、项目绩效、商务绩效、加班补助等福利[6]
智元首发SOP系统:打破离线训练瓶颈,让具身智能在“干中学”
量子位· 2026-01-08 19:07
当通用能力主要通过大规模预训练获得之后,下一阶段的关键在于让已经具备通用能力的模型,在真实部署环境中持续进化。 这是智元机器人首席科学家 罗剑岚 博士在接受量子位采访时给出的论断。 智元机器人 投稿 量子位 | 公众号 QbitAI 2025年机器人领域最火的VLA让机器人通过预训练具备了相当的通用性,但与此同时,机器人能否长时间,稳定,高效地完成任务仍是一 个问号。 基于此,当机器人走出实验室,走向开放、复杂且持续变化的真实世界时,一个更核心的问题随之出现:如何真正实现通用机器人的规模化 部署与智能化运行。 为此,智元机器人具身研究中心提出 SOP(ScalableOnlinePost-training) ——一套面向真实世界部署的 在线后训练系统 。 这是业界首次在物理世界的VLA后训练中, 系统性地融合在线学习、分布式架构与多任务通才性 ,使机器人集群能够在真实环境中持续进 化,让个体经验在群体中高效复用,从而将"规模"转化为"智能"。 真实世界中的规模化智能增长挑战 要在真实世界中大规模运行,通用机器人必须同时满足两个看似矛盾的要求: 现有VLA预训练模型已经提供了强大的通用性。但 真实世界的部署受困 ...
「AI 100」榜单启动招募,AI产品“年会”不能停丨量子位智库
量子位· 2026-01-08 19:07
2025年中国AI产品市场概览 - 2025年国内AI产品领域涌现多个关键趋势,包括深度思考、Agentic AI、多智能体协作、多模态生成和端侧AI [4] - 多个颠覆性产品引领各技术方向:DeepSeek凭借强推理和透明化思考引领智能助手迭代;Manus实现从“思考→规划→执行→交付”的全链路自主任务处理,成为“真正意义上的通用AI Agent”;Lovart等产品通过多智能体协作实现高效任务处理;即梦AI等在多模态生成上取得进步;豆包AI手机实现了系统级AI智能体与手机操作系统的深度集成,重构人机交互范式 [4] 量子位智库「AI 100」榜单介绍 - 榜单旨在对过去一年中国AI产品发展进行全景式检阅,并深度洞察未来AI产业格局,目标是找到代表中国AI实力的巅峰力量 [4] - 榜单共分为三大板块:代表最强综合实力的「旗舰AI 100」、最具未来潜力的「创新AI 100」和十大热门赛道的代表产品 [6] - 「旗舰AI 100」聚焦2025全年表现,评选综合能力最强的100款AI产品,这些产品在技术上实现突破并在实际应用场景中展现巨大价值 [7] - 「创新AI 100」旨在挖掘在2025年崭露头角、具备2026年爆发潜力的创新产品,它们代表了AI技术的前沿方向 [8] - 榜单另设10大细分赛道TOP3专项提名,以精准反映各领域发展态势,赛道包括:AI浏览器、AI Agent、AI智能助手、AI工作台、AI创作、AI教育、AI医疗、AI娱乐、Vibe Coding和AI消费级硬件 [9] 榜单评估体系与内容 - 「AI 100」是量子位智库推出的AI产品风向标系列内容,旨在全维度提供AI技术驱动下产品长期创新和变革的第三方参考,主要由「旗舰 AI 100」和「创新AI 100」构成,按季度发布 [12] - 榜单采用定量与定性相结合的双重评估体系以确保客观性和准确性 [13] - 定量评估以真实用户数据为基础,涵盖用户规模、增长、活跃、粘性四大核心维度,包含下载总量、新增下载、活跃用户数、留存率等超过20个具体指标;硬件产品则考察出货量 [13] - 定性评估聚焦长期发展潜力,通过专家评估和用户调研,综合考量产品的底层技术、市场空间、功能设计、变现潜力、团队背景、增长速度等多重因素;硬件产品考察功能设计和实际使用体验 [13] - 除榜单外,周边内容还包括数据解读文章、分赛道产品解析、1v1 AI产品深度访谈等 [14] 相关资源与参与方式 - 量子位智库已对外公开自研梳理的国内AI产品知识库,提供对国内AI应用生态全景式、结构化、实时更新的梳理 [15] - 榜单申报时间为即日起至2026年1月15日,榜单将于2026年1月中下旬发布 [10]
刚刚,智谱港交所敲钟!市值528亿港元
量子位· 2026-01-08 09:38
上市概况与市场表现 - 智谱于港交所正式挂牌上市,成为全球首家AGI基座模型上市公司,股票代码2513 [1] - 上市首日开盘价为120港元/股,较发行价116.20港元上涨超过3%,市值突破528亿港元 [2][3] - 香港公开发售获得超额认购1159.46倍,国际发售获得15.28倍认购,显示市场热度极高 [6] 融资与股东背景 - 本次IPO以116.20港元发行价计算,募资总额超过43亿港元(绿鞋前)[5] - IPO引入11家基石投资者,合计认购29.8亿港元,占发售股份近七成,投资者包括北京核心国资、泰康人寿、广发基金及JSC International等机构 [10] - 上市前,公司历经8轮融资,累计融资额超过83亿元人民币,投资方包括美团、阿里、腾讯、红杉、高瓴及地方国资等 [12] 技术实力与行业地位 - 公司新一代旗舰模型GLM-4.7在全球多项榜单中表现突出,在AA智能指数中获开源与国产双料榜首,在Code Arena盲测中力压GPT-5.2成为开源第一,并登上Hugging Face全球趋势榜第一 [15] - 公司原创的GLM架构已适配40余款国产芯片,其AutoGLM 2.0的设备操控能力覆盖8000万台终端,日均调用规模达4.6万亿Token [18] - 包括美国Anysphere(Cursor背后公司)、Cerebras在内的超过50个海外平台已主动接入GLM模型作为核心能力 [19] - 公司74%的员工为研发人员,核心团队源自清华KEG实验室 [30] 财务表现与商业模式 - 公司营收从2022年的5740万元人民币增长至2024年的3.124亿元人民币,年复合增长率达130% [22] - 2025年上半年收入达1.91亿元人民币,同比暴涨325% [22] - 公司自2021年提前布局MaaS(模型即服务)模式,目前国内有超过270万企业与开发者接入其平台,中国前十大互联网公司中有9家使用其服务 [26] - 其Coding订阅产品在短时间内年度经常性收入突破1亿元人民币,在OpenRouter平台上的调用量稳居全球前十,付费收入超过所有国产模型之和 [27] 研发投入与未来规划 - 2022年至2025年上半年,公司累计研发投入超过44亿元人民币 [30] - 2024年单年研发费用达21.95亿元人民币,是当年营收的7倍 [30] - 本次IPO募资的70%将用于继续投入大模型研发,10%用于优化MaaS平台,旨在持续构建技术壁垒 [33] 行业意义与展望 - 此次上市标志着中国AGI企业首次以完整商业主体身份进入国际资本市场定价体系 [36] - 作为“全球大模型第一股”,其上市被认为是中国大模型产业从“技术跟跑”迈向“全球竞技”新阶段的一个标志 [37]
给AI打个分,结果搞出17亿估值独角兽???
量子位· 2026-01-07 17:11
融资与估值 - 大模型评估平台LMArena完成1.5亿美元A轮融资[1] - 公司估值在此轮融资后升至17亿美元[1] - 此轮融资由Felicis和加州大学投资公司领投,Andreessen Horowitz、The House Fund等机构跟投[3] 公司起源与背景 - 公司前身是Chatbot Arena,最初由来自UC伯克利、斯坦福等顶尖高校的成员组成的开源组织LMSYS创建[5][6] - 团队曾开发开源推理引擎SGLang,在96块H100上实现了媲美DeepSeek官方报告吞吐量的开源方案[7] - SGLang已被xAI、英伟达、AMD、谷歌云、阿里云、美团、腾讯云等企业和机构采用[8] - 团队核心为90后华人,占比达99%[4] 核心业务与产品 - 公司核心业务是提供第三方大模型评估平台,主要产品为LMArena(原Chatbot Arena)[9][16][18] - 平台采用匿名对战、Elo式评分和人机协同框架进行评估[20] - 用户输入问题后,系统随机匹配两个模型进行匿名回答,用户投票选择更优答案后揭晓模型身份[21][22] - 基于Bradley–Terry模型的Elo评分机制,模型根据对战胜负增减分数,形成实时排行榜[22] - 平台通过算法平衡模型的出场次数、任务类型和样本分布,以确保评估公平[22] 市场地位与影响力 - 平台已成为全球大模型“出道”时的必测榜单,是模型测评首选的排行榜[14][23] - 截至报告时,平台累计获得5000万张跨模态投票,完成了400余种开放及专有模型的评估,并产出了14.5万个开源战斗数据点[25] - 在平台实时排行榜中,Gemini 3 Pro以1490分位居榜首[23][24] 发展历程与资金用途 - 平台最初因团队为评估自研的Vicuna模型而创建,后因影响力扩大而独立成为商业公司[10][11][15][16] - 2025年5月,公司获得1亿美元种子轮融资,估值达6亿美元[17] - 新一轮融资将用于平台运营以保障稳定高效运行,并扩大技术团队[25]