Workflow
量子位
icon
搜索文档
「AI 100」榜单启动招募,AI产品“年会”不能停丨量子位智库
量子位· 2026-01-08 19:07
2025年中国AI产品市场概览 - 2025年国内AI产品领域涌现多个关键趋势,包括深度思考、Agentic AI、多智能体协作、多模态生成和端侧AI [4] - 多个颠覆性产品引领各技术方向:DeepSeek凭借强推理和透明化思考引领智能助手迭代;Manus实现从“思考→规划→执行→交付”的全链路自主任务处理,成为“真正意义上的通用AI Agent”;Lovart等产品通过多智能体协作实现高效任务处理;即梦AI等在多模态生成上取得进步;豆包AI手机实现了系统级AI智能体与手机操作系统的深度集成,重构人机交互范式 [4] 量子位智库「AI 100」榜单介绍 - 榜单旨在对过去一年中国AI产品发展进行全景式检阅,并深度洞察未来AI产业格局,目标是找到代表中国AI实力的巅峰力量 [4] - 榜单共分为三大板块:代表最强综合实力的「旗舰AI 100」、最具未来潜力的「创新AI 100」和十大热门赛道的代表产品 [6] - 「旗舰AI 100」聚焦2025全年表现,评选综合能力最强的100款AI产品,这些产品在技术上实现突破并在实际应用场景中展现巨大价值 [7] - 「创新AI 100」旨在挖掘在2025年崭露头角、具备2026年爆发潜力的创新产品,它们代表了AI技术的前沿方向 [8] - 榜单另设10大细分赛道TOP3专项提名,以精准反映各领域发展态势,赛道包括:AI浏览器、AI Agent、AI智能助手、AI工作台、AI创作、AI教育、AI医疗、AI娱乐、Vibe Coding和AI消费级硬件 [9] 榜单评估体系与内容 - 「AI 100」是量子位智库推出的AI产品风向标系列内容,旨在全维度提供AI技术驱动下产品长期创新和变革的第三方参考,主要由「旗舰 AI 100」和「创新AI 100」构成,按季度发布 [12] - 榜单采用定量与定性相结合的双重评估体系以确保客观性和准确性 [13] - 定量评估以真实用户数据为基础,涵盖用户规模、增长、活跃、粘性四大核心维度,包含下载总量、新增下载、活跃用户数、留存率等超过20个具体指标;硬件产品则考察出货量 [13] - 定性评估聚焦长期发展潜力,通过专家评估和用户调研,综合考量产品的底层技术、市场空间、功能设计、变现潜力、团队背景、增长速度等多重因素;硬件产品考察功能设计和实际使用体验 [13] - 除榜单外,周边内容还包括数据解读文章、分赛道产品解析、1v1 AI产品深度访谈等 [14] 相关资源与参与方式 - 量子位智库已对外公开自研梳理的国内AI产品知识库,提供对国内AI应用生态全景式、结构化、实时更新的梳理 [15] - 榜单申报时间为即日起至2026年1月15日,榜单将于2026年1月中下旬发布 [10]
刚刚,智谱港交所敲钟!市值528亿港元
量子位· 2026-01-08 09:38
上市概况与市场表现 - 智谱于港交所正式挂牌上市,成为全球首家AGI基座模型上市公司,股票代码2513 [1] - 上市首日开盘价为120港元/股,较发行价116.20港元上涨超过3%,市值突破528亿港元 [2][3] - 香港公开发售获得超额认购1159.46倍,国际发售获得15.28倍认购,显示市场热度极高 [6] 融资与股东背景 - 本次IPO以116.20港元发行价计算,募资总额超过43亿港元(绿鞋前)[5] - IPO引入11家基石投资者,合计认购29.8亿港元,占发售股份近七成,投资者包括北京核心国资、泰康人寿、广发基金及JSC International等机构 [10] - 上市前,公司历经8轮融资,累计融资额超过83亿元人民币,投资方包括美团、阿里、腾讯、红杉、高瓴及地方国资等 [12] 技术实力与行业地位 - 公司新一代旗舰模型GLM-4.7在全球多项榜单中表现突出,在AA智能指数中获开源与国产双料榜首,在Code Arena盲测中力压GPT-5.2成为开源第一,并登上Hugging Face全球趋势榜第一 [15] - 公司原创的GLM架构已适配40余款国产芯片,其AutoGLM 2.0的设备操控能力覆盖8000万台终端,日均调用规模达4.6万亿Token [18] - 包括美国Anysphere(Cursor背后公司)、Cerebras在内的超过50个海外平台已主动接入GLM模型作为核心能力 [19] - 公司74%的员工为研发人员,核心团队源自清华KEG实验室 [30] 财务表现与商业模式 - 公司营收从2022年的5740万元人民币增长至2024年的3.124亿元人民币,年复合增长率达130% [22] - 2025年上半年收入达1.91亿元人民币,同比暴涨325% [22] - 公司自2021年提前布局MaaS(模型即服务)模式,目前国内有超过270万企业与开发者接入其平台,中国前十大互联网公司中有9家使用其服务 [26] - 其Coding订阅产品在短时间内年度经常性收入突破1亿元人民币,在OpenRouter平台上的调用量稳居全球前十,付费收入超过所有国产模型之和 [27] 研发投入与未来规划 - 2022年至2025年上半年,公司累计研发投入超过44亿元人民币 [30] - 2024年单年研发费用达21.95亿元人民币,是当年营收的7倍 [30] - 本次IPO募资的70%将用于继续投入大模型研发,10%用于优化MaaS平台,旨在持续构建技术壁垒 [33] 行业意义与展望 - 此次上市标志着中国AGI企业首次以完整商业主体身份进入国际资本市场定价体系 [36] - 作为“全球大模型第一股”,其上市被认为是中国大模型产业从“技术跟跑”迈向“全球竞技”新阶段的一个标志 [37]
给AI打个分,结果搞出17亿估值独角兽???
量子位· 2026-01-07 17:11
融资与估值 - 大模型评估平台LMArena完成1.5亿美元A轮融资[1] - 公司估值在此轮融资后升至17亿美元[1] - 此轮融资由Felicis和加州大学投资公司领投,Andreessen Horowitz、The House Fund等机构跟投[3] 公司起源与背景 - 公司前身是Chatbot Arena,最初由来自UC伯克利、斯坦福等顶尖高校的成员组成的开源组织LMSYS创建[5][6] - 团队曾开发开源推理引擎SGLang,在96块H100上实现了媲美DeepSeek官方报告吞吐量的开源方案[7] - SGLang已被xAI、英伟达、AMD、谷歌云、阿里云、美团、腾讯云等企业和机构采用[8] - 团队核心为90后华人,占比达99%[4] 核心业务与产品 - 公司核心业务是提供第三方大模型评估平台,主要产品为LMArena(原Chatbot Arena)[9][16][18] - 平台采用匿名对战、Elo式评分和人机协同框架进行评估[20] - 用户输入问题后,系统随机匹配两个模型进行匿名回答,用户投票选择更优答案后揭晓模型身份[21][22] - 基于Bradley–Terry模型的Elo评分机制,模型根据对战胜负增减分数,形成实时排行榜[22] - 平台通过算法平衡模型的出场次数、任务类型和样本分布,以确保评估公平[22] 市场地位与影响力 - 平台已成为全球大模型“出道”时的必测榜单,是模型测评首选的排行榜[14][23] - 截至报告时,平台累计获得5000万张跨模态投票,完成了400余种开放及专有模型的评估,并产出了14.5万个开源战斗数据点[25] - 在平台实时排行榜中,Gemini 3 Pro以1490分位居榜首[23][24] 发展历程与资金用途 - 平台最初因团队为评估自研的Vicuna模型而创建,后因影响力扩大而独立成为商业公司[10][11][15][16] - 2025年5月,公司获得1亿美元种子轮融资,估值达6亿美元[17] - 新一轮融资将用于平台运营以保障稳定高效运行,并扩大技术团队[25]
黄仁勋CES回应全场!内存卡了GPU脖子,游戏玩家可能只能用旧显卡了
量子位· 2026-01-07 17:11
黄仁勋在CES 2026的核心观点与行业洞察 - 英伟达CEO黄仁勋在CES 2026的核心主题围绕“物理AI”展开,包括机器人和自动驾驶,并提出了“机器人是AI移民”以解决人口结构问题并推动经济增长的观点 [10] - 黄仁勋将AI基础设施定位为前所未有的“AI工厂”,认为其需求是新型基础设施建设,持续将电力、芯片和数据转化为智能产出 [35] 机器人产业的展望与进展 - 从人口结构看,现有经济规模难以为继,需要“AI新移民”(机器人)来承担人类不愿从事的工作,以推动经济发展并创造更多就业 [10][11] - 预计在“今年内”(指2026年),将能看到在移动能力、关节活动度与精细动作技能上达到人类水平的机器人 [12] - 当前机器人主要依赖视觉,但实现精细动作需要触觉能力,这是行业正在积极推进技术突破的难点 [13] 自动驾驶战略与行业定位 - 英伟达发布了全球首款开源、大规模的自动驾驶视觉-语言-行动推理模型Alpamayo 1 [15] - 英伟达与特斯拉FSD的核心区别在于定位:英伟达不生产自动驾驶汽车,而是为全行业提供完整的技术栈与解决方案 [16] - 公司为自动驾驶领域打造了三大核心计算平台(训练、仿真、车载)及完整软件栈,客户可灵活选用 [17][18] - 英伟达的客户遍及行业上下游,包括特斯拉、Waymo、小鹏汽车、Nuro、Lucid和Uber等,系统具有极高的行业渗透率 [19] - 全球道路上有超过10亿辆汽车,未来10年将有数亿辆具备强大自动驾驶能力,该领域可能成为未来十年规模最大、增长最快的科技产业之一 [20] - 公司奉行全面开源策略,旨在赋能全球自动驾驶产业,目标是让所有具备移动能力的载具实现自动驾驶 [22] 游戏显卡与消费级市场的策略 - 在CES 2026上,英伟达未发布消费级游戏显卡,当前DDR5内存和SSD价格暴涨,部分渠道RTX 5090售价逼近4000美元,显卡价格遭受成本上升与供应紧张的双重挤压 [25] - 针对增加旧款显卡产量以应对市场情况的方案,黄仁勋回应“有这种可能”,并考虑将最新AI技术移植到上一代GPU产品中 [25][26] - 重启旧产线需权衡研发成本,例如最新的DLSS 4.5会导致旧款显卡性能大幅下降,实现兼容需要投入相当多的工程资源 [27] - AMD高管也透露,公司正在研究所有可行方案以增加供应,考虑将部分产品重新引入旧的AM4生态系统 [29] 游戏图形技术的未来方向 - 英伟达在CES 2026上推出了全新的DLSS 4.5版本和增强版多帧生成模型 [31] - 黄仁勋认为图形技术的未来方向是神经渲染(本质即DLSS),未来将能以每秒500帧的速度生成从写实到卡通渲染的任何风格图像 [31] - 未来的渲染方式可能是在更少但质量极高的像素上执行更多AI运算 [32] - 未来的视频游戏将充满AI角色,每个角色都拥有自己的AI并通过AI进行动画驱动,游戏真实感将在未来几年大幅跃升 [32] AI基础设施与内存供应链 - 黄仁勋指出,现有高带宽内存容量远不足以支撑GPU运行需求,内存瓶颈问题只会愈发严重 [36] - 英伟达是横跨HBM、GDDR与LPDDR的关键需求引擎,也是全球首家且在短期内几乎是唯一的HBM4主要用户 [36] - 公司已与主要内存供应商建立高度紧密的规划机制,直接协同规划产能以确保新产品量产节奏,各家HBM供应商正在为英伟达全面扩产 [36] 其他业务合作与个人动态 - 黄仁勋在CES后出席了联想Tech World活动,双方共同宣布“联想人工智能云超级工厂”,英伟达最新发布的Vera Rubin超算平台将是该合作的重要组成部分 [6] - 黄仁勋在IEEE颁奖现场领取了2026年IEEE荣誉奖章,以表彰其领先行业数十年的前瞻布局能力和对创新的坚持 [7][8]
让欧美老外彻底“真香”,这家中国割草机器人品牌正在定义一个行业新标准
量子位· 2026-01-07 15:11
文章核心观点 - 中国厂商在割草机器人这一具身智能垂直场景已占据领先地位,技术成熟度与市场推进速度均走在前列 [1] - 未岚大陆作为行业代表,其产品已进入超过四十万欧美家庭,并在CES 2026上发布了涵盖旗舰、复杂庭院、中小面积及商用场景的五大新品系列 [2][4] - 公司通过建立“Navimow标准”体系,整合了免部署自动建图、三重融合定位、零转全驱等核心技术,系统性解决了行业长期存在的部署复杂、导航不稳、损伤草坪等痛点,推动了产品从需要用户频繁介入到可放心托付的日常工具的转变 [6][17][47][51][53][54] 市场与产品发布 - 未岚大陆在CES 2026上重磅发布了五大新品阵容:面向大面积全地形庭院的X4旗舰系列、搭载三重融合定位技术专为复杂庭院设计的H2系列、针对中小面积的全驱不伤草i2 AWD和兼顾精准导航与轻松上手的i2 LiDAR,以及面向商业场景的Terranox系列 [4] - 公司产品已进入超过四十万欧美家庭的真实使用环境 [2] 核心技术体系:Navimow标准 - 公司通过“Xero-Turn™ 零转全驱、越障不伤草”解决方案与全系列支持的“免部署、自动建图”功能,共同呈现了“Navimow标准”体系下的具体实践 [6] - 该技术体系将定位、导航、执行等关键能力纳入统一框架,使行业长期存在的不确定性被系统性地收拢,产品表现进入可验证、可评估、可持续优化的状态 [51][53] 定位与建图技术演进 - 行业定位部署从最初耗时数小时、精度不高的“物理埋线”方式,演进到采用RTK技术,通过安装天线和基站并用手机遥控建图,大大缩短了流程 [10][11] - 未岚大陆实现了进一步突破,让全系产品支持“免部署、自动建图”,彻底丢掉了埋线、插杆、遥控建图等步骤,实现开箱即用 [12][13] - 借助GeoSketch™可视化编辑功能,用户可在APP中将庭院实景投射为全彩可交互地图,并定制专属割草计划,大幅降低了用户的心智负担和操作门槛 [14][15][16][17] 三重融合定位系统 (EFLS™ LiDAR ⁺) - 为解决复杂庭院环境下的导航难题,公司推出了“EFLS™ LiDAR ⁺ 三重融合定位系统”,融合了固态激光雷达、视觉感知与Network RTK,并结合AI算法进行实时数据协同处理,实现了极端复杂环境下的厘米级精准建图与稳定导航 [21][44] - **Network RTK技术**:通过4G/网络直接接入运营商侧持续校准的RTK基准数据,无需用户自建基站,实现了真正意义上的免部署,同时提升了定位准确度和一致性 [24] - **固态激光雷达技术**:采用无转动部件的固态激光雷达,解决了机械雷达在耐用性、集成度上的难题;其传感器每秒可扫描约20万个点,成像精度是普通机械雷达的4倍,测距达70米,扫描间隔50ms [32][33] - **AI视觉能力**:通过融合固态激光雷达提供的3D数据信息,使视觉具备更精细的AI识别能力,能结合空间信息判断物体属性,实现厘米级精准度 [39][40][41] - 三重系统可优势互补:在信号被遮挡时,固态激光雷达和视觉成为关键补充;在空旷无参照物草坪,Network RTK定位更稳定;三种技术协同工作,确保定位导航在不同庭院环境下都能稳定成立 [46][47] 运动控制与草坪保护 - 针对主流“硬转向”方案导致草坪磨痕和伤草的问题,公司提出了“Xero-Turn™ 零转全驱、越障不伤草”解决方案 [48] - 在底盘引入“零转模组”,使轮子具备主动转向能力,转弯时动力轮持续输出,转向轮根据内外侧差异形成不同转角,模拟真实车辆转向轨迹,实现原地转向不蹭地、不伤草 [48] - 通过电子稳定控制算法(ESC)和牵引力控制逻辑(TCS)进行软件协同,防止在坡地下滑或在湿滑草皮上打滑空转,避免对草坪造成刨坑式损伤 [50][51] - 该技术通过硬件与软件的深度协同,重新定义了高端智能割草机器人的性能标准,并在X4系列和i2 AWD上实现应用 [51] 行业影响与技术价值 - 公司的技术实践为割草机器人行业在定位问题上铺出了一条更稳定、更可复用的长期路径 [25] - 围绕Navimow标准建立的技术体系,不仅在特定产品上提升体验,更在具身智能机器人整体技术体系中沉淀出一套可复用、可扩展的工程范式 [51] - 技术标准进入长期运行并持续作用于真实场景,使割草从一件需要时刻盯着、反复介入的事,变成了可以放心交给机器完成的日常 [54]
首家央企AI独角兽浮出水面!背靠自研大模型,4家国家队资本背书
量子位· 2026-01-07 14:09
事件概览 - 中电信人工智能科技有限公司完成首轮增资,引入四家国家级战略投资方,成为央企首家AI独角兽 [1][2] 战略投资方分析 - **国家人工智能基金**:战略性引导基金,旨在长期投资芯片、算法等AI基础设施,为高风险、长周期项目提供支持 [7][8] - **北京人工智能基金**:由北京市政府主导,聚焦AI生态建设与产业闭环,助力企业接入庞大产业应用场景 [7][9] - **华舆高新交控基金**:中车资本旗下平台,背后是庞大的轨道交通实体产业资源,为AI产品提供天然“试炼场”和可预期的变现能力 [10][11] - **央视融媒体基金**:与中央电视台联动,拥有顶级宣传资源,能为企业提供市场信任背书 [13][14] - 四家国家队投资方协同,整合政策导向、产业试炼与权威背书,旨在合力攻克单一企业无法解决的技术与产业壁垒 [15] 核心技术实力:“星辰”系列大模型 - 公司构建了“全模态、全尺寸、全国产”的“三全”模型体系,覆盖语义、语音、视觉、多模态四种核心能力 [17] - **星辰语义大模型**:基于全国产化万卡集群和国产框架打造,近期开源的MoE模型TeleChat3-105B-A4.7-Thinking在多项评测中比肩业内头部,语义大模型累计下载量已突破40万 [19] - **星辰语音大模型**:支持60多种方言自由混说,已在中国电信万号智能客服规模落地,日均处理超过100万通电话 [19] - **星辰视觉大模型**:在跨模态检索上达到国际领先水平,已在防汛防涝、应急指挥等实际场景中投入使用 [19] - **星辰多模态大模型**:整合语义理解、语音合成及数字人等技术,为复杂内容生产和交互打下基础 [20] - 星辰大模型成功入选2025年度央企十大国之重器 [22] 业务落地与商业化成果 - **C端产品**: - 推出央企首个视频生成创作工具TeleStudio,支持2K分辨率、20秒以上长镜头和精准动作生成 [26] - 推出天翼智能防诈,提供全流程通话守护 [28] - 推出AI眼镜、AI智伴玩偶等硬件,旨在让AI以更自然的方式渗透日常生活 [29] - **B端产品与平台**: - 推出“星辰超级智能体”,强调为企业提供高自由度的定制能力,以对齐业务需求 [30][32] - 打造一站式智能体“训练基地”——星辰MaaS平台,提供完整工具包帮助企业组建专属AI军团 [35][37] - 星辰智能体平台公有云已服务数万名开发者,累计创建智能体数量突破10万;私有化部署方案已在超过50家大型国央企中成功落地 [37] 国家队优势与产业落地能力 - 央国企内部拥有海量可落地场景,可作为新产品内部测试与迭代的训练场 [39][40] - 中国电信在产业数字化方面经验丰富,2024年其产业数字化收入达到1466亿元,占整体营收近30%,并拥有超10亿公众客户、上千万政企客户及全国渠道网络 [41][42] - 央企对安全合规性的严苛要求,使其在需要与业务深度嵌合的智能体领域具备天然优势 [43] - 国家队天生擅长推动产业落地,是连接前沿技术与产业的桥梁 [38][44] 发展理念与行业意义 - 公司坚持技术自研路线,积极响应国家“开源协同、自主可控”的发展方向 [1] - 公司秉持“长期主义”,在数据标注等环节扮演生态规划者、产能运营者和新职业培育者三重角色,追求通过技术赋能带动产业发展、培育繁荣生态的长期价值 [49][50][51][52][53] - 央企首家AI独角兽的出现,标志着国家队在AI领域的市场认可,其“国家队+自研模型”的模式可能重塑全球AI竞争格局,推动AI技术大规模产业落地 [2][21][46][55][56]
量子位编辑作者招聘
量子位· 2026-01-07 13:17
以下是岗位详情: 编辑部 发自 凹非寺 量子位 | 公众号 QbitAI AI热潮还在汹涌,但如果你还不知道如何参与……那为什么不来 量子位 呢? 我们是一家以 追踪AI新进展 为核心的内容平台,经过8年积累,目前拥有顶流影响力,广泛且备受认可的产业资源,以及时代风口的最佳观 测和学习生态位。 目前,我们有 三大方向 岗位招聘,希望你是 (或者能成为) 这三个方向的内容专家: 岗位均为全职,工作地点:北京中关村。 岗位面向: 加入我们,你可以获得: 所有岗位不同能力层级职位均在开放,欢迎结合个人履历和经验申请。 AI产业方向 岗位职责: AI产业方向 :关注基建层创新,包含芯片、AI Infra、云计算; AI财经方向 :关注AI领域创投和财报,跟踪产业链资本动向; AI产品方向 :关注AI在应用和硬件终端方向的进展。 社招:覆盖编辑、主笔、主编各个层级,按能力匹配岗位; 校招:应届毕业生,接受实习且可转正。 站在AI浪潮之巅 :第一时间接触和了解AI领域最新技术和产品,构建完整的AI认知体系。 玩转AI新工具 :将各种AI新技术、新工具应用于工作,提升工作效率和创造力。 打造个人影响力 :通过撰写独家原创内 ...
「AI 100」榜单启动招募,AI产品“年会”不能停丨量子位智库
量子位· 2026-01-07 13:17
2025年中国AI产品市场发展态势 - 2025年国内AI产品领域涌现多个关键趋势,包括深度思考、Agentic AI、多智能体协作、多模态生成和端侧AI [4] - 多个颠覆性产品引领各技术方向:DeepSeek凭借强推理和透明化思考引领智能助手迭代;Manus实现从“思考→规划→执行→交付”的全链路自主任务处理,成为“真正意义上的通用AI Agent”;Lovart等产品通过多智能体协作实现高效任务处理;即梦AI等在多模态生成上取得进步;豆包AI手机将系统级AI智能体深度集成于操作系统,重构人机交互范式 [4] 量子位智库「AI 100」榜单概况 - 榜单旨在对过去一年中国AI产品发展进行全景式检阅,并深度洞察未来AI产业格局,目标是找到代表中国AI实力的巅峰力量 [4] - 榜单共分为三大板块:代表最强综合实力的「旗舰AI 100」、最具未来潜力的「创新AI 100」和十大热门赛道的代表产品 [6] - 「旗舰AI 100」聚焦2025全年表现,评选综合能力最强的100款AI产品,这些产品在技术上实现突破并在实际应用场景中展现巨大价值 [7] - 「创新AI 100」旨在挖掘在2025年崭露头角、具备2026年爆发潜力的创新产品,这些产品代表了AI技术的前沿方向 [8] - 十大细分赛道TOP3评选覆盖热度最高的10个领域,依次为:AI浏览器、AI Agent、AI智能助手、AI工作台、AI创作、AI教育、AI医疗、AI娱乐、Vibe Coding和AI消费级硬件 [9] 榜单评估体系与内容构成 - 「AI 100」是量子位智库推出的AI产品风向标系列内容,旨在全维度提供AI技术驱动下产品长期创新和变革的第三方参考,主要由「旗舰AI 100」和「创新AI 100」构成,按季度发布 [12] - 榜单采用定量与定性相结合的双重评估体系以确保客观性和准确性 [13] - 定量评估以真实用户数据为基础,涵盖用户规模、用户增长、用户活跃、用户粘性四大核心维度,包含下载总量、新增下载、活跃用户数、留存率等超过20个具体指标;硬件产品则考察出货量 [13] - 定性评估聚焦长期发展潜力,通过专家评估和用户调研,综合考量产品的底层技术、市场空间、功能设计、变现潜力、团队背景、增长速度等多重因素;硬件产品考察具体功能设计和实际使用体验 [13] - 除榜单外,周边内容还包括数据解读文章、分赛道产品解析、1v1 AI产品深度访谈等 [14] 相关信息与参与方式 - 量子位智库已对外公开自研梳理的国内AI产品知识库,提供对国内AI应用生态全景式、结构化、实时更新的梳理 [15] - 榜单申报时间为即日起至2026年1月15日,榜单将于2026年1月中下旬发布 [10]
马斯克xAI又融了200亿美元!老黄说到做到投了更多
量子位· 2026-01-07 13:17
融资与估值 - xAI完成E轮融资,融资额达200亿美元,超出此前市场传闻的150亿美元 [1] - 本轮融资后,xAI估值预计从2024年底的500亿美元暴涨至2000多亿美元,在一年内翻了四倍 [6] - 本轮投资者包括英伟达和思科等战略投资者,以及代表产业、金融和主权战略的多种资本力量 [2][11][12] 基础设施与算力 - xAI拥有Colossus I和Colossus II两大AI算力集群,到2025年底算力规模已超过100万个H100 GPU等效容量 [14] - Colossus I是全球规模最大、运行最稳定的单一算力集群,配备约20万颗英伟达H100/H200和约3万颗英伟达GB200 NVL72 GPU [14] - Colossus II第一阶段将部署11万个英伟达GB200 GPU,最终目标超过55万个GPU [15] - 公司另有“巨硬计划”,其专属厂房供电规模达2GW,可支持约110万台英伟达GB200 NVL72 GPU,完成后算力储备将再创全球之最 [15][16][17] 产品与用户 - xAI在模型上全面布局,包括语言模型Grok 4系列、语音模型Grok Voice以及图像生成模型Grok Imagine [19] - 基于自研Grok模型,公司开发了独立应用并整合至X平台,两个平台合计的月活跃用户平均为6亿 [21][22] - 下一代基础模型Grok 5正在训练中,官方公告已确认此进展 [25] 下一代模型Grok 5 - Grok 5的参数预计将达到6万亿左右,远多于GPT-4,且是Grok-4的两倍以上 [33] - 该模型将采用混合专家架构,在拥有超过20万个NVIDIA GPU的“Colossus II”超级集群上训练,耗电量约为1GW [35] - Grok 5将拥有原生150万Token的上下文窗口、实时多模态处理能力,并能与实时数据流集成 [36] - 公司创始人马斯克曾表示,Grok 5有机会成为真正的AGI,并可能在2025年底推出,但目前有传闻称其将在今年一季度推出 [29][30][31] 行业与市场信号 - xAI成功融资200亿美元且估值飙升,被市场视为AI热潮仍在继续的重要信号 [7] - 投资者对xAI的信心部分源于其快速的算力基础设施扩展计划,旨在构建全球最大的GPU集群 [11] - 行业领军人物如英伟达创始人黄仁勋曾表示,已投资xAI并遗憾于投资不足,此次融资或弥补此遗憾 [4][5]
8块钱跑通一次强化学习全流程,潞晨云重塑微调赛道:1名算法工程师=1支Infra团队
量子位· 2026-01-07 13:17
行业趋势:大模型竞争焦点转向后训练 - 大模型竞争的下半场焦点已从“暴力预训练”转向“后训练”战场[1] - 决定模型天花板的因素不再只是算力堆砌,而是更精准的微调和强化学习迭代[2] - 强化学习在低数据量下即可实现模型能力大幅跃升,例如DeepSeek-R1仅通过RL训练,在AIME数学推理基准上的pass@1从15.6%提升至77.9%[7] 核心痛点:后训练面临的高门槛 - 复杂的分布式基建、高昂的显卡租金和繁琐的架构调优构成了高墙,阻碍算法工程师进行后训练[3] - 强化学习涉及复杂的系统设计,包括多模型优化、数据与权重传递,工程化工作对基础设施要求极高[9] 解决方案:潞晨云微调SDK - 公司推出国内首个全面开放、兼容Tinker范式的Serverless微调平台[5] - 核心目标是提供一套更具成本优势的工业级解法,以应对复杂且昂贵的强化学习[6] - 核心思路是实现算法设计与底层算力架构的解耦,开发者只需定义数据与损失函数,底层基础设施实现全托管与无感支持[10] 产品优势:易用性与人力效能 - 产品兼容Tinker接口,在零代码微调与裸机全手写之间找到平衡点,提供“训练即服务”的流畅体验[11] - 将大模型训练拆解为一组标准函数原语,打通从监督微调到强化学习的全链路[14] - 颠覆性提升人力效能比,将原本需要庞大团队配合的工作简化为一名算法工程师的独立闭环[12][16] - 用户可在本地IDE中使用标准Python语法自由组合训练逻辑,成为驾驭大规模训练流的主动设计师[16][17] 技术架构:实现丝滑体验 - 采用控制面与计算面分离设计,通过统一API Server管理跨地域的多个GPU计算集群,实现多云部署能力[22] - 核心采用基于Future模式的异步API,所有训练操作支持非阻塞调用,用户无需等待GPU计算完成[23] - 具备智能队列系统,资源洪峰期任务进入持久化队列,等待期间0计费,仅对实际产生计算的有效Token量收费[25] 商业模式:按Token计费的算力零售 - 引入Serverless架构,推行“按Token计费”的商业模式,将算力服务切分到最细颗粒度[29] - 用户仅为前向传播、推理输出和训练产生的有效计算Tokens量付费,本地调试、数据预处理等环节全部免费[29] - 实测基于官方Cookbook跑通包含Rollout采样、Reward评分和PPO更新的完整RL流程,总算力成本仅8.61元[29] - 提供具体模型计费示例,如Qwen3-4B模型的前向传播、推理输出和训练单价分别为每百万Token 0.42元、1.4元和1.4元[31] 应用场景:覆盖多领域工作流 - **科研场景**:支持“白盒级”科研探索,研究人员可自定义评估逻辑与控制训练流程,无需关心底层分布式实现,大幅降低实验复现成本[32][34] - **创业与独立开发**:利用Serverless特性,无需等待资源排期,实测从安装到跑通一个包含1000条样本的微调实验仅需数分钟,实现极速MVP验证和低成本试错[35][36] - **工业级落地**:允许工程师自由定义损失逻辑与强化学习奖励函数,拥有对模型权重与训练细节的完整控制权,可应对金融、医疗等领域的复杂异构架构需求[37] 使用与生态 - 使用流程极简,仅需安装、初始化客户端和定义训练循环三步,像写普通Python脚本一样简单[38][39] - 目前已支持Qwen3系列模型,并准备了开箱即用的HPC-AI Cookbook,提供包括DeepSeek-R1 GRPO算法等复杂RL场景的完整代码实现[40][41] - 开发者无需从零构建复杂流水线,复制Cookbook中的“配方”运行本地脚本即可驱动云端复杂的分布式RL训练流[41]