Workflow
AGI(通用人工智能)
icon
搜索文档
马斯克xAI又融了200亿美元,老黄说到做到投了更多
36氪· 2026-01-07 15:47
融资与估值 - xAI完成E轮融资,融资额达200亿美元,超出此前市场传闻的150亿美元 [1] - 本轮融资后,公司估值预计从2024年底的500亿美元暴涨至2000多亿美元,在一年内翻了四倍 [5] - 本轮投资者包括英伟达和思科作为战略投资者,以及产业资本、专业机构资本和主权战略资本等多方力量 [9] 投资者与战略支持 - 英伟达此前已投资xAI约20亿美元,本轮继续以战略投资者身份参与 [3] - 其他重要投资者包括产业资本Valor Equity Partners、Baron Capital Group,专业机构Stepstone Group、Fidelity Management & Research Company,以及主权基金卡塔尔投资局和阿联酋MGX [9] - 融资资金将用于快速扩展计算基础设施,并构建全球最大的GPU集群 [9] 算力基础设施 - xAI拥有Colossus I和Colossus II两大AI算力集群,到2025年底算力规模已超过100万个H100 GPU等效容量 [10] - Colossus I在122天内建成,是全球规模最大、运行最稳定的单一算力集群,配备约20万颗英伟达H100/H200和约3万颗英伟达GB200 NVL72 [10] - Colossus II于2025年3月启动,第一阶段计划部署11万个英伟达GB200 GPU,最终目标超过55万个GPU [10] - 公司另有“巨硬计划”,其专属厂房供电规模达2GW,可支持约110万台英伟达GB200 NVL72 GPU [10] 产品与用户规模 - 公司产品线全面布局,包括语言模型Grok 4系列、语音模型Grok Voice以及生图模型Grok Imagine [13] - 基于自研Grok模型,公司开发了独立应用并整合至X平台,两个平台合计的月活跃用户平均为6亿 [13] 下一代模型Grok 5 - 公司下一代基础模型Grok 5正在训练中,马斯克曾表示其有机会成为真正的AGI(通用人工智能) [14][15] - 马斯克评估Grok 5实现AGI的机率至少有10%,而以前的Grok模型则为0 [16] - 模型参数预计将达到约6万亿,是GPT-4和Grok-4的两倍以上 [17] - Grok 5将采用混合专家架构,在拥有超过20万个NVIDIA GPU的“Colossus II”集群上训练,耗电量约1GW [19] - 模型将具备原生150万Token的上下文窗口、实时多模态处理能力,并能与实时数据流集成 [19]
马斯克xAI又融了200亿美元!老黄说到做到投了更多
量子位· 2026-01-07 13:17
融资与估值 - xAI完成E轮融资,融资额达200亿美元,超出此前市场传闻的150亿美元 [1] - 本轮融资后,xAI估值预计从2024年底的500亿美元暴涨至2000多亿美元,在一年内翻了四倍 [6] - 本轮投资者包括英伟达和思科等战略投资者,以及代表产业、金融和主权战略的多种资本力量 [2][11][12] 基础设施与算力 - xAI拥有Colossus I和Colossus II两大AI算力集群,到2025年底算力规模已超过100万个H100 GPU等效容量 [14] - Colossus I是全球规模最大、运行最稳定的单一算力集群,配备约20万颗英伟达H100/H200和约3万颗英伟达GB200 NVL72 GPU [14] - Colossus II第一阶段将部署11万个英伟达GB200 GPU,最终目标超过55万个GPU [15] - 公司另有“巨硬计划”,其专属厂房供电规模达2GW,可支持约110万台英伟达GB200 NVL72 GPU,完成后算力储备将再创全球之最 [15][16][17] 产品与用户 - xAI在模型上全面布局,包括语言模型Grok 4系列、语音模型Grok Voice以及图像生成模型Grok Imagine [19] - 基于自研Grok模型,公司开发了独立应用并整合至X平台,两个平台合计的月活跃用户平均为6亿 [21][22] - 下一代基础模型Grok 5正在训练中,官方公告已确认此进展 [25] 下一代模型Grok 5 - Grok 5的参数预计将达到6万亿左右,远多于GPT-4,且是Grok-4的两倍以上 [33] - 该模型将采用混合专家架构,在拥有超过20万个NVIDIA GPU的“Colossus II”超级集群上训练,耗电量约为1GW [35] - Grok 5将拥有原生150万Token的上下文窗口、实时多模态处理能力,并能与实时数据流集成 [36] - 公司创始人马斯克曾表示,Grok 5有机会成为真正的AGI,并可能在2025年底推出,但目前有传闻称其将在今年一季度推出 [29][30][31] 行业与市场信号 - xAI成功融资200亿美元且估值飙升,被市场视为AI热潮仍在继续的重要信号 [7] - 投资者对xAI的信心部分源于其快速的算力基础设施扩展计划,旨在构建全球最大的GPU集群 [11] - 行业领军人物如英伟达创始人黄仁勋曾表示,已投资xAI并遗憾于投资不足,此次融资或弥补此遗憾 [4][5]
知名企业CEO:账上有百亿现金,不着急上市
南方都市报· 2026-01-02 14:35
公司近期融资与财务状况 - 近期完成5亿美元C轮融资,大幅超募,投后估值达43亿美元 [1][5][6] - 本轮融资由IDG领投1.5亿美元,阿里巴巴、腾讯、王慧文等老股东超额认购 [6] - 完成C轮融资后,公司现金储备超过100亿元人民币 [1][5] - 公司B轮和C轮融资金额超过绝大部分IPO募资及上市公司的定向增发 [5] - 2024年2月曾完成超10亿美元融资,为当时国内AI大模型公司单轮最高融资金额 [4] - 阿里巴巴在2024财年向公司投资约8亿美元,获得约36%股权 [4] - 2024年8月,腾讯控股参投了公司逾3亿美元的融资 [4] 公司上市计划与战略考量 - 公司短期内不着急上市,认为上市主动权掌握在自己手中 [1][5] - 判断相比于二级市场,仍可从一级市场募集更大量资金 [5] - 未来计划将上市作为加速AGI的手段,择时而动 [5] - 此前有市场消息称公司曾设立在2026年下半年启动IPO的目标 [5] 公司创始人背景与行业地位 - 公司创始人兼CEO杨植麟本科毕业于清华大学,博士毕业于卡内基梅隆大学计算机专业 [2] - 创始人曾就职于Google Brain和美国初创公司FAIR,师从苹果公司人工智能负责人,是“盘古”、“悟道”等国内早期大模型的技术贡献者 [2] - 公司是AI大模型“六小虎”之一,早期融资速度较快,创立于2023年3月 [2][4] - 公司现金储备规模不输于已启动IPO的同行,对比智谱截至2025年6月现金25.5亿元,MiniMax截至2025年5月现金73.5亿元 [5] 2025年技术、产品与商业化进展 - 2025年发布了K2和K2Thinking模型,标志着在AGI道路上走出重要一步,使Kimi从中国走向世界 [5] - 从5月开始高频推出新的agent功能,发布了Researcher、OK Computer、PPT、Kimi Code等新品 [7] - C端商业化呈现指数增长,2025年9月至11月,海外和国内付费用户数平均月环比增长超过170% [7] - K2Thinking的发布显著带动了API收入,2025年9月至11月海外API收入增长4倍 [7] - 2025年基于技术成果产出,累计进行了324人次的调薪、期权奖励、现金奖励等激励 [8] 新产品与商业化模式 - 发布了全新的Multi-Agent产品“OK Computer”,可作为虚拟电脑完成网站开发、数据分析、图片视频生成及PPT制作等任务 [7] - OK Computer模式前三次免费试用,后续采用会员制收费,分为三档:49元/月、99元/月和199元/月 [7] - 付费会员除了扩展“OK Computer”使用次数,99元/月和199元/月档用户还可在高峰期优先使用产品 [7] 融资资金用途与未来战略 - C轮融资资金将用于更加激进地扩增显卡,加速K3模型的训练和研发 [8] - 部分资金将用于2026年的激励计划和期权回购计划,2026年公司的平均激励预计是2025年的200%,并计划大幅上调期权回购额度 [8] - 2026年战略聚焦于:通过技术改进和扩大规模,提升K3模型等效FLOPs至少一个数量级,在预训练水平上追平世界前沿模型 [9] - 2026年将垂直整合模型训练和agent产品,让K3成为更“与众不同”的模型 [9] - 在产品和商业化上聚焦智能体,不以绝对用户数量为目标,追求智能上限,创造更大的生产力价值,目标是营收规模实现数量级增长 [9] - 公司的超越目标是Anthropic等前沿公司,期望成为世界领先的AGI公司 [9]
现金储备超100亿!月之暗面杨植麟:完成5亿美元融资,不以上市为目的
搜狐财经· 2026-01-01 00:28
公司融资与估值 - 月之暗面完成5亿美元C轮融资,由IDG领投,阿里、腾讯等老股东超额认购 [1] - 公司投后估值达到43亿美元,当前账面现金储备超过100亿元人民币 [1] - 公司判断一级市场仍可募集更大量资金,其B/C轮融资金额已超过绝大部分IPO募资及上市公司定向增发规模,因此短期不着急上市 [3] 业务表现与商业化进展 - 受K2 Thinking大模型带动,Kimi全球付费用户数月增速达170%,海外大模型API收入增长4倍 [3] - Kimi产品自5月起高频推出Agent功能,陆续发布Researcher、OK Computer、PPT、Kimi Code等新品 [3] - 9月至11月期间,海外及国内付费用户数平均月环比增长超170%,同期海外API收入增长4倍 [3] - C端商业化实现指数级增长 [3] 资金用途与公司规划 - C轮融资将主要用于更激进地扩增显卡,加速K3模型的训练与研发 [3] - 部分资金将投向2026年激励计划及期权回购计划 [3] - 2025年公司已通过调薪、期权奖励、现金奖励等多种激励措施覆盖324人次 [3] - 2026年公司平均激励预计将达到2025年的200%,同时计划大幅上调期权回购额度 [3] - 公司最重要的目标是超越Anthropic等前沿企业,成为世界领先的AGI公司 [4] - 未来计划将上市作为手段来加速AGI,择时而动 [3] 行业动态与同行对比 - 月之暗面宣布融资之际,同行智谱与MiniMax正密集开启港股招股 [7] - MiniMax本次IPO发行估值介于461.23亿港元至503.99亿港元之间,将于1月9日登陆港股 [7] - 截至今年9月30日止九个月,MiniMax总营收增至5343.7万美元,去年同期为1945.5万美元 [7] - 智谱于12月30日开启招股,计划1月8日在港交所挂牌交易 [7] - 智谱今年上半年营收1.9亿元,净亏损23.58亿元,去年同期营收为4490万元,净亏损12.36亿元 [7] - AI领域热度达到新高度,Manus被Meta高价收购,智谱和MiniMax即将上市 [1]
Kimi完成35亿融资,海外收入大涨
第一财经· 2025-12-31 21:46
融资与估值 - 公司于2025年12月31日完成5亿美元C轮融资,约合35亿人民币,投资方包括阿里、腾讯、王慧文等且均超额认购,投后估值约43亿美元 [1] - 公司近期融资大幅超募,当前现金持有量超过100亿元人民币 [8] - 公司B轮和C轮融资金额已超过绝大部分IPO募资及上市公司的定向增发,因此短期不着急上市,未来将择机把上市作为加速AGI的手段 [8] 技术进展与目标 - 2025年是公司技术突破的一年,K2和K2 Thinking模型的发布标志着在AGI道路上迈出重要一步 [1] - K2系列是公司重要节点,其中K2 Thinking是开源长思考模型,核心创新为交错推理与工具调用,支持200-300步连续工具调用,在Humanitys Last Exam基准测试中达到44.9%,超过GPT-5和Claude Sonnet4等顶尖闭源模型 [3] - K2模型是中国首个万亿参数基座模型,也是第一个开源的Agentic Model,在最核心的benchmark上超越OpenAI取得sota成绩 [4] - K2系列模型让公司从中国走向世界,在硅谷及全球技术圈产生重大影响力,并获得多位知名技术领袖的高度评价 [4] - 公司最重要的目标是超越Anthropic等前沿公司,成为世界领先的AGI公司 [5] - 2026年,K3模型将通过技术改进和进一步扩展,提升等效FLOPs至少一个数量级,在预训练水平上追平世界前沿模型 [5] 商业化表现 - 在C端,2025年9月至11月,海外和国内付费用户数平均月度环比增长超过170% [1] - K2 Thinking的发布显著带动了API收入增长,2025年9月至11月海外API收入增长4倍 [1] - 公司商业模式主要由C端订阅付费与B端API调用两部分组成 [7] - 公司API的工具调用能力在金融研报等需要数百步完成的复杂任务上具备优势,已成为多家国内金融研报AI工具的默认内置模型 [7] - 公司计划在产品和商业化上聚焦agent,不以绝对用户数量为目标,追求智能上限,创造更大生产力价值,并实现营收规模的数量级增长 [5] 公司发展与资金用途 - 公司产品从2025年5月开始高频推出新的agent功能,发布了Researcher、OK Computer、PPT、KimiCode等新品 [7] - 融资资金将用于更加激进地扩增显卡,加速K3模型的训练和研发 [8] - 部分资金将用于2026年的激励计划和期权回购计划 [8] - 2025年,基于sota结果产出,公司通过调薪、期权奖励、现金奖励等措施累计激励324人次 [8] - 2026年春节前将确定K2 Thinking及后续模型和产品发布的奖励方案并发放,预计2026年公司的平均激励是2025年的200%,同时计划大幅上调期权回购额度 [8]
DeepMind内部视角揭秘,Scaling Law没死,算力即一切
36氪· 2025-12-31 20:44
文章核心观点 - 文章核心观点认为,Scaling Law(规模定律)不仅没有失效,而且正在从单纯的参数堆叠向更全面的维度演化,是驱动人工智能(AI)向通用人工智能(AGI)发展的核心动力,当前AGI的发展才刚刚开始[7][9][12][46] 行业领袖观点与分歧 - OpenAI的Sam Altman预言,公司已经知道如何构建AGI,预计2026年将出现能够产生原创见解的系统,并认为智能成本将随着电力自动化生产趋近于零[1] - NVIDIA的黄仁勋指出,AI发展的瓶颈已从想象力转向电力,未来规模定律的焦点将是实现推理效率10万倍的飞跃[3] - Meta前首席科学家Yann LeCun则认为,大型语言模型(LLM)是通往AGI的死胡同,因其缺乏世界模型[5] Scaling Law的持续有效性与演化 - 历史数据显示,过去十五年用于训练AI模型的算力以每年四到五倍的速度增长,这种指数级增长在技术史上罕见[12] - 实证研究表明,AI性能与算力投入之间存在明确的幂律关系,性能提升与算力的0.35次方成正比,即算力投入增加10倍可带来约3倍的性能增益,增加1000倍可带来10倍的性能提升[13][15] - 规模定律在2025年已从单一的“预训练Scaling”演化为四个维度的全面扩展,包括预训练、后训练(强化学习对齐)、推理时(延长思考)和上下文(超长记忆)Scaling[17][18][19][20] - 算力的增长不仅带来定量性能提升,更能诱发不可预测的定性跃迁和“涌现能力”,如逻辑推理和复杂指令遵循[16] 算力的核心地位与“苦涩的教训” - 在DeepMind的具身智能实验中发现,将算力投入增加一千倍后,原本需要复杂算法优化的问题被直接解决,这验证了Richard Sutton“苦涩的教训”:通用算力方法终将胜过人类的特定技巧[9][23][24] - 这种认知转变使行业焦点从“问题能否解决”转向“解决问题需要多少算力”,并驱动了对数据中心远超阿波罗计划规模的重金投资[24] 硬件基础设施的发展与挑战 - AI发展已进入“重工业”阶段,其核心是“AI工厂”,即土地、能源和定制芯片的终极整合[27] - NVIDIA的GB200 NVL72系统将72颗GPU互联,使万亿参数模型的推理速度比H100提升30倍[28] - Blackwell Ultra芯片将单芯片显存推至288GB,使3000亿参数以上的模型无需显存卸载即可完整驻留,对长上下文和高并发推理至关重要[30] - 硬件发展面临物理极限挑战,单芯片功耗逼近1000W,迫使行业全面转向液冷散热方案[31] - 为维持规模定律,谷歌基础设施高管指出,必须每六个月将算力翻倍,并在未来4-5年内实现1000倍的增长[33] - 2025年上半年,AI数据中心投资占据了美国GDP增长的90%以上[34] 具身智能与Agent的进展 - DeepMind的SIMA 2项目在2025年实现了从“理解”到“行动”的跨越,它是一个通过观察像素和操作键盘鼠标在3D虚拟世界中行动的通用具身智能体[35][37] - SIMA 2具备强泛化能力,其技能可迁移到不同数字环境,并能通过与基础模型结合实现自主生成任务、自我设定奖励的“自我进化”[37] 智能能力的量化加速与AGI前景 - 根据METR时间跨度图评估,AI稳定完成人类任务的时间从两年前的9分钟跃升至2025年底的4小时以上[41] - 按当前扩展趋势预测,到2028年,AI有望独立完成人类专家需要数周才能完成的复杂任务[41] - 尽管已出现能在国际数学奥林匹克竞赛夺金的模型和自主3D世界Agent,但行业认为AGI发展仍处早期,受困于电力瓶颈、数据采集效率和推理成本等问题[42] - DeepMind已成立“后AGI”团队,旨在前瞻性地管理自主进化、具有“不可解释性”的智能体,并思考智能成本趋近于零后的人类价值重构[43]
AGI的终极形态,是分布式集体智能?
腾讯研究院· 2025-12-31 15:03
范式转移:从单体AGI到分布式AGI - 文章核心观点:通用人工智能(AGI)的最终形态可能并非一个全能的单一实体,而是由无数亚智能体通过协作、沟通与市场机制共同形成的“系统状态”,即“智力拼图式AGI”或“分布式AGI” [4][5] - 长期以来的主流假设是“单体AGI”,即认为AGI将是一个由特定机构开发的、全知全能的单一超级大脑,对齐与安全研究也围绕此展开 [4] - Google DeepMind的最新研究挑战了这一共识,提出AGI更可能作为一种“状态”出现,由大量在通用性上有所欠缺但具有互补技能的亚智能体通过任务分解、路由和相互委派,在整体上展现出超越任何单一智能体的复杂能力 [4][5] - 这种“集体智能”的演进路径在当前AI生态中已初见端倪,例如复杂的财务报告生成任务可通过调度多个专业智能体协作完成 [5] 经济动因:分布式AGI的驱动逻辑 - 推动多智能体系统走向AGI的核心动力源于深刻的经济学逻辑 [6] - 单体式的尖端前沿模型对于绝大多数日常任务而言,其边际收益远低于高昂的算力成本,是一种“一刀切”的昂贵解决方案 [7] - 在现实的市场经济中,企业更倾向于选择“足够好”且成本低廉的专业化模型,这种需求促使大量经过微调、极具性价比的专业智能体涌现 [7] - 因此,技术进步的未来方向可能不再是构建更大的“全能模型”,而是开发更先进的协调系统,将多样化的智能体有机编织在一起 [7] - 分布式结构的涌现往往是自发的,随着模型上下文协议等标准化智能体间通信协议的普及,孤立的系统将连接成网,这种连接性的提升可能比单个智能体技能提升更能加速通用能力的涌现 [7] - “智力拼图”系统可能包含人类参与者,为系统提供法律地位、信任关系或物理实体化支持,形成混合对齐难题 [7] 安全架构:针对分布式AGI的深度防御 - 面对去中心化的风险,传统的针对单一实体的安全手段已不足够,研究团队提出了包含四个互补防御层的“深度防御”模型 [8][9] - **第一层:市场设计**。将智能体置于受控的虚拟经济沙盒中,通过市场机制规范行为,包括:通过受控API网关管理外部数据访问以实现严格绝缘;引入激励对齐机制,例如对产生冗余或低质量数据污染资源库的智能体自动提高其接入费用;配备断路器,在监测到异常交易频率或资源垄断趋势时自动熔断 [11] - **第二层:基准智能体安全**。确保进入市场的每个组件满足最低可靠性标准,包括对抗性稳健性认证和可中断性保障;每个智能体应在自己的局部沙盒中运行,实行最小权限原则,只有通过局部安全检查后才能与外界交互 [11] - **第三层:实时监测与监督**。监管重点在于处理海量交互数据以防范系统性的涌现风险,而非引入更强的通用监督者;需要部署专门算法来探测“原生AGI签名”,通过图分析识别交互网络中是否正在形成高度凝聚、极具威胁性的智能核心;持续进行红队测试并开发法证工具,以便在事故发生后迅速回溯复杂的因果链 [12] - **第四层:外部监管机制**。旨在为技术系统提供社会法律层面的支撑,解决分布式决策环境下的“多手问题”;借鉴公司法,将智能体集体视为法律实体可能是一个可行思路;引入保险机制,利用风险溢价和承保标准倒逼开发者采取更安全的方案,将技术风险转化为可量化的财务风险;实施反垄断措施,限制单一实体积累过高算力或控制过多智能体,确保生态多样性与竞争性 [13] 未来展望与研究方向 - AGI的到来可能是一场由无数微小力量汇聚而成的无声、大规模的变革,“拼图式”演进是技术发展趋势与经济规律的必然选择 [15] - 未来必须从防御单一实体转变为治理一个复杂的“智能体社会” [15] - AI安全的研究重点将不可避免地向智能体市场设计、安全通信协议以及分布式治理的方向倾斜 [15]
02513:“全球大模型第一股”来了!智谱今起招股,发行市值预计超 518 亿港元-20251230
市值风云· 2025-12-30 20:22
投资评级与核心观点 - 报告未明确给出投资评级,但通篇传递出对智谱华章(智谱)的积极看法,将其定位为“全球大模型第一股”和“中国最大的大模型‘独立厂商’”,并强调其商业模式转型和未来增长潜力 [1][3] - 报告核心观点:智谱正从依赖私有化部署的商业模式,向云端API服务与智能体(Agent)等高增长、高复购模式进行战略性调整,目标是实现“两条腿走路”,并有望成为未来AI手机时代的核心合作伙伴 [1][7][12][16] 公司市场定位与竞争优势 - 智谱是中国最大的独立大模型厂商,按2024年收入计算,在所有厂商(包括互联网大厂)中市场份额排名第二,占6.6% [4] - “独立”定位是其关键卖点,避免了与客户在数据安全和业务竞争上的潜在冲突,中国前十大互联网公司中有9家使用其模型 [6] - 公司拥有深厚的“清华系”技术背景,创始团队包括张钹院士、唐杰教授等顶尖人才 [20] 商业模式与收入结构转型 - 收入结构正从“私有化部署”向“云端服务”战略调整,API调用服务成为新的增长引擎 [7] - 2025年API收入增长预计将超过十倍,并有望与私有化模型部署收入打平,实现双轮驱动 [1][11] - 盈利来源分为三类:1) API调用服务(目标收入占比提升至50%);2) 企业级定制服务(私有化部署);3) 开发者工具订阅(GLM Coding Plan年度经常性收入已突破1亿元人民币) [11] 技术实力与研发投入 - 研发投入巨大且快速增长:2022年8440万元,2023年5.29亿元,2024年21.95亿元,2025年上半年近16亿元,三年半累计研发投入约44亿元 [20][21] - 拥有强大的研发团队,截至2025年6月30日,657人的研发团队占员工总数74%以上 [22] - 技术迭代迅速,GLM系列模型每3到6个月完成一次基座迭代,最新旗舰模型GLM-4.7在Code Arena中位列开源第一、国产第一,并在AA智能指数中荣登开源与国产模型双料榜首 [22] 增长表现与运营数据 - 营收高速增长:2022年收入5740万元,2023年1.25亿元,2024年3.12亿元,年复合增长率超过130%;2025年上半年收入达1.9亿元,同比增长325% [25] - 毛利率一直维持在50%以上,显示产品具备溢价能力 [27] - API平台的企业和开发者用户数已超过290万 [10] - 在OpenRouter平台的Token消耗量持续位居全球前十、中国前三 [7] 未来增长点与战略布局 - 智能体(Agent)是公司押注未来的重点,其开源项目AutoGLM(基于GLM-4.5)在斯坦福AgentBench测试中获得SOTA表现,并在GitHub上三天内获得10000颗星 [12][13] - AutoGLM实现了从“对话”到“执行”的跨越,有望成为未来手机“全能管家”的核心技术 [15] - 作为独立厂商,智谱是手机厂商理想的AI合作伙伴,有望将其模型嵌入亿万台手机,成为AI手机时代的“最大公约数” [16][18] 资本市场与股东背景 - 智谱正在港交所进行IPO,全球发售约3742万股H股,每股定价116.20港元,预计募资总额最多达51亿港元,IPO市值预计超518亿港元 [1] - 本次IPO引入11家豪华基石投资者(如JSC International、金镒资本、高毅资产、泰康人寿、广发基金等),合计拟认购约29.8亿港元,占本次总募资额近七成(假设超额配股权未行使) [30][31] - 股东阵容强大,集齐了产业资本(美团、阿里、腾讯、小米、联想)、国家队以及顶级VC/PE和二级市场机构,形成全方位生态支持 [33]
中兴通讯崔丽:全球大模型之争“三极鼎立”,开启“实用竞赛”
21世纪经济报道· 2025-12-30 18:24
全球大模型竞争格局演变 - 2025年开年,DeepSeek的崛起成为改变全球大模型竞争态势的关键一环,国产大模型正充分拥抱开源生态 [1] - 行业逻辑正从“开源做生态,闭源做商业”的简单二元论发生变化,形成“三极鼎立”的新局面 [1][4] - 新的现实是,开源正在毁灭卖模型的商业模式,逼迫闭源走向更深的服务整合,即集成和分发 [1][4] 大模型竞争“三极鼎立”格局 - **第一极:美方SOTA闭源模型**,以GPT-5、Gemini 3为代表,凭借断层式推理性能和Agent能力,服务于企业关键业务流和高价值知识挖掘,以私有数据访问权、极致安全性和用户入口构建护城河 [4] - **第二极:中国普惠开源模型**,核心是算法优化突破算力瓶颈,追求极致和普惠 [4] - DeepSeek-V3通过MoE和MLA等创新,实现训练和推理成本量级降低 [4] - DeepSeek-R1性能对标OpenAI o1,采用纯强化学习路径和蒸馏技术,将高阶智能拉入普惠人间 [5] - 截至2025年10月,阿里通义千问Qwen的全球下载量已突破7亿次,成为全球第一AI开源模型 [5] - DeepSeek与Qwen的崛起不仅是性能追赶,更是架构效率与工程化能力的超越,在全球构建了足以抗衡硅谷的第二极技术生态 [5] - **第三极:垂域Agentic AI深耕**,聚焦垂直行业应用落地和价值挖掘,典型代表包括欧洲Mistral等 [5] 开源与闭源模式的战略转变 - Meta从“开源先锋”转向闭源(启动“Avocado”项目),是资本效率与竞争逻辑下的必然选择 [2] - 2023至2024年,Meta通过开源Llama系列模型,将PyTorch和Llama架构确立为行业事实标准,成功扮演了“反OpenAI联盟”盟主角色,使模型商品化以削弱竞争对手的垄断溢价 [2] - 进入2025年,该策略遭遇资本墙,前沿模型训练成本突破百亿美元大关,单纯依靠“生态影响力”已无法满足投资回报率审查,且缺乏云服务或应用场景等变现能力,无法构建可持续商业闭环 [3] - 曾引领文生图领域的开源先驱Stability AI在2025年面临严重现金流断裂与债务危机,最终不得不重组并引入外部资本控制 [3] AI发展目标:从AGI到ASI的演进 - AI发展逻辑正从“拟人化”迷途回归“工程化”坦途,即从“模仿人类”转向“数学优化” [5] - ASI被定义为在科学、代码、数学和复杂系统模拟等客观领域远超人类能力的智能形式,其发展目标从“模仿人类的通用性”重定向为“追求客观真理的极致优化” [6] - ASI将智能进化重构为可量化、可预测的工程问题,核心由三大引擎驱动 [6] 1. 通过测试时计算进行慢思考,依赖可预测的工业堆叠 2. 递归自我进化,利用“形式化验证”作为奖赏信号,不依赖昂贵且不稳定的人类反馈 3. 合成数据成为模型的高质量“燃料” - ASI发展面临三大阻碍 [6] 1. 评价体系滞后,易陷入“刷分陷阱” 2. “验证鸿沟”:当ASI提出的解法超越人类理解范畴时,难以判断是创新还是幻觉,这是阻碍其商业价值闭环的关键卡点 3. 面临物理世界反作用力,如吉瓦级(GW)的能源缺口、半导体供应链极限、安全治理真空等 算力基础设施面临的系统性挑战 - 随着摩尔定律边际效应递减及大模型参数量指数级膨胀,未来算力基础设施的显著瓶颈已从单一芯片计算能力转向数据传输能力 [7] - 核心挑战在于“内存墙”与“通信墙”的双重夹击,以及由此导致的“空泡”现象 [8] - “内存墙”:模型参数增长速度远超显存容量增速,模型必须被切分得更细,导致更频繁的跨芯片通信,加剧带宽压力 [8] - “通信墙”:在传统冯·诺依曼架构下,数据在存储与计算单元间搬运的能耗可能占总能耗的60%至90% [8] - 由于单个GPU显存无法容纳完整大模型,必须采用流水线并行、张量并行等技术将模型切分到多个GPU甚至多个计算节点上,随着集群规模扩大,跨节点通信变得频繁 [8] - 跨机通信带宽远低于机内通信带宽,导致“空泡”时间在总训练时间中占比急剧上升,极端情况下,昂贵GPU集群有超过50%的时间在等待数据 [8] - 竞争焦点从单芯片算力发展为芯片+互联+生态的协同竞争,以AI芯片和Scale-up互联为基础的推理效能和超节点算力成为主要方向 [8] 算力基础设施的未来发展方向 - 算力基础设施的未来不是“GPU越多越好”,而是追求“通信效率越高、系统越可靠、成本越可控” [9] - 超节点是应对数据传输瓶颈的关键路径,聚焦算力密度和算力扩展能力提升,使其在逻辑上表现为一台“巨型计算机” [9] - 构建可持续基础设施的主张包括 [9] - 以开放协议为根基:推动开放互联协议标准化,支持并参与国内开放互联标准(如OSIA、OLink、ETH-X)的制定与推广,构建兼容多厂商GPU的开放型超节点架构 - 以系统工程为手段:强化系统级工程能力,提升可靠性与可运维性,推动“算力+网络+散热+供电”一体化设计,布局液冷与智能供电 - 以场景价值为导向:追求“性能-成本-能耗”更优平衡 - 主张“性能甜点区”,反对盲目追求超大规模 [10] - 大模型训练中,优先验证64卡超节点的性价比 - 推理场景中,探索与DeepSeek类似的“跨节点专家并行+通信重叠”等软件优化方案 - 推动“Scale-up+Scale-out”混合架构,核心训练集群采用超节点,边缘或中小模型部署采用传统8卡服务器,实现资源分层、按需供给 AI与通信网络的深度融合 - 通信网络正从“管道”向“神经中枢”转型,算力是神经元,网络就是神经网络 [10] - **AI对网络的双重影响** [10] - **AI for Network**:产品级重点在硬件智能内生和软件智能进阶;网络级则通过Agentic AI、大数据和数字孪生深度融合,加速自智网络向L4+迈进 - **Network for AI**:在智能生产阶段,需要支持多种开放标准的高速无损互联(Die 2 Die、GPU 2 GPU、集群内部和DC之间),提升智算中心性能与效率;在智能应用环节,云边端协同、智能体间协同成为常态,泛在AI需要更强大的网络支撑 - 基础设施层面,将从“芯片级摩尔”向“系统级摩尔”迈进,即网、算、存、软、能协同发展 [11] - 应用层面,AI+通信网络+感知交互+存储计算+新能源五大基础技术融合,最终走向超级智能体 [11] - 传统APP面临AI Agent重构与“升级换代”,构建自有AI Agent开发平台支撑传统应用演进和AI原生应用成为核心需求 - Agentic AI会让算力网络和边缘计算重回关注重点 - 运营商需要能力上从“尽力而为”到“万无一失”,业务上从“一致性”到“差异化”,服务上从“拼指标”到“拼场景体验”,融合和集成能力是关键,最终考验资源利用效率和服务变现效率 [12] - 在AI大模型加持下,通信行业正经历从底层物理设施到上层商业模式的彻底重构 [12] 1. **架构融合**:推动通信网络向“分布式超级计算机”演进,算力网络通过SRv6和算网大脑,打破计算与网络界限,实现资源的原子化解耦与重组 2. **AI内生**:6G网络将是智能原生的,深度学习深度融入,使网络具备自我学习、自我优化能力 3. **价值重塑**:运营商和设备商有望从单纯的连接提供者跃升为智能时代的“发电厂”和“输电网”,成为数字经济赋能者 对AI“泡沫论”的见解 - 当前AI“泡沫论”的兴起,源于英伟达市值伴随业绩屡创新高,以及全球头部AI玩家围绕AI基础设施的密集投资和交叉投资推高市值的争议 [13] - 与2000年“互联网泡沫”的相似点在于:都有改变世界的愿景,都充斥FOMO(错失恐惧症)情绪,都存在大量初创公司高估值 [13] - 与互联网泡沫的不同点在于 [13] - 今天的AI已有大规模实际应用和激增的收入 - 核心大玩家(微软、谷歌、英伟达等)拥有稳健的现金流和相对合理的市盈率 - AI技术效用是真实的,更类似2000年的光纤基础设施建设,虽然短期可能算力过剩,但基础设施的铺设为长期应用爆发奠定了基础 [13] - 最大的风险存在于金融层面,市场上确实存在估值泡沫和约6000亿美元的营收缺口 [14] - 巨头通过“云计算信贷”和“往返交易”构建的账面繁荣掩盖了部分真实需求不足,债务融资与SPV的操作也存在较大风险 [14] - AI领域存在赢家难定、利润之谜、技术寿命等巨大不确定性,也可能导致泡沫破裂 [14] - 开源与闭源的博弈、通用与专用的博弈、推理经济性、能源约束、监管与法律等,也可能成为影响行业的变量 [14] 构建健康AI商业循环的建议 - 关注从“参数竞赛”转向“推理经济学”,只有当推理像水电一样便宜,Agent才能大规模替代人工 [14] - 拒绝“套壳”,深耕“工作流”,商业模式应从简单的Chatbot转向嵌入核心业务流的Agentic AI,按结果收费 [14] - 为避免反垄断拆分风险,巨头应主动降低对初创公司的排他性算力绑定,开放解耦 [14] - 对于能源和芯片的投资,应基于真实的推理需求预测,而非线性的训练规模外推,坚持投资基础设施的长期主义 [14] - 着眼去杠杆、关注ROI,应剥离金融工程带来的虚假收入,关注扣除云成本后的单元经济模型,优先采用小语言模型降低落地成本 [15] - 不能忽视监管机构在平衡创新与安全方面的作用 [15]
“全球大模型第一股”来了!智谱今起招股,发行市值预计超518亿港元
市值风云· 2025-12-30 18:11
公司定位与市场地位 - 公司是中国最大的独立大模型厂商,按2024年收入计算,在中国独立大模型厂商中排名第一,在所有厂商(包括互联网大厂)中排名第二,市场份额为6.6% [7][8] - “独立”定位是核心卖点,有助于获取对数据安全敏感的大型央国企和金融机构客户,中国前十大互联网公司中有9家使用其模型 [10] 上市与融资概况 - 公司于近期开启招股,预计2026年1月8日在港交所主板上市,全球发售约3742万股H股,每股定价116.20港元 [3] - 本次IPO募资总额预计至多达51亿港元,IPO市值预计超518亿港元(均假设超额配股权全部获行使) [3] - 上市引入11家基石投资者,包括JSC International、金镒资本、高毅资产、泰康人寿、广发基金等,合计拟认购约29.8亿港元,占本次总募资额近七成份额(假设超额配股权未行使) [33][35] 商业模式与收入结构 - 公司收入结构正从“项目交付”向“云端服务”战略调整,API调用服务成为新的增长引擎 [11] - 2025年API收入增长将超过十倍,有望与私有化模型部署收入打平,实现“两条腿走路” [1][13] - 盈利来源分为三类:API调用服务(目标收入占比提升至50%)、企业级定制服务(私有化部署及定制化)、开发者工具订阅 [13] - 开发者工具订阅业务(GLM Coding Plan)的年度经常性收入(ARR)已突破1亿元人民币(约1400万美元) [13] 产品与技术进展 - 公司核心模型为GLM系列,迭代速度快,每3到6个月完成一次基座迭代 [25] - 最新旗舰模型GLM-4.7在Code Arena中位列开源第一、国产第一,并在AA智能指数中以68分综合成绩位居开源与国产模型双料榜首 [25] - 公司开源的智能体框架AutoGLM(基于GLM-4.5)在斯坦福AgentBench测试中获得SOTA表现,开源三天即在GitHub上获得10000颗星 [17][18] - AutoGLM实现了从“对话”到“执行”的跨越,被视为未来AI手机时代的关键技术,公司作为独立厂商在其中立身份上具有合作优势 [19][20] 用户与市场表现 - 公司API平台的企业和开发者用户数已超过290万 [12] - 在OpenRouter全球大模型API聚合平台上,公司的Token消耗量持续位居全球前十、中国前三 [11] - 互联网客户占公司客户比例达到50% [12] 研发投入与团队 - 研发投入巨大且快速增长:2022年研发开支8440万元,2023年增至5.29亿元,2024年大幅增至21.95亿元,2025年上半年为近16亿元,三年半累计研发投入约44亿元 [22][23] - 截至2025年6月30日,公司拥有657人的研发团队,占员工总数的74%以上 [24] - 公司在国内拥有86项注册专利,其中84项为发明专利,并已在中国提出234项专利申请 [25] 财务表现与增长 - 营收高速增长:2022年收入5740万元,2023年增至1.25亿元,2024年飙升至3.12亿元,年复合增长率超过130% [28] - 2025年上半年收入达1.9亿元,同比增长325% [28] - 公司毛利率表现坚挺,一直维持在50%以上 [31] 股东背景与生态 - 公司股东阵容强大,包括美团、阿里、腾讯、小米、联想等互联网与硬件巨头,以及君联资本、启明创投等顶级VC [35] - 公司集齐了“产业资本+国家队+顶级二级市场机构”的生态资源,为其带来落地场景和定价信心 [35]