大模型
搜索文档
杨植麟、张鹏、罗福莉首度对谈
21世纪经济报道· 2026-03-29 20:30
文章核心观点 - OpenClaw等开源智能体(Agent)框架的兴起,正在深刻改变行业对大模型能力边界的预期,并引发从技术研发、商业化路径到算力基础设施和软件生态的连锁反应 [1] 以OpenClaw为代表的Agent技术演进与影响 - 以OpenClaw为代表的Agent框架打破了智能体仅在极客群体流行的壁垒,使普通人能通过简单交流调用顶尖大模型的编程与执行能力 [4] - 模型正在从一次性回答问题转向处理多步骤复杂任务,导致Token消耗急剧放大,完成一个任务所需的Token量可能是回答简单问题的十倍甚至百倍 [5] - 智能体框架激活了预训练模型未被发挥的能力上限,大模型上下文处理能力的提升成为行业竞争重心 [5] - 在很强的自进化Agent框架加持下,大模型对科学研究可能带来指数级加速,这一进程的时间窗口从预估的三到五年缩短至一到两年 [6] - Agent框架显著拉高了国内尚未完全逼近闭源模型但位于开源前列的模型上限,在绝大多数场景中,国产开源模型的任务完成度已非常接近Claude最新模型 [10] 对算力基础设施和模型架构的变革要求 - OpenClaw带来Token需求爆炸式增长,有公司自1月底起每两周Token消耗量翻一番,至今已翻10倍,增长速度堪比3G时代手机流量普及 [8] - 当前算力供需缺口需从系统层重新思考,现有云计算基础设施本质是为人类工程师设计,而非为能在毫秒级发起任务的AI智能体设计 [8] - 短期应对策略是打通软硬件,接入国内十几种计算芯片与算力集群,打造更高效的Token工厂;中长期看,基础设施需进化为能自我迭代、甚至由AI自主管理的智能组织 [8] - 面对更复杂、更长程的任务,低成本、高速度、稳定处理长上下文的能力成为关键,中国团队在受限算力条件下被逼出的架构创新正为此提前布局 [9] Agent技术落地面临的技术瓶颈与挑战 - OpenClaw的“活人感”体验是其迅速出圈的重要原因,但体验突破不意味着底层问题已解决 [12] - 规划能力存在瓶颈:任务步骤越多,模型越难做出合理规划,根本原因是当前模型在复杂垂直领域缺乏足够的隐性知识积累 [12] - 记忆管理存在挑战:超长上下文下,信息压缩失真和存储量暴增是难以兼顾的矛盾,多模态数据的高效索引也是未解难题 [12] - 生态质量有待提升:开源Skills质量参差不齐,高质量Skills偏少,且存在恶意代码注入的安全隐患 [12] - 智能体要真正进入生产场景,不能仅依赖单项模型能力突破,需要整个软硬件生态的一致协同,未来软件可能更多面向智能体原生使用 [13]
Kimi创始人杨植麟:未来AI研发将进入AI主导时代
凤凰网财经· 2026-03-29 18:49
月之暗面创始人杨植麟演讲核心观点 - 大模型的本质是将能源转化为智能,规模化是行业发展的核心基础,但规模化并非暴力堆砌算力与能源,而是以升级效率为核心 [1] - 公司围绕三大方向构建规模化策略:Token效率、长上下文、Agent集群,旨在有限资源下实现智能最大化 [1] 公司规模化策略三大方向 - **提升Token效率**:通过更优的网络架构与优化器,从等量的有效数据(有限常量)中学习更多智能 [3] - **拓展长上下文能力**:通过自研Kimi Linear架构,让模型在更长输入下获得更低的损失函数,从而支撑更长输出与更复杂任务的执行 [3] - **突破Agent效率瓶颈**:在最新发布的旗舰模型K2.5中,首创了Agent集群技术,以彻底打破单一智能体的效率瓶颈 [3] 大模型训练三阶段演进 - **第一阶段(约三年前)**:行业主要使用互联网天然数据,搭配少量人工标注,通过标注判断内容是否符合价值观与偏好 [3] - **第二阶段(2025年)**:行业更加重视大规模强化学习系统,由人工筛选高质量任务并定义任务,再通过强化学习提升模型效果,编程、数学等领域的性能提升主要源于此路线 [3] - **第三阶段(未来几年)**:人工智能的研究与研发方式将发生重大变化,越来越多的研究工作将由AI主导,每个研究员将配备海量的Token,由AI自动合成新任务、构建新环境、定义最优奖励函数,甚至自主探索全新网络架构,从而进一步加快整个AI领域的研发速度 [3]
大模型该去二级市场要钱了
虎嗅APP· 2026-03-29 17:34
行业竞争阶段转变 - 大模型行业竞争焦点已从比拼技术能力(如SOTA排名)转向验证商业价值阶段,关注点变为模型能力能否被持续投入支撑并转化为可验证的商业价值 [6] - OpenAI、Anthropic、月之暗面、阶跃星辰等中美头部基座模型公司,预计将在2026年前后集体走向资本市场 [2][3] - 当头部公司密集启动IPO,表明该赛道已难以依赖一级市场的耐心维持运转,行业进入新阶段 [8] 头部公司估值与融资现状 - Anthropic估值约3800亿美元并已推进至G轮融资,月之暗面估值约1800亿美元,是国内IPO前估值最高的模型公司之一 [2] - 过去两年,中美头部大模型公司动辄获得数十亿甚至上百亿美元融资,但资金正从“押注未来”转变为需要解释的账目 [8] - 自ChatGPT出现(2022年末)至今约三年,大模型公司估值已飙升至上千亿美元,发展周期极快 [8] 商业模式与资金需求困境 - 大模型公司已演变为“基础设施”,其本质是持续投入,包括模型训练、推理成本及迭代升级,无法通过一次性投入建立壁垒 [9][10] - 公司收入(如API调用、企业客户、订阅模式)虽在增长但不稳定,价格持续下探,形成“规模越大,压力越大”的局面:模型越强、调用越多则成本越高,价格竞争压缩利润空间 [11] - 大模型公司处于尴尬位置:需要按“基础设施”规模持续投入(数十亿甚至上百亿美元),但尚未具备相应的稳定回报能力,回报周期不确定 [12][13] 一级市场逻辑转变与IPO动因 - 一级市场可为公司承担风险,但前提是风险有明确时间边界,而大模型公司的时间边界不清晰,既无法像互联网平台快速形成网络效应,也不像传统基础设施能通过稳定现金流逐步回收成本 [11] - 当单家公司需持续巨额投入且回报周期不确定时,一级市场的投资逻辑开始失效,长期资本不愿再无条件支持 [13][14] - 在一级市场融资难以为继的背景下,大模型公司选择转向二级市场,因为那里仍可讲述“未来”故事并接纳其发展模式 [15] 二级市场反应与历史对比 - 市场对AI情绪乐观,例如MiniMax上市首日高开,盘中冲高,随后几个交易日市值较发行阶段持续抬升;智谱AI上市初期经历短暂波动后股价快速回暖,部分交易日内出现超过8%甚至10%的单日涨幅 [16] - 与上一代AI公司(如出门问问、商汤科技)相比,当前大模型公司上市后的市场表现不同,后者上市后经历了较长时间的估值消化期,股价表现谨慎,市场对其商业化能力的质疑长期压制估值 [17]
突发!华为盘古大模型负责人离职
程序员的那些事· 2026-03-28 19:05
核心人事变动 - 2025年3月28日,华为盘古大模型负责人、诺亚方舟实验室主任王云鹤确认离职,结束了其近9年的华为生涯 [3] - 王云鹤于2017年作为北京部门首个实习生加入华为,博士毕业后留任,从算法部门负责人成长为执掌顶级AI实验室的技术标杆 [5] - 2025年3月接手盘古大模型后,其负责该模型的整体研发规划,是公司在大模型领域直面行业竞争的关键人物 [6] - 其个人技术成果包括轻量级网络GhostNet、落地天文领域的AI算法应用,在学界与产业界兼具声望 [7] - 业内消息显示,其离职后的下一站将聚焦于AI智能体创业,这是当前大模型落地最具商业化潜力的方向 [8] 模型发布与争议 - 2025年6月30日,华为开源了盘古Pro MoE等模型 [10] - 随后,外界质疑盘古Pro MoE模型与Qwen在参数分布上存在异常相似性,且代码中保留了第三方版权信息,被指为“续训”或“套壳” [10] - 针对上述质疑,华为方舟实验室于2025年7月5日发文予以否认 [10]
GLM-5.1上线,编程表现贴Opus 4.6开大,Coding plan瞬间断货
量子位· 2026-03-28 13:17
文章核心观点 - 智谱公司最新发布的GLM-5.1模型在编程能力上相比上一代GLM-5有显著提升,评测得分飙升近10分,且与全球领先的Claude Opus 4.6模型差距仅为2.6分 [1][2] - 该模型已面向所有GLM Coding Plan用户开放(包括Lite/Pro/Max),开放后需求火爆,一度售罄 [9][10] - 尽管官方文档和公告信息有限,但根据现有资料和网友实测,GLM-5.1在代码生成、空间结构理解、动态环境构建等方面展现出强大能力 [12] 模型性能与评测 - **编程能力大幅提升**:在Coding Evaluation评测中,GLM-5.1相比上一代GLM-5得分直接飙升近10分 [1] - **接近全球顶尖水平**:其编程能力评测得分与当前全球最强的编程模型Claude Opus 4.6相比,仅有2.6分之差 [2] - **潜在超越同级对手**:有网友推测,其评分可能已经超过了目前仅次于Opus 4.6的Sonnet4.6模型 [4] 模型能力与实测表现 - **核心能力定位**:模型定位主要偏向代码场景,并支持reasoning模式 [16] - **空间结构理解**:在生成室内设计平面图的实测中,模型对厨房、客厅、卧室等区域划分明确,并能处理动线关系,显示出对空间结构的到位理解能力 [18][19][20] - **动态环境构建**:在生成可交互的“我的世界”游戏实测中,模型展现了“动态补全能力”,即随着镜头移动,能对未出现区域的内容进行持续生成,保持画面流畅不卡顿 [25][26][29] - **空间一致性**:在游戏搭建实测中,模型能一起生成场景、视角和交互,说明其在处理连续环境时能呈现相对稳定的空间状态 [28] - **复杂任务处理**:有用户将关于灵巧手的研究资料输入模型后,成功生成了一本专业的行业手册,输出效果远超用户预期 [7][9] 模型配置与发布信息 - **模型配置**:支持在Claude Code中手动切换使用,也能接入OpenClaw进行自定义配置,同时支持OpenAI Compatible接入,降低了开发者的使用门槛 [14][17] - **上下文窗口**:大约在200K级别,基本延续了GLM-5的配置,量级上没有太大变化 [16] - **迭代节奏**:GLM-5.1距离上一代GLM-5模型的发布仅间隔一个多月,表明公司产品处于非常快速的迭代周期中 [31] - **版本定位**:GLM-5.1更像是上一代模型的强化版本,其提升更多体现在稳定性、执行效率以及复杂任务下的表现上 [32] 用户反响与市场热度 - **开放范围广泛**:模型率先向GLM Coding Plan的全部用户(包括Lite用户)开放 [9][17] - **市场需求旺盛**:模型开放后因过于火爆而直接显示“售罄” [10] - **开发者积极实测**:众多网友在模型发布后立即进行实测,并将其应用于日常工作流,例如生成专业手册、构建交互式游戏等 [4][6][7]
娃哈哈停产了?知情人士回应;九号公司与泡泡玛特达成合作,联名电动车将于4月推出;雷军介绍小米机器人团队在灵巧手领域新进展丨邦早报
创业邦· 2026-03-28 09:10
AI与科技人才竞争 - OpenAI对苹果构成显著人才威胁,已从苹果挖走数十名工程师,并计划到2026年底将员工从4500人扩至8000人[3] - 苹果为应对AI公司抢人,向部分iPhone硬件设计师发放价值20万至40万美元的特别股票奖金,但该金额仍远低于部分AI公司提供的每年约100万美元的股票激励[3] - 百度内部推动AI能力内化,已有超过50%的员工“养上龙虾”,公司表示相关投入不受预算限制,将全力支持员工能力演进[18] 大模型与AI公司动态 - OpenAI的ChatGPT广告业务在美国试点六周内达到年化收入超1亿美元的里程碑,并计划将试点扩大至澳大利亚、新西兰和加拿大[19] - 美团发布并全面开源原生多模态大模型LongCat-Next,该模型将图像、语音与文本统一映射为同源的离散Token[21] - Anthropic考虑最早于10月进行IPO,可能筹集超过600亿美元的资金,并与OpenAI在上市方面展开竞争[20] - 红果短剧平台回应“AI焦虑”传闻,明确表示对真人短剧的投入一如既往,并未缩减,平台将继续加强对真人短剧的投入和激励[15] 具身智能与机器人融资热潮 - 多家具身智能与机器人公司完成大额融资:世航智能完成A+和A++两轮数亿元战略融资[20];深度机智年初至今完成3轮数亿元级别融资[20];格松科技完成新一轮超亿元融资[21];知行机器人完成近亿元B轮融资[21] - 小米机器人灵巧手在技术上取得新进展,能够完成高精度工作,并已通过15万次抓握循环可靠性测试,目标是实现接近100%的作业成功率[6][7] - 镜象科技完成数千万元融资,将用于深化其情感心理大模型M1的技术底座,并加速在医疗与消费场景的布局[20] 新能源汽车与智能驾驶 - 比亚迪2025年全年营收8039.6亿元,同比增长3.46%,其中汽车业务收入约6486.46亿元,同比增长5.06%;全年净利润326.2亿元,同比下降19%[10] - 零跑汽车A10全球上市,售价6.58万元起,将高阶智驾与长续航能力下探至10万元内区间,该车型将登陆近40个国家和地区[23][24] - 智己LS8开启预售,价格25.98万-30.98万元,新车搭载英伟达Thor芯片、激光雷达及支持向L4升级的辅助驾驶系统[26] - 理想汽车已开启至多10亿美元的股票回购计划,并已在3月24日和25日进行了回购,公司表示回购将结合市场情况分批推进[10] 消费与文娱行业 - 茶百道2025年业绩表现强劲,全年总营收53.95亿元,同比增长10%;净利润8.2亿元,同比增长71%;国内门店数增至8621家,三线及以下城市门店占比升至46.1%[18] - 乐华娱乐宣布与旗下艺人王一博续签独家艺人管理合同,公司认为这将巩固其作为中国娱乐行业主要市场参与者的地位[15][16] - 九号公司与泡泡玛特旗下IP小甜豆达成品牌合作,计划于4月推出首款IP联名电动车产品[4] - 2026年清明档新片预售总票房已突破1000万元[28] 公司治理与运营动态 - 俞敏洪卸任新东方旗下东小甄商贸公司的法定代表人、董事、经理职务[9] - 娃哈哈被传临时停产70%工厂生产线,知情人士回应称公司生产经营稳定,部分工厂停工是生产排期或库存原因所致[4] - 追觅科技创始人俞浩遭恶意造谣,公司已报警处理,多名涉事人员被依法处理[10] - 黄天鹅就产品检测报告日期标注错误(将2026年误标为2027年)发布致歉声明,并宣布原分析证书作废[12][13] - 微信平台宣布将持续强化“自媒体”创作者在发布时事、虚构内容及AI生成内容时的信息来源标注要求[10]
中国软件国际(00354.HK):3月27日南向资金增持904.2万股
搜狐财经· 2026-03-28 03:17
南向资金持股动态 - 3月27日南向资金增持中国软件国际904.2万股 [1] - 近5个交易日累计净增持2160.8万股,期间5天均获增持 [1] - 近20个交易日累计净增持4961.8万股,期间15天获增持 [1] - 截至目前南向资金持有公司9.65亿股,占公司已发行普通股的35.31% [1] 公司业务概况 - 公司是一家提供全球化科技软件与信息技术服务的投资控股公司 [1] - 公司通过技术专业服务分部和互联网资讯科技服务分部两大分部运营 [1] - 公司主营业务为生成式人工智能(AIGC)研发、大模型软硬件销售和泛企业资源计划(ERP)模式的数字化转型服务咨询 [1] - 公司主要产品包括“问系列”解决方案、大模型应用一体机、灵析人工智能应用平台等 [1] - 公司主要向水利、交通、政务平台、军工、能源、教育、金融等领域提供服务 [1] - 公司在国内市场及海外市场开展业务 [1]
杨植麟当主持人的大模型圆桌:张鹏罗福莉夏立雪都放开说了
量子位· 2026-03-28 00:01
文章核心观点 本次中关村论坛汇集了中国大模型领域的顶尖专家,围绕Agent(智能体)的下一代演进、行业发展趋势、技术挑战与机遇进行了深入探讨。核心观点聚焦于:Agent框架(如OpenClaw)正成为推动大模型从对话工具转向生产力工具的关键催化剂,引发了推理需求(token消耗量)的爆发式增长,这进而对模型架构创新(尤其是长上下文与效率)、算力基础设施、以及行业生态的可持续发展提出了全新要求。专家们普遍认为,行业正从“训练时代”迈向“推理时代”,竞争维度已扩展至模型、算力、能源乃至全球化的“token经济学”层面 [5][12][32][45][65]。 对OpenClaw及Agent框架的认知与影响 - **OpenClaw被定位为革命性的“脚手架”**:它降低了使用顶尖模型能力的门槛,让非程序员也能通过简单交流构建复杂应用,其开源特性和社区参与度是成功的关键 [11][16]。 - **重新定义了模型能力的上下限**:此类框架能将次闭源水平模型的性能上限拉高,在多数场景下接近顶级闭源模型,同时通过体系化设计保证任务完成的下限(准确率)[17]。 - **带来交互模式的革新**:其IM软件嵌入方式提供了更强的“活人感”和“贾维斯”体验,区别于以往工具感更强的Agent [19][21]。 - **引爆了token使用量的激增**:从一月底开始,某基础设施厂商的token调用量每两周翻一倍,至今已增长十倍,增速堪比3G时代手机流量的普及速度 [12]。 - **激活了社区生态**:让更多非研究员参与AGI变革,推动了面向Agent的应用(skills、harness)开发,撬动了整个工具生态 [18][23]。 大模型技术演进与竞争焦点 - **中国团队的核心优势在于“算力受限下的最优解能力”**:在互联带宽等限制下,催生了如细粒度MoE、MLA等模型结构创新,追求更高的训练与推理效率 [40][42]。 - **竞争的关键是“长上下文”与“推理效率”的结合**:未来竞争不仅是做出原生适配长上下文的模型架构,更关键的是能否在100万甚至1000万级上下文下,将推理成本打下来、速度提上去 [42][43]。 - **超长上下文是模型“自迭代”的前提**:只有当上下文长度达到1000万甚至上亿级,模型才可能在复杂环境中依靠超强上下文完成对自身的持续进化 [5][44]。 - **模型正从“简单对话”转向“真正干活”**:完成复杂任务(如规划、尝试、debug)所消耗的token量是简单问答的十倍甚至百倍,这直接推动了模型能力的专门优化和定价策略的调整 [26][30]。 行业发展趋势与市场动态 - **推理需求爆发,行业进入“推理时代”**:由Agent驱动,token需求正经历十倍甚至百倍的增长,对算力基础设施构成巨大压力 [32][45][65]。 - **模型定价策略反映价值回归**:为完成复杂任务而增强的模型,因消耗token量巨大、推理成本增加,其涨价被视为回归正常商业价值,长期低价竞争不利于行业发展 [26][30]。 - **竞争维度扩展至全链路**:未来的竞争不仅是模型间的竞争,更是算力、推理芯片乃至能源层面的全方位竞争 [45]。 - **基础设施需为AI原生(Agent-native)重构**:当前云计算基础设施是为服务人类工程师设计的,未来需要能支持Agent毫秒级任务调度的“智慧化工厂”,甚至基础设施本身也应进化为智能体 [37]。 未来12个月的关键词与展望 - **生态**:Agent的发展依赖开源社区共同建设,未来软件可能不再以人类为中心,而是转向原生面向Agent(agent-native),需要整个技术栈朝此方向重构 [56][57]。 - **自进化**:在Agent框架加持下,模型能够通过可验证的目标约束进行持续自我优化,未来一两年内可能对科学研究带来指数级加速,研究效率已可提升近十倍 [59][60][61]。 - **可持续**:关注如何将中国在能源等方面的优势,通过“token工厂”持续转化为高质量token并输出全球,构建可持续的“AI Made in China”经济化迭代链路 [62][63][64]。 - **算力**:推理需求的爆发性增长使得算力成为未来12个月最关键的制约因素,确保用户“用得起、用得上”是行业发展的前提 [65]。
发布两款大模型,紫光云补上B端落地“最后一块拼图”
半导体芯闻· 2026-03-27 18:26
文章核心观点 - AI发展已从概念讨论进入价值兑现阶段,关键在于如何在B端(尤其是工业和半导体等核心生产场景)落地和变现[1] - B端AI落地面临准确性、系统性与可追责性的更高要求,其价值释放虽慢但更深更持久[1][6] - 紫光云提出,AI在B端的竞争关键在于打通模型与算力、数据、应用三个闭环,并发布了面向芯片设计和工业制造的两款垂类大模型,以嵌入产业核心流程[11][16][18] AI发展的三个阶段与B端特点 - **第一阶段“百模大战”**:核心是算力与数据驱动下的模型“智商”极限训练,使其具备理解与生成的基础能力[5][6] - **第二阶段“工具化”**:模型开始进入实际工作场景,成为生产体系中的辅助工具[6] - **第三阶段“从工具走向事业”**:AI在具体行业中承担事业,向业务主体演进,角色从“实习生”转变为具备组织决策能力的“leader”[6] - **B端与C端差异**:C端可一夜成名,B端则需要体系、生态和时间,但落地后价值更深更持久[6] B端大模型落地的挑战与解决方案 - **面临三大门槛**:数据难题(大量企业数据无法上云)、算力压力(训练与推理成本)、应用复杂度(需与既有系统深度耦合)[8] - **深层矛盾**:通用大模型是“通才”,但B端需要经过行业知识、业务规则和流程经验训练的“专才”[11] - **解决方案“三个闭环”**: - **算力闭环**:提出“三算合一”(通算、智算、超算统一承载、动态调配)的底座能力,是对既有系统的升级[13] - **数据闭环**:通过数据平台与知识平台,将分散的数据转化为可被模型利用的知识资产[13] - **应用闭环**:让模型真正嵌入业务流程,与行业应用共同形成生产能力[14] - **竞争本质**:拼的不是模型大小,而是算力、数据与应用的整合能力,让模型从“能用”走向“好用”和“用得久”[16] 紫光云发布的行业垂类大模型 - **发布背景**:紫光云此前已发布“三算合一”云底座(紫鸾6.0)、大模型一体机及知识平台,本次发布补上了行业垂类模型这最后一块拼图[16] - **两款模型战略意义**:分别对应中国产业体系中具战略意义的半导体和工业制造领域,旨在为产业发展做出贡献[18] - **紫鸾芯片设计大模型**: - **目标**:嵌入芯片设计全流程,而非做问答机器人[18] - **现实基础**:国内有近4000家半导体企业,研发体系成熟度参差不齐,芯片设计是高度复杂的系统工程[18] - **实施路径**:以平台化方式重构研发体系,提供从项目管理到算力调度的全栈研发基础设施,切入EDA与算力资源核心环节[19] - **模型架构**:采用三层体系——承担代码生成等任务的大模型、针对细分任务的专家小模型、发挥关键作用的传统算法[22] - **知识基础**:积累了大量EDA厂商手册、后端工厂资料、近千份行业文档及内部芯片企业的研发经验、代码与EDA日志[22] - **智能体与目标**:构建了覆盖设计关键环节的五类智能体,目标是将芯片设计周期从24个月压缩至12个月左右,实现5%–10%的PPA优化,并提升算力利用率[22] - **紫鸾工业图纸大模型**: - **核心认知**:图纸是制造业的“知识入口”,长期处于不可结构化、不可调用的状态[23] - **处理流程**:拆解为版面解析、信息提取、图样解析、尺寸与标注提取、标准体系融合五个环节,将图纸转化为可理解的数据结构[24] - **B端AI底线**:强调信息提取的完整性、可核验性与可追溯性,不能“选择性理解”[24] - **人机协同机制**:约90%的信息可自动处理,剩余通过人工交互完成,并构建了“AI识别+人工确认+全链路追溯”机制[24] - **关键能力**:实现100%可追溯、持续记忆和快速微调(支持企业标准快速适配)[24] - **智能体与成效**:推出五类智能体,其中图纸审查效率提升超过80%,图档转换可实现多格式解析并回写CAD系统,打通设计与制造[24] - **共同指向**:两款模型旨在将依赖经验、分散在个体中的能力,转化为可复用、可规模化的系统能力,切入研发和制造核心流程[25] 公司定位与行业展望 - 紫光云定位为AI+行业解决方案和服务提供商,将继续深耕政企市场[26] - 认为大模型落地行业没有捷径,必须深耕业务和场景才能真正成为生产力[26]
“龙虾”出现后,大模型时代的共识被推翻了
虎嗅APP· 2026-03-27 18:12
文章核心观点 - 以OpenClaw为代表的智能体(Agent)技术正在引发大模型行业从“训练时代”向“推理时代”的加速转变,其核心价值在于使大模型能够执行完整的复杂任务,而不仅仅是回答问题,这正在重塑行业的技术路线、商业模式和竞争格局 [9][10][13] 行业动态与公司进展 - 月之暗面正考虑在香港进行首次公开募股(IPO),并已与中金公司及高盛展开初步磋商 [5] - 在OpenRouter平台上,代号为Hunter Alpha的模型(即小米MiMo-V2-Pro)调用量迅速冲上榜首,显示模型厂商正从OpenClaw引发的浪潮中直接获益 [9] - 智谱AI发布了新的GLM Turbo模型,旨在从“简单的对话”转向支持完成任务的“干活”能力 [27] OpenClaw(智能体)带来的范式转变 - **任务执行取代问答交互**:OpenClaw将模型拉入任务执行环节,用户交互从“提问-回答”转向“目标-执行-迭代”,模型更像一个帮助完成完整任务链路的“脚手架” [13] - **评价体系改变**:评价重点从单轮回答质量,转向复杂任务能否稳定收敛并交付结果,同时用户对系统响应产生了“慢”的感知,因为这涉及规划、调度和试错过程 [13] - **Token消耗与属性剧变**:智能体场景下,单个任务的Token消耗是传统问答的10倍甚至100倍 [15]。无问芯穹公司的Token用量从1月底开始,每两周翻一倍 [15][26]。Token不再仅是成本指标,而是对应规划、执行、调用工具的全过程,具备了“生产力”或“机器工时”属性,这将重塑价格体系 [16] - **技术竞争维度下沉**:行业竞争焦点从模型参数规模,转向推理效率、系统调度能力甚至能源成本 [20]。随着任务复杂度上升,上下文长度(Context)迅速拉长至1M甚至10M级别,迫使厂商在推理侧进行结构创新以降低成本、提高稳定性 [18][19] 对行业生态与竞争格局的影响 - **系统能力部分抵消模型差距**:在智能体框架下,通过技能(Skill)和工具组合,次顶级模型也能完成复杂任务,模型之间的能力差距被压缩,用户更关注任务结果而非模型本身指标 [22][23] - **降低参与门槛与激发生态**:构建能力向系统工程倾斜,而不再局限于算法本身,降低了参与门槛 [24]。OpenClaw的“开源”特性有利于社区深入参与,将国内次顶级闭源模型的上限拉高,同时靠技能体系保证了下限 [26]。它点燃了行业想象力,让更多人参与AGI变革,并释放时间去做更有创造性的事 [26] - **推动架构创新**:中国大模型团队在算力受限背景下,通过对模型结构(如Hybrid、Linear Attention、Long Context Efficient设计)的创新来追求高效率与低推理成本的经验,在当前长上下文推理需求下依然重要 [30][31] - **预示未来竞争**:随着推理需求爆发,预计今年可能增长100倍,竞争维度将进一步下探到算力、推理芯片甚至能源层面 [32] 主要参与者的观点摘要 - **智谱CEO张鹏**:将OpenClaw定义为“脚手架”,使普通人能以极低门槛使用顶尖模型完成复杂任务,是重大突破 [25]。GLM Turbo模型的发布旨在优化任务执行所需的高Token消耗过程,近期提价是因任务消耗Token量为简单问答的10-100倍,旨在回归正常商业价值以支持持续优化 [27][28] - **无问芯穹创始人夏立雪**:初期感觉OpenClaw交互慢,后发现其能完成大型任务,这标志着从聊天到完成任务的想象力空间提升,但对系统能力要求增大 [25] - **小米MiMo负责人罗福莉**:认为OpenClaw是革命性事件,在智能体框架设计上领先,其最大价值在于“开源”和激发社区参与 [26]。强调在长上下文下实现低成本、高速度的推理结构创新,是激发高生产力任务和模型自迭代的关键 [30] - **香港大学助理教授黄超**:认为OpenClaw提供了“更有活人感”的体验,证明了构建智能体的框架可以既简单又高效,促使行业重新思考智能体的形态 [27]