通用Agent
搜索文档
Manus是通用Agent的未来,还是一个不可复制的孤例?
钛媒体APP· 2025-12-31 10:54
文章核心观点 - Meta以数十亿美元收购中国AI公司蝴蝶效应及其核心产品Manus,这是Meta历史上第三大收购案,创始人将出任Meta副总裁,公司保持独立运作 [1] - Manus作为一款通用AI Agent,上线不足一年便实现年度经常性收入(ARR)突破1亿美元,并在被收购前估值已达20亿美元,其高速成长与成功退出引发了关于AI Agent赛道价值与商业模式的深度讨论 [1][2] - 此次收购对Meta而言是一次关键的战略补位,旨在获取一个已跑通商业闭环的Agent样本,以弥补其在AI应用层变现能力的不足,并争夺未来人机交互的入口 [4][5][6] - Manus的成功重塑了市场对AI应用层公司价值的认知,但其作为具备综合优势的“中间层标的”属于稀缺案例,并不意味着Agent赛道将迎来普遍繁荣,行业将加速分化 [7][8][9] Manus的产品与增长路径 - Manus于2025年3月6日发布,自称是“第一款通用AI Agent”,采用“大模型+云端虚拟机”架构,能自主理解任务并直接产出交付成果,而非仅提供答案 [2] - 产品上线后增长迅猛,在不到270天内实现年度经常性收入(ARR)突破1亿美元,且增长模式为无投放、零预算的“纯产品驱动” [2] - 公司估值在短时间内急剧攀升,从2023年2月种子轮投后估值1400万美元,快速成长至2025年B轮后近5亿美元,并在被Meta收购前正以20亿美元估值进行新一轮融资 [2] - 其高速成长被部分观点视为一次精准的价值套利与理性退出,是在产品能力、收入结构、市场窗口与收购方需求间把握时机的成果 [1] 收购背后的战略考量与行业竞争 - Meta在AI领域投入数百亿美元,但在将模型能力转化为持续收入方面存在短板,缺乏连接模型与用户的“桥梁”和可立即变现的AI产品 [4] - 竞争对手如OpenAI(ChatGPT付费用户超3700万)、Google、微软等已在应用层建立商业闭环,Meta面临竞争压力 [5] - Manus为Meta提供了一个现成的解决方案:一个已跑通订阅模式、具备工程闭环和商业增量潜力的中间层系统 [5] - 对于Meta而言,收购Manus的战略意义在于获取一个“AI Agent样本”,并视Agent为未来的平台入口和“下一代操作系统”的潜在核心,旨在保住参与AI未来的门票 [5][6] Manus的挑战与收购的协同效应 - Manus的架构导致其运营成本居高不下,因其调度大量模型与任务依赖于持续性的高强度算力资源 [3] - 同时,公司面临“上游挤压(大模型厂商切入应用层)+下游资源劣势”的双重挑战,独立发展存在较高不确定性 [3] - Meta的收购为其带来了基础设施能力和全球产品生态的分发通道,解决了算力与平台难题,这是一次“有组织的战略置换” [3] 对AI Agent行业的影响与展望 - Manus的成功打破了行业对不掌握底层模型的Agent产品的轻视,证明其核心壁垒可能在于“调度与交付能力”而非原创算法 [7] - 然而,其成功案例具有特殊性,对于科技巨头而言,Agent能力重要但技术壁垒不高,更倾向于自主研发,例如字节跳动曾迅速推出类似产品 [7][8] - 因此,具备海外用户基础、全球化架构、工程化能力和顶级VC背书等综合优势,并能被巨头高价收购的“中间层标的”将成为稀缺品 [9] - 此次收购为Agent赛道设定了一个“预期高点”,但不会带来普遍繁荣,行业将加速分化,价值判断标准转向能否打造持续可用、可交付、可变现的产品系统 [9]
数十亿美金收购在赌什么?Manus倒向Meta的N个关键解读
36氪· 2025-12-30 18:38
文章核心观点 - Meta以数十亿美元的价格闪电收购了通用AI智能体公司Manus,这是Meta公司史上第三大收购案,旨在通过获取通用AI智能体的执行能力,实现从社交网络向AI智能平台的战略转型,以应对其在AI时代的竞争焦虑 [1][3][6] - 收购价格区间可能在20亿至30亿美元之间,基于Manus约20亿美元的融资前估值给予25%-50%溢价,对应其1.25亿美元年度经常性收入(ARR)的16-24倍估值倍数,符合高增长SaaS公司水平 [3][4] - 此次收购对Manus及其投资人而言是“最好的结局”和“最好的时机”,公司在成立不到3年内实现了估值从1400万美元到数十亿美元的跃升,为早期投资人带来了可观回报,同时也揭示了AI初创公司在利润率与规模化方面的瓶颈 [7][10][11] 交易详情与估值分析 - 交易金额达数十亿美元,是Meta成立以来规模第三大的收购案,仅次于收购WhatsApp(约190亿美元)和对Scale AI的战略性投资(约143亿至150亿美元)[3][4] - 收购谈判推进极快,从初步接触到最终签署仅持续十余天 [3][5] - 最可能的收购价格区间为20-30亿美元,在Manus寻求新一轮融资的20亿美元估值基础上,给予25%-50%的溢价 [3] - 估值上限应不超过50亿美元,主要受限于Manus 1.25亿美元的ARR规模,若达到40-50亿美元则被认为估值偏高 [4] - 交易完成后,Manus将保持相对独立运营,其创始人兼首席执行官肖弘将出任Meta副总裁,负责领导通用AI智能体方向的全球业务 [3] Meta的收购动机与战略考量 - Meta官方将Manus定位为其AI战略中的关键“执行层”组件,目标是将具备端到端执行能力的智能体系统整合进其庞大的社交与企业服务平台 [5] - 收购折射出Meta的转型焦虑,在AI竞争窗口期,通过收购来获取关键能力比内部开发更高效,被视为在AI赛道上“保命且翻盘的关键” [6] - Meta当前的主线故事Llama已显露疲态,需要像Manus这样的资产来破局,以避免被华尔街归类为“上一代”公司 [6] - Manus展现了极罕见的商业化速度,上线仅8个月内便实现超过1.25亿美元的ARR,其技术方案已得到验证,累计处理超过147万亿个tokens,支撑逾8000万台虚拟计算机运行 [5] - 在既有成熟产品又有用户规模的通用AI智能体公司中,Manus被认为是Meta当前最好的选择 [6] Manus的公司价值与发展路径 - Manus的产品力很强,在硅谷拥有良好口碑和人气,这是其估值的坚实根基 [1] - 公司创造了8个月内ARR突破1亿美元的增长奇迹 [7] - 公司在发展过程中做出了几个关键选择:2024年10月决定开发通用Agent产品Manus;产品海外首发并利用Anthropic等顶级模型作为底层支撑;在获得Benchmark的7500万美元B轮融资后迅速将总部迁至新加坡;果断接受Meta收购而非执着于独立上市 [7][8][9] - 公司商业模式面临挑战,作为通用Agent产品,其每次执行都需调用昂贵的大模型和云端虚拟机,导致利润率(Profit Margin)较薄,在用户规模持续增长时面临盈利瓶颈 [10] - 公司订阅价格与全球顶级大模型(SOTA)订阅价格基本持平,若不能清晰证明其比通用大模型更强,将难以与资金和用户规模更雄厚的大模型公司竞争 [10] 交易的影响与行业意义 - 对Manus及其投资人而言,此次收购带来了丰厚回报,公司估值在不到3年内从1400万美元跃升至20-30亿美元,为投资方带来了5-12倍的可观回报,例如真格基金预计获得10倍以上的整体回报 [11] - 领投其B轮7500万美元融资的Benchmark Capital,若以25亿美元收购价计算,在8个月内获得了约5倍的回报 [12] - 此次收购引发了为何最终买家是Meta而非中国公司的讨论,原因包括国内投资人早期未看懂其底层逻辑、认为估值太贵或性价比不高,以及后期估值已主要由硅谷资本主导 [11][12] - 此次收购被视为AI Agent行业的里程碑事件,也是中国新一代创业者全球竞技精神的象征 [13] - 行业共识认为,通用Agent处于大模型的“主航道”上,被大厂收购是注定的归宿 [1]
Manus卖给了Meta!年初火爆年底数十亿美元被收购
量子位· 2025-12-30 08:02
收购事件概览 - Meta宣布收购通用人工智能代理公司Manus,旨在提升其通用Agent能力[1][3] - 此次收购是Meta自成立以来的第三大收购案,收购金额达数十亿美元[5][8][9] - 收购完成后,Manus创始人肖弘将出任Meta副总裁,Manus团队将继续在新加坡运营[4][7] 收购背景与战略意义 - Meta将此次投资视为公司最高优先事项,由CEO马克·扎克伯格亲自关注[6] - 此次收购被类比为获取“智能体船票”,是Meta在AI领域的关键布局[15] - Manus在2025年早些时候的年收入已达1.25亿美元,其盈利能力被认为是Meta快速收购的原因之一[15] Manus公司发展历程 - Manus于2025年3月发布,核心产品叙事是“第一款通用Agent”,能自动拆解并执行用户任务[21] - 产品发布后迅速爆火,邀请码在二手市场被炒至数千美元,发布约两个月后估值达5亿美元[34][36][45] - 公司发展路径从微信生态B端工具,到浏览器插件AI助手,最终聚焦于能交付任务的通用Agent[28] Manus核心团队与架构 - 核心创始团队包括创始人肖弘、联合创始人兼首席科学家季逸超、合伙人张涛,以及范斌和潘潘[21][22][24][31] - 公司采用典型的出海架构:开曼控股公司全资控股新加坡实体Butterfly Effect Pte. Ltd.,再下设产品团队[56][57] - 2025年6月至7月,公司将总部迁至新加坡,原120人团队中仅40余名核心技术人员随迁,其余人员被裁撤[50][53] 产品技术与商业化进展 - 产品战略确立为“通用性平台+高频场景优化”双轮驱动,技术核心是“状态持久化”和“云端浏览器”[32][42] - 2025年3月底开始商业化,订阅价格后续调整为Pro会员20美元/月起,Team会员40美元/席/月起[40][41] - 产品持续快速迭代,至2025年12月已发布v1.6版本,支持全栈Web/移动应用开发、图像编辑等复杂功能[62] - 截至2025年12月初,Manus已处理超过147万亿个token,并创建了超过8000万台虚拟计算机[62] 关键合作与市场表现 - 2025年3月,Manus与阿里通义千问团队达成合作,旨在国产模型与算力平台实现其功能[37] - 2025年4月,获得由Benchmark领投的7500万美元融资,此前已从腾讯、红杉中国等处融资超1000万美元[43][44] - 2025年5月,产品向所有用户开放,开放首日注册量即突破100万[47] - 2025年5月,宣布与微软达成合作[48]
AI大牛张祥雨:Transformer撑不起Agent时代
第一财经· 2025-12-18 18:52
核心观点 - 当前AI领域的核心架构Transformer存在根本性技术瓶颈,其单向信息流设计导致模型在处理长上下文时智商快速下降,无法支撑具备长期记忆和持续学习能力的通用智能体(Agent)的下一步发展 [1][3][4] 行业技术瓶颈与现状 - Transformer架构是当前生成式AI和大语言模型的基石,其核心创新在于“自注意力机制” [1] - 行业看似进入“稳态”,各种创新模型架构最终都收敛到以Transformer为核心的变体上 [3] - 针对长上下文处理效率瓶颈,业界通过线性注意力、稀疏注意力等技术进行“小修小补”,但未改变Transformer的本质建模能力 [3] - 当前Transformer模型,无论宣称支持多少Token,基本上到8万个就不可用 [3] - Transformer的单向信息流设计缺乏从深层向浅层的反馈与压缩机制,与人类大脑的“无限流”记忆机制存在本质差异 [3] 技术缺陷的具体分析 - 人类大脑能对海量经历进行动态压缩和选择性回溯,而Transformer结构无法实现这种类似“无限流”世界的智能处理需求 [4] - 模型的智商会随着文本变化快速下降,制约了AI向具备高度自主性、能长期持续学习的通用Agent演进 [3][4] - 人类记忆是历史上所有信息的函数,无法用层数固定的网络来表示 [4] 行业反思与探索 - Transformer架构的共同创造者Llion Jones已开始寻找下一次重大突破,并警告研究者因过度依赖现有架构而错失下一个重大突破的风险正在加剧 [4] - Mamba、TTT(Test-Time Training)等新架构正吸引越来越多目光 [4] - 英伟达、Meta、腾讯等巨头已在探索将Mamba与Transformer融合 [4] - 中国科学院自动化所与沐曦合作研发的类脑脉冲大模型“瞬悉1.0”,展示了构建非Transformer架构生态的可行性 [4] 公司研发动态 - 阶跃星辰团队正在探索新的架构方向,一些小规模实验已取得积极结论 [5] - 公司认为未来的架构可能是基于非线性递归网络的全新架构 [5] - 这种架构革新将给系统效率和可并行度带来巨大挑战,需要协同设计才能落地 [5]
昆仑万维方汉:通用Agent是伪命题,AI Office仍有存在空间丨MEET2026
量子位· 2025-12-15 13:57
文章核心观点 - AI技术正经历从通用大模型到可执行智能体的拐点,其底层动力是推理能力提升和长思维链成熟后,“过程”开始被批量学习与调用 [1][3] - 智能体(Agent)的本质并非通用人工智能(AGI),而是一种可验证过程的自动化系统,擅长将已被人类验证过的流程规模化复制,但不擅长创造新范式 [2][12][16] - 智能体将最先落地于流程稳定、结果可验证的AI Office场景,并最终重塑公司组织,使人类从重复执行者转变为过程的架构者 [5][12][28] 昆仑万维公司介绍与业务 - 公司成立于2008年,2015年上市,业务覆盖全球100多个国家和地区,全球月活用户近4亿 [8] - 2024年前三季度公司营收58亿,其中海外收入占比高达93% [8] - 公司自2020年开始AI业务,2022年12月发布中国首个开源的13B中文预训练大模型,2024年5月推出Skywork Super Agents产品 [8] - 公司AI音乐Mureka、Skywork Super Agents、AI社交Linky在海外已产生实际收入并高速成长 [11] Skywork Super Agents产品特性 - 产品形态为从通用到专业的智能体,包括五个专家Agent和一个通用Agent [11][12] - 其PPT模式可在5分钟内生成30页PPT,该模式占当前日活跃用户(DAU)的40%,是用户使用量和好评量双排名第一的功能 [11][12] - 产品具备强大的多模态输出能力,可一键生成Word、PPT、Excel、播客、视频、小程序等内容,并支持上传多种格式文件、录音、网址进行内容生成 [13] - 产品所有内容附带清晰可追溯的参考文献,旨在彻底解决AI幻觉问题 [13] - 自2024年5月22日发布后,产品在下半年进行了紧密迭代,不断增加智能体种类并升级功能 [15] 对智能体(Agent)的行业认知 - 技术拐点出现:大模型完成了从“背答案”到“背过程”的关键跃迁,以ChatGPT为起点,到DeepSeek等模型通过更高效、更长推理的方式,实现了过程的泛化 [5][18] - 智能体大行其道的根本逻辑在于“过程可学习”实现了大规模的工业化和产业化 [20] - 智能体擅长数学、代码和结构化决策,但不擅长创新、范式突破和新框架 [12][16][19] 智能体的落地场景与挑战 - **首要落地场景**:AI Office,因其流程稳定、跨行业使用、结果可验证 [12][21] - **垂类场景挑战**:医疗、金融、建筑、法律、制造等行业缺乏高质量的过程数据集,这是阻碍智能体在这些领域应用的关键问题 [21][24] - **类比历史**:智能体的发展类似PC操作系统,通用智能体可能是一个伪命题,而像AI Office这样的通用产品以及各行业的专业软件将共存 [25] 通用智能体的渠道竞争格局 - **操作系统与硬件**:对于手机上的通用智能体,只有硬件手机厂商才能决定其设备上可以安装什么,其他智能体厂商不具备此能力 [12][26] - **浏览器**:被视为相对公平的渠道,因为全球主要浏览器(如Chrome、Firefox、Edge、Opera)数量有限且开放插件生态 [26] - **办公软件**:如飞书、钉钉、WPS、Office是重要入口,但办公软件需求是长尾市场,仍为第三方软件留有空间 [26] - **即时通讯**:由于社交网络效应,垄断性更强,作为通用智能体入口,其他厂商难以介入 [27] - **搜索引擎**:大模型聊天机器人(如ChatGPT、豆包、千问)本质上是分食传统搜索引擎市场,而搜索引擎在每个国家通常只会有1到2个胜利者 [27] 智能体时代对组织与人类角色的影响 - **组织重塑**:公司内部的流程属于过程数据,只要可验证就可以被智能体自动化,每个岗位将变成智能体的执行上下文 [12][28] - **角色转变**:重复操作的岗位将消失,人类员工将转变为“过程架构师”或“过程设计者”,负责维护旧流程和创造新流程 [12][28][31] - **类比黑灯工厂**:如同黑灯工厂的员工负责制造流程的维护与迭代,未来人类将成为智能体流程的维护者和创造者 [28][29]
原神Agent,字节出品
猿大侠· 2025-11-16 12:11
文章核心观点 - 字节公司开发出名为Lumine的原神Agent,该智能体不仅能自主完成《原神》游戏内的跑图、战斗、解谜等复杂任务,还具备强大的跨游戏泛化能力,可在《鸣潮》、《崩坏:星穹铁道》及《黑神话:悟空》等未学习过的游戏中执行任务,代表了在3D开放世界中构建通用智能体(AGI)的重要进展[1][4][46][55] Lumine Agent的核心能力 - 在《原神》中能动态追踪敌人位置、精准射击、流畅切换角色并收集宝箱[4] - 具备超强理解能力,可应对Boss战[6]和空间感知能力,能完成沿风场收集风神瞳等解谜关卡[8] - 能在多NPC环境中锁定指定对象并完成对话[10],并通过鼠标移动完成材料制作、使用传送锚点等GUI操作[12] - 对于复杂长指令,只需提供任务先验信息或步骤即可执行,例如切换特定角色并释放技能以完成收集任务[14] 技术架构与核心机制 - 基于Qwen2-VL-7B-Base模型搭建,继承其多模态理解与生成能力[16] - 采用类人交互范式,通过统一语言空间建模所有操作和推理,实现感知、推理、行动的无缝融合[17] - 感知空间将游戏画面帧调整至720P,以每200ms速度处理一帧,并保留历史推理轨迹与动作记录以提供决策上下文[20][21] - 采用混合思考策略,仅在关键场景生成内心独白式推理,简单场景则直接输出动作以提高效率[22] - 将所有键盘与鼠标操作纳入语言空间,定义为鼠标位移和按键序列的格式[23] 三阶段训练流程 - 第一阶段预训练混合80%游戏动作数据和20%多模态网页数据,使模型掌握基础视觉运动能力,涌现出物体交互、基础战斗等核心能力[25][26] - 第二阶段指令跟随训练使用38类任务场景下的200小时数据,使模型理解自然语言指令,关联动作与语言,可完成10秒至数分钟短周期任务且成功率超80%[27][28] - 第三阶段决策推理训练使用15小时人工标注推理数据,让模型学会自主规划、反思与修正,从而能自主完成数小时以上的长周期任务[29][30] 性能优化与实验结果 - 通过上下文管理和多维度实时优化,包括滑动窗口机制与推理触发刷新策略,并将端到端延迟降至129.8ms[31][32][33] - Lumine-Base在无语言指令下,基础交互能力总成功率超90%,能自发运用元素反应和理解体力值限制等游戏机制[39] - Lumine-Instruct在语言指令驱动的短周期任务中,简单任务成功率达92.5%,困难任务成功率达76.8%,远超其他主流视觉语言模型[41] - Lumine-Thinking在长剧情任务中,完成蒙德主线第一章耗时56分钟且完成率100%,第二、三章合计耗时4.7小时且完成率98.2%[44][45] 跨游戏泛化能力 - 在相似玩法的《鸣潮》中,前100分钟剧情总耗时102分钟且完成率100%[48] - 在玩法差异较大的《崩坏:星穹铁道》中,通过第一章主线总耗时7.2小时且完成率92.3%,是唯一能完整通关的模型[48] - 在高难度3A游戏《黑神话:悟空》中,完成新手教程和第一章前半段耗时2.1小时且完成率85.7%[49] 行业趋势与意义 - 谷歌等公司也在使用游戏场景训练Agent,例如其基于Gemini模型的SIMA 2,具备遵循指令和强大推理能力[52][53] - 字节和谷歌DeepMind代表了一条清晰的Agent发展路径:在大型3D游戏中构建具身AGI,并相信游戏内的通用Agent终将进入现实物理世界[55][56]
原神Agent,字节出品
量子位· 2025-11-14 20:10
文章核心观点 - 字节公司推出专为3D开放世界游戏设计的智能体Lumine,该智能体能够自主完成《原神》等游戏中的跑图、战斗、解谜及长周期主线任务,并展现出强大的跨游戏泛化能力 [1][4][9] - Lumine智能体基于Qwen2-VL-7B-Base模型构建,通过三大核心机制设计和三阶段训练流程,实现了感知、推理、行动的无缝融合,在多项测试中性能显著领先于主流视觉语言模型 [9][10][12][17][22][24] - 行业趋势显示,谷歌等公司也在利用游戏场景训练通用智能体,游戏被视为构建具身通用人工智能的重要试验场,代表了一条清晰的Agent发展路径 [46][48][51] Lumine智能体的核心能力 - 在《原神》中能够动态追踪敌人位置、精准射击、流畅切换角色、收集宝箱,并成功应对Boss战和各种解谜关卡 [4][5][6] - 具备空间感知能力,能沿风场方向收集风神瞳,并在多NPC环境中锁定指定对象完成对话 [6] - 可处理GUI操作,如材料制作、使用传送锚点、切换角色武器,通过鼠标移动完成 [7] - 对于复杂长指令,只需提供任务先验信息或步骤,即可自主执行,例如切换角色并释放技能完成特定收集任务 [8] 技术架构与训练方法 - 感知空间将游戏画面帧调整至720P,以每200ms处理一帧的速度平衡文本可读性和计算效率,并保留历史推理轨迹与动作记录以提供完整上下文 [12][13] - 采用混合思考策略,仅在关键场景生成内心独白式推理,简单场景直接输出动作,提高计算效率 [14] - 通过键盘与鼠标操作建模,将所有操作纳入语言空间,定义为鼠标位移和按键序列格式 [15] - 三阶段训练流程:预训练阶段混合80%游戏动作数据和20%多模态网页数据,使模型掌握基础动作;指令跟随训练使用200小时数据,使短周期任务成功率超80%;决策推理训练使用15小时人工标注数据,使模型能自主完成长周期任务 [17][20][21][22][23][24] 性能表现与实验结果 - Lumine-Instruct在短周期任务中表现优异,简单任务成功率92.5%,困难任务成功率76.8%,显著领先于GPT-5和Gemini 2.5 Pro [33][34][35] - Lumine-Thinking在长周期任务中效率突出,完成《原神》蒙德主线第一章耗时56分钟,任务完成率100%,而GPT-5耗时112分钟,Gemini 2.5 Pro未完成 [40][41] - 跨游戏测试显示,Lumine-Thinking在《鸣潮》前100分钟剧情完成率100%,在《崩坏·星穹铁道》第一章完成率92.3%,在《黑神话·悟空》新手教程及第一章完成率85.7% [43][45] 行业动态与竞品分析 - 谷歌推出基于Gemini模型的SIMA 2智能体,能够遵循基本指令、理解多模态提示、完成长时间复杂任务,并在生成的世界中合理自我定位 [48][49] - 行业共识认为,在大型3D游戏中训练通用智能体是构建具身AGI的重要路径,游戏内的Agent未来有望进入现实物理世界 [51][52]
Meta最新论文解读:别卷刷榜了,AI Agent的下一个战场是“中训练”
36氪· 2025-10-13 15:19
AI行业竞争焦点转变 - 2025年AI竞争焦点从跑分比拼转向Agent自主完成复杂长程任务的能力 [1] - 行业巨头如xAI和Anthropic发布新品时均强调同一能力 [1] - AI的下一战场被明确为通用Agent [2] Agent落地的现实瓶颈 - 除编程领域外,Agent落地应用寥寥无几 [2] - 核心瓶颈之一是反馈机制的困境 [2] - 现有反馈机制要么太弱要么太贵,阻碍预训练模型蜕变为强大Agent [2] 主流Agent训练方法的局限性 - 模仿学习(监督微调)依赖昂贵静态反馈,高质量专家数据难以大规模生产 [4] - 模仿学习导致模型泛化能力极差,无法适应训练数据外的情况 [4] - 强化学习依赖复杂动态反馈,在真实世界任务中奖励信号常缺失、稀疏或延迟 [5] - 强化学习应用高度依赖精心设计的奖励函数或人工调整的训练流程 [5] Meta提出的“中训练”范式 - Meta等机构在2025年10月论文中提出“早期经验”的“中训练”范式 [2][7] - 该范式利用Agent自己探索产生的状态变化作为宝贵的学习信号 [7] - 设计两种具体训练策略:隐式世界建模和自我反思 [7] 隐式世界建模策略 - 让Agent学会预测“如果我这么做,世界会变成什么样” [9] - 具体步骤包括自我尝试、记录数据、微调训练预测能力 [9] - 通过大量“作死”和观察后果,让Agent悟出世界运行规律 [10] 自我反思策略 - 让Agent学会解释“为什么专家的做法比我的其他想法更好” [11] - 具体步骤包括自我尝试、教练点评、微调训练预思考能力 [11] - 训练Agent学会先生成反思推理再输出正确动作 [11] “中训练”范式的有效性验证 - 在8个多样化环境中测试显示,平均成功率比传统模仿学习提升9.6% [15] - 在未见过的任务上表现提升9.4%,显示强大泛化能力 [15] - 作为强化学习初始化时,最终性能提升最多6.4% [15] - 提升在不同复杂度的环境中保持稳定 [17] “中训练”的理论基础与价值 - 谷歌DeepMind研究证明成功Agent内部必须拥有准确“世界模型” [18] - 传统模仿学习只学习从状态到行为的浅层映射 [20] - “早期经验”补上了建立世界因果理解的关键课程 [21] - 可能需“预训练+中训练+后训练”三段式训练范式通往通用Agent [23] 参数效率与新Scaling Law可能性 - “早期经验”展示通过自我递归训练释放参数潜力的可能性 [25][27] - 700M参数小模型经训练后可在某些任务上超越参数量大十几倍的大模型 [25] - 传统增加参数量的做法边际收益递减很快 [27] - 可能预示一个新的属于Test Time Compute的Scaling Law [28]
朱啸虎:搬离中国,假装不是中国AI创业公司,是没有用的
虎嗅· 2025-09-20 22:15
开源AI模型趋势 - DeepSeek等中国开源模型显著影响行业 保证AI技术不被少数私有化公司控制 开源成为AI领域主流趋势[3] - Hugging Face平台中国开源模型下载量已超过美国 开源模型与闭源模型能力差距正迅速缩小 预计半年到一年内可齐头并进[4] - 形成"中国开源vs美国闭源"竞争格局 美国开发者也在采用开源模型 开源生态一旦建立将形成长期壁垒[5][6][7][9] AI应用核心壁垒 - Manus案例显示Go-to-Market能力是关键壁垒 中国创业者技术能力不逊色但市场进入策略存在短板[10] - AI应用公司首要壁垒是发展速度 需要让竞争对手感到绝望的快速增长 其次才是用户留存能力[11] - 中美市场存在Token消耗差异 中国更关注Token消耗量作为"含AI量"指标 日均消耗达百亿级别 大厂提供补贴使性价比显著提升[12][13][14] AI编程赛道分析 - AI编程是大厂主导领域 中美都在进行补贴 美国补贴AI Coding 中国补贴外卖 几乎都是负毛利运营[15] - Cursor从月费改为按流量收费 显示ARR难以维持 负毛利达300%-500% 收入增长越快VC补贴压力越大[16] - 程序员群体忠诚度低 对价格和性能高度敏感 切换成本极低 OpenAI的API调用量曾因Gemini新版本发布而急剧下降[18] 机器人投资策略 - 重点关注能实际干活的"牛马型机器人" 如洗船机器人和按摩机器人 虽然外观不讨巧但能创造真实商业价值[21] - 按摩机器人不仅能按摩理疗 还能实现卖卡功能 转化率甚至高于人工 真正取代整个岗位而非"半个人"[22][23] - 机器人ROI计算必须完整取代岗位 很多创业公司陷入只能取代"半个人"的陷阱 导致ROI测算不真实[22] AI硬件发展逻辑 - AI硬件成功关键是做减法而非加法 优先保证大批量发货能力 许多公司因添加花哨功能无法交货而失败[28] - Plaud案例显示应选择小切入点 使用成熟技术实现商业化 FuzozoAI玩具本质是游戏玩法创新 AI只是噱头[28] - AI时代独有新硬件物种尚未出现 取代手机非常困难 电池 存储 联网等技术瓶颈可能需要10-20年突破[29][30] 全球化战略 - 中国C端App在全球市场具有绝对优势 过去十年超过百亿美金的C端App几乎全是中国创业者开发 美国VC已基本不投Consumer领域[37] - To B应用面临Go-to-Market挑战 PLG模式可做到2000-3000万美金ARR 但要突破5000万美金必须转型SLG模式[38][39] - 出海市场选择取决于团队背景 F-35级别打美国市场 F-20级别打日本市场 F-16级别打东南亚市场[39] 估值与资本环境 - 高估值会压缩犯错空间 移动互联网时代很多大厂高管创业即获5000万美金估值 但产品上线后第二轮融资就失败[43] - 中国美元基金资金量减少 因大量LP资金被锁在字节 小红书 蚂蚁等未上市公司 总市值约1.5-2万亿美金[45] - 香港成为主要IPO目的地 中国企业应选择在香港上市 全球投资人都认可香港市场的资产购买价值[47] AI创业投资策略 - 投资回报期指现金回收时间 希望市场投放资金在3-6个月内回笼 最佳情况是首月投1元收回0.8元 六个月后能收回2元[50] - 早期投资更关注用户参与度指标 如日活率 周活率 留存率 使用时长等 而非仅看收入数据[51] - AI时代演化速度是移动互联网的三倍速 创业者需在离大厂三条马路之外寻找机会 并以三倍速发展[53]
AutoGLM2.0升级发布,智谱:给每个手机装上通用Agent
新浪科技· 2025-08-20 15:45
产品升级 - AutoGLM 2.0突破硬件限制 可在任何设备及场景下运行[1] - 从1.0有限场景升级为云端自主执行型助手[1] - 配备专属智能体手机/电脑 无需占用用户本地设备[1] 生活场景应用 - 支持操作美团、京东、小红书、抖音等数十个高频应用[1] - 实现点外卖、订机票、查房源等生活服务功能[1] - 可通过语音指令完成具体消费行为如购买奶茶[1] 办公场景应用 - 跨网站操作飞书、网易邮箱、知乎、微博等网页平台[1] - 覆盖信息检索、内容撰写、生成视频/PPT/播客全流程[1] - 直接完成社交媒体平台内容发布功能[1] 技术实现方式 - 云端自主完成任务 用户可同步使用其他APP[1] - 实现多任务并行处理能力[1] - 突破本地硬件资源限制[1]