Workflow
Operator
icon
搜索文档
AI Agent:超级助手,重塑人类生活和商业
泽平宏观· 2026-02-05 00:06
AI Agent的定义与核心价值 - AI Agent是具备行动力的代理式AI,核心区别在于能从生成内容转向执行行动,拥有“大脑规划+工具调用+记忆经验”的能力 [4][10][13] - AI Agent是AI发展的第三阶段,标志着从“对话AI”到“干活AI”的本质跃迁,最终目标是实现具身智能AI [7][10] - 根据能力分级,AI Agent属于Level 3,是可执行行动的系统,高于仅具备对话或推理能力的AI [12] AI Agent带来的未来生活改变 - **APP后台化与商业模式重构**:未来手机界面可能简化,AI Agent在后台直接调度各应用服务,用户无需操作具体APP,这将冲击现有的流量和广告商业模式 [14] - **操作系统拟人化**:未来的操作系统将演变为全知全能的智能管家,能主动预测并满足用户需求,实现系统完全服务于人 [14] - **人类角色转变**:AI Agent将接管大部分执行工作,人类的核心价值将转向决策与审美,个人借助Agent团队可实现远超传统公司的生产力 [15] AI Agent的行业竞争格局 - **全球科技巨头卡位战**:Meta拟以数百亿美元收购Manus,引发对AI Agent超级入口的争夺,证明中国AI企业已具备全球产品与工程竞争力 [17] - **主要厂商战略路径**: - OpenAI推出系统级Agent“Operator”,在处理多步骤复杂任务时成功率已达70% [18] - 微软推出“Windows 365 for Agents”平台,专注于智能体管理和工作流程预测 [18] - Anthropic专注于提供底层的“Computer Use”API能力,定位为基础设施提供商 [18] - 谷歌通过“Project Jarvis”接管Chrome浏览器,并将Gemini Nano植入安卓系统以守住入口 [19] - 马斯克的Grok致力于与特斯拉汽车和Optimus机器人结合,向物理世界操控拓展 [19] - **中国大厂布局差异**: - 字节跳动聚焦平台化工具“扣子空间”构建技能生态,并与中兴合作推出豆包手机,但遭遇生态围剿 [20] - 阿里巴巴利用其商业生态,将通义千问打造成智能调度中枢,直接调用集团内部服务 [5][20] - 百度结合网盘、文库等优势,将智能体定位为“超级个人助手”,专注于个人知识管理与生产力 [20] AI Agent的关键技术趋势:协议标准化 - **MCP协议成为AI世界的“Type-C接口”**:由Anthropic提出,现已成为行业通用连接标准,支持大模型与外部工具的即插即用,极大提升了AI Agent调用技能的效率 [22][24] - **MCP协议的应用案例**:例如,Claude通过MCP可打通Notion、Linear和GitHub等系统;Coinbase推出基于MCP的Agent Wallet;国内支付宝、高德地图、百度系应用也提供了MCP Server服务 [25] - **A2A协议解决“机机交互”**:由谷歌提出,旨在实现不同AI Agent之间的直接对话与协作,未来互联网可能从APP群岛转变为Agent联盟 [26][27] AI Agent落地的主要挑战与未来展望 - **核心挑战是利益重构**:AI Agent绕过APP界面直接调用底层服务,动摇了互联网公司依赖广告、用户时长和数据的商业模式,引发了关于流量与入口控制权的争夺 [3][31] - **生态冲突的现实案例**:字节跳动推出的豆包手机因试图通过屏幕读取和模拟点击操控第三方APP,遭遇微信、淘宝、银行APP的强力反制,导致核心功能受阻 [32] - **可能的解决方案与商业模式演变**:未来可能出现“Service-as-an-API”模式,即应用提供“Agent专用付费接口”并收取“Agent税”,商业模式从追求用户时长转向追求交易并发量 [33]
速递 | Mac mini遭疯抢!Clawdbot爆火背后,藏着半年窗口期的暴富机会
文章核心观点 - 开源AI助手项目Clawdbot的爆火,标志着AI正从“对话工具”向“执行伙伴”发生范式转变,这背后是技术成熟、用户需求与生态争夺的三重叠加,并预示着一个巨大的赛道机会,但其窗口期可能仅有半年[1][24] 为何现在爆火?不是新东西,却踩中了临界点 - 类似技术(如Anthropic的Computer Use)去年已出现但未普及,主要因其需要API调用和编程知识,门槛过高[5] - Clawdbot成功将技术产品化,用户无需懂技术,通过Telegram或WhatsApp等常用通讯工具即可指挥AI执行任务,实现了极低的使用门槛[5] - 该AI助手可7×24小时不间断运行,像一个永在线的私人管家[5] 核心区别:从“对话工具”到“执行伙伴”的质变 - 与传统聊天机器人(如ChatGPT)本质不同,后者是对话工具,仅提供信息,需要用户手动执行[8] - Clawdbot是执行者,能根据用户指令直接操作电脑完成任务,例如整理报销发票、管理家庭生意、生成健康报告等,实现了从“出主意”到“干完活”的质变[8] 爆火三要素:技术、门槛与隐私刚需 - **技术临界点**:Claude 3.7 Sonnet等新一代模型编程能力大幅提升(SWE-bench测试成绩创新高),使其能写出可靠代码来执行复杂任务[10] - **门槛极低**:无需新设备,旧笔记本或每月五美金的云服务器即可运行,成本低、上手快[10] - **隐私刚需**:与多数需上传数据至云端的AI工具不同,Clawdbot主要在本地运行,数据保存在用户自有设备,满足了企业及隐私敏感型用户的强烈需求[10] 隐藏风险:AI权限背后的安全漏洞 - 赋予AI最高权限(可读取所有文件、安装软件、修改系统配置)存在巨大安全隐患[13] - 已有安全研究员披露Clawdbot存在超过五百个漏洞,包括提示注入攻击和远程代码执行风险[13] 竞品博弈:AI agent的战争,是生态之争 - 国内存在类似竞品,如字节跳动与中兴合作的豆包手机,其AI能跨应用操作(如订机票、酒店)[15] - 此类AI agent面临平台封禁,因其绕过了应用界面,直接动摇了各平台通过界面、算法和广告位构建的生态与流量入口[15] - AI agent的竞争本质是生态与入口之争,巨头如OpenAI(Operator)、Google、Anthropic(Claude Code)以及国内的智谱(AutoGLM)、零一万物等均在积极布局,争夺下一代入口[16] 创业方向:三个可落地的暴富机会 - **垂直场景的AI agent**:避开与巨头的通用领域竞争,专注于法律文书、电商选品、财务审核等有明确工作流和ROI的细分场景,企业付费意愿强,可实现“小而美”的快速启动与盈利[19][20] - **AI agent的基础设施和工具链**:针对企业级需求,开发解决安全、权限管理、多智能体协调等问题的管理平台、监控审计系统或编排平台,技术壁垒高,护城河深[21] - **端侧AI的硬件和芯片**:Clawdbot热潮带动了Mac mini等设备需求,未来专为AI agent设计的低成本、低功耗硬件(如小型服务器、AI盒子)及端侧AI芯片市场潜力巨大,这与云计算集中化趋势相反,受隐私、成本和实时性需求驱动[22] 机会窗口期 - 机会窗口期可能仅有半年,因各大公司正在加速布局,巨头产品成熟后将快速定局[23] - AI agent赛道先发优势明显,AI会学习用户习惯形成路径依赖,早期用户难以被后来者抢夺[23]
智能体不再 “偏科”,OpenAI、讯飞、千问等各显神通
AI研究所· 2026-01-26 17:33
市场概况与政策驱动 - 2025年中国智能体市场规模已达78.4亿元,预计2026年增速将超过70% [1] - 制造、能源、金融、政务四大领域需求占比超70% [1] - 政策层面,《“人工智能 + 制造”专项行动实施意见》明确提出培育1000个高水平工业智能体 [1] 行业核心痛点与挑战 - 传统智能体多依赖单一模态交互,难以应对复杂场景 [2] - 定制开发成本高,限制了中小企业参与 [2] - 部分产品执行链路不完整,无法实现“数据-决策-执行”闭环 [2] 技术突破:多模态交互升级 - 多模态融合已成为头部企业的共同选择,旨在提升智能体对环境的感知与需求理解能力 [4] - 阿里千问采用多模态扩展架构,将图像、音频、GUI界面等不同模态映射至统一语义空间,实现同步处理与融合理解 [5] - 智谱AI旗下CogAgent通过多模态感知实现全GUI空间交互,能以视觉形式感知界面并模拟人类进行点击、输入等操作 [5] - OpenAI旗下智能体Operator具备与图形用户界面交互的能力,可模拟人类在电脑上的操作行为完成任务 [5] - 科大讯飞星辰智能体平台打通语音、视觉、动作、业务流等多模态能力,整合AIUI全链路技术实现1.6秒极速响应 [8] - 星辰平台搭配多麦克风阵列降噪等技术,在-5dB高噪场景中也能保持92%以上的交互成功率 [8] - 阿里千问通过跨应用数据协同,实现文本、支付、物流等多维度信息整合调用 [11] - OpenAI产品强化自然语言理解与工具调用的协同,提升复杂任务执行精度 [11] 技术突破:降低开发门槛 - 星辰智能体平台通过原生MaaS架构,一键连接超50个业界优质开源模型,提供一句话精调、零代码可视化精调等多种定制方式 [12] - 平台深度集成原生RPA功能与AI原子能力,接入行业通用MCP工具,让智能体具备执行与链接能力 [12] - 阿里千问通过简化应用接入流程,让企业无需复杂适配即可实现智能体与现有业务对接 [13] - 智谱AI的Auto框架聚焦终端设备的快速赋能,降低移动场景部署成本 [13] - 星辰智能体推出的Astron开源项目基于Apache2.0协议,支持核心能力二次开发,在GitHub已获得13k+ Star [13] 生态构建与场景落地 - 星辰智能体平台在海外市场聚焦中东、东南亚区域,覆盖公共服务、基建招投标等八大场景,通过本地化部署提供适配服务 [15] - 其海外应用覆盖从数千页基建标书的自动分析,到多语言实时出行引导,再到复杂合同合规风险透视等场景 [15] - 阿里千问重点发力消费服务场景,实现外卖、购物、出行等高频需求的智能协同 [18] - 商汤医疗聚焦医疗领域,其肝脏智慧诊疗智能体实现分钟级三维重建,已在多家头部医疗机构落地 [18] - 星辰智能体依托讯飞开放平台资源积累,该平台聚集超过1026.5万开发者团队,累计覆盖终端设备42.8亿台 [18] - 平台在国内聚焦开发者赋能,在海外设立区域总部与本地化团队,构建全球化生态网络 [18] - OpenAI通过API开放策略,让第三方开发者能基于其核心能力构建垂直场景智能体 [18] - 阿里借助自身生态优势,实现智能体与电商、支付、物流等业务的深度融合 [19] - 智谱AI通过“工具赋能 + 创业辅导”模式,加速培育AI原生企业,丰富产业生态 [19] 行业发展趋势 - 智能体产业正处于从技术探索向规模化落地转型的关键阶段 [21] - 未来智能体的发展将更注重场景适配的精准性、开发的便捷性与生态的开放性 [21] - 企业与开发者的协同创新将成为产业进步的重要动力 [21]
爆发时刻?科技大厂纷纷布局,AI Agent商业化落地加速
证券时报· 2026-01-19 08:38
文章核心观点 - 人工智能体已从技术概念跃入商业现实,正式迎来爆发时刻,其作为推动AI从“辅助工具”向“核心生产力”跃迁的关键形态,正重构产业逻辑并激活万亿级市场潜力 [1] 科技大厂布局人工智能体 - 人工智能体是由大语言模型动态指挥流程和工具使用的系统,其模式是“人给个目标,AI自己想办法”,区别于传统“人写好剧本,AI照着演”的工作流 [3] - 人工智能体能够调用工具、完成复杂任务、与外部系统集成及持续运行,可真正替代人完成部分工作,而不仅仅是辅助回答问题 [3] - 根据OpenAI分级,人工智能体处于L3阶段,即“能决策、会用工具”的新阶段,这得益于大模型能力提升、API成本下降、开源生态成熟及算力升级等多重因素推动 [3] - OpenAI于2025年1月发布人工智能体产品Operator,可模拟人类操作计算机完成在线订餐、购买机票等任务 [4] - Monica于2025年3月发布全球首款通用型AI智能体Manus,具备复杂任务自主处理能力,可完成筛选简历、旅行规划、股票分析等任务 [4] - 阿里巴巴近期发布升级后的应用千问,其关键变化在于以智能体形式在后台自动完成跨应用协同,用户只需一句话即可自动完成如飞猪查机酒、淘宝选商品、闪购备补给、支付宝支付等完整流程 [5] 商业化落地与细分领域突破 - 人工智能体在2026年将迎来爆发,特别是垂直类智能体 [7] - 金融行业是落地领域之一,例如华通金融推出面向专业投资者的应用,通过一组AI助手将投资决策流程自动化,为用户提供包括买卖时机在内的投资建议,但最终决策权仍在用户手中 [7] - 编程是智能体更早落地的领域,如Claude Code、Cursor、Codex等编程智能体已能理解需求、读取项目代码、修改文件、运行测试,自主完成整个开发流程 [7] - 当前全球AI编程市场规模约30亿美元,预计2030年将达230亿美元,远期潜在空间更接近7000亿美元 [7] - AI编程行业前三的市场份额已接近70%,呈现“工具塑造用户习惯、头部效应显著”的市场格局 [7] - AI Agent的商业化落地呈现“全行业渗透、高价值聚焦”特征,其中金融、编程、政务等领域率先突破,成为技术赋能的标杆场景 [8] 市场前景与驱动因素 - 据亿欧智库预测,2024年中国人工智能体市场规模达1473亿元,企业渗透率不足5%,预计到2028年市场规模将突破3.3万亿元 [10] - 企业级智能体更受青睐,根据MarketsandMarkets研究报告,预计2025年企业级智能体市场份额将超过消费级Agent市场 [11] - 根据Gartner测算,2024年仅约1%的企业软件内置AI智能体功能,但到2028年,这一比例有望飙升至33%,届时约15%的日常业务决策将可由AI自动完成 [11] - 政策支持与技术突破形成双重驱动力,工信部“人工智能+制造”行动、政务智能体发展规划等政策密集出台,为行业发展保驾护航 [11] - 随着多模态融合、低能耗算法等技术创新,AI Agent的可靠性、可解释性持续提升,将加速在更多关键领域的渗透 [11] - 人工智能体目前仍处于早期阶段,当前主要挑战包括门槛较高、安全问题和可靠性 [11] - 近期科技大厂密集入场,本质上是看到了智能体的巨大潜力,旨在抢占生态位,谁能率先建立丰富的生态,谁就能在下一阶段占据优势 [11]
收购“Manus”也治不好大厂的焦虑症
36氪· 2026-01-05 19:24
Meta收购Manus的交易概况 - Meta于2025年最后一天宣布收购AI Agent创业公司Manus,交易金额约20亿美元,几乎是“闪电成交”[1] - 被收购方Manus总部位于新加坡,由几位中国创业者创立,成立仅三年,专注于Agent层,不做基座模型[1] - Manus于2025年3月发布产品,在8个月内实现了1.25亿美元的年化收入,年度经常性收入突破1亿美元[1][6] Meta收购的背景与动机 - Meta的焦虑源于其基座模型能力落后,2025年4月发布的Llama 4系列模型(最高参数量2万亿)在发布72小时后即因实际表现与基准测试不符而引发“翻车”争议[2] - 竞争对手如Anthropic的Claude、Google的Gemini、OpenAI的GPT系列在模型迭代、多模态能力及Agent产品上持续领先,而Meta的“个人超级智能助手”愿景仍停留在PPT阶段[3] - Meta的收入高度依赖广告,而AI Agent可能改变用户意图的解释权和注意力捕获模式,对传统广告构成威胁[5] - 为弥补能力短板,Meta于2025年6月以143亿美元战略投资Scale AI并挖来其创始人担任首席AI官,但后续出现高管摩擦、核心人员离职等整合问题[3][14] Manus被收购的考量与机遇 - Manus自身不研发底层大模型,产品体验依赖调用Anthropic的Claude等第三方API,面临可变成本和供应链风险[5] - 作为创始团队和早期研发在中国的公司,即便迁至新加坡并清退中国业务,在美国市场获得完全信任仍异常艰难,被收购是规避地缘博弈风险的路径[5] - 收购使Manus团队实现财富自由,其产品有机会深度集成至Meta旗下Facebook、Instagram、WhatsApp等每日数十亿用户活跃的平台中[7] - Meta主导的Llama开源大模型生态可为Manus提供稳定、可控且低成本的底层技术支撑[7] 资本市场与行业反应 - 收购消息公布后,Meta股价连续两个交易日下跌,表明资本市场对该交易能否为公司带来改变持怀疑态度[1] - 交易在创投圈引发震动,促使多家VC在元旦假期加班研究其投资组合中是否有可被大厂收购的AI Agent公司[1] - 此次收购为国内科技大厂提供了定价参考,可能推高类似AI Agent创业公司的收购价码[1] 科技巨头的“焦虑”与不同应对策略 - 科技巨头普遍面临AI时代底层能力建设跟不上产品化需求的困惑,纷纷采取“买人、买团队、买时间”的策略[9] - 腾讯采取“守”势,于2025年12月高价从OpenAI挖来首席AI科学家,并整合分散的大模型研发力量以求突破[10] - 阿里面临B端(云份额)和C端(AI应用)两线作战,选择“内部封闭研发+投资初创”的组合拳,于2025年11月密集推出两款杀入App Store免费榜前六的AI应用[10] - 字节表现从容,其豆包App日活跃用户破亿,火山引擎日均处理50万亿token,并挖来谷歌DeepMind副总裁专注长期基础研究,应用层与模型层团队并行推进[10] - 字节与Meta最为相似,核心命脉均为流量和广告,但字节更清醒,未陷入“大模型竞赛”执念,而是聚焦模型能力的产品化变现和分发渠道优势[10][11] 历史收购案例的启示与风险 - 成功的收购案例如Google在2014年以约5亿美元收购DeepMind,关键因素包括给予高度自治权、长期稳定资源投入及共同的技术愿景[12] - 失败的收购案例众多,如微软2007年以63亿美元收购aQuantive,五年后确认62亿美元资产减值;苹果收购多家AI初创公司后,相关团队销声匿迹,Siri进展缓慢[13] - Meta当前困境类似失败案例,其控制欲强的管理风格导致新收购团队(如Scale AI创始人团队)整合困难、内耗严重、高管离职[14] - 英伟达2019年以69亿美元收购Mellanox,以及特斯拉2016年收购SolarCity、2019年收购Maxwell的成功案例表明,收购成功需有清晰战略主线、尊重被收购方核心能力、并以“共生”而非“控制”为目标进行整合[16] 对Meta收购Manus前景的质疑 - 市场观点认为该交易更像是掩盖失利的“止痛药”,而非深思熟虑的战略布局[1][8] - Meta被指将发展顺序搞反,先高调画饼再补课,在技术迭代不确定的AI时代容易碰壁[11] - 分析认为Meta的组织能力(“腿部肌肉”)可能已“萎缩”,存在文化冲突风险,Manus团队在Meta“板结”的土壤中能否成功成长存疑[17] - 核心观点指出,真正的能力是长出来的,不是买回来的[18]
“姚顺雨在 OpenAI 不到一年就跳槽到腾讯,是不是说明他缺乏稳定性?”
程序员的那些事· 2026-01-03 08:49
核心观点 - 文章通过对比高价值人才与普通职场人的跳槽案例 指出职场规则与评价标准存在双重标准 高价值人才的职业流动被赋予积极意义 而普通人的类似行为则可能面临负面标签与职业发展限制 [4][5][6][7][8] 人才流动与市场评价 - 前OpenAI研究员姚顺雨于2024年8月加入OpenAI 参与Operator、Deep Research等核心项目 于2025年9月离职 同年12月宣布加入鹅厂 其在OpenAI任职时间不足一年 [4] - 对于姚顺雨此类高价值人才的短期跳槽 市场舆论倾向于解读为“人往高处走”的积极职业选择 而非稳定性不足 [5][7] - 相比之下 普通职场人的频繁跳槽则容易被企业或HR贴上“缺乏稳定性”或“能力不行”的标签 可能在简历筛选阶段就被淘汰 [6][8] - 部分大型科技公司在招聘中存在明确的筛选规则 例如有评论指出阿里可能因“三年跳槽两次”的履历而过滤掉候选人简历 [9] 行业规则与双重标准 - 文章观点认为 职场中的许多规则更像是针对普通人的枷锁 而强者的职业选择往往不受同一套标准限制 [8] - 相关评论进一步指出 “所有规则只适用于普通人” 而“所有规则的解释权在于强者” 这反映了职场评价体系中的权力不对等现象 [9]
Manus补上一块短板,但Meta AI 的短板实在太多了
36氪· 2025-12-31 19:46
文章核心观点 Meta收购Manus是一项由扎克伯格亲自操盘、旨在快速补足其AI Agent能力短板的战术性举措,但鉴于Meta在基座大模型能力、AI战略及产品竞争力方面的根本性薄弱,此次收购难以扭转公司在AI领域的落后颓势 [1][34][40] Meta收购Manus的交易与标的分析 - 谈判由扎克伯格亲自操盘,仅持续10多天便达成交易,反映出Meta面对2026年AI竞争的急切心态 [1] - 被收购方Manus在8个月内达到了1.25亿美元的年化收入,显示出较强的商业化能力 [2] - Manus的核心技术是一个多智能体协同架构,由规划、执行、验证和知识四大核心Agent组成,并集成了29种工具 [3][5] - 该公司提供了一个沙盒执行环境,允许AI在云端隔离环境中运行代码、操作浏览器,实现“后台执行”,对处理耗时任务的企业用户有实用价值 [6] - 然而,Manus自身没有自主训练的底层大模型,其Agent能力完全依赖第三方模型,主要是Anthropic的Claude和阿里巴巴的Qwen [7][9] - 与OpenAI基于专门训练CUA模型的Operator相比,Manus在任务执行的成功率和稳定性上存在明显差距,例如Operator在WebVoyager基准测试成功率高达87%,而Manus用户报告显示其容易陷入无限循环和执行错误 [10][11] Manus的市场推广与增长潜力 - Manus展现出极强的市场推广能力,其于2025年3月6日发布的一支4分17秒产品演示视频,在数小时内观看量超过20万,在科技圈迅速传播 [12][14] - 该视频直观展示了产品完成简历筛选、股票分析等复杂任务的能力,采用“所见即所得”方式降低了技术理解门槛 [13][15] - 视频发布后4小时,Manus官网访问量突破千万级别,邀请码需求火爆导致官网注册页面一度崩溃,二手平台邀请码价格被炒至最高10万元 [17] - 截至发稿,Manus用户数量已达百万级,若借助Meta旗下Facebook、Instagram、WhatsApp等每日触达数十亿用户的渠道,其商业化潜力有望指数级提升 [17] Meta在AI领域的困境与挑战 - 公司在2025年于AI领域投资高达640至720亿美元,但投入与产出不成正比,表现落后于OpenAI、Google和Anthropic,其大模型被外媒嘲讽为“二流” [18][19] - 旗舰模型Llama 4发布后引发争议,其提交给LMArena基准测试的优化版本与公开发布版本性能差异巨大,后者在同一排行榜上仅排第32位,被批评破坏了测试公平性 [20][21][22][23] - 公司内部对开源策略存在根本分歧,秘密启动了代号“Avocado”的闭源项目,且其AI短视频平台Vibes并未使用自家Llama模型,引发外界对其已放弃Llama的猜测 [25][26] - AI战略混乱,2025年6月以143亿美元收购Scale AI 49%股份并聘请其CEO Alexandr Wang负责所有AI研发,但新成立的Meta Superintelligence Labs在10月便裁员600人,顶尖研究员因官僚主义、战略不明等原因迅速离职 [29] - 标志性事件是图灵奖得主杨立昆于2025年11月离职,原因包括公司战略重心转向商业化与其学术理念不符,以及在新架构中需向Alexandr Wang汇报 [29] Meta AI产品线的竞争力短板 - Meta AI虽依托社交产品获得超10亿月活用户,但功能仍停留在基础对话层面,不具备真正的自主任务执行(Agent)能力 [30][32][33] - 相比之下,竞争对手产品迭代迅速:OpenAI在2025年初推出可操作浏览器的Operator,2月发布能进行深度网络研究的Deep Research,7月整合为“研究+行动”闭环的ChatGPT Agent [31] - Anthropic的Claude建立了在计算机控制、应用构建及编程(Claude Code)方面的Agent优势,谷歌也推出了具备网页导航能力的Gemini和集成开发平台Antigravity [32] - 在企业LLM API使用份额中,Meta仅占约12%,较2024年的19%下降了7个百分点,显示出其基座模型市场接受度在下降 [37] - 在关键的编程Agent市场,Claude Code占据54%的份额,OpenAI占21%,Google占16%,Meta几乎完全缺席 [39] 收购Manus的战略价值与局限性 - 对Meta而言,Manus提供了即插即用的Agent产品,可快速整合到WhatsApp Business和Meta AI中,填补公司在AI Agent领域的空白,具备战术价值 [11] - 然而,Manus的多Agent编排、沙盒环境等属于工程层面优化,而非AI核心能力突破,任何有足够工程能力的团队都可在几个月内搭建类似系统,不构成技术壁垒 [8][40] - AI Agent时代的核心竞争力在于基座模型的持续进化,其规划、推理等能力直接源于大模型的认知水平,而Manus团队也承认当模型足够强大时,相关能力会自然涌现 [35][36][37] - 收购Manus不会增强Meta的基座模型Llama 4的能力,仅为Meta提供了“更好的包装”,在2026年激烈的AI竞争中,此类战术动作意义有限 [34][40]
27岁掌舵腾讯大模型,非典型天才定义AI下半场
搜狐财经· 2025-12-24 01:06
公司核心人事动态 - 姚顺雨于2025年出任腾讯首席AI科学家 同时兼任AI Infra部及大语言模型部负责人 掌舵公司AI基础设施与大模型研发的核心业务[1] - 姚顺雨于2024年加入OpenAI 担任研究科学家 专注于将大型语言模型从理论研究推向实际应用 主导开发了OpenAI首个发布的智能体模型及产品 同时参与了Deep Research项目[1][10] - 姚顺雨的加入与腾讯近期优化人工智能战略布局相契合 公司新成立了AI Infra部、AI Data部、数据计算平台部 以全面强化其大模型的研发体系与核心能力[11] 行业技术趋势与个人研究重点 - 姚顺雨认为AI的下半场已经来临 评价会比训练更重要 研究者应将重心从“解决问题”转向“定义问题” 像产品经理那样思考[12] - 其研究核心关键词为“智能体” 认为语言是实现通用智能体的“先天圣体” 因为语言天然携带推理基因 能够跨环境迁移[7] - 在技术路径上 其早期认为计算机视觉难实现通用智能 转而专攻语言方向 并选择GPT而非当时主流的BERT作为研究基础 因其更符合开放行为空间决策的需求[4][8] - 其提出的ReAct方法已成为世界范围内构建语言智能体的最主流方法 该方法核心理念是让大语言模型在行动前先进行可解释的内在推理 继而基于推理结论去决策与操作[9] - 其研究追求“简单且通用”的方法 希望找到能泛化到多任务的简单解法 并认为有必要将多模态能力纳入语言智能体框架中[10] 个人背景与职业轨迹 - 姚顺雨于2015年以安徽省理科第三名成绩考入清华大学交叉信息研究院“姚班” 2019年赴美国普林斯顿大学深造 专攻自然语言处理与强化学习[1] - 其在普林斯顿大学与副教授卡提克·纳拉辛汉合作 后者是GPT-1论文的第二作者 他们共同探索利用GPT-2等强大模型进行复杂语言游戏训练 以研究智能体的新可能性[4][5] - 其曾以最年轻入选者身份跻身《麻省理工科技评论》“35岁以下科技创新35人”中国区名单[3]
豆包手机引发的思考:AgentVS超级App,AI公司VS手机厂商
新财富· 2025-12-16 16:22
文章核心观点 - 字节跳动推出的豆包手机助手技术预览版,通过系统级GUI Agent实现了跨应用自动操作,标志着AI手机从“以App为中心”向“以用户意图为中心”的范式转变,并引发了与超级App的生态冲突 [5][8] - 系统级Agent与超级App内Agent代表了两种不同的技术路线和商业模式,其核心冲突在于对用户意图入口和操作权限的争夺,行业可能走向重新划分权力边界的共存方案 [14][17] - 字节跳动率先推出豆包手机,是其寻找新增长入口、绕开阿里腾讯既有优势的战略实验,而华为、小米、三星、苹果等手机厂商基于各自的软硬件生态,采取了不同的Agent发展策略 [20][22] 豆包手机的突破性意义 - 技术演进:GUI Agent从依赖固定脚本的“不可理解”阶段,发展到2024年基于多模态视觉识别的“可理解”阶段,并在2025年随着OpenAI Operator等产品的推出走向实用化 [6][7] - 机制突破:豆包手机依托INJECT_EVENTS等系统级权限,实现了无需App开放API即可“看懂”屏幕并操作,其核心在于操作系统层面的高权限,而非模型本身 [8] - 优势体现:任务组织方式从“用户选App再操作”变为“Agent解析用户总任务并调度多个App完成”,理论上具有平台中立性,能缓解跨App流程割裂、操作链条过长等问题 [10][11] - 现状与挑战:当前仍处于“可用但早期”的工程机阶段,复杂链路执行效率、界面变化适应性有待提升,且用户对高权限Agent的隐私与安全存在顾虑 [13] 系统级Agent和超级App的冲突 - 路线对立:冲突本质是“操作系统+App+系统级Agent”与“超级应用+小程序+应用内Agent”两条路线的正面相遇,争夺用户意图的“总入口”地位 [14] - 超级App的反制:微信、支付宝、淘宝等超级App通过屏蔽、风控、人机验证等手段,旨在守住“账号由我监管、入口由我解释”的边界 [3][15] - 未来格局:中长期看,双方可能重新划分权力边界,形成分工合作,系统级Agent负责通用意图理解和基础编排,超级App则在高价值场景内提供标准化接口,形成新的“共存方案” [17] - 模式对比:操作系统+App模式优势在于复用现有生态、培养用户习惯,但模型通用性、本地算力、隐私保护要求高;超级应用+Agent模式优势在于云端统一运行、场景精准,但需重建以超级App为核心的生态 [18] 主要厂商在Agent方面的进展 - 华为:采用自研鸿蒙OS+自研大模型,将小艺深度写入系统,向“AI native OS”演进,致力于打造系统级、跨终端(手机、车机、穿戴、家居)的统一Agent [22][23][25] - 小米:路径是“系统助手+生态助手”结合,在HyperOS中整合AI能力,小爱同学叠加大模型,重点强化手机与AIoT设备之间的协同,打造人车家一体场景 [22][23][25] - 三星:深度绑定Google,以Google Gemini为核心打造Galaxy AI,自身侧重硬件与体验打磨,在安卓阵营中做Gemini的最佳载体 [22][24][25] - 苹果:坚持软硬一体,iOS 18的Apple Intelligence是唯一官方全局Agent(新Siri),第三方模型(如ChatGPT)只能作为可选插件接入,强调本地推理与隐私保护 [22][24][25] - 字节跳动:推出豆包手机是“重构入口的实验”,战略意图在于通过“硬件+AI模型+新入口”的组合,绕开阿里、腾讯的既有优势,寻找新增量 [20][21]
OpenAI teases stream for expected browser launch, sending Alphabet shares lower
CNBC· 2025-10-22 00:13
市场反应 - Alphabet股价在OpenAI预告新产品后下跌4% [1] OpenAI新产品预告 - OpenAI发布5秒视频预告新产品 显示包含"Livestream"、"Today"和"太平洋时间上午10点"标签的浏览器界面 [2] - 公司首席执行官Sam Altman在X平台上表示对即将发布的新产品感到非常兴奋 [2] - 公司曾在1月发布使用浏览器完成任务的操作员Agent 但尚未推出独立的浏览器产品 [2] 行业竞争格局 - OpenAI若推出浏览器将直接与谷歌和Perplexity AI等对手竞争 [2] - Perplexity AI本月宣布其AI浏览器Comet在全球免费提供 该浏览器设计为个人助手 具备网页搜索、标签管理、邮件起草和购物等功能 [3] - 谷歌在9月于Chrome浏览器中推出Gemini模型 帮助用户理解网页内容、跨标签页工作以及执行会议安排和YouTube视频搜索等任务 [4]