Workflow
智能体(Agent)
icon
搜索文档
官宣!姚顺雨出任腾讯首席AI科学家,带队大语言模型、AI Infra
机器之心· 2025-12-17 17:42
腾讯大模型研发架构升级 - 公司升级大模型研发架构,新成立AI Infra部、AI Data部、数据计算平台部,以全面强化其大模型研发体系与核心能力 [2] - AI Infra部将负责大模型训练和推理平台技术能力建设,聚焦分布式训练、高性能推理服务等核心技术,构建AI Infra核心竞争力 [3] - AI Data部将负责大模型数据及评测体系建设 [4] - 数据计算平台部将负责大数据和机器学习的数据智能融合平台建设工作 [4] 关键人事任命与汇报关系 - 姚顺雨(Vinces Yao)出任腾讯“CEO/总裁办公室”首席AI科学家,向总裁刘炽平汇报;同时兼任AI Infra部、大语言模型部负责人,向技术工程事业群总裁卢山汇报 [2] - 王迪继续担任大语言模型部副总经理,向姚顺雨汇报 [5] - 刘煜宏担任AI Data部负责人,陈鹏担任数据计算平台部负责人,均向公司副总裁蒋杰汇报 [5] 新任首席AI科学家的背景 - 姚顺雨是人工智能领域,特别是“智能体(Agent)”方向备受瞩目的青年研究者 [6] - 在加入OpenAI之前,他已在语言智能体领域做出了一系列开创性工作,并参与构建了著名软件工程基准SWE-Bench和模拟电子商务网站环境WebShop [7] - 其论文总引用量已超过1.9万次 [7] - 其研究工作包括使AI通过多路径推理解决复杂问题的ToT(思维树)、让AI在推理中动态行动的ReAct,以及为AI智能体提供模块化认知架构的CoALA [11]
别吹了,智能体Demo能跑通和能上线,是两码事!| 极客时间
AI前线· 2025-12-16 17:40
然而,下一波真正的浪潮已经涌现:智能体(Agent)时代。这里的"智能体",不是简单的聊天机器 人。它指的是 以大型语言模型为认知引擎,具备自主决策、目标导向和环境交互能力的 AI 系统。 从 ChatGPT 到 Claude,从文心一言到 DeepSeek,我们已习惯与各种 Copilot 协作。它们能力惊 人,但本质仍是 被动响应 的工具——我们发出指令,它们返回结果。 "我看到很多开发者卡在'只会调 API'的层面,这非常可惜。AI 智能体的底层,是一套精密的 系统工程。掌握它,意味着你能从'工具的使用者'转变为'智能系统的创造者'。这不仅是技能 的提升,更是思维模式的跃迁。" 想象一下: 这就是 Agentic AI ——未来最炙手可热的技术方向,也是拉开下一代 AI 应用差距的关键。 热潮之下,开发者真正的 挑战是什么? 智能体开发就像一座冰山。水面之上,是大家熟悉的"调 API、写 Prompt";水面之下,才是真正的 复杂性所在: 这些,才是考验开发者能否将炫酷概念转化为真实价值的核心能力。面对这片充满机遇但略显复杂的 海域,一位资深的技术"引路人"—— 王延飞老师 ,分享了他的观察。 作为一位 ...
下一个十年的AI发展图景
中国青年报· 2025-12-08 06:52
国家政策与战略指引 - 国务院印发《关于深入实施“人工智能+”行动的意见》,为人工智能与经济社会各行业各领域广泛深度融合提供指引 [1] - 《中共中央关于制定国民经济和社会发展第十五个五年规划的建议》明确,要深入推进数字中国建设,加快人工智能等数智技术创新,全面实施“人工智能+”行动,抢占人工智能产业应用制高点,全方位赋能千行百业 [1] - 工业和信息化部强调,人工智能领域要占领先机、赢得优势,必须厚植“根技术”,夯实算力、算法、数据等基础底座,并推动“模数共振” [5] 人工智能技术发展趋势与目标 - 人工智能未来发展的核心目标是成为通用人工智能,其关键在于具身智能、科学智能与安全治理三大方向 [2] - 具身智能旨在赋予机器人同时具备“小脑”的敏捷行动能力与“大脑”的认知决策能力,以替代人类承担危险、繁重的工作 [2] - 智能体成为AI行业重要发展方向,全球智能体市场规模预计将从2024年的51亿美元增长至2030年的471亿美元,年均复合增长率达44.8% [2] - 大模型能力密度法则指出,大模型每100天左右可实现模型密度翻倍,从而大幅降低模型训练和推理成本 [6] 关键应用领域与场景 - 在制造业,人工智能是应用的主战场,需推动全流程智能化升级,并加速智能产品装备迭代创新,如AI手机、AI电脑、人形机器人、脑机接口等 [8][9] - 智能体以硬件智能终端为载体,有望成为AI入口,涵盖可穿戴设备、智能驾驶系统、全屋智能等,通过自然语言实现人机交互 [3] - 科学智能推动科学研究进入“人机协同”新阶段,主流推理模型在物理、化学、生物等领域能力超越人类博士水平,AI已应用于量子纠错等前沿难题 [3] - 具身智能机器人应用场景广泛,包括工厂协作、社区养老(如护理机器人)、家庭服务(如打扫、看护、辅助学习)等 [1][9] - “十四五”以来,中国已建成基础级智能工厂超3.5万家、先进级智能工厂7000余家、卓越级智能工厂230余家 [8] 规模化落地的挑战与策略 - AI落地面临核心痛点之一是“有数据但无准备”,企业积累的数据未按AI需求整理成标准化数据集,阻碍技术与产业需求的有效衔接 [6] - AI规模化落地需场景驱动,在细分产业中找到与AI技术的契合点,避免技术与需求脱节 [6] - AI落地需解决三大关键问题:具备全系统、全链路交付能力;实现软硬件结合;提升通用人工智能在真实场景中的可定制能力 [7] - 企业在选择AI落地场景时应避免标新立异,从重复性工作场景和可借鉴领域开始,并优化数据质量、选择适合的模型 [7] - 智能体的快速迭代需要企业提升工程化能力,重视工程师的作用以推动规模化落地 [7] 产业生态与合作 - 发展AI产业需全球协作,包括与开源社区合作加速技术共享、降低创新成本,以及与全球伙伴共建机器人伦理与安全标准 [5] - 人工智能技术的突破与规模化落地需要跨界交流,激发技术在实际应用中的潜能 [1]
云计算一哥AWS的新战事:10分钟发布25款新品,全面押注智能体
36氪· 2025-12-04 08:19
文章核心观点 - AWS在re:Invent大会上宣布战略重心从技术突破转向企业级价值落地,推动AI从“助手”向“智能体”进化,以解决企业“高投入、低回报”的焦虑 [1] - 公司通过向下造芯片提升性价比、中间做厚模型打破微调天花板、向上立规矩解决智能体落地失控风险的三层策略来抓住机会 [1] - 大会密集发布近40款新品,覆盖算力、模型和应用三个维度,展示公司在AI堆栈各层面的突破 [1][2] 算力层进展 - 发布Trainium 3 UltraServers,推理能效比前代提升5倍,并预告Trainium 4性能将再提升6倍,彰显摆脱外部算力依赖的决心 [4] - 推出AWS AI Factories,将算力基础设施部署在客户自有数据中心,以满足金融和政企客户对数据主权的敏感需求 [4] - 新发布P6e实例首批搭载英伟达GB300 NVL72系统,同时Trn3未来将兼容英伟达NVlink Fusion技术,保持与英伟达的紧密合作 [4] - AWS全球数据中心网络覆盖38个区域、120个可用区,过去一年新增3.8吉瓦容量,拥有总长超过900万公里的私有网络 [13] 模型层进展 - 补齐Amazon Nova自研模型家族,发布Nova 2系列,其中Nova 2 Omni是业界首个支持文本、图、音、视四种输入并能多模态输出的模型 [6] - Nova 2 Pro在复杂指令遵循上表现激进,公司称其在基准测试中优于GPT-5.1 [6] - 推出Amazon Nova Forge服务,引入“开放训练模型”概念,允许企业在模型预训练最后阶段注入专有数据,解决微调导致模型变笨的痛点 [6] - 索尼集团作为早期客户采用Nova Forge和AgentCore,旨在将合规审查效率提升100倍 [6] 应用层进展 - 将AI Agent作为未来核心,推出AgentCore Policy,基于Cedar语言构建确定性控制系统,可实时拦截违规操作如阻止超过1000美元的自动退款 [7] - 发布Frontier Agents系列,包括能自主修复Bug的Kiro Autonomous Agent、代码提交前自动扫描漏洞的Security Agent和自动诊断根因的DevOps Agent [7] - AgentCore服务SDK自发布几个月以来下载量已超过200万次,显示强劲发展势头 [12] - 公司认为AI正在从技术奇迹转变为生产力工具,未来每家公司内部将涌现数十亿个Agent [18] AWS业务与基础设施概况 - AWS年化收入达1320亿美元,年增长率20%,过去一年收入增长约220亿美元,超过半数《财富》500强公司全年收入 [10] - Amazon S3存储对象数量超过500万亿个,数据量达数百艾字节,平均每秒处理超过2亿次请求 [11] - 连续第三年新增CPU容量中一半以上来自自研Graviton芯片,已部署超过100万枚Trainium芯片 [12][26] - Amazon Bedrock目前支持超过10万个AI推理应用,福特AI 50榜单中85%的企业以及CNBC Disruptor 50榜单中85%的企业运行在AWS上 [12][14]
实测豆包手机助手:比价点外卖、自动回微信,AI 操作手机的时代来了?
晚点LatePost· 2025-12-01 11:01
豆包手机助手核心能力 - 字节发布豆包手机助手预览版,这是一个面向手机厂商的系统级服务,将豆包大模型深度融入操作系统,用户可通过语音或简单手势指挥手机执行复杂操作[3] - 豆包手机助手是一个Agent智能体,具备系统级操作权限,能识别屏幕UI元素,通过模拟点击、滑动和输入等动作跨应用执行复杂操作[5] - 助手能实现跨平台比价点外卖、搜索小红书整理旅游攻略、定时执行查看微博热搜并截图存档等任务,在执行过程中用户可进行其他操作不被打断[5][13][18] 交互与功能特性 - 合作手机在机身左侧配备独立专属物理按键,不论手机处于何种状态,按下按钮即可唤出豆包手机助手,以叠加层形式出现不打断当前应用进程[23] - 助手具备屏幕感知能力,可自动读取当前聊天记录上下文并生成回复内容,例如安慰朋友或帮助处理工作需求如修改图片颜色[23][25][26] - 支持语音交互,在特定场景如开车时可通过语音指令让助手回复消息,同时具备全局记忆功能,可手动存储信息或授权获取特定应用收藏内容以提供个性化服务[33][32] 行业合作与发展模式 - 豆包手机助手是字节与中兴合作开发的打样产品,售价3499元,公司正与多家手机厂商洽谈合作[1][4] - 行业出现新模式,手机厂商与外部模型供应商合作,例如苹果拟每年花10亿美元购买Google的Gemini服务,豆包与中兴的合作也体现此模式[36] - 豆包手机助手实现了各大手机厂商发布会曾描绘但难以落地的跨应用操作能力,在当前量产手机中较为罕见[36] 当前表现与未来潜力 - 作为预览版,助手执行任务时并非每次都能完美完成,但具备较强纠错机制,例如在点外卖任务中遇到弹窗会反复尝试50秒最终找到解决方案[20] - 执行效率有待提升,例如对比三家外卖平台肯德基价格耗时1分56秒,比手动操作慢近一分钟,且目前无法合理解决如识别视频播放完毕等长尾需求[36][37] - 字节计划吸引第三方开发者将服务和应用集成到豆包手机助手,以获得应用级别底层权限,从而解决更多问题,尽管说服大型互联网公司开放权限存在挑战[37]
南财快评|如何看待美股AI估值争议?
21世纪经济报道· 2025-11-21 19:28
英伟达财报表现 - 第三财季营收为570.1亿美元,超出市场预期的549.2亿美元,同比增长62% [2] - 第三财季净利润为319.1亿美元,同比大涨65% [2] - 财报超出预期,有望缓解美股市场对AI估值的近期忧虑 [2] AI行业现状与资本开支 - 当前美国AI热潮主要由供给侧推动,科技巨头如微软、谷歌、Meta等斥巨资购买英伟达GPU建设算力中心 [2] - 竞争性资本开支导致AI基础设施建设可能远超当前实际需求 [3] - 数据中心建设速度惊人,但杀手级应用的出现相对滞后 [3] 历史对比与泡沫争议 - 市场将当下美股类比为2000年互联网泡沫破裂前夕,类似当时光纤网络的过度铺设 [3] - 回顾历史,每一轮科技革命中,资本先于技术成熟的非理性繁荣(泡沫)是常见阶段,为技术迭代提供了资金支持 [3] - 2000年互联网泡沫催生了廉价光纤基础设施,为移动互联网爆发奠定基础;同理,当前全球算力堆积可能是通向通用人工智能(AGI)的必经之路 [3] 行业发展阶段与挑战 - 行业正从概念验证的“上半场”步入预期、资本与技术现实交织的艰难“中场时刻” [4] - 单纯算力堆叠的边际效应开始递减,技术神话需面对财务报表的冷酷审视 [4] - 投资者开始索要营收数据和利润率,商业化落地需追上预期上升速度 [4] - 技术需继续加速以验证缩放定律,同时商业化需证明AI是利润引擎而非昂贵玩具 [4] 未来方向与价值筛选 - Agent(智能体)、具身智能及垂直领域模型正在尝试突破,是伪需求被淘汰、真价值被筛选的分水岭 [4] - 市场关注点将从“买铲子”(购买算力)转向“谁用铲子挖到了金子”(应用盈利) [4] - 英伟达的长期命运取决于其客户能否利用昂贵芯片赚到钱 [4] 估值消化路径 - 对AI估值争议的最好回应是“时间换空间”,通过技术应用的逐步渗透让高估值慢慢变得合理 [5] - 这需要市场投资者的耐心、对短期波动的容忍以及对技术长周期的坚定信心 [5]
AI手机竞速智能应用,卡点在哪里?
21世纪经济报道· 2025-11-20 18:06
AI手机行业战略转型 - 竞争焦点从早期强调大模型跑分数据转向端侧智能的实际应用 特别是离线状态下手机的丰富功能 [1] - AI手机正跨越从“炫技”到“刚需”的临界点 让AI手机具备Agent能力是必然趋势 [1] - 行业竞争不再局限于单一终端技术参数 更在于构建开放统一的生态标准、符合用户智能交互习惯以及实现跨场景跨设备协同 [10] AI底层技术进展 - 开源大模型如DeepSeek快速发展 推动端侧模型小型化进展迅速 [1] - 模型小型化让手机有充足算力支撑端侧部署 小型化模型效果已逼近早期百亿、千亿规模模型 [3] - 端侧模型对手机内存占用显著缩小 例如vivo端侧3B模型仅占用2G内存 相比此前部署7B模型需要匹配3.5G内存大幅降低 [5] - 多模态化和长上下文扩展等技术突破为手机端侧应用提供基础条件 [1] 厂商战略布局 - OPPO提出新计算、新感知、新生态三大AI战略 结合云端和端侧算力是关键机会点 [2][3] - 厂商多数在开源模型基础上做业务适配与训练优化 OPPO强调“自主训练模型”聚焦业务定制、个性化模型和端侧小型化 [5] - 厂商与芯片厂商合作进行模型结构适配和加速 确保端侧模型部署过程中性能和功耗平衡 [3] - vivo推出3B端侧多模态推理大模型 可实现离线通话录音总结、写作等功能 [3] 应用落地演进 - OPPO将AI模型能力系统级嵌入手机经历三个阶段:智能助理、系统级感知能力、软硬件能力定制 [7] - 传统功能如录音、相册管理、语音助手借助AI技术帮助用户提升效率 [6] - 系统级AI通过优化输入方式、简化交互流程 比单纯“应用+AI”模式更贴近用户需求 [6] - 采用多智能体架构 引入第三方厂商智能体由手机整体调度 实现智能点外卖、打车等效果 [7] 生态构建挑战 - Agent普及面临三大挑战:生态开放与协议统一、跨应用调度权限获取、用户习惯培养 [7] - 多智能体连接需要手机厂商与第三方服务商联动数据与权限 国内外推进相关协议规范构建如谷歌A2A方案 [7][8] - 部分第三方服务厂商对开放权限持谨慎态度 导致生态协同效率受限 [8] - OPPO与支付宝合作推出多智能体互联协同方案Agent Hub Access 通过构建“Hub”管理账号与安全协议 [8] 用户接受度与市场影响 - 消费者对AI手机能力调用和感知较少 难以成为现阶段购机影响因素 [9] - 系统级软硬件结合解决方案若能精准命中用户痛点 能转化为核心购机驱动力 [9] - 端侧完成用户偏好积累可能形成品牌黏性 影响用户后续换机品牌选择 [9] - 用户习惯需从GUI触控操作转向“AI代劳”的交互逻辑 需要长期市场教育 [7][8]
【环球财经】谷歌三季报前瞻:广告业务和云计算双轮驱动能否持续?
新华财经· 2025-10-28 20:31
公司业绩与市场预期 - 公司将于10月30日美股盘后发布2025年第三季度财报,市场预期营收846亿美元,同比增长13.4%,每股收益2.27美元,同比增长7.1% [2][3] - 公司股价近6个月涨幅超过60%,市值攀升至3万亿美元创历史新高,在38位分析师中,32位给予“买入”评级,平均目标股价为273美元,较当前价格有约1.3%的上行空间 [2] - 公司财报已连续四个季度超出市场预期,市场关注焦点包括广告收入、搜索引擎份额、AI赋能、云业务及资本开支 [2][3] 广告业务表现 - 广告收入占公司总营收近80%,是维持业绩高增速的关键,AI技术正改写其增长叙事 [3] - 公司在搜索领域的市场份额达90.4%,基于Gemini AI的“Peak Points”广告工具提高了点击率和转化率,有望在第三季度贡献增量收入 [3] - YouTube在AI技术支持下有巨大变现潜力,预计能更好地提升用户体验和广告业务收入 [4] 云计算业务增长 - 云计算部门是推动公司营收持续增长的关键和下一个增长点,第三季度营收预计达146.6亿美元,同比涨幅29% [4] - 云业务的强劲增长源于AI快速发展及与更多企业建立合作,自研TPU芯片降低了成本并吸引大厂使用 [4] - 人工智能公司Anthropic扩大与谷歌云合作,获得100万个谷歌TPU芯片使用权,协议为期6年,总价值介于500亿至800亿美元之间 [4] 资本开支与AI基础设施 - 公司2025年全年资本支出预计上调至880亿至920亿美元,市场认为这是其在AI竞赛中保持领先的必要代价 [5] - 花旗预计公司2026年资本开支将达到约1110亿美元,2024至2029年间资本开支复合年增长率将达到26% [5] - 公司宣布未来几年将投资超过500亿美元用于AI基础设施建设,包括在美国多州投资建设数据中心和改造设施 [6] AI算力需求趋势 - 公司Gemini的Token使用量持续飙升,2025年6月已增至每月980万亿次,远高于4月的480万亿次,反映AI算力需求激增 [5] - AI应用厂商正探索智能体落地,从聊天机器人到Agent的升级有望带来Token调用量十倍以上提升,从而带动算力需求加速增长 [6] - 大模型进入后训练和推理时代,模型输出Token数将有约10倍提升,Agent处理单任务所需请求数有约20倍提升,整体Token增长十倍以上 [6]
均降40%的GPU成本,大规模Agent部署和运维的捷径是什么?| 直播预告
AI前线· 2025-10-28 17:02
直播活动信息 - 直播时间为2025年10月28日19:30-20:30 [3][5] - 直播主题为探讨大规模Agent部署和运维的捷径 [3][7] - 嘉宾为阿里云云原生应用平台Serverless计算负责人杨皓然(不瞋)和极客邦科技总编赵钰莹 [4] 核心议题与解决方案 - 行业面临Agent大规模落地挑战,包括开发复杂、运维困难、成本高企 [2] - 阿里云提出解决方案可实现百倍启动加速并平均降低40%的GPU成本 [4][9] - 将探讨从“云原生”到“AI原生”的技术跃迁以及智能体的全生命周期治理 [4][8][9] 技术演进与未来展望 - 直播将解读AgentRun技术并分享Serverless AI的未来演进路径 [4][9] - 重点覆盖从开发到运维的智能体全生命周期管理议题 [4][9]
对话蚂蚁 AWorld 庄晨熠:Workflow 不是“伪智能体”,而是 Agent 的里程碑
AI科技大本营· 2025-10-28 14:41
文章核心观点 - AI行业当前陷入追求榜单分数的"应试狂热",真正的智能体技术必须超越考试逻辑,走向解决现实世界复杂问题的"实干" [2][7] - 智能体赛道存在泡沫,许多产品仅是传统工作流自动化的"套壳",但Workflow是智能体发展过程中的重要里程碑,而非终点 [3][10] - 群体智能被视为一条可能实现"弯道超车"的路径,其与基础大模型训练是螺旋上升的相辅相成关系,而非替代 [16][18][20] - 真正的智能体具备动态适应和问题解决能力,其核心标志是能够自主"绕路"应对意外情况,而非僵化执行预设流程 [23][24] - 开源是推动AI技术发展和建立行业生态的关键力量,代码背后的认知共享比代码本身更具价值 [32][33][35] 智能体技术与Workflow的关系 - 行业存在对智能体的质疑,认为其仅是Workflow自动化脚本的包装,即"智能体洗白",导致用户体验后迅速流失 [3] - 大模型的出现是分水岭,用基于概率的语义理解替代了过去难以维护的、僵化的手写规则图 [9] - Workflow被视为智能体发展前期的成熟技术阶段和必经的里程碑,但智能体终将超越Workflow [10] - 根本性转变在于从遵循固定标准作业程序的过程导向,演进为以最终结果好坏为评判标准的结果导向 [13] - 真智能体的标志是动态适应能力,例如在工具调用失败后能自主寻找替代方案(如自己写代码),而非像Workflow那样流程中断 [23][24] 群体智能与模型发展的战略路径 - 面对大模型军备竞赛的资源消耗,群体智能提供了一种"弯道超车"的非对称战略思路 [16] - 群体智能的核心是构建协同框架,使多个相对较小的智能体像专家团队一样合作,完成复杂任务 [17] - 群体智能与基础大模型训练是相辅相成、螺旋上升的关系:群体智能系统作为"数据工厂"产生的高质量数据可反哺基础模型,增强其推理能力;更强的基础模型又能提升群体智能中单个智能体的能力 [18][19][20] - 通用智能体与基础模型的边界相对模糊,智能体团队的核心价值在于完成技术到商业价值的"最后一公里",包括必要的模型后训练(post-train)和工程落地 [21][22] 智能体与真实世界的交互演进 - 智能体影响真实世界的三种介质包括:通过自然语言与人交互、通过API交互、以及通过GUI(图形用户界面)交互 [25] - API方式当前最主流但脆弱,依赖提供方且难以泛化;GUI方式模拟人类自然操作,泛化性和扩展性潜力最高,但实现难度也最大 [25][26][27] - 行业需要建立智能体间的通信与协作标准协议(如MCP、A2A),其最终形态可能由大公司推动或因其好用而形成稳定生态 [28] 开源策略与行业生态建设 - 开源是应对AI技术快速迭代、保持领先的关键方法论,其力量体现在集体智慧能加速AI发展,迅速缩小与闭源模型的差距 [32][33] - 开源项目超越代码本身,其核心价值在于共享背后的技术认知和设计哲学,接受检验并激发共创,是极佳的技术"名片" [35][37] - 智能体技术的硬性标准是"自己做出来的智能体自己能用",强调实际应用价值而非空谈 [38] 智能体技术的未来方向 - 未来智能体的关键挑战是完成"长程任务",即像独立个体一样7x24小时运行,处理持续数小时甚至更久的复杂任务,这将引出超长上下文管理、记忆等核心技术难题 [39] - 公司对智能体的未来规划聚焦于两点:一是让智能体在多种环境(如GAIA、IMO)中学习并沉淀经验至模型;二是将智能体作为开放的技术产品,让社区优先享受到技术红利 [40]