智能体(Agent)
搜索文档
百万人围观,「上下文图谱」火了,万亿美元新机遇?
机器之心· 2025-12-28 17:00
文章核心观点 - 智能体(Agent)的崛起正在重塑企业软件生态,其核心影响并非简单地取代传统的记录系统,而是暴露并催生了对新型“记录结构”的需求,这背后隐藏着万亿美元级别的市场机遇 [2][5][16] - 传统记录系统(如CRM、ERP)作为业务数据的“单一事实来源”不会消亡,但Agent的跨系统、面向行动的特性,迫使其角色从人类操作中心演变为服务于机器的“带API的状态机”,对数据质量和治理提出了更高标准 [10][14][15] - 当前企业自动化的真正瓶颈在于缺乏对“决策轨迹”的系统性记录,即那些解释“为什么”某个行动被允许发生的关键上下文信息,这些信息通常散落在聊天记录、个人经验和临时讨论中 [22][28][31] - 能够捕获并结构化“决策轨迹”以形成“上下文图谱”的创业公司,具备构建下一代万亿美元级平台(即“决策的记录系统”)的结构性优势,而传统软件巨头由于架构和历史原因难以涉足此领域 [26][40][42][50] - 构建有效的“上下文图谱”需要先建立“操作上下文”这一基础层,以解决身份、关系、时间状态等根本问题,而当前市场主流的RAG和AI记忆方案无法满足这一需求 [55][63][77][80] 记录系统的定义与演变 - 记录系统是企业的“总账本”和“黑匣子”,负责记录谁在何时做了什么、数据如何变更、流程进展到哪一步,用于对账、追责和合规检查,上一代万亿美元级的企业软件生态正是基于此构建 [7][8] - 传统工作流程严重依赖记录系统,例如销售必须将商机录入Salesforce,财务必须在ERP中做凭证,否则相关业务“就算没发生” [9] - Agent的出现动摇了记录系统的中心地位,Agent可以从各系统读取数据,在系统外完成决策和执行,最后只回写结果,这使得记录系统可能退化为只读的数据仓库,不再是流程的必经中心 [10] - 有观点认为记录系统已死,但反驳意见指出,自动化程度越高,越需要明确的“真相源”,记录系统通过各司其职(CRM管客户、ERP管财务)或通过数据仓库/湖仓作为“单一事实来源”来解决数据混乱问题 [11][13] - Agent是跨系统且面向行动的,其能力上限取决于对“哪个系统拥有哪项真相”以及“真相间契约”的理解,这迫使工作的用户体验与真相源分离,前端可以是自然语言界面,但底层仍需权威记录 [14] 上下文图谱:新机遇与核心价值 - “上下文图谱”是由长期积累的、结构化的“决策轨迹”构成,它是一份跨实体、跨时间连接的活的决策记录,使历史先例可搜索、可复用 [26][61] - 决策轨迹记录的是具体某次决策如何产生,包括:使用了哪种定义、基于哪个政策版本、是否获得例外审批、参考了哪些历史先例以及做了哪些调整,这与一般性的业务规则有本质区别 [24][25][58] - 上下文图谱的价值在于,它不仅能记录“发生了什么”,更能解释“为什么这些行为被允许发生”,从而成为自治系统真正的事实来源 [26][40] - 系统型Agent创业公司因位于实际执行路径中,能在决策发生时捕获完整的跨系统上下文、政策评估、例外流程和审批链条,从而具备构建上下文图谱的结构性优势 [25][42] - 上下文图谱能形成强大的反馈循环:被捕获的决策轨迹成为可搜索的先例,新的自动化决策又为图谱增添新轨迹,使得系统越用越懂业务,复利效应显著 [33] 传统系统的局限与创业公司的机会 - 传统记录系统(如Salesforce、ServiceNow)天然是孤立的、以当前状态为核心,它们擅长记录“当前状态什么样”,但无法回放决策发生时的完整世界状态,因此无法捕获支撑决策的上下文 [38][39] - 真实的业务决策几乎总是跨系统的,但没有任何传统厂商位于这个跨系统的执行路径中,因此无法捕获完整的决策上下文 [39][40] - 传统巨头可能通过并购、封锁API、收取高额数据外流费用等方式竞争,但他们无法强行插入一个自己从未参与过的编排层,因为捕获决策轨迹的前提是在决策提交时就身处执行路径中 [43] - 创业公司有三条主要发展路径:1)从头构建AI原生的记录系统以替换现有系统(如Regie);2)聚焦于例外密集的关键子流程,成为该环节的决策记录系统,并与传统系统同步状态(如Maximor);3)从编排层起步,创建专门记录决策过程的全新记录系统(如PlayerZero) [44][45] - 随着Agent规模化部署,对Agent可观测性的需求将催生新的基础设施公司,例如Arize正在构建监控和评估Agent决策质量的可观测性层 [46] 识别市场机会的关键信号 - 高人力密度是强烈信号,如果大量人力重复处理同一复杂工作流(如工单路由、跨系统对账),说明传统工具无法自动化,存在Agent切入机会 [47] - 例外密集型决策场景价值最高,例如交易审批、承保决策、合规审查、升级处理等,这些场景逻辑复杂、先例重要,需要视情况而定的判断 [48] - 位于多个系统交汇处的“胶水型”组织职能(如RevOps、DevOps、Security Ops)是通往新一代记录系统的明确信号,因为这些职能的存在本身就意味着没有现成系统能完整掌管其跨职能工作流 [49] 操作上下文:构建决策图谱的基础 - 在捕获“决策轨迹”之前,必须先解决“操作上下文”问题,即让Agent理解组织的真实结构、角色和关系 [55][63] - 操作上下文包含四个核心要素:1)身份解析,确保同一个人在不同系统中被识别为统一实体;2)所有权和关系建模,明确谁负责什么以及实体间关联;3)时间状态理解,能还原决策发生时的世界状态而非仅看当前结果;4)跨系统综合判断能力 [66][70][71][72] - 当前主流的RAG方案存储的是文本相似性,而非语义和关系;AI记忆平台记录的是聊天历史,而非组织现实,两者都无法解决操作上下文的结构性问题 [77][78][79] - 构建操作上下文层需要具备多模态数据接入、时间建模、关系映射、Agent互操作性以及企业级部署等核心能力 [81][82][83][84][85] - 决策轨迹是一种比传统Agent可观测性更高层级的业务语义记录,它描述在什么政策下、基于哪些上下文、触发了哪些例外、由谁批准、参考了哪些先例 [87]
火山引擎FORCE大会追踪(2):Agent规模化落地,方舟与企业底座升级
海通国际证券· 2025-12-21 22:15
报告行业投资评级 - 报告未明确给出对火山引擎或其所属行业的投资评级 [1] 报告核心观点 - 火山引擎通过其产品组合将智能体(Agent)从概念探讨转向工程化与规模化落地,构建了覆盖模型服务、训练优化、上下文与记忆管理、企业级底座与治理以及开发提效工具的全链路支撑体系 [2] - 该平台化整合方案为企业客户提供了明确价值:有效降低拼装与集成成本,清晰界定工程边界,并确立可预期的上线路径,从而助力开发团队更聚焦于业务价值创造 [2] - 火山引擎正通过日益完善的产品矩阵与体系化的生态运营,在技术快速迭代的窗口期内,助力开发者将创新高效、稳健地转化为可衡量的业务价值 [6] 根据相关目录分别进行总结 火山方舟平台关键升级 - 发布新一代Responses API,支持单次请求内完成多轮上下文承接、多工具协调与结果归总,显著减少了传统方案中多次交互与复杂胶合代码带来的开销 [3] - 发布开发者模式,通过节点化、可追踪、可展开的工具调用链路,将智能体决策过程由黑箱转为可观测、可调试的资产,提升了问题定位效率 [3] - 现场披露的量化效果显示,在部分场景中,平均回复时延降低约20%,失败率下降约75% [3] - 借助上下文缓存,端到端时延可降低约50%,成本节约超过80%,会话缓存命中率可达85%–93% [3] 企业级规模化落地支持体系 - 发布并升级AgentKit企业级AI Agent平台底座,以模块化架构覆盖开发、部署、运维、监控与安全等环节 [1][4] - AgentKit突出零信任身份管控、存量API资产工具化、既有知识向智能体体系迁移及开箱即用评测能力,旨在解决企业当前的核心瓶颈——在不重构系统的前提下,实现既有资产安全、可控、可评估地被智能体调度 [4] - 发布TRAE CN企业版,为企业AI编码提供稳定性、适配性与安全性更强的工程底座,支持超大规模代码库索引、毫秒级响应及全链路加密传输,并以云端零存储策略保障数据合规 [1][4] - 增强VikingDB向量数据库及Viking记忆库的功能,结合其递进式检索、图文记忆与知识整合能力,为企业实现知识高效入模、上下文精准供给、抑制幻觉及结果可溯源提供了系统化的工程落地路径 [1][4] 开发者生态与增长动能 - 产品层面,扣子平台月活跃开发者已超300万,TRAE月活用户突破160万,表明其开发者生态已具备显著的规模基础与用户粘性 [5] - 生态运营层面,将原有开发者社区升级为专注Agent的开发者社区,并同步上线动手实验室、核心开发者计划及城市社区等系列生态支持举措 [1][5] - 城市社区已在北京、上海、深圳、成都四地试点,并计划于2026年扩展至全国十余城,旨在将发布会上的短期热度转化为持久的开发与实践闭环 [5]
官宣!姚顺雨出任腾讯首席AI科学家,带队大语言模型、AI Infra
机器之心· 2025-12-17 17:42
腾讯大模型研发架构升级 - 公司升级大模型研发架构,新成立AI Infra部、AI Data部、数据计算平台部,以全面强化其大模型研发体系与核心能力 [2] - AI Infra部将负责大模型训练和推理平台技术能力建设,聚焦分布式训练、高性能推理服务等核心技术,构建AI Infra核心竞争力 [3] - AI Data部将负责大模型数据及评测体系建设 [4] - 数据计算平台部将负责大数据和机器学习的数据智能融合平台建设工作 [4] 关键人事任命与汇报关系 - 姚顺雨(Vinces Yao)出任腾讯“CEO/总裁办公室”首席AI科学家,向总裁刘炽平汇报;同时兼任AI Infra部、大语言模型部负责人,向技术工程事业群总裁卢山汇报 [2] - 王迪继续担任大语言模型部副总经理,向姚顺雨汇报 [5] - 刘煜宏担任AI Data部负责人,陈鹏担任数据计算平台部负责人,均向公司副总裁蒋杰汇报 [5] 新任首席AI科学家的背景 - 姚顺雨是人工智能领域,特别是“智能体(Agent)”方向备受瞩目的青年研究者 [6] - 在加入OpenAI之前,他已在语言智能体领域做出了一系列开创性工作,并参与构建了著名软件工程基准SWE-Bench和模拟电子商务网站环境WebShop [7] - 其论文总引用量已超过1.9万次 [7] - 其研究工作包括使AI通过多路径推理解决复杂问题的ToT(思维树)、让AI在推理中动态行动的ReAct,以及为AI智能体提供模块化认知架构的CoALA [11]
别吹了,智能体Demo能跑通和能上线,是两码事!| 极客时间
AI前线· 2025-12-16 17:40
行业趋势:从被动工具到自主智能体 - AI行业正从被动响应指令的Copilot工具时代,迈向具备自主决策、目标导向和环境交互能力的智能体时代[1] - 智能体是以大型语言模型为认知引擎的AI系统,是未来最炙手可热的技术方向,也是拉开下一代AI应用差距的关键[2] - Agentic AI代表的自主智能系统,被认为是未来5-10年数字化转型的核心引擎[16] 智能体开发的核心挑战与复杂性 - 智能体开发的表面工作是调API和写Prompt,但水下真正的复杂性在于多智能体协作、工程化落地、领域专业化和评估与安全[4][5] - 开发者面临的挑战是将炫酷概念转化为真实价值,这需要从“工具的使用者”转变为“智能系统的创造者”,涉及思维模式的跃迁[6] - 真正的智能体应用不是简单的助手,而是能自主分析数据、撰写并发送完整季度报告的“数字员工”,或是能理解复杂诉求、调用多工具完成全流程服务的“业务专员”[4] 智能体开发能力体系与学习路径 - 一套完整的智能体开发“能力图谱”包括:打通“感知现实”的能力、构建“复杂协作”的能力、掌握“工程化交付”的能力、建立“评估与护航”的能力以及打造“领域专家”的能力[9][10][13] - 具体技术路径涵盖从Function Calling到MCP协议的工具调用,使用LangGraph构建多智能体系统,以及从架构设计、全栈开发到Docker容器化部署的工程化实践[10] - 领域专业化需要通过LlamaFactory等框架对开源模型进行LoRA微调,以打造精通医疗、金融等特定领域的专业智能体[13] 实战项目与前沿技术应用 - 通过6个企业级项目的阶梯式实战,旨在交付可商用的代码与部署方案[11] - 项目涵盖MCP天气查询助手、GAME智能体框架、深度研究助手、多角色AI旅行规划智能体“旅小智”、Agent追踪评估平台以及医疗领域模型微调[14] - 课程强调跟进开源LLM和AI Agent开发的最新成果,涉及MCP、LangGraph、vLLM、LangFuse、LlamaFactory等前沿技术[12] 课程价值主张与市场定位 - 该行动营定位为5周实战课程,旨在系统构建智能体开发全链路能力,帮助开发者快速上手[6] - 课程原价699元,活动立减200元,福利价为499元[6][8][21] - 课程特色包括项目带练深度实战、25个开发任务通关、专属学习群讲师答疑、涵盖从原理到部署的全流程以及2个大作业深化技能[12]
下一个十年的AI发展图景
中国青年报· 2025-12-08 06:52
国家政策与战略指引 - 国务院印发《关于深入实施“人工智能+”行动的意见》,为人工智能与经济社会各行业各领域广泛深度融合提供指引 [1] - 《中共中央关于制定国民经济和社会发展第十五个五年规划的建议》明确,要深入推进数字中国建设,加快人工智能等数智技术创新,全面实施“人工智能+”行动,抢占人工智能产业应用制高点,全方位赋能千行百业 [1] - 工业和信息化部强调,人工智能领域要占领先机、赢得优势,必须厚植“根技术”,夯实算力、算法、数据等基础底座,并推动“模数共振” [5] 人工智能技术发展趋势与目标 - 人工智能未来发展的核心目标是成为通用人工智能,其关键在于具身智能、科学智能与安全治理三大方向 [2] - 具身智能旨在赋予机器人同时具备“小脑”的敏捷行动能力与“大脑”的认知决策能力,以替代人类承担危险、繁重的工作 [2] - 智能体成为AI行业重要发展方向,全球智能体市场规模预计将从2024年的51亿美元增长至2030年的471亿美元,年均复合增长率达44.8% [2] - 大模型能力密度法则指出,大模型每100天左右可实现模型密度翻倍,从而大幅降低模型训练和推理成本 [6] 关键应用领域与场景 - 在制造业,人工智能是应用的主战场,需推动全流程智能化升级,并加速智能产品装备迭代创新,如AI手机、AI电脑、人形机器人、脑机接口等 [8][9] - 智能体以硬件智能终端为载体,有望成为AI入口,涵盖可穿戴设备、智能驾驶系统、全屋智能等,通过自然语言实现人机交互 [3] - 科学智能推动科学研究进入“人机协同”新阶段,主流推理模型在物理、化学、生物等领域能力超越人类博士水平,AI已应用于量子纠错等前沿难题 [3] - 具身智能机器人应用场景广泛,包括工厂协作、社区养老(如护理机器人)、家庭服务(如打扫、看护、辅助学习)等 [1][9] - “十四五”以来,中国已建成基础级智能工厂超3.5万家、先进级智能工厂7000余家、卓越级智能工厂230余家 [8] 规模化落地的挑战与策略 - AI落地面临核心痛点之一是“有数据但无准备”,企业积累的数据未按AI需求整理成标准化数据集,阻碍技术与产业需求的有效衔接 [6] - AI规模化落地需场景驱动,在细分产业中找到与AI技术的契合点,避免技术与需求脱节 [6] - AI落地需解决三大关键问题:具备全系统、全链路交付能力;实现软硬件结合;提升通用人工智能在真实场景中的可定制能力 [7] - 企业在选择AI落地场景时应避免标新立异,从重复性工作场景和可借鉴领域开始,并优化数据质量、选择适合的模型 [7] - 智能体的快速迭代需要企业提升工程化能力,重视工程师的作用以推动规模化落地 [7] 产业生态与合作 - 发展AI产业需全球协作,包括与开源社区合作加速技术共享、降低创新成本,以及与全球伙伴共建机器人伦理与安全标准 [5] - 人工智能技术的突破与规模化落地需要跨界交流,激发技术在实际应用中的潜能 [1]
云计算一哥AWS的新战事:10分钟发布25款新品,全面押注智能体
36氪· 2025-12-04 08:19
文章核心观点 - AWS在re:Invent大会上宣布战略重心从技术突破转向企业级价值落地,推动AI从“助手”向“智能体”进化,以解决企业“高投入、低回报”的焦虑 [1] - 公司通过向下造芯片提升性价比、中间做厚模型打破微调天花板、向上立规矩解决智能体落地失控风险的三层策略来抓住机会 [1] - 大会密集发布近40款新品,覆盖算力、模型和应用三个维度,展示公司在AI堆栈各层面的突破 [1][2] 算力层进展 - 发布Trainium 3 UltraServers,推理能效比前代提升5倍,并预告Trainium 4性能将再提升6倍,彰显摆脱外部算力依赖的决心 [4] - 推出AWS AI Factories,将算力基础设施部署在客户自有数据中心,以满足金融和政企客户对数据主权的敏感需求 [4] - 新发布P6e实例首批搭载英伟达GB300 NVL72系统,同时Trn3未来将兼容英伟达NVlink Fusion技术,保持与英伟达的紧密合作 [4] - AWS全球数据中心网络覆盖38个区域、120个可用区,过去一年新增3.8吉瓦容量,拥有总长超过900万公里的私有网络 [13] 模型层进展 - 补齐Amazon Nova自研模型家族,发布Nova 2系列,其中Nova 2 Omni是业界首个支持文本、图、音、视四种输入并能多模态输出的模型 [6] - Nova 2 Pro在复杂指令遵循上表现激进,公司称其在基准测试中优于GPT-5.1 [6] - 推出Amazon Nova Forge服务,引入“开放训练模型”概念,允许企业在模型预训练最后阶段注入专有数据,解决微调导致模型变笨的痛点 [6] - 索尼集团作为早期客户采用Nova Forge和AgentCore,旨在将合规审查效率提升100倍 [6] 应用层进展 - 将AI Agent作为未来核心,推出AgentCore Policy,基于Cedar语言构建确定性控制系统,可实时拦截违规操作如阻止超过1000美元的自动退款 [7] - 发布Frontier Agents系列,包括能自主修复Bug的Kiro Autonomous Agent、代码提交前自动扫描漏洞的Security Agent和自动诊断根因的DevOps Agent [7] - AgentCore服务SDK自发布几个月以来下载量已超过200万次,显示强劲发展势头 [12] - 公司认为AI正在从技术奇迹转变为生产力工具,未来每家公司内部将涌现数十亿个Agent [18] AWS业务与基础设施概况 - AWS年化收入达1320亿美元,年增长率20%,过去一年收入增长约220亿美元,超过半数《财富》500强公司全年收入 [10] - Amazon S3存储对象数量超过500万亿个,数据量达数百艾字节,平均每秒处理超过2亿次请求 [11] - 连续第三年新增CPU容量中一半以上来自自研Graviton芯片,已部署超过100万枚Trainium芯片 [12][26] - Amazon Bedrock目前支持超过10万个AI推理应用,福特AI 50榜单中85%的企业以及CNBC Disruptor 50榜单中85%的企业运行在AWS上 [12][14]
实测豆包手机助手:比价点外卖、自动回微信,AI 操作手机的时代来了?
晚点LatePost· 2025-12-01 11:01
豆包手机助手核心能力 - 字节发布豆包手机助手预览版,这是一个面向手机厂商的系统级服务,将豆包大模型深度融入操作系统,用户可通过语音或简单手势指挥手机执行复杂操作[3] - 豆包手机助手是一个Agent智能体,具备系统级操作权限,能识别屏幕UI元素,通过模拟点击、滑动和输入等动作跨应用执行复杂操作[5] - 助手能实现跨平台比价点外卖、搜索小红书整理旅游攻略、定时执行查看微博热搜并截图存档等任务,在执行过程中用户可进行其他操作不被打断[5][13][18] 交互与功能特性 - 合作手机在机身左侧配备独立专属物理按键,不论手机处于何种状态,按下按钮即可唤出豆包手机助手,以叠加层形式出现不打断当前应用进程[23] - 助手具备屏幕感知能力,可自动读取当前聊天记录上下文并生成回复内容,例如安慰朋友或帮助处理工作需求如修改图片颜色[23][25][26] - 支持语音交互,在特定场景如开车时可通过语音指令让助手回复消息,同时具备全局记忆功能,可手动存储信息或授权获取特定应用收藏内容以提供个性化服务[33][32] 行业合作与发展模式 - 豆包手机助手是字节与中兴合作开发的打样产品,售价3499元,公司正与多家手机厂商洽谈合作[1][4] - 行业出现新模式,手机厂商与外部模型供应商合作,例如苹果拟每年花10亿美元购买Google的Gemini服务,豆包与中兴的合作也体现此模式[36] - 豆包手机助手实现了各大手机厂商发布会曾描绘但难以落地的跨应用操作能力,在当前量产手机中较为罕见[36] 当前表现与未来潜力 - 作为预览版,助手执行任务时并非每次都能完美完成,但具备较强纠错机制,例如在点外卖任务中遇到弹窗会反复尝试50秒最终找到解决方案[20] - 执行效率有待提升,例如对比三家外卖平台肯德基价格耗时1分56秒,比手动操作慢近一分钟,且目前无法合理解决如识别视频播放完毕等长尾需求[36][37] - 字节计划吸引第三方开发者将服务和应用集成到豆包手机助手,以获得应用级别底层权限,从而解决更多问题,尽管说服大型互联网公司开放权限存在挑战[37]
南财快评|如何看待美股AI估值争议?
21世纪经济报道· 2025-11-21 19:28
英伟达财报表现 - 第三财季营收为570.1亿美元,超出市场预期的549.2亿美元,同比增长62% [2] - 第三财季净利润为319.1亿美元,同比大涨65% [2] - 财报超出预期,有望缓解美股市场对AI估值的近期忧虑 [2] AI行业现状与资本开支 - 当前美国AI热潮主要由供给侧推动,科技巨头如微软、谷歌、Meta等斥巨资购买英伟达GPU建设算力中心 [2] - 竞争性资本开支导致AI基础设施建设可能远超当前实际需求 [3] - 数据中心建设速度惊人,但杀手级应用的出现相对滞后 [3] 历史对比与泡沫争议 - 市场将当下美股类比为2000年互联网泡沫破裂前夕,类似当时光纤网络的过度铺设 [3] - 回顾历史,每一轮科技革命中,资本先于技术成熟的非理性繁荣(泡沫)是常见阶段,为技术迭代提供了资金支持 [3] - 2000年互联网泡沫催生了廉价光纤基础设施,为移动互联网爆发奠定基础;同理,当前全球算力堆积可能是通向通用人工智能(AGI)的必经之路 [3] 行业发展阶段与挑战 - 行业正从概念验证的“上半场”步入预期、资本与技术现实交织的艰难“中场时刻” [4] - 单纯算力堆叠的边际效应开始递减,技术神话需面对财务报表的冷酷审视 [4] - 投资者开始索要营收数据和利润率,商业化落地需追上预期上升速度 [4] - 技术需继续加速以验证缩放定律,同时商业化需证明AI是利润引擎而非昂贵玩具 [4] 未来方向与价值筛选 - Agent(智能体)、具身智能及垂直领域模型正在尝试突破,是伪需求被淘汰、真价值被筛选的分水岭 [4] - 市场关注点将从“买铲子”(购买算力)转向“谁用铲子挖到了金子”(应用盈利) [4] - 英伟达的长期命运取决于其客户能否利用昂贵芯片赚到钱 [4] 估值消化路径 - 对AI估值争议的最好回应是“时间换空间”,通过技术应用的逐步渗透让高估值慢慢变得合理 [5] - 这需要市场投资者的耐心、对短期波动的容忍以及对技术长周期的坚定信心 [5]
AI手机竞速智能应用,卡点在哪里?
21世纪经济报道· 2025-11-20 18:06
AI手机行业战略转型 - 竞争焦点从早期强调大模型跑分数据转向端侧智能的实际应用 特别是离线状态下手机的丰富功能 [1] - AI手机正跨越从“炫技”到“刚需”的临界点 让AI手机具备Agent能力是必然趋势 [1] - 行业竞争不再局限于单一终端技术参数 更在于构建开放统一的生态标准、符合用户智能交互习惯以及实现跨场景跨设备协同 [10] AI底层技术进展 - 开源大模型如DeepSeek快速发展 推动端侧模型小型化进展迅速 [1] - 模型小型化让手机有充足算力支撑端侧部署 小型化模型效果已逼近早期百亿、千亿规模模型 [3] - 端侧模型对手机内存占用显著缩小 例如vivo端侧3B模型仅占用2G内存 相比此前部署7B模型需要匹配3.5G内存大幅降低 [5] - 多模态化和长上下文扩展等技术突破为手机端侧应用提供基础条件 [1] 厂商战略布局 - OPPO提出新计算、新感知、新生态三大AI战略 结合云端和端侧算力是关键机会点 [2][3] - 厂商多数在开源模型基础上做业务适配与训练优化 OPPO强调“自主训练模型”聚焦业务定制、个性化模型和端侧小型化 [5] - 厂商与芯片厂商合作进行模型结构适配和加速 确保端侧模型部署过程中性能和功耗平衡 [3] - vivo推出3B端侧多模态推理大模型 可实现离线通话录音总结、写作等功能 [3] 应用落地演进 - OPPO将AI模型能力系统级嵌入手机经历三个阶段:智能助理、系统级感知能力、软硬件能力定制 [7] - 传统功能如录音、相册管理、语音助手借助AI技术帮助用户提升效率 [6] - 系统级AI通过优化输入方式、简化交互流程 比单纯“应用+AI”模式更贴近用户需求 [6] - 采用多智能体架构 引入第三方厂商智能体由手机整体调度 实现智能点外卖、打车等效果 [7] 生态构建挑战 - Agent普及面临三大挑战:生态开放与协议统一、跨应用调度权限获取、用户习惯培养 [7] - 多智能体连接需要手机厂商与第三方服务商联动数据与权限 国内外推进相关协议规范构建如谷歌A2A方案 [7][8] - 部分第三方服务厂商对开放权限持谨慎态度 导致生态协同效率受限 [8] - OPPO与支付宝合作推出多智能体互联协同方案Agent Hub Access 通过构建“Hub”管理账号与安全协议 [8] 用户接受度与市场影响 - 消费者对AI手机能力调用和感知较少 难以成为现阶段购机影响因素 [9] - 系统级软硬件结合解决方案若能精准命中用户痛点 能转化为核心购机驱动力 [9] - 端侧完成用户偏好积累可能形成品牌黏性 影响用户后续换机品牌选择 [9] - 用户习惯需从GUI触控操作转向“AI代劳”的交互逻辑 需要长期市场教育 [7][8]
【环球财经】谷歌三季报前瞻:广告业务和云计算双轮驱动能否持续?
新华财经· 2025-10-28 20:31
公司业绩与市场预期 - 公司将于10月30日美股盘后发布2025年第三季度财报,市场预期营收846亿美元,同比增长13.4%,每股收益2.27美元,同比增长7.1% [2][3] - 公司股价近6个月涨幅超过60%,市值攀升至3万亿美元创历史新高,在38位分析师中,32位给予“买入”评级,平均目标股价为273美元,较当前价格有约1.3%的上行空间 [2] - 公司财报已连续四个季度超出市场预期,市场关注焦点包括广告收入、搜索引擎份额、AI赋能、云业务及资本开支 [2][3] 广告业务表现 - 广告收入占公司总营收近80%,是维持业绩高增速的关键,AI技术正改写其增长叙事 [3] - 公司在搜索领域的市场份额达90.4%,基于Gemini AI的“Peak Points”广告工具提高了点击率和转化率,有望在第三季度贡献增量收入 [3] - YouTube在AI技术支持下有巨大变现潜力,预计能更好地提升用户体验和广告业务收入 [4] 云计算业务增长 - 云计算部门是推动公司营收持续增长的关键和下一个增长点,第三季度营收预计达146.6亿美元,同比涨幅29% [4] - 云业务的强劲增长源于AI快速发展及与更多企业建立合作,自研TPU芯片降低了成本并吸引大厂使用 [4] - 人工智能公司Anthropic扩大与谷歌云合作,获得100万个谷歌TPU芯片使用权,协议为期6年,总价值介于500亿至800亿美元之间 [4] 资本开支与AI基础设施 - 公司2025年全年资本支出预计上调至880亿至920亿美元,市场认为这是其在AI竞赛中保持领先的必要代价 [5] - 花旗预计公司2026年资本开支将达到约1110亿美元,2024至2029年间资本开支复合年增长率将达到26% [5] - 公司宣布未来几年将投资超过500亿美元用于AI基础设施建设,包括在美国多州投资建设数据中心和改造设施 [6] AI算力需求趋势 - 公司Gemini的Token使用量持续飙升,2025年6月已增至每月980万亿次,远高于4月的480万亿次,反映AI算力需求激增 [5] - AI应用厂商正探索智能体落地,从聊天机器人到Agent的升级有望带来Token调用量十倍以上提升,从而带动算力需求加速增长 [6] - 大模型进入后训练和推理时代,模型输出Token数将有约10倍提升,Agent处理单任务所需请求数有约20倍提升,整体Token增长十倍以上 [6]