A2A - 财报，业绩电话会，研报，新闻

A2A

搜索文档

创业邦· 2026-01-24 18:43

AI手机技术路线之争：GUI与A2A - 文章核心观点：AI手机的发展存在两条主要技术路线——GUI（图形用户界面）路线与A2A（智能体到智能体）路线，这不仅是技术选择，更是不同公司基于自身生态位对未来主导权的押注，将决定下一个十年人机交互的方式[7][17][37] 技术路线逻辑与特点 - GUI路线主打“快”，通过系统权限“读屏”并模拟操作APP，能快速验证AI手机可能性，但存在体验不稳定和安全隐私风险[7][10][14] - 实现方式包括调用安卓“无障碍服务”或获取系统签名权限进行进程注入，绕开应用厂商，快速覆盖现有生态[10] - 体验依赖应用界面稳定性，一个包含5个步骤的操作，即便每一步成功率高达90%，整体成功率也可能骤降至59%[11] - A2A路线主打“稳妥”，通过标准API接口让AI与应用直接“对话”，需要生态共识，发展缓慢但更安全[7][14][16] - 核心设计是“双重授权”，需同时获得用户和应用方授权，权责清晰，数据流动有据可查[14] - 需要操作系统厂商、应用开发者共同推进标准化协议，协调成本高[15] 海外科技巨头的选择与策略 - 海外巨头几乎都选择A2A路线，推动API集成，以维护现有秩序和生态控制力[18][21] - 苹果升级“App Intents”框架，要求接入AI功能的应用按标准提供API接口[18][20] - 谷歌推动“AppFunctions API”以统一安卓生态的AI调用标准[18][20] - 微软自研“AutoGen”多智能体对话框架，并通过API整合软件生态[19][20] - OpenAI和Anthropic推动“函数调用”和“工具使用”，Anthropic的MCP活跃服务从2025年3月的2000多个增长到12月的超过1万个[19][20] - 海外巨头对GUI尝试谨慎，主要在PC端受控环境内进行，未向普通用户大规模推广[22] - 谷歌、微软在手机上推出“屏幕共享”功能，AI只能“看”不能操作[22] - OpenAI将GUI能力限定在Atlas浏览器内，Anthropic的Computer Use API仅供开发者在虚拟环境测试[22] - 微软将“看”（Copilot Vision）和“做”（Copilot Actions）的动作拆分，后者在沙盒桌面中进行[22] 国内科技公司的布局与考量 - 国内市场格局复杂，厂商选择多样，既有“挑战者”也有“守成者”[23][27] - 字节跳动走高权限GUI路线，通过豆包大模型与中兴努比亚合作推出AI手机，争夺流量入口[23] - 阿里、华为、OPPO布局A2A路线，但各有商业考量[24][25][26][27] - 阿里通过自建API体系将“通义千问”集成到淘宝、支付宝等核心业务，保护交易生态并打造入口[24][27] - 华为在HarmonyOS 6中通过“意图框架”实现“小艺”与鸿蒙原生应用的A2A协作[25] - OPPO联合支付宝等探索A2A行业标准[26] - 国内厂商通过A2A争取话语权，并试图建立以自身OS或大模型为核心的混合生态[27] A2A路线成为主流倾向的原因 - 从技术角度看，A2A符合AI分工协作本质，让AI专注理解与调度，执行交给垂直应用智能体，更高效可靠[30] - 从监管角度看，A2A更安全合规，其明确的接口和“双重授权”机制建立了合规防火墙，而GUI的“读屏”面临严格隐私监管，例如2025年12月美国德州起诉多家智能电视制造商高频截屏收集数据[31][32] - 从商业成本角度看，A2A长期运营更经济，GUI需要持续消耗大量云端计算资源分析图像，规模化商用成本高昂，几乎不可持续[32][33] AI手机生态的未来机遇 - 协议层与中间件将成为核心，A2A、MCP等协议标准可能成为AI时代的“操作系统”，掌握标准可能成为平台级巨头[33] - “智能体工厂”与垂直Agent服务商将迎来爆发，基于标准协议为特定行业开发专属智能体将成巨大市场，可能出现“智能体商店”[35] - 云厂商将成为智能体的“训练场”，手机厂商成为智能体的承载终端，都将获得新增长[35] - 对于中国科技公司，这是在底层协议和基础设施上与全球巨头同台竞技的机会[36]

Agent 正在终结云计算“流水线”，Infra 必须学会“思考” | 专访无问芯穹夏立雪

AI前线· 2025-12-02 12:28

基础设施范式转变 - 基础设施演进正从AI Infra走向Agent Infra乃至Agentic Infra，成为推动智能体规模化落地的关键力量[2] - 范式从“处理”转变为“思考”，基础设施需从“生产线工厂”转变为“解决方案公司”，为Agent的整体产出质量提供系统性支撑[3] - 基础设施需具备智能性，能够保障Agent执行任务的质量，协调连续且相互关联的多任务协作[3][4] Agent Infra 核心升级维度 - 运行环境需灵活适配Agent的执行方式，环境的沙盒化与灵活调度能力尤为关键[4] - 为Agent配备完善的工具，使其能够有效调用资源[4] - 提供精准而充分的上下文信息，确保任务理解与执行的一致性[4] - 通过安全与监控机制，保障整个任务过程的可控性与可观测性[4] Agentic Infra 的演进与目标 - Agent Infra是第一阶段，旨在让算法能力被更好地发挥，推动智能体走出实验室环境，帮助Agent从演示品走向生产力[9] - Agentic Infra是第二阶段，重点构建能更好支持下一代AI进化与规模化落地的基础设施，推动智能体深度参与基础设施的核心工作流[10] - 目标是实现从“将智能体视为工具”到“将智能体视为协作者”的范式转变，构建支撑智能体高效、稳定、低成本协作与进化的基础设施新形态[10] 当前Agent发展的核心问题与瓶颈 - 模型能力已经相当出色，但配套给Agent的基础设施服务与工具尚不成熟，瓶颈不在模型本身，而在支撑体系的响应能力[5][6] - 用户对“无代码编程”的期待是“用自然语言一步到位生成完整程序”，但现实仍需频繁迭代和更专业知识，高门槛和不确定性导致用户流失[5] - Lovable平台的用户数从6月的峰值3512万跌至9月的不足2000万，下降了超过40%[5] 算力资源优化与调度创新 - 传统AI算力基础设施以固定虚拟化或容器化单元划分资源，在Agent场景下极不经济，造成资源浪费[15] - 良好Agent Infra通过微虚拟化沙箱、沙箱调度和高并发沙箱管理机制，实现毫秒级环境切换和接近100%的资源利用[16] - 容器冷启动过程通常耗时数秒到数十秒，在高频创建和销毁任务的Agent场景中会造成大量时间损耗与资源空转[15] 异构算力统一调度与生态整合 - 核心技术创新是实现资源的统一标准化，包括功能层面打通不同类型算力的使用和效率层面实现任务的合理分配[16] - 国内算力资源种类多样、分布分散，基础设施必须始终面向最前沿，让Agent像使用水电一样使用算力[7][17] - 技术适配是早期最大阻力，一旦把不同模型与不同硬件之间的M × N映射打通，后续维护成本不高[17] 技术先进性与工程落地的协同 - 构建AI原生的基础设施，技术先进性与应用落地性相辅相成、互相迭代[19] - 研发支持弹性伸缩和动态资源调度的沙箱系统，每个Agent的沙箱可以按需启动或销毁，实现毫秒级响应[20] - 资源分配可根据任务类型和负载自动调整，通过智能调度引擎实现高峰弹性扩容、低峰快速收回，显著提升集群资源利用率[20] 未来基础设施形态与发展愿景 - 未来希望看到智能体之间进一步形成组织，共同完成更复杂的任务，各个智能体的KV Cache和上下文可以根据需求实现共享或隔离[14] - 目标是释放无穹算力，让AGI触手可及，通过系统层面的创新，让AGI能够更高效、更可持续地实现[22] - 基础设施引入Agent能力后具备自主性，从而实现更高效的资源整合和更具价值的功能创新[13]

Artificial Intelligence

Artificial Intelligence

沙箱系统

人工智能行业专题（12）：AIAgent开发平台、模型、应用现状与发展趋势

国信证券· 2025-09-10 23:25

投资评级 - 行业投资评级为优于大市（维持）[1] 核心观点 - AI Agent是突破指令执行的智能实体具备代理权可主动感知自主决策并执行复杂任务在AGI分级中处于L3智能体阶段性能等效90%熟练成年人[3] - AI背景下AI基础设施层面临重构客户将重新选择云/AI平台云厂商加大布局AI/Agent平台瓜分新市场[3] - 海外模型呈现差异化发展国内模型层并未拉开显著差异 2025年初深度推理与长上下文模型发布推动Tokens调用量快速提升[3] - 应用C端重磅搜索产品依赖模型能力与生态导流图像与编程类产品发展迅猛应用越偏向垂类则技术门槛越低产品理解要求越高竞争越激烈商业化闭环越容易[3] - 应用B端Copilot/Agent产品形态丰富持续渗透机遇与挑战并存企业落地仍面临幻觉数据安全成本高等问题[3] - 全球AI IT支出2023-2028年CAGR 22.3% 其中GenAI达73.5% CBINSIGHTS预计2032年AI Agent营收有望达1036亿美元（CAGR 44.9%）[3] Agent定义、技术与发展 - AI Agent具备自主性规划力与执行力核心突破在于赋予代理权可主动感知环境自主规划决策执行复杂任务[10] - 关键特性包括自主决策动态学习跨系统协作核心模块包括感知层记忆层决策层执行层[10] - 与LLM和传统自动化的关键区别在于LLM是知识顾问 Agent是战略指挥官传统自动化仅规则执行 Agent实现端到端任务闭环[10] - 在AGI分级中 Agent处于L3智能体阶段性能等效90%熟练成年人[11] - 代理核心构成包括记忆感知规划工具使用[12][15] - 相关技术创新包括MCP（模型上下文协议）和A2A（Agent-to-Agent通信协议）[16][19] - Agent市场图谱分为基础设施类横向职能类垂直应用类三大类别[20][22] Agent开发平台的布局 - 海外云厂商平台布局对比：微软聚焦B端基础设施模型支持最全面工具链和生态整合全面安全与稳定性强谷歌兼顾B/C端多场景多模态强但生态不成熟市占率较低亚马逊依托AWS服务中小企业侧重算力销售与便捷部署但工具链分散[51] - 国内平台布局对比：字节扣子覆盖全场景开发者与智能体数量领先阿里百炼主攻B端全行业服务30余万企业客户 MCP工具链和开源生态丰富腾讯元器基于混元大模型主打轻量化低代码开发聚焦社交与游戏垂类[55] - 微软Azure AI Foundry已被80%财富500强企业使用 25Q2处理tokens超500万亿同比增长超7倍 agent service客户数达1.4万[42] - 谷歌AI平台架构涵盖数据综合层控制层数据层业务活动层赋能基础设施包括TPU v7 Ironwood和英伟达支持[48][49] - PaaS/Agent平台面临市场份额重构机会 IDC调查显示70%受访企业将更换或新增云/AI平台供应商[56] - 平台关键需求包括提高开发交付效率 AI驱动的工作流自动化是首要需求安全与隐私是最大落地障碍[62][63] - 企业AI战略重心分层核心模型能力是第一抓手云服务商在助力实现AI目标的供应商中占比49%[68][70] 模型层与Tokens调用量分析 - 根据Openrouter数据谷歌Gemini与Anthropic Claude占API市场半壁江山国内DeepSeek 阿里Qwen系列份额稳步提升[3][95] - 谷歌2025年7月调用量980万亿tokens 较去年增长100倍其中内部需求占比高达97%[3] - 国内字节豆包2025年5月日均tokens 16.4万亿增长137倍内部占比超80%[3] - 海外模型差异化发展：OpenAI技术路径领先聚焦推理与专业能力谷歌端到端原生多模态领先 Anthropic编程场景领先实用性突出[102][103] - 国内模型未拉开显著差距：DeepSeek技术研究领先阿里自研能力与综合能力强字节各模态均衡百度中文场景优化腾讯基于DeepSeek改造[105][106] - 分场景份额：编程场景Claude Sonnet4占近半调用量角色扮演场景DeepSeekV3领先科技金融场景Claude Sonnet4与Gemini Flash占优营销搜索翻译场景Gemini Flash优势明显[108][111][113] - 过去半年模型周tokens消耗量增长4.7倍深度推理与长上下文模型发布推动调用量快速提升[122][123] C端与B端Agent进展 - 应用C端重磅搜索产品依赖模型能力与生态导流 ChatGPT MAU预计年底超10亿 Gemini MAU 4.5亿国内夸克元宝依托生态导流[3] - 图像类Midjourney ARR 5亿美元可灵月收入1.5亿元编程类Cursor ARR 5亿美元 GitHub Copilot Web MAU 1.2亿[3] - 应用B端Copilot/Agent产品形态丰富持续渗透微软Copilot家族月活用户已超1亿但企业落地面临幻觉数据安全成本高（Agent调用成本为LLM 15倍）等问题[3] - 根据CBINSIGHTS 企业工作流编码两大领域2024年营收均超10亿美元微软Microsoft Copilot 2024年收入约8亿美元 GitHub Copilot收入约6亿美元总占整体市场超25%份额[25] - 垂类市场中客户服务软件开发为高潜力赛道 64家组织中2/3计划12个月内用AI代理支持客服[25] Agent的市场空间与发展预期 - 根据IDC数据全球AI IT支出2023-2028年CAGR 22.3% 其中GenAI达73.5%[3] - CBINSIGHTS预计2032年AI Agent营收有望达1036亿美元 CAGR 44.9%[3] - 根据Garnter与IDC 短期（2023-2025）GenAI嵌入现有应用中期（2025-2027）Agent成核心组件长期（2027+）自主代理网络主导业务 2035年后Agent将成为认知共生的人类助手智能体即应用将成主流[3]

AI智能体，是不是可以慢一点？ | ToB产业观察

钛媒体APP· 2025-05-06 13:42

大模型应用套壳争议 - Manus采用第三方大模型进行工程化包装实现通用AI智能体能力被业内质疑为"极致套壳" 但创始团队认为这是成功策略 [2] - 行业普遍以自研基础大模型为荣 DeepSeek OpenAI等头部企业聚焦底层技术研发形成赢者通吃格局 [2] - 金沙江创投朱啸虎直言"所有AI应用都是套壳应用所谓壁垒是忽悠人的" 反映行业对应用层技术价值的争议 [2] 市场融资与估值动态 - Manus背后公司"蝴蝶效应"获Benchmark领投7500万美元融资估值飙升至5亿美元 [2] - 融资事件显示资本市场对AI智能体赛道的认可尽管存在技术争议 [2] 大厂AI智能体布局 - 字节组建至少5个团队开发不同AI智能体产品推出"扣子空间"协作平台提供股票分析和行研分析两类专业Agent [4] - 百度95后团队30天研发对标Manus的"心响"APP 涵盖超200个任务类型包括专业咨询和日常规划 [4] - 阿里与Manus战略合作基于通义千问开源模型实现功能复制并推出"心流"智能体开启公测 [5] 技术生态构建 - 阿里云腾讯云蚂蚁集团百度等大厂相继拥抱MCP机制推动智能体间通信和资源连接 [6] - 民生证券预测MCP协议+Agentic-based决策路径将成为主流范式大厂通过协议引入生态伙伴推动产业发展 [6] 安全风险与治理挑战 - AI智能体自主决策特性带来更高安全风险包括幻觉问题提示注入攻击数据泄露等隐患 [7] - 多智能体协作导致访问控制漏洞资源竞争冲突等问题安全管理复杂度指数级上升 [8] - 70%以上企业客户对AI智能体认知不足行业缺乏专职安全团队产品安全性能存疑 [7][8] 技术本质与发展趋势 - AI智能体需解决感知理解规划执行等多环节协同技术架构复杂度远超传统系统 [11] - 微软预测未来将出现专业智能体集群通过通信协作完成任务 Anthropic和谷歌分别推出MCP A2A协议提升搭建效率 [10] - 行业需从被动执行转向主动进化如自动驾驶系统对传统技术模块的AI化改造 [11]

AI智能体

MCP

A2A

Artificial Intelligence

Artificial Intelligence

Manus

扣子空间

Agent 开发的上半场: 环境、Tools 和 Context 如何决定 Agent | 42章经

42章经· 2025-04-27 22:10

Agent定义与核心特征 - Agent是基于环境反馈使用工具的程序采用Anthropic的定义[2] - 核心三要素包括状态(Context)、行动(Tool Use)、激励信号(RL反馈机制)[32][33] - 与RL强关联需理解强化学习才能设计优质Agent产品[31] Agent技术演进 - 2023年4月AutoGPT为代表的早期Agent更像玩具实际应用价值有限[4] - 当前Agent已能在工作生活场景中真正解决问题实现价值跃迁[5] - 进步源于：1)底层模型能力提升(如RL结合、长思维) 2)工程产品突破(Context构建)[6][7] Context工程创新 - Context是大模型执行任务所需信息总和不同产品Context构成不同[8] - 相比传统RAG Agent能自动化提炼Context 减少人工干预[10][11] - 优质Context需包含用户历史行为路径如APP打开瞬间即提供海量意图线索[48][49] Tool Use技术方案 - Function Call/MCP/A2A属于代码驱动派 Computer Use/Browser Use属于视觉模拟派[13] - MCP核心价值在于统一Tool Use标准降低工具调用门槛[12] - Browser Use存在纯视觉方案(如已倒闭的Adept)和API包装方案后者更成熟稳定[15] 产品设计方法论 - Chat是最佳交互入口保障用户自由度优于追求准确度[41] - 需解决双重信任问题：开发者信任模型能力用户信任执行过程[52][54] - 垂直领域Agent将长期主导通用Agent面临收敛困难[25][46] 行业竞争格局 - 当前Agent可分为：1)Coding Agent(交付代码) 2)调研Agent(交付报告) 3)表格Agent(定量分析)[61][64] - Sheet0实现100%准确率核心在于模块化工具复用与AI Coding验证[57][67] - AI Coding与Agent存在协同效应但直接编码执行任务成本过高[29][30] 发展关键变量 - 模型能力突破与Context工程进步是两大核心驱动因素[69][70] - 需构建完整评估体系(激励信号) 确保系统可收敛[35][71] - 产品需平衡通用性与准确性不同场景选择不同技术路径[59][60]