Workflow
Agent
icon
搜索文档
「AI助手」真来了?谷歌牵头推进Agent支付协议AP2
36氪· 2025-09-17 19:12
近日,Agent 领域再次传来新进展,谷歌宣布推出 Agent 支付协议 ——AP2(Agent Payments Protocol ),这是一种开放的共享协议,为 Agent 和商家之 间安全合规的交易提供通用语言。 换句话说,这一协议是用于 AI Agent 跨平台主导发起与处理的购买支付,为每笔交易提供可追溯的记录。 具体来看,AP2 可视为是 A2A 协议和 MCP 协议的扩展。 今年年初,Manus 在全球范围内掀起 Agent 热潮,带着 MCP 协议变热,而这一协议是由 Athropic 于 2024 年 11 月推出,为的是让 Agent 更好与外部资 源、工具、API 接口集成,使 Agent 能够具备更多的能力。 之后今年 4 月,谷歌推出了开放的 A2A(Agent2Agent)协议,这面向的是 Agent 与 Agent 之间的「交互」,基于这一协议,Agent 之间可以相互协作、 一起完成复杂任务。 其实很好理解,虽然 Agent 成为今年 AI 主流叙事,开启「百 Agent 混战」模式,但更多是聚焦垂类,距离通用还很遥远,如果用户想要处理一件事情需 要用到多个 Agent 时,常 ...
「AI助手」真来了?谷歌牵头推进Agent支付协议AP2
机器之心· 2025-09-17 17:37
机器之心报道 机器之心编辑部 近日,Agent 领域再次传来新进展,谷歌宣布推出 Agent 支付协议 ——AP2(Agent Payments Protocol ),这是一种开放的共享协议,为 Agent 和商家之间安全合 规的交易提供通用语言。 换句话说,这一协议是用于 AI Agent 跨平台主导发起与处理的购买支付,为每笔交易提供可追溯的记录。 具体来看,AP2 可视为是 A2A 协议和 MCP 协议的扩展。 今年年初,Manus 在全球范围内掀起 Agent 热潮,带着 MCP 协议变热,而这一协议是由 Athropic 于 2024 年 11 月推出,为的是让 Agent 更好与外部资源、工具、 API 接口集成,使 Agent 能够具备更多的能力。 之后今年 4 月,谷歌推出了开放的 A2A(Agent2Agent)协议,这面向的是 Agent 与 Agent 之间的「交互」,基于这一协议,Agent 之间可以相互协作、一起完成 复杂任务。 其实很好理解,虽然 Agent 成为今年 AI 主流叙事,开启「百 Agent 混战」模式,但更多是聚焦垂类,距离通用还很遥远,如果用户想要处理一件事情需要 ...
@CEO,你的下一个私人助理何必是人类
搜狐财经· 2025-09-17 12:25
鱼羊 闻乐 发自 凹非寺 量子位 | 公众号 QbitAI CEO私人助理的活儿,也被Agent盯上了。 每天能独立更新出全公司的日报版"今日头条",还是完全本地部署、开箱即用的那种: 本体甚至能被CEO拎着走。 没错,整个机箱就A4大小,跟iPhone 15 Pro Max对比起来是这样的: 不卖关子,这么个新鲜角色,名叫智跃Agent一体机。很有意思的一点是,这是市面上首个专门面向CEO打造的软硬一体私有化Agent,目标用户非常明 确。 不强调提供模型和算力,而是把硬件+软件+算力+预置的Agent打包成一个整体,整合在一个超小型的精巧机箱里,搭配App实现插电即用。 在硬件层面,它采用小巧的12L机箱设计,搭载单卡4090,可以说是超小型化的Agent方案。 所有数据处理、存储环节均可以在本地完成,无需依赖外部云端算力资源,在保证数据处理高速响应的前提下,避免了数据传输过程中的延迟和安全风 险。 软件系统则完全基于管理场景自研开发,不仅拥有专属的操作系统,还配套了定制化App。 这种高效联动的整体性特点,让智跃Agent一体机真正做到了开箱即用: 不愧是"Agent应用元年",连AI新硬件都开始彰显" ...
LLM开源2.0大洗牌:60个出局,39个上桌,AI Coding疯魔,TensorFlow已死
机器之心· 2025-09-17 12:00
大模型开源开发生态全景图2.0核心变化 - 全景图收录114个项目 较上一版减少21个 覆盖22个领域 其中39个为新晋项目 60个项目被淘汰[7] - 生态中位年龄仅30个月 平均寿命不足三年 62%的项目诞生于2022年10月"GPT时刻"之后 包含12个2025年新项目[10] - 分类框架从Infrastructure/Application进化为AI Agent/AI Infra/AI Data三大板块 反映行业以智能体为中心的技术趋势[15][16] 项目活跃度与更替 - PyTorch以92,039个Star位居榜首 vLLM以53,912个Star位列第二 新晋项目GERTINI获得66,881个Star[11] - TensorFlow因迭代迟缓退出市场 PyTorch实现生态统一[8] - 头部前十项目覆盖模型生态全链路 平均Star数接近3万 远超历史同期开源项目[10] 开发者地域分布 - 全球366,521位开发者中 美国占37.41% 中国占18.72% 中美合计贡献超55%[17][20] - 美国在AI Infra领域贡献度达43.39% 为中国的两倍 在AI Data领域优势更明显[18][19] - 中国在AI Agent领域贡献度达21.5% 与美国24.62%接近 反映应用层投入集中[23] AI Agent领域演进 - AI Coding成为最活跃赛道 完成从"补代码"到"全生命周期智能引擎"的跨越 支持多模态与团队协同[43] - Chatbot领域经历高光后回归理性 Lobe-Chat保持64.7k Star Cherry Studio以"个人知识助理"定位逆势上榜[50][53] - Agent Workflow Platform向基础设施演化 Dify提供从原型到生产的一站式平台 RAGFlow等项目快速走红[54][57] - Agent Tool领域爆款频出 Browser-use9个月获60k Star mem0解决记忆管理问题 Supabase成为GenAI数据基础设施[57] AI Infra技术趋势 - Model Serving持续高热 vLLM和SGLang主导云端推理 NVIDIA TensorRT-LLM绑定GPU硬件巩固算力优势[62][66] - 本地化推理快速发展 ollama使大模型可运行于个人设备 GPUStack等新框架持续涌现[68][70] - LLMOps接棒MLOps 成为2025年增长最快赛道 Phoenix/Langfuse等项目覆盖监控至工作流管理全环节[71][72] - 模型训练热度回落 社区更关注低成本微调方案如Unsloth集成QLoRA[78] AI Data领域状态 - 技术成熟度较高 多数项目诞生于2014-2020年 Chroma成为少数抓住RAG机遇的新秀[82] - 向量数据库等基础组件缺乏突破点 Milvus/Weaviate/Elasticsearch等已成为标准拼图[86] - 企业级场景特性使开发者关注度难以维持 但向量化/RAG/多模态处理正推动数据平台向智能中枢演进[87] 开源许可模式演变 - 新项目多采用限制性许可协议 保留许可方干预权 Dify使用BSL变体 n8n采用Fair-code条款[92][93][94] - 部分项目按用户规模设限 月活超阈值需重新授权 GitHub出现代码闭源但获高星现象[91][94] 大模型技术发展动向 - MoE架构成为主流 DeepSeek/Qwen/Kimi等模型参数达万亿级 推理时仅部分激活[101] - Reasoning能力成为标配 DeepSeek R1通过强化学习增强推理 Qwen/Claude引入"快思慢想"混合模式[102] - 多模态全面爆发 语言/图像/语音交互成基础能力 语音模态工具链Pipecat/LiveKit Agents快速完善[103][104] - 模型评价体系多元化 从人工投票平台转向OpenRouter等API网关的"数据投票"排行榜[106]
@CEO,你的下一个私人助理何必是人类
量子位· 2025-09-17 11:43
鱼羊 闻乐 发自 凹非寺 量子位 | 公众号 QbitAI CEO私人助理的活儿,也被Agent盯上了。 每天能独立更新出全公司的 日报版"今日头条" ,还是完全 本地部署 、 开箱即用 的那种: 本体甚至能被CEO拎着走。 没错,整个机箱就A4大小,跟iPhone 15 Pro Max对比起来是这样的: 不卖关子,这么个新鲜角色,名叫智跃Agent一体机。很有意思的一点是,这是市面上首个专门面向CEO打造的软硬一体私有化Agent,目标 用户非常明确。 不愧是"Agent应用元年",连AI新硬件都开始彰显"个性"了。 到底怎么一回事,量子位编辑部的同事们也是率先过了一把CEO瘾,咱们一边实测,一边看看2025年的AI新硬件,都进化成什么样的形态了 —— 开箱即用的"信息管理助手" 传统的一体机大家已经比较熟悉了,大体上是算力+模型供给的模式,基本上买到手里还是得给它配个专门的开发团队。 与之相比,智跃Agent一体机实际上属于一个 全新的概念,定位并不相同 。 在硬件层面,它采用小巧的12L机箱设计,搭载 单卡4090 ,可以说是超小型化的Agent方案。 所有数据处理、存储环节均可以在本地完成,无需依赖外 ...
腾讯云首发智能体战略全景图,国产芯片全面适配
中邮证券· 2025-09-17 11:36
行业投资评级 - 强于大市 维持 [1] 核心观点 - 腾讯打造智能化与全球化两大效率引擎 首发智能体战略全景图 从基础设施 开发平台到应用生态为企业提供工具和支持 [3] - 智能体开发平台ADP面向全球发布3.0 新增近600项功能 支持LLM+RAG Workflow Multi-Agent等多种开发框架 [3] - 个人用户可使用腾讯元器件 无需编程经验即可将创意转化为AI产品 [3] - 腾讯云国际业务过去三年持续高双位数增长 海外客户数同比翻番 90%以上中国互联网企业和95%以上头部游戏公司出海选择腾讯云 [4] - 元宝DAU跻身国内AI原生应用前三 日提问量达年初月总量级别 相当于暴增30倍 与微信 腾讯会议等10余款核心应用深度打通 [5] - ima知识库文件数量突破1亿 QQ浏览器AI月活数比4月增长17.8倍 [5] - 腾讯通过大模型优化广告业务 提升广告点击率与转化率 助力Q2营销服务收入增长20% [5] - 腾讯用AI加速游戏内容制作 推出高仿真虚拟队友和NPC 助力游戏收入实现双位数增长 [5] - 腾讯云异构计算平台全面兼容适配国产芯片 推出Agent Infra解决方案Agent Runtime 集成五大组件提供安全可信计算能力 [6] - 推出专家服务智能体Cloud Mate 用Agent改造Infra服务 打造主动服务的云 [6] 投资建议关注领域 - AI Agent领域建议关注鼎捷数智 视源股份 泛微网络 致远互联 金蝶国际 用友网络 汉得信息 赛意信息 迈富时 光云科技 税友股份 润达医疗 同花顺 恒生电子 金山办公 万兴科技 福昕软件 科大讯飞 金桥信息 卓易信息 普元软件等 [8] - 国产算力领域建议关注寒武纪 云天励飞 亿都 浪潮信息 曙光数创 超讯通信 华丰科技 神州数码 软通动力 烽火通信 广电运通 拓维信息 四川长虹 数据港 润泽科技 光环新网 科华数据 奥飞数据等 [8] - 海外算力领域建议关注新易盛 中际旭创 天孚通信 长光华芯 长芯博创 源杰科技 华工科技 光迅科技 太辰光 仕佳光子 胜宏科技 景旺电子 沪电股份 生益电子 深南电路 东山精密 兴森科技 工业富联 英维克 高澜股份 申菱环境 巨化股份 川环科技 同飞股份 飞荣达 鸿腾精密 麦格米特 欧陆通 禾望电器 盛弘股份 杰华特 紫光股份 锐捷网络 中兴通讯 菲菱科思等 [8] 行业基本情况 - 行业收盘点位5617.07 [1] - 52周最高点位5841.52 [1] - 52周最低点位2855.49 [1]
腾讯邱跃鹏:推理需求爆发,云基础设施也要同步升级
华尔街见闻· 2025-09-16 16:04
行业趋势 - 2025年AI应用爆发并迎来Agent元年 推理需求出现暴涨[3] - 大模型产业重心从训练转向推理成为行业共识[3] - 客户对大模型和Agent建设迸发强烈热情[3] 基础设施升级 - 公司不断升级云基础设施以支撑Agent规模化落地和企业全球化发展[4] - 深入参与开源贡献 向DeepSeek、vLLM、SGLang等社区提交多项优化技术[4] - 自研并开源FlexKV多级缓存技术 大幅降低KVCache占用 首字时延降低多达70%[4] 算力平台 - 依托异构计算平台整合多种芯片资源 提供高性价比AI算力[5] - 平台已全面适配主流国产芯片[5] - 通过软硬件协同全栈优化整合不同类型芯片[6] Agent解决方案 - 推出Agent Runtime解决方案 集成执行引擎、云沙箱等五大能力[6] - 云沙箱基于自研技术 启动时间只需100毫秒 支持数十万实例并发[6] - 开发专家服务智能体Cloud Mate 由多个子Agent构成[6] 应用成效 - Cloud Mate实现风险SQL拦截率95%[7] - 排障时间从30小时缩短至最快3分钟[7] - 改变云管理方式 可视化治理架构并前置拦截风险[6]
腾讯云总裁邱跃鹏:腾讯云已全面适配主流国产芯片
新浪科技· 2025-09-16 11:26
AI基础设施升级 - 腾讯云通过异构计算平台整合多种芯片资源提供高性价比AI算力 并全面适配主流国产芯片[1] - 大模型产业重心从训练转向推理 客户对Agent应用热情推动推理需求暴涨[3] - 自研FlexKV多级缓存技术将首字时延降低70% 对话时延降低57%[4] - 集成多token联合预测技术使生成速度提升35% 注意力数据并行功能使吞吐量提升30%[4] - MoE-Chunk技术支持超过256K超长输入 适用于长文档分析和复杂代码生成场景[5] 全球化基础设施布局 - 云基础设施覆盖全球55个可用区 部署3200多个加速节点 为超1万款游戏提供安全防护[1][10] - 在日本大阪和沙特新建可用区 全球设立9个技术支持中心 获得400多项专业认证[1][14] - 自研星星海服务器全球累计部署核数超2亿 旗舰SA9单机规格提升至768核[9] - 防护容量达25T(同比增长70%) 带宽储备达400T(同比增长100%)[13] 企业级解决方案创新 - 推出Agent Runtime解决方案 集成执行引擎/云沙箱/安全服务 提供100毫秒极速启动支持数十万实例并发[6] - 云沙箱通过MCP/SDK/API多种方式接入 具备严格身份权限管理和数据安全防护[6] - 专家服务智能体Cloud Mate集成超90%腾讯云产品 提供超100万次智能架构治理服务[7] - Cloud Mate对风险SQL拦截率达95% 累计检测超770万行代码 平均排障时间从30小时缩短至分钟级[8] 客户实践与性能提升 - 完成印尼GoTo集团超大规模迁移 管理1亿注册用户/10000台云主机/730+数据库实例/1000+微服务[13][14] - 5个月建成印尼第三可用区 交付500+定制化需求 进行5轮全链路演练[14] - 新一代TDSQL数据库在复杂查询场景下总时延下降80% 专有云TCE达到RTO 2分钟容灾能力[9] - EdgeOne Pages产品上线3个月助力超10万用户出海 互动直播组件客户数增长超300%[11][12] 行业领导地位与技术贡献 - 与AWS/Google/Microsoft同被评为全球游戏云平台领导者[10] - 深度参与开源社区 向DeepSeek/vLLM/SGLang提交优化技术[1] - 优化DeepEP使IB网络性能提升30% RoCE网络性能翻倍[3] - 支撑国家级活动8000万观众同时在线直播 保障亚太超一半正版英超直播[13]
张小珺对话OpenAI姚顺雨:生成新世界的系统
Founder Park· 2025-09-15 13:59
文章核心观点 - 语言是人类实现泛化的核心工具,是构建通用人工智能系统的最本质要素 [4][7][77] - AI Agent发展已进入下半场,重点从模型训练转向任务定义和环境设计 [5][62][63] - 创业公司最大机会在于设计新型人机交互界面,而非重复ChatGPT模式 [110][112][113] - 未来AI生态将呈现既单极又多元格局,由不同超级应用共同定义智能边界 [5][146][154] 姚顺雨背景与研究历程 - 清华姚班本科、普林斯顿博士,2019-2024年在普林斯顿攻读博士学位 [13] - 2016年接触多模态嵌入技术后转向深度学习,2018年系统性开始深度学习研究 [14][15] - 博士期间从计算机视觉转向语言模型研究,因认为语言是实现AGI的更核心方向 [15] - 专注Language Agent研究6年,2024年加入OpenAI [4][19] AI Agent技术演进 - 技术发展三阶段:符号主义AI(规则系统)→深度强化学习(环境特定)→大语言模型(泛化推理)[40][41][43] - 语言智能体与传统Agent本质区别在于具备推理能力从而实现泛化 [36][38][39] - ReAct框架成为最通用方案,实现推理与行动的协同 [26][50] - 代码环境是数字智能体最重要的"手",提供天然机器表达形式 [53][54][55] 任务与环境设计 - 当前瓶颈从方法创新转向任务定义和环境设计 [62][63] - 优秀任务需具备:结果导向奖励机制、基于规则的白盒评估、可解释性 [64][66][71] - 任务分类标准:可靠性需求型(如客服)vs创造力需求型(如证明猜想)[70][72] - 评估指标需区分Pass@k(多次尝试成功率)和Pass^k(每次成功率)[74] 产业发展与创业机会 - 模型能力溢出为创业公司创造机会,关键在于设计新型交互界面 [110][112] - 成功案例包括Cursor(编程副驾驶)、Manus(通用交互)、Perplexity(研究型搜索)[117][127][129] - 数据飞轮形成需三个条件:自主训练能力、清晰奖励信号、数据好坏分离 [123][124] - 成本不是核心瓶颈,真正关键在于找到价值超过成本的应用场景 [139][141] 未来生态展望 - OpenAI五级能力划分:聊天机器人→推理者→智能体→创新者→组织者 [44][45] - 未来12-24个月趋势:Chatbot系统自然演进为Agent系统,新型Copilot应用涌现 [165][166] - 记忆系统(Memory)将成为核心竞争壁垒,特别是上下文管理能力 [51][158][159] - 最终生态将由多个超级应用共同定义,呈现中心化与分布式并存格局 [146][152][154]
对谈 Macaron 创始人陈锴杰:RL + Memory 让 Agent 成为用户专属的“哆啦 A 梦”|Best Minds
海外独角兽· 2025-09-11 20:02
AI Agent发展趋势 - ChatGPT加入memory功能后用户粘性显著增强 AI Agent开发进入更成熟阶段 从依赖prompting构建基础Agent转向通过RL和memory开发Agentic能力更强的Agent [2] - AI角色正从写代码、做PPT的生产力助手向真正懂用户的个性化生活伙伴转变 [2] - Multi-agent系统可将Memory Agent和Coding Agent分开训练 实现情商和智商的平衡 [3] - 不同的生活场景叠加会给Agent带来更大的商业价值 [3] Macaron产品定位 - Macaron定位为Personal Agent 专注于个人生活场景而非生产力方向 [13] - 产品核心特点是Memory强和有用性 能帮助用户定制饮食记录、健身日志、心情日记等Sub Agent小工具 [14] - 产品最佳类比是多啦A梦 既是用户朋友又是生活助手 而非单纯工具 [23] - 采用multi-agent架构:高情商的Memory Agent作为用户朋友 高智商的Coding Agent专注工具开发 [24] - 上线一周多已有7000多用户创建10000多个小应用 主要集中生活记录与规划类需求 [51] Memory技术突破 - Memory不是目的而是方法 目标是更好服务用户而非单纯记忆 [15] - 将Memory当作智能能力进行训练 采用Memory强化学习技术 [16] - 在671B大模型级别进行Memory强化学习训练 国内能做的团队不到5个 [33] - 训练中机器Memory与人的Memory需要拟合对齐 用户强调的信息会被着重记录 [17] - 开发all-sync RL技术 将训练时间从按周压缩到按天 约30小时完成一次有意义的RL [39] 训练技术优势 - RL是智能提升下半场的核心 在特定场景可推到智能最上限 [34] - 在700B大模型上进行RL训练才能迈过AGI门槛 200B是分水岭 [34] - all-sync RL通过通信与模型压缩实现训练与推理同步 效率提升数倍 原需512张卡现仅需48张卡 [42] - RL在场景优化中价值显著 从85分往95分提升时RL效果最强烈 [47] 商业化路径 - 生活场景相比工作场景具有更大商业价值 场景叠加能产生更大效果 [60] - 当前采用订阅制商业模式 未来考虑社区分享回报和第三方接入等创新模式 [61] - 不是传统App Store模式 而是生活方式分享平台 创作者无需创作能力只需分享独特生活方式 [27] - Personal Agent赛道类似社交软件格局 不同性格的Agent可并存 [63] 市场竞争格局 - ChatGPT已占据4亿DAU 处于Facebook式的统治地位但定位更偏向工作场景 [64] - Macaron定位生活陪伴场景 与ChatGPT可并存甚至抗衡 [65] - 时间点正好 作为第一批Personal Agent上市团队 有三到六个月窗口期建立用户心智 [65] - 专业场景Agent仍有巨大机会 但单纯工作流式小Agent会被大Agent覆盖 [66] 用户案例 - 用户创建多样化生活应用:高尔夫动作分析、搬家规划、家庭菜谱管理等个性化需求 [55][56][57] - 这些应用太个性化难以在传统应用商店找到解决方案 但完美符合个人需求 [57] - 代码生成成本大幅降低 像自来水一样流动 普通用户也能造出合心意工具 [59] 技术架构 - 摒弃传统数据库系统 设计让所有Sub Agent共享同一份个人数据的架构 [32] - 记忆传递机制复杂 需实现Sub Agent间相互理解与信息反馈 [31] - 训练目标分离:Memory Agent优化更懂用户和聊天服务 Coding Agent优化200个真实案例工具开发 [25]