Agent

搜索文档
Agent发展打开了人机协同全新范式
搜狐财经· 2025-05-06 12:50
AI Agent发展 - Agent发展打开了人机协同全新范式,将为AI应用提供新的发展思路 [1] - 未来模型能力将持续提升,各领域Agent将成为模型触达终端用户的载体 [1] - 持续看好AI应用后续发展 [1] 字节跳动 - 发布通用Agent扣子空间开启内测,定位通用Agent [4] - 平台上用户可以选择精通各项技能的通用实习生或行业领域专家,通过与AI互动完成工作任务 [4] - 支持添加MCP扩展,AI Agent能力边界被进一步扩展,更多插件将接入 [4] - MCP有望成为AI时代的HTTP协议 [4] - 此举拉开大厂布局通用Agent序幕,阿里、腾讯等公司有望迅速推进 [4] 智谱 - 正式发布AutoGLM沉思,具备深度研究能力和实际操作能力 [4] - 利用全栈自研大模型技术,在多个测试环境中取得SOTA成绩 [4] - 核心模型逐步开源,推动相关生态扩展并快速催化应用场景 [4] Genspark - 发布超级智能体Genspark,综合性AI助手可协调多个AI工具高效执行任务 [5] - 采用整合多AI模型的混合代理(MoA)系统 [5] - 包含80多个工具集和10多个高级数据集,每个模型专门用于特定任务 [5]
AI Agent:模型迭代方向?
2025-05-06 10:28
纪要涉及的行业和公司 - **行业**:AI行业 - **公司**:微软、OpenAI、Anthropic、Deepseek、Kimi、Meta 纪要提到的核心观点和论据 AI商业化进展 - **观点**:AI商业化进展整体慢于预期,ToB端更慢,ToC端OpenAI产品仍以chatbot为主 [1][3] - **论据**:微软Copilot未达2023年3月披露时预期效果,OpenAI产品未进入agent阶段 大模型迭代趋势 - **观点**:过去三年全球大模型能力通过前训练和后训练提升,近三个季度后训练成主要迭代方式,推理模型能力显著提高 [2] - **论据**:思维链数据使agent执行复杂任务时可利用过程数据提升推理能力,大模型厂商迭代模型,无迭代能力公司用工程化方式完善产品 agent面临的问题及解决方法 - **观点**:agent执行复杂任务准确率受大模型能力限制,可通过工程化方法和后训练技术提高准确率 [1][5][9] - **论据**:工程化方法如将任务拆分由多个Agent执行;后训练技术如思维链技术可提高模型推理能力 各公司在agent研究方面进展 - **观点**:Anthropic在agent产品化和模型能力方面比OpenAI更具优势 [1][6] - **论据**:Anthropic技术积累更超前,ComputeUse系统运行时间早于OpenAI相应产品至少一个季度 大型科技公司推动大模型发展方式 - **观点**:大型科技公司通过技术研发和工程化手段推动大模型发展 [1][7] - **论据**:Deepseek、OpenAI和Anthropic专注技术研发,其他公司采用工程化手段完善产品 Chatbot和Agent对模型幻觉容忍度差异 - **观点**:Chatbot对模型幻觉容忍度高,Agent需每步操作准确无误,提升执行准确率是当前模型重要问题 [1][8] - **论据**:Chatbot一问一答,个别回答错误不影响后续;Agent执行多步任务,每步正确率90%最终任务也可能失败 DeepSeek发展情况 - **观点**:DeepSeek在2024年推出系列新型多模态模型,提升整体性能与应用范围 [4][12] - **论据**:发布GPT系列多个版本,Prover系列不同版本陆续推出 Prover V2相关情况 - **观点**:Prover V2为解决agent产品化问题提供新思路,性能有显著提升 [1][5][20] - **论据**:核心作者公开信息并提供论文;参数量达6,711亿,采用混合专家模型等改进使其能解决更复杂任务 推理能力提升挑战与方法 - **观点**:推理能力提升依赖算法设计,各公司缺乏统一路径,Deepseek通过两阶段训练提升下一代模型推理能力 [30][32] - **论据**:成功设计奖励函数和强化学习算法可提高推理效果;第一阶段用专家模型迭代,第二阶段优化数据集和架构 Agent AI商业化与算力需求 - **观点**:Agent AI商业化需全面分析,算力需求对Agent发展有重要影响 [37][38] - **论据**:市场可能低估关键算力需求,识别后将推动Agent发展,大厂改造推荐引擎已显示算力提升重要性 其他重要但可能被忽略的内容 - **Kimi情况**:Kimi发布72B预训练版本,能力较强,产品质量优于初期,团队技术实力较强 [24] - **测试集特点**:Putnam Benchmark测试集侧重分解解决问题能力;Deepseek Prover Bench不仅测试数学问题,还对比非形式化与形式化推理,在Deepseek V3版本展示非正式推理优势 [25][26] - **Lean四版本作用**:Lean四版本作为Deepseek Prover V2形式化证明标准,确保验证过程严谨准确 [27] - **DeepSigmaMath模型应用**:V1和V1.5版本参数量约7B,采用监督学习,转向强化学习和树搜索增强探索能力;V2版本参数量提升至7,000亿,采用混合专家模型架构,提高Prover能力 [28] - **基座模型挑战**:数据集和架构优化无市场共识,增加参数量是否为未来迭代主要方式存在分歧 [31] - **DeepSeek模型迭代路径**:从2024年2月DeepSeek模型开始,经Prover 1.0、V1.5、DeepSeek V3等版本,最终蒸馏出7B参数小型高性价比模型,未来可能演化出R2或V4 [34][35]
未知机构:华泰计算机Agent和MCP是AI主线中的主线近期变化Ag-20250506
未知机构· 2025-05-06 09:45
纪要涉及的行业和公司 - **行业**:计算机、AI行业 - **公司**:Manus、Genspark、Meta、阿里、纳米搜索、TextInMCP Server、Anthropic 纪要提到的核心观点和论据 - **核心观点**:Agent和MCP是AI主线中的主线 - **论据**: - **产品层**:Manus加入主动查看图像功能后开始自动检查生成的数据可视化,AI网络效应或初现,4月底获7500万美元融资;Genspark更新更好的个性化能力,Meta AI基于社交打造个性化有10亿月活,个性化是护城河 [1] - **模型层**:阿里Qwen 3强调Agent能力和MCP生态支持,预期国产模型积极拥抱MCP [2] - **商业化阶段**:工具厂商按API用量计费率先实现收入,如TextInMCP Server覆盖核心产品能力;Agent客户端商业化较快,Manus、Genspark已实现定价和初期用户增长;MCP生态建设者前期免费投入,后期通过广告和高级订阅摘取商业化果实 [2][3] 其他重要但是可能被忽略的内容 - 纳米搜索客户端是上市公司中首个2C Host并支持MCP Server,MCP功能限免,后续可能通过订阅或次数兑现收入 [3] - C端MCP客户端不能直接用于B端,但C端繁荣带来更多B端商机,MCP Server对B端同样受益 [3] - 列出其他MCP相关标的,包括工具类、客户端类、边缘计算类、开发类 [3]
千问3的屠榜,是AI的一小步,也是阿里的一大步
搜狐财经· 2025-05-05 14:31
阿里AI战略与成果 - 阿里通过Qwen3系列大模型的发布确立了在开源大模型领域的全球领先地位 终结了关于其是否为AI公司的讨论 [2] - Qwen3系列模型在多项基准测试中表现优异 如235B版本在ArenaHard达到95.6分 显著优于OpenAl-o1(92.1)和Deepseek-R1(93.2) [3] - 公司宣布未来三年将投入3800亿人民币建设云和AI基础设施 金额超过过去十年总和 [5] 技术优势与成本控制 - Qwen3-235B仅需4张H20显卡即可部署 成本仅为竞品DeepSeek-R1(需16张H20)的30% [7] - 模型支持从0.6B到235B的全尺寸分类 适配手机/智能眼镜/机器人等多种终端设备 [7] - 具备自适应算力分配功能 可根据需求动态调整思考模式与非思考模式的资源调用 [9] 行业竞争格局 - 中国AI应用需求旺盛 2022年工业机器人安装量达29万台 远超日本等十国总和 [11] - 中国78%受访者对AI持乐观态度 显著高于美国的35% 反映两国市场接受度差异 [10] - 当前ChatGPT单产品月活已超过中国前十大AI产品总和 显示国内应用层仍有差距 [12] 战略定位与生态布局 - 公司采用"云+AI"组合拳战略 将云计算定位为AI时代的核心基础设施 [14] - 通过开源策略构建产业生态 已为夸克/钉钉等内部产品提供AI底层支持 [11][12] - 明确从模型训练向Agent中心时代过渡的技术路线 强化对计算资源的整合能力 [14] 行业发展趋势 - AI投资呈现"杰文斯悖论" 技术进步未降低资源消耗 反而刺激全球算力需求激增 [6] - 中美AI发展路径分化 美国侧重AGI愿景 中国更注重产业落地与实际问题解决 [10] - 中国互联网进入"智能化"十年周期 需将技术优势转化为商业动能与用户福祉 [13]
为什么Agent对算力需求如此大
国盛证券· 2025-05-02 22:13
报告行业投资评级 - 行业评级为增持 [6] 报告的核心观点 - Agent对算力需求大,由其技术特性和发展阶段决定,算力是支撑Agent发展的关键基础设施和核心瓶颈 [49] 根据相关目录分别进行总结 海外科技巨头财报超预期,持续加大AI基建支出 - 谷歌2025年第一季度营收902.3亿美元、净利润345亿美元均超预期,云计算部门收入同比增长28%达123亿美元,2025年全年资本支出计划达750亿美元 [1][12] - 微软2025财年第三财季营收700.66亿美元、净利润258.24亿美元,智能云业务事业部营收267.51亿美元,剔除财务租赁的资本支出达167.5亿美元,2026财年资本支出预计继续增长但增速低于2025财年 [1][13][14] - Meta 2025年第一季度营收423.14亿美元、净利润166.44亿美元,预计2025年全年资本支出达640 - 720亿美元 [1][15] Agent内在技术对算力天然存在高需求 - Agent需处理长上下文和接入外部数据,增加上下文长度和处理复杂度,消耗更多算力 [20][21][22] - Agent能力增强带来调用频率提升,阿里云平台大语言模型API调用量近一年增长近100倍 [23] - Agent执行任务验证带来算力开销,如Manus的三重校验体系 [24] - 多模态发展使Agent处理整合多种类型数据,满足实时性交互需求,推高算力消耗 [25] Agent处于爆发期,应用层出不穷 - 市场规模爆炸式增长,2024年中国AI Agent市场规模1473亿元,企业渗透率不足5%,2028年有望达3.3万亿元 [26] - 通用AI助手积累海量用户,如DeepSeek 7天实现1亿用户增长,2025年2月中国生成式AI用户总数达2.5亿 [29] - 垂直领域Agent应用蓬勃发展,如营销领域覆盖全链路环节,旅行领域飞猪“问一问”提供定制化服务 [30][31] - MCP影响力不断扩大,加速Agent生态构建,智能体开发平台降低开发门槛,推动应用创新与普及 [36][37][39] - Agent市场爆发和应用普及转化为对算力的海量需求,模型训练也需海量算力支持 [41][42] 算力瓶颈影响Agent服务的用户体验 - 算力瓶颈导致服务响应延迟、不稳定甚至中断,如Manus执行任务耗时较长,扣子空间开放demo后服务器拥堵 [44] - Agent服务需预留冗余算力应对用户流量波动,但并非所有服务商都具备灵活调配能力 [47] 建议关注 - 算力相关企业:寒武纪、海光信息等 [5][51] - Agent相关企业:金山办公、泛微网络等 [51] - 垃圾发电相关企业:旺能环境、盈峰环境等 [52] - 互联网大厂AI链相关企业:寒武纪、恒玄科技等 [52] - 军工AI相关企业:能科科技、品高股份等 [53]
多模态和Agent成为大厂AI的新赛点
创业邦· 2025-05-01 10:54
大模型C端落地的核心方向 - 大模型落地C端场景的核心是让模型能力接近人类,分为降低用户沟通难度和提升复杂任务执行能力两个方向 [4] - 降低沟通难度依赖多模态能力提升,复杂任务执行依赖Agent产品生态成熟 [4] - 字节、百度、谷歌、OpenAI近期均推出多模态基础模型,阿里夸克上线"拍照问夸克"功能实现图文交互 [4][9] 多模态能力进展与场景渗透 - 火山引擎豆包1.5具备视觉理解能力,文心4.5 Turbo展示图像/视频识别能力,OpenAI o3/o4-mini实现"用图像思考" [9] - 谷歌Gemini 2.5 Flash可分析股票走势图并生成游戏场景设计图 [9] - 夸克"拍照问夸克"支持拍照搜索、文案生成、卡路里识别等功能,未来可能延伸至实时摄像头交互 [10][11][14] - 多模态能力将推动AI眼镜发展,目前受限于模型成熟度 [14] Agent产品生态现状 - 通用Agent产品形态趋向Manus提出的"对话框+工作区"模式,字节扣子空间、百度心响App等均采用该框架 [16][17] - 扣子空间擅长文字梳理但网页转化效果欠佳,心响App侧重移动端轻量化任务 [17][19] - 海外Agent更聚焦单一场景:Notion Mail处理邮件,OpenAI Operator操控浏览器,X AI Grok Studio生成文档/代码 [5] Agent核心能力要求 - 关键能力1:连接第三方数据/工具,需通过MCP/A2A协议扩展工具箱,纳米AI已接入近百工具 [20][21] - 关键能力2:编码能力,OpenAI拟收购Windsurf强化AI编程,支撑PPT/网页/游戏生成 [23] - 关键能力3:模型任务理解能力,OpenAI通过o3/o4-mini实现上网查资料/执行代码等"大脑"功能 [23] 厂商差异化发展路径 - 字节/百度采用API逻辑开发Agent,OpenAI按职业培养拟人化Agent(如司机型Operator、学者型Deep Research) [24] - OpenAI预计2025年Agent业务收入达30亿美元,2029年增至290亿美元,需结合多模态与执行能力成为底层入口 [25]
值得买(300785) - 300785值得买投资者关系管理信息20250430
2025-04-30 21:53
公司经营业绩 - 2024 年公司实现营业收入 15.18 亿元,同比增长 4.55%;归属于上市公司股东的净利润为 7,524.05 万元,同比增长 0.62%;扣除非经常性损益后归属于上市公司股东的净利润为 7,182.27 万元,同比增长 13.93% [3] - 2024 年累计投入研发费用 1.82 亿元,较 2023 年增长 10.52%,在营业总收入中的占比提升至 11.96% [3] - 2024 年第四季度实现归属于上市公司股东的净利润 7,143.6 万,同比增长 17.7% [3] - 2025 年第一季度,公司实现归属于上市公司股东的净利润情况未提及,但一季报合同负债因预收款项增长而明显提升 [3][15] - 2024 年度和 2025 年一季度销售费用率下降,得益于 AI 带来的运营和管理效率提升 [14] 公司战略规划 - 2023 年开始将 AIGC 纳入年度重点战略,2024 年 5 月正式发布并实施“全面 AI”战略 [3] - 2025 年按照“聚焦 AI”和“全面提效”的战略指导方针,推进 AI 技术与业务融合、创新型 AI 产品研发以及内部管理和运营效率提升 [3] - 全力投入 AI 技术研发,赋能消费内容、智能营销两大业务板块,探索 AI Agent 产品创新,助力国际化业务拓展;推行 AI 技术在公司内部各岗位的实际应用,赋能组织和业务流程提效 [3][4] - 继续全面推进国际化战略,2024 年启动“值得买”模式进入国际市场,首站泰国;2025 年深化全球化拓展,推进消费内容和智能营销全面全球化,计划年底在 5 个亚洲国家落地 [22][13] 产品进展情况 - “什么值得买 GEN2”2024 年小批量上线测试,2025 年引入 AIUC 引擎后用户二创内容质量和核心指标改善,预计 5 月全量上线,新版本信息流以商品内容为主 [6] - 正在规划独立 Agent 产品,希望在“小值”基础上更进一步,实现帮助用户下单、查快递等功能,构建新的电商流量生态 [8] - 星罗积极应用 AI 对业务平台进行升级 [21] - 星罗创想推出 AI 工具“神灯素材助手”,提升创意产出水准和内容生产效率,降低内容制作成本 [21] 竞争优势与特色 - 新定位为“AI 与内容驱动的数字消费服务集团”,AI 和内容是区别于其他数字营销公司的核心竞争力和差异化优势 [5] - 内容能力方面,有十多年消费内容建设经验;AI 方面,除 AIGC 外,还积极开展 AIUC 和 Agent 相关工作 [5] - AIUC 即 AI Understand Content,通过该引擎理解全网海量消费内容,支撑业务升级 [5] - 积极构建独立 Agent 产品,参与 MCP 等生态建设,抓住 Agent 互联机会 [5] 交流互动问题解答 - 公司 AI 业务与其他数字营销公司相比,内容和 AI 是核心竞争力,AI 方面有 AIUC 和 Agent 等特色 [5] - ChatGPT 等更新商品推荐功能可培养用户认知,对公司产品发布和用户习惯培育有促进作用,公司独立 Agent 产品有行业积累和合作优势 [10] - 通过 AI 优化工作流提升“什么值得买 GEN2”内容实时性和精准度,商品内容精准度从 85%提升到 95%以上,后期引入 Agent 进一步提升 [11] - 出海计划是消费内容和营销服务同步出海,年底在 5 个亚洲国家落地,上半年将签约印度尼西亚合作伙伴 [13] - 2024 年度销售费用率下降得益于 AI 带来的效率提升,2025 年继续投入 AI 并优化业务结构 [14] - 一季报合同负债增加是预收款项增长所致,保证了服务交付和费用收取的安全性 [15] - AI 化改造“什么值得买”工作流使人效提升、成本节约,仍有较大费用节省空间 [16] - AI 时代公司可将内容和商品能力通过 AI 引擎输出给其他流量体,未来有望构建新电商流量体系 [17][18] 公司 AI 领域规划与优势总结 - 坚持技术驱动战略,核心团队对 AI 有独到理解,提出 AIUC 体现对消费内容领域应用的创新理解;认识到智能终端 Agent 交互机会,通过推出独立 Agent 产品和参与 MCP 生态建设构建新电商流量体系 [20] - 基于底层 AI 能力改进主线产品,“什么值得买 GEN2”5 月全量上线,星罗应用 AI 升级业务平台,表明坚定投入 AI 的决心 [21] - 在 AI 领域有很多创新尝试,如“小值”、独立 Agent 产品、“神灯素材助手”,用大模型分析社交网络内容提供洞察 [21] - 积极参与 AI 生态建设,形成独特价值的商品库和内容库,开放给合作伙伴,与多家大模型公司和智能终端产品合作,“小值”入驻智能体应用平台 [21][22]
o3解读:OpenAI发力tool use,Manus们会被模型取代吗?
Founder Park· 2025-04-30 20:31
模型发布与能力升级 - OpenAI发布o3和o4-mini模型,o3具备最全面的推理能力、丰富的tool use方式和全新的多模态CoT能力 [8] - o4-mini专为高效推理优化,部分benchmark表现优于o3,但实际使用中思考时间更短 [8] - 模型首次实现将图像直接融入CoT中,能"看懂"图像并用图像思考,在多模态理解benchmarks中领先 [45] - o3在外部专家评估中比o1少犯20%重大错误,能意识到自身能力边界并拒绝无法解决的问题 [61] 技术路线与产品策略 - Agent产品分化出两类路线:OpenAI黑盒化端到端训练路线和Manus白盒化虚拟机模仿人类工作方式路线 [15] - OpenAI将Agent产品作为未来商业化收入占比的大头 [4] - OpenAI开源Codex CLI,具备多模态推理能力和本地代码环境集成特性,旨在普及竞争对手产品 [64][68] - OpenAI采用先训练mini reasoning版本再scale到full model的发布策略,与GPT系列先大后小的策略不同 [9] 能力测试与表现 - o3在YC官网信息收集任务中经过两次prompt后完成90+家公司信息整理,而Manus能一次性完成但速度较慢 [16][17] - 在Amazon销售数据分析任务中,o3比Manus给出更简洁专业的策略建议和可视化效果 [19][27][28] - o3能通过模糊图片识别出《绝命毒师》角色"炸鸡叔"Gus Fring [46][52] - 模型在数手指个数和判断时钟时间等视觉推理任务上仍存在系统性错误 [69][70][72] 定价与市场竞争 - o3定价为$10/Mtok输入和$40/Mtok输出,是旗舰模型中最贵的 [77][80] - o4-mini定价为o3的1/10,比Claude 3.7更便宜 [78][80] - Gemini 2.5 Pro和DeepSeek-V3等模型在性价比上更具优势 [80] - 行业认为所有一线模型定价可视为在同一水平竞争,Gemini和OpenAI相对便宜 [77][79] 技术发展与未来方向 - OpenAI发现RL Scaling呈现"more compute = better performance"规律,o3投入算力比o1高一个数量级 [81][82] - 强化学习教父提出Era of Experience概念,认为agent需从experience中学习达到superhuman水平 [85][86] - 未来agent可能发展出非人类思维方式的推理,如符号化、分布式或可微分计算 [89] - 构建"world model"预测动作对环境的影响将成为重要发展方向 [89]
对话朱松纯:Agent喧嚣之上,“走心”才是AGI的未来?
AI科技大本营· 2025-04-30 11:02
Agent概念与现状 - 当前AI领域最热门的词是"Agent",被业界称为"智能体元年",但对其定义存在模糊性,有人认为只是RPA的升级版,有人视为无所不能的商业应用[1] - 真正的Agent应具备自主性、自我意识和内在诉求,能主动与环境互动并形成价值判断,而非被动响应指令的工具[4] - 目前多数系统缺乏物理世界互动能力和社会性,仅能完成特定任务,本质仍是工具而非智能体[4] 通通智能体的创新路径 - "通通"采用价值与因果驱动的终身学习模式,在虚拟环境中持续演化并发展个性,核心在于内在驱动力而非数据堆砌[4] - 该智能体已展现出类人行为如讨价还价、策略性撒谎等社会性特征,表明其价值体系正在形成[7] - 与主流Agent相比,"通通"强调"理"(推理能力)和"心"(价值体系)的构建,而非仅关注"技"(任务技能)[6] 多智能体协作挑战 - 社会智能需要模拟组织结构的动态演化,包括家庭、公司等V++集合体的目标形成与内部认知构建[7] - 当前多智能体系统缺乏共享价值体系和社会关系理解,难以实现鲁棒的群体智能[7] - 关键瓶颈在于对社会规则、契约及责权利等内隐知识的建模能力[7] AI发展范式批判 - 主流大模型路径被比作"鹦鹉范式",依赖海量数据但缺乏深层理解,表现出任务脆弱性[9][10] - 倡导转向"乌鸦范式",通过小数据解决大任务,强调内在需求驱动和因果推理的自主智能[12] - 千亿参数模型虽工程有效但科学上"丑陋",存在黑箱问题和泛化能力缺陷[9][13] AGI评估新框架 - 提出能力与价值双系统的评级方法,通过开放环境测试自主定义任务和适应变化的能力[14] - "通通"在测试中表现接近3-6岁儿童水平,验证了该框架可行性[14] - 批评"预测下一个token"模式缺乏多模态反馈闭环,导致知识组织混乱[14] 中国AI发展路径 - 主张跳出数据算力军备竞赛,结合实体经济需求发展具身智能[16] - 将儒家文化等传统价值融入AI设计,探索不同于西方的社会智能解决方案[16] - 强调哲学心理学等人文学科对构建AI价值体系的关键作用[16] 智能本质的哲学思考 - AGI发展应回归对智能本质的理解,构建具备内在价值和认知能力的智能体[18] - "为机器立心"是技术目标也是哲学宣言,关乎AI与人类社会的共生方式[18] - 指出通用人工智能的发展选择将深刻影响国家未来竞争力[18]
多模态和Agent成为大厂AI的新赛点
36氪· 2025-04-30 07:29
大模型应用场景的竞争策略 - 大厂AI竞争策略向应用场景倾斜,多模态能力和代理执行成为两大焦点 [1] - 大模型落地C端需接近人类能力,进化方向包括降低沟通难度和提升复杂任务执行能力 [1] - 多模态能力实现需依托基础大模型升级,代理执行能力依赖Agent产品生态成熟 [1] 多模态能力发展现状 - 字节、百度、谷歌、OpenAI近期推出多模态能力更强的基础大模型产品 [1] - 阿里夸克上线"拍照问夸克"功能,基于通义推理及多模态大模型+后训练实现 [1] - 多模态应用场景包括看图分析地貌、生成流程图、识别图像视频内容等 [5] - OpenAI最新o3和o4-mini具备"用图像思考"能力,谷歌Gemini 2.5 Flash可分析股票走势图 [5] 代理执行产品发展 - 通用Agent产品近期集中上线,包括字节扣子空间、百度心响App、360纳米AI等 [1] - 海外巨头倾向打造单一场景Agent,如Notion Mail、OpenAI的Operator和Deep Research [2] - 通用Agent产品雏形为对话框+工作区模式,能理解任务意图并调用工具模块 [12] - 百度心响App侧重移动端轻量化任务,包含数学解题、AI相亲等生活化功能 [13] Agent产品关键能力 - 优化任务体验需培养三大能力:第三方数据工具连接、编码能力、大模型任务理解能力 [14][16] - MCP和A2A协议为Agent提供统一接口和协作能力,国内厂商已接受该解决方案 [14] - AI编程能力对复杂任务执行至关重要,OpenAI可能收购编程公司Windsurf提升该能力 [16] - 大模型任务理解能力是底层基础,OpenAI正培养职业化Agent如司机、学者等角色 [16] 行业发展趋势 - 多模态能力提升将影响AI硬件发展,未来交互可能从手机迁移到智能眼镜 [11] - OpenAI预计2025年Agent业务销售额达30亿美元,2029年达290亿美元 [17] - 国内厂商采取API逻辑开发Agent,OpenAI采用职业化培养模式 [17] - 未来入口可能是多模态能力与Agent执行能力的结合 [17]