AI Agent
搜索文档
通信行业周报:谷歌AI亮眼,坚定看好全球AIDC产业链
开源证券· 2025-05-25 12:25
报告行业投资评级 - 看好(维持)[1] 报告的核心观点 - 谷歌开发者大会发布多款AI新品,用户量持续攀升,大厂陆续宣布支持MCP,助力AI Agent加速发展,持续看好国产AI算力产业链、卫星互联网、6G等七大产业方向 [3][4][5] 根据相关目录分别进行总结 周投资观点 谷歌开发者大会发布多款AI新品,用户量持续攀升 - 2025年5月21日,谷歌I/O开发者大会发布多款AI模型、AI应用、AI Agent等产品,Gemini系列模型全面升级,Imagen 4和Veo 3等多模态模型功能增强,Gemini模型将登陆多平台赋能终端产品,AI Agent产品功能丰富且计划扩展平台 [11][13][15] - 截至5月21日,谷歌每月token处理数量达480万亿,同比提升超50倍,超700万名开发者用Gemini搭建AI应用,是去年的5倍,Gemini应用有4亿月活用户,使用2.5 Pro模型的用户活跃度上涨45% [13] - 谷歌搜索方面,截至5月21日,AI Overviews月活用户达15亿,新上线“AI Mode”功能强大,可用于多方面 [14] 大厂陆续宣布支持MCP,助力AI Agent加速发展 - 5月19 - 22日,字节、微软、谷歌、OpenAI等大厂陆续宣布支持MCP协议,随着A2A协议和MCP生态完善,AI Agent开发效率和交互能力有望提升,加速AI应用落地 [16] 投资建议 - 展望2025年,看好国产AIDC算力产业链、海外AIDC产业链以及AI应用、运营商、卫星互联网&6G等板块投资价值,建议重视七大产业方向,包括AIDC机房建设、IT设备、网络设备、算力租赁、云计算平台、AI应用、卫星互联网&6G,并给出各方向推荐标的和受益标的 [17][18][19] 市场回顾 - 本周(2025.05.19 - 2025.05.23),通信指数下跌2.3%,在TMT板块中排名第三 [24] 通信数据追踪 5G - 2025年3月底,我国5G基站总数达439.5万站,比2024年末净增14.5万站;3月,三大运营商及广电5G移动电话用户数达10.68亿户,同比增长22.20%;3月,5G手机出货1942.4万部,占比85.3%,出货量同比增长9.52% [25] 运营商 - 云计算方面,2024年中国移动、中国电信、中国联通云营收分别达1004亿元、1139亿元、686亿元,同比分别增长20.4%、17.1%、17.1% [41] - 三大运营商ARPU值方面,2024年中国移动、中国电信移动业务ARPU值分别为48.5元、45.6元,同比分别略减1.6%、略增0.4%;2023年中国联通移动业务ARPU值为44.0元,同比略减0.7% [41]
业界对 Agent 的最大误解:它能解决所有问题
AI前线· 2025-05-25 12:24
AI Agent 的核心观点 - 业界对 AI Agent 的最大误解是认为它能解决所有问题,实际上 AI 并非万能,需回归业务场景验证价值 [1][2] - AI Agent 的规模化应用拐点已至,但需避免过度神化技术,重点在于解决企业核心业务问题 [1][28] - 企业级 AI 的本质是业务重构而非炫技,需结合全栈技术、行业 Know-How 和开放生态实现可量化成果 [30] AI Agent 的技术特性 - 区别于传统 AI 助手,AI Agent 能自主规划任务路径、调用多系统资源并动态优化策略 [4] - "假智能体"可通过算力需求识别:真 Agent 需持续消耗算力自主运行,传统自动化工具仅需低算力 CPU [4] - IBM 内部 AskIBM 平台展示 Agent 能力,可自动路由员工查询至 HR、IT 等垂直领域智能体实现全流程自动化 [4] 规模化挑战与解决方案 - 企业规模化应用 AI Agent 面临三大难题:异构系统连接、高 ROI 场景选择、全生命周期管理 [5][6] - watsonx Orchestrate 的三层架构: - 开箱即用垂域智能体(HR、销售、采购智能体,6 月上线)可解决 90% 标准化问题 [8] - 多智能体编排支持跨智能体协作,如销售→市场→客服智能体自动串联 [9] - 开放生态集成 80+ 企业应用(Salesforce、SAP 等),避免重复开发接口 [10] 数据准备与治理 - AI Agent 依赖高质量数据,企业需评估数据可用性及实际作用,90% 非结构化数据未被充分利用 [12] - watsonx.data 通过语义层整合结构化和非结构化数据,自然语言查询准确率高于 RAG 技术 [14][17] - 数据治理工具 watsonx.data intelligence 统一管控多访问方式权限,封装 API/向量数据库供 Agent 实时调用 [18] 流程自动化与集成 - 企业平均上千个异构系统需与 AI Agent 打通,Hybrid Integration 提供跨平台集成能力解决"次元壁"问题 [22][23] - AgentOps 实现全链路可视化运维,Instana 工具实时监控响应延迟并自动扩容 [24] - 27% 云计算浪费可通过自动化平台优化,IBM 收购 HashiCorp 强化基础设施生命周期管理 [26] 业务落地策略 - 企业需分阶段迭代验证 AI Agent ROI,30 天 POC 周期内每周调整方案,优先选择研发/生产/供应链/财务等高价值场景 [29] - 制造业案例显示,IBM 内部已验证 HR、财务、采购智能体的高 ROI,可作为企业模板 [29] - 完备 IT 基础设施是 AI 落地前提,企业需先补齐基础能力再寻找场景痛点 [28][30]
通信行业周报:谷歌AI亮眼,坚定看好全球AIDC产业链-20250525
开源证券· 2025-05-25 11:41
报告核心观点 - 看好通信行业,谷歌发布多款AI新品且大厂支持MCP,持续看好国产AI算力产业链、卫星互联网、6G等七大产业方向 [1][3][5] 周投资观点 谷歌开发者大会发布多款AI新品,用户量持续攀升 - 2025年5月21日谷歌I/O开发者大会发布多款AI产品,Gemini系列语言模型全面升级,如Gemini 2.5 Pro Deep Think强化推理能力、Gemini 2.5 Flash注重效率成本、Gemini Diffusion文本生成速度快,还引入新功能 [11][12] - 多模态模型方面,Imagen 4支持高分辨率和定制,Veo 2和Veo 3新增功能且Veo 3可直接生成有声视频,截至5月21日谷歌月处理token量同比提升超50倍,超700万开发者用Gemini搭建应用,Gemini应用月活4亿,2.5 Pro模型用户活跃度涨45% [13] - AI应用上,Gemini将登陆多平台,谷歌搜索AI Overviews月活15亿,新上线“AI Mode”功能强大,可用于多方面 [14] - AI Agent方面,Google Beam可将2D转3D,Project Astra功能丰富,Project Mariner能协作完成多任务,未来将扩展平台 [15] 大厂陆续宣布支持MCP,助力AI Agent加速发展 - 5月19 - 22日,字节、微软、谷歌、OpenAI等大厂宣布支持MCP协议或完善相关版本,随着A2A和MCP协议完善,AI Agent开发效率和交互能力有望提升,加速应用落地 [16] 投资建议 - 看好国产AIDC算力产业链、海外AIDC产业链及AI应用、运营商、卫星互联网&6G等板块,建议重视七大产业方向,包括AIDC机房建设、IT设备、网络设备、算力租赁、云计算平台、AI应用、卫星互联网&6G,并给出各方向推荐和受益标的 [17] 市场回顾 - 本周(2025.05.19 - 2025.05.23)通信指数下跌2.3%,在TMT板块中排名第三 [24] 通信数据追踪 5G - 2025年3月底我国5G基站总数达439.5万站,比2024年末净增14.5万站;3月三大运营商及广电5G移动电话用户数达10.68亿户,同比增长22.20%;3月5G手机出货1942.4万部,占比85.3%,出货量同比增长9.52% [25] 运营商 - 云计算方面,2024年中国移动、中国电信、中国联通云营收分别达1004亿、1139亿、686亿元,同比分别增长20.4%、17.1%、17.1% [41] - ARPU值方面,2024年中国移动、中国电信移动业务ARPU值分别为48.5元、45.6元,同比分别略减1.6%、略增0.4%,2023年中国联通移动业务ARPU值为44.0元,同比略减0.7% [41]
2024年中国人工智能产业研究报告
艾瑞咨询· 2025-05-23 17:42
人工智能产业宏观环境 - 2024年国家将人工智能纳入战略重点,各地政府推进科研创新与算力基建,因地制宜出台特色政策 [4] - GDP增速放缓背景下,AI作为新质生产力在效率提升和产业升级方面展现潜力,政府支持提供强劲动能 [4] - 资本市场聚焦语言/多模态模型应用、芯片、算力服务等领域,基础层与应用层协同完善产业生态 [4][12] - 生成式AI普及提升公众接受度,但就业替代和隐私问题引发焦虑 [4] 技术发展与创新 - Transformer架构仍主导大模型发展,研发侧通过强化学习、思维链优化提升推理能力,加速跨模态融合 [4][16] - Scaling Law面临高质量数据与资源限制挑战,厂商转向后训练思维链优化和强化学习推理优化 [18] - DeepSeek开源模型通过多令牌预测(MTP)、多头潜在注意力机制(MLA)等技术降低训练/推理成本达50%以上 [31][83] - 端到端语音大模型架构(如GPT-4o)提升交互流畅度,但级联式架构仍保持可控性优势 [50] 市场规模与商业化 - 2024年中国AI产业规模2697亿元,增速26.2%低于预期,主因大模型场景落地成本高且处于探索阶段 [6][24] - 预计2025-2029年CAGR达32.1%,2029年规模破万亿,DeepSeek开源推动2025年加速增长 [25] - B端以项目制为主(政务、教科、通信、能源领域占60%),C端采用"免费+订阅制" [6][37][39] - 价格战激烈:字节大模型降价99%,阿里云通义千问降价97%,百度部分模型免费 [34] 产业动态与竞争格局 - 算力需求向推理侧转移,开源模型推动智算中心利用率提升 [6] - 分布式框架(DeepSpeed、Colossal-AI)、LLMOps平台及一体机产品降低企业应用门槛 [28] - 大厂主导C端生态(如kimi、豆包),创业公司聚焦垂类B端市场 [66] - 出海集中在图像/视频(占40%)和社交/情感陪伴(占35%)赛道,字节、阿里云、Minimax为主要厂商 [71][73] 产品创新方向 - AI Agent从对话问答向复杂任务代理演进,智谱AutoGLM支持超长任务规划 [45][76] - 具身智能成为战略高地,需解决硬件加速与跨行业协作挑战 [80] - AI硬件端侧落地加速:华为、荣耀等手机集成大模型,豆包推出AI耳机 [47] - 多模态模型分化为生成向(DiT架构)与理解向(MLLM架构),技术融合是未来关键 [63] 技术普惠与生态建设 - DeepSeek开源策略降低中小开发者使用门槛,带动沐曦、阿里云等产业链合作 [7][37][83] - MCP协议连接1100+工具服务,推动Agent生态标准化 [77] - 视觉生成产品商业化提速,Sora验证DiT架构在视频生成的优势 [56][63]
科创人工智能ETF华夏(589010)跌1.65%,OpenAI宣布“星际之门”首个国际部署项目落户阿联酋
每日经济新闻· 2025-05-23 14:43
市场表现 - 科创人工智能ETF华夏(589010)午盘下跌1.65%,持仓股中恒玄科技领跌8.72%,中邮科技跌5.9%,优刻得跌4.27%,海天瑞声逆势上涨2.53% [1] OpenAI重大项目进展 - OpenAI联合G42、甲骨文、英伟达等合作伙伴启动"星际之门阿联酋"项目,计划2026年建成1GW数据中心集群,阿联酋将成为全球首个全国启用ChatGPT的国家 [1] AI行业趋势 - 大模型公司转向AI Agent领域,因预训练边际收益放缓、数据边界显现及开源模型竞争加剧,API模式难以盈利,需发展具备推理能力、工具调用及个性化服务的高价值链AI Agent [1] 科创人工智能ETF特点 - 该ETF跟踪科创人工智能指数,聚焦高研发强度AI核心资产,结合科创板政策红利,提供低门槛、高弹性的AI赛道投资工具 [2]
大模型之后,AI 开始“自己动手”了
AI科技大本营· 2025-05-23 14:14
全球科技巨头AI Agent布局 - 微软在Build 2025大会上推出Copilot Studio解决方案,强调AI Agent将重塑未来工作方式 [8] - Google在I/O大会上宣布为Chrome浏览器、搜索及Gemini应用推出智能体模式,支持自动执行任务 [8] - OpenAI发布能自动执行复杂操作的AI Agent "Operator"并推出面向深度研究的智能体功能 [8] - Anthropic发布Agent最佳实践指南,推动工程落地 [8] 腾讯AI Agent战略与进展 - 腾讯云升级智能体开发平台TCADP,融合知识管理、工作流编排和AI能力 [5] - QQ浏览器、腾讯健康、腾讯云代码助手CodeBuddy等C端与B端应用已集成智能体能力 [5] - 腾讯云与汽车、金融、文旅等行业合作,智能体应用在生产环境中落地 [13][15] - 智能体在汽车行业用于故障自诊断,金融行业用于智能客服,文旅行业用于行程规划 [15] AI Agent技术演进 - 智能体具备自主规划能力,能根据自然语言指令调用工具或协同多Agent完成任务 [11] - 工具调用技术经历三个阶段:Function Calling、ReAct模式、Code Agent,执行效率逐级提升 [14] - 腾讯通过文档转问答对、版本比对和运营机制优化RAG效果 [15] - 视觉、多模态、文本与智能体技术协同支撑企业AI应用落地 [12] 行业趋势与驱动力 - 互联网从"信息获取"转向"任务完成",Agentic AI成为关键方向 [1] - 技术演进与业务需求双轮驱动智能体爆发 [6][9] - 客户对个性化、智能化解决方案的需求推动AI应用范式变革 [10][11] - 智能体被视为大模型落地最具系统性、可扩展性与变革性的路径之一 [18]
明略科技宣布与Dify达成生态合作 推动企业级AI Agent应用落地
环球网· 2025-05-23 11:45
资料显示,Dify作为一款开源的大语言模型(LLM) 应用开发平台,融合了"后端即服务"(Backend as Service)和"LLMOps"理念,为开发者及企业用户提供了构建 LLM 应用所需的关键技术栈,包括对全 球1000+大语言模型的支持、直观的Prompt编排界面、高质量的RAG引擎、稳健的Agent框架、灵活的 流程编排,并同时提供了一套易用的界面和API。 明略科技副总裁杨威表示:"企业级Agent技术正在从试验阶段迈向生产力阶段,逐渐成为智能化转型的 核心驱动力。通过本次合作,明略科技将与Dify平台形成协同互补,为企业客户提供从应用构建到落地 部署的一站式解决方案,帮助企业解决生成式AI应用投入生产的实际痛点。在复杂业务场景中,我们 将共同致力于优化企业级Agent的可用性、适配性与实用性,推动其深度融入企业核心系统,并为企业 进入AGI时代铺设重要入口。" 此外,依托自身在多模态数据集成、企业知识图谱及数据隐私保护方面的技术积淀和服务经验,明略科 技称将在与Dify的合作基础上提供更丰富的技术服务,以适配企业发展需要。如通过自研的MoE(混合 专家模型)架构,明略科技能够为不同领域动态 ...
Claude 4发布:新一代最强编程AI?
虎嗅· 2025-05-23 08:30
模型发布与性能 - Anthropic正式发布Claude 4系列模型 包括Claude Opus 4和Claude Sonnet 4 [2] - Opus 4是目前全球最强的编程模型 能够稳定胜任复杂且持续时间长的任务和Agent工作流 [4] - Sonnet 4着重强化了编程和推理能力 能更精准地响应用户的指令 [4] - Opus 4在编程基准测试SWE-bench上拿下72.5%的高分 在Terminal-bench上以43.2%领先同行 [6] - Sonnet 4在SWE-bench的成绩达到72.7% 几乎与Opus 4持平 [15] 新功能与特性 - 工具辅助的延伸思考功能 模型在进行深入思考时能够交替使用工具优化推理过程 [7] - 两款模型可并行使用工具 执行更精确的指令 并提升记忆能力 [7] - Claude Code正式发布 支持GitHub Actions、VS Code和JetBrains [7] - API新增四项功能 包括代码执行工具、MCP连接器、文件API和最长可缓存1小时的提示缓存功能 [7] - 引入"思维总结"功能 在模型思考路径过长时自动调用更小模型进行压缩和归纳 [30] 实测表现 - 在Replit的实测中 Opus 4在多文件、大改动的项目中表现出更高准确率 [9] - 在代号为Goose的Agent中 该模型显著提升了代码质量 同时保持稳定性和性能 [10] - 进行高要求的开源重构任务时 连续稳定运行7小时 [11] - 能解决其他模型无法完成的复杂任务 成功处理多个前代模型没法完成的关键操作 [11] - 创建带有动画效果的天气卡片 只用一次机会就成功生成 [12] 行业影响与定位 - GitHub选择Sonnet 4作为新一代Github Copilot的底座模型 [17] - 两款模型为不同层级用户提供明确选项 Opus 4面向极致性能与科研突破 Sonnet 4面向主流落地与工程效率 [39] - 价格与前代保持一致 Opus 4每百万token为$15/$75 Sonnet 4为$3/$15 [38] - 三家头部AI公司几乎在同一时间选择Agent路径 编程是最天然适合AI Agent落地的场景 [55][56][57] - 开发者群体是天然适配Agent产品的用户 他们习惯自定义、愿意尝鲜、擅长集成 [58] 技术演进与未来展望 - 模型开发过程中存在"最后开窍"现象 某些能力在最后一刻才展现出来 [69][70] - 正在进入新世界 开发者可以像管理一支Agent团队一样工作 [74] - 预训练和后训练都有显著进步 扩展规律在预训练阶段依然有效 [78] - 未来一年"代码"方面会出现很多令人惊艳的进展 构建"Agent团队"将对世界产生有意思的影响 [103] - 当写软件的成本大幅下降时 经济和商业结构将发生改变 [104][105]
天工超级智能体上线三小时即限流,昆仑万维股价涨停
新浪财经· 2025-05-22 15:56
产品发布与市场反应 - 昆仑万维发布通用Agent平台天工超级智能体(Skywork Super Agents),上线三小时后因用户量过大导致卡顿并采取限流措施[1] - 该消息推动昆仑万维A股午后触及涨停,成交额超30亿元[1] - 产品聚焦个人生产力场景,采用AI agent架构和deep research技术,可一站式生成文档、PPT、表格、网页、播客和音视频多模态内容[1] 产品性能与行业地位 - 天工超级智能体在GAIA榜单上排名全球第一,超过OpenAI Deep Research和Manus[2] - 产品主打"专业+通用"功能,由5个专家智能体和1个通用智能体组成[3] - 实现生成结果可溯源、可编辑,具备在线私人知识库功能,创新性支持AI生成数据表格和图标[6] 产品功能与架构 - 网站界面覆盖场景较多,包括文档、PPT、表格、网页和通用模式[4] - Office三件套(文档、PPT、表格)均为专家模式[4] - 通用智能体接入数十个MCP,可生成图片、海报、音乐、MV等多媒体内容[4] - 播客智能体可生成脚本并通过语音合成技术完成音频制作,但暂不支持中文[4] 行业竞争与发展趋势 - 2025年AI Agent风口再起,OpenAI、微软、谷歌DeepMind等头部厂商相继推出Agent产品[6] - 国内字节跳动、阿里巴巴、百度在2024年4月入局通用Agent市场[6] - 中信证券研报称2025年有望成为AI应用落地元年,AI Agent应用场景将快速爆发[6] 公司战略与财务表现 - 昆仑万维2023年4月发布天工3.5大语言模型,之后陆续发布音乐推理大模型、视频生成模型等[6] - 2024年研发费用达15.4亿元,同比增长59.5%[7] - 2025年第一季度亏损达7.69亿元[7] - 公司董事长兼CEO方汉表示昆仑万维在PPT生成和PDF生成领域是国内最好产品之一[7]
不甘于工具,谷歌、微软重注AI Agent
21世纪经济报道· 2025-05-21 21:12
谷歌AI战略升级 - 谷歌在2025年I/O开发者大会上将AI作为绝对主角,核心迭代方向为"更智能"和"更主动",全面重构产品体系并将Gemini AI嵌入所有核心业务[1] - Gemini从单一语言模型升级为整个AI生态的核心架构,用户和开发者面临全新交互模式,同时推动AI从被动工具向主动代理转变[1][2] - 发布会上Gemini被提及95次,AI被提及92次,构成叙事主线[2] Gemini技术进展与数据表现 - Gemini 2.5 Pro模型新增"Deep Think"模式,复杂推理、编程和多模态理解能力大幅提升[2] - 谷歌每月处理的令牌数从去年同期的9.7万亿增长至480万亿,增幅超50倍[2] - Gemini开发者数量达700万(同比增5倍),Vertex AI使用量增长40倍,月活跃用户超4亿[2] - Gemini 2.5 Pro使用量增长45%,2.5系列模型成为主力[2] 搜索业务AI化改造 - 推出颠覆传统的AI Mode,支持自然语言复杂提问和多轮对话,查询长度达传统搜索的2-3倍[3] - AI Overviews已覆盖15亿用户,在200个国家和地区推出[4] - 全球搜索引擎市场份额近六个月跌破90%,面临ChatGPT(周活4亿)等竞品挑战[3] AI Agent布局与行业趋势 - 谷歌定义新一代AI Agent具备主动决策、多任务协同能力,Project Astra(多模态环境理解)和Project Mariner(10任务并行)为代表项目[6] - 全球AI Agent市场规模预计从2024年51亿美元增至2030年471亿美元,年复合增长率44.8%[6] - 微软同步强化Agent生态,GitHub Copilot实现从代码补全到自主编程的质变,智能体日活用户翻倍[8] 商业模式与竞争格局 - 搜索广告收入模式受AI Mode冲击,公司探索生成式AI对话中的广告植入[5] - 微软通过Azure AI Foundry(支持1900+模型)和Windows AI Foundry构建Agent开发平台[9] - 行业共识2025年为AI智能体爆发年,但大规模部署仍受计算成本、可靠性及伦理问题制约[9]