Workflow
Agents
icon
搜索文档
百度沈抖:企业对AI Infra的要求,已从“降本增效”转向“直接创造价值”
新浪科技· 2025-08-28 14:30
行业趋势与战略转型 - 智能经济时代企业对AI基础设施的要求从降本增效转向直接创造价值 所有计算产生的智能被封装进Agents参与价值创造和交付 企业的AI云从成本中心转变为新型利润中心 [2] - 互联网时代核心是信息流通 网站和App封装信息并交付信息 而智能时代核心是Agent智能体 封装智能并交付结果 企业需要大量Agents接管从生产到经营的各种环节 [2] - 单个岗位或场景未来可能对应几个至几十个Agents 价值创造方式重构推动产业链进化 AI产业进入超级周期 当前正处于智能经济时代的起点 [2] 产品与技术升级 - 百度百舸AI计算平台5.0和千帆企业级AI开发平台4.0升级发布 帮助企业以更低成本更高效率部署和开发AI产品 [3] - 基于慧播星数字人技术推出数字员工新成员"吴彦祖数字英语教练" 并发布一见视觉大模型平台的工序合规分析能力 [3] 市场地位与客户覆盖 - 超65%央企落地大模型选择百度智能云 [3] - 80%系统重要性银行及150余家保险/券商/基金公司落地大模型选择百度智能云 [3] - TOP10手机厂商和95%主流车企落地大模型选择百度智能云 [3] - 50%以上游戏厂商和最多重点具身智能企业落地大模型选择百度智能云 [3]
企业级LLM:性能为王,开源采用趋于平缓 | Jinqiu Select
锦秋集· 2025-08-03 12:31
核心观点 - 企业级LLM API支出在过去六个月内从35亿美元增长至84亿美元,实现翻倍增长,闭源模型正在建立性能护城河 [1] - Anthropic以32%的市场份额超越OpenAI成为企业级AI市场新领导者 [2] - 代码生成已成为AI的第一个杀手级应用,Claude在代码生成领域占据42%的市场份额,远超OpenAI的21% [2] - 强化学习与验证器(RLVR)成为扩展智能的新路径,模型训练重心从"数据量"转向"后训练"的质量和效率 [2] - 2025年被称为"智能体之年",大模型通过工具集成和多轮交互解决复杂问题 [2] 基础模型市场格局 - 企业级LLM API支出从2024年11月的35亿美元跃升至2025年中的84亿美元 [4] - Anthropic占据32%市场份额,OpenAI降至25%,谷歌占20%,Meta的Llama占9%,DeepSeek仅占1% [9] - Claude Sonnet 3.5和3.7的发布推动Anthropic登顶,Claude 4、Opus 4和Claude Code巩固其领先地位 [12] 开源模型现状 - 开源模型采用率从19%降至13%,性能仍落后闭源模型9到12个月 [14] - Meta的Llama仍是开源领导者,但Llama 4表现平平 [14] - 部署复杂性和对中国公司API的顾虑阻碍开源模型在企业市场的扩张 [14] - 66%开发者选择在现有提供商内升级模型,仅11%会切换供应商 [20] 市场动态 - 开发者优先选择性能最好的模型而非更便宜的替代品,模型价格下降10倍也不会影响选择 [25] - 74%初创企业和49%大型企业的计算支出转向推理,高于去年的48%和29% [27] - Claude 4发布后一个月内占据Anthropic用户群的45%,Sonnet 3.5份额从83%降至16% [23] 技术趋势 - 代码生成领域已形成19亿美元的生态系统,AI集成开发环境和应用程序构建器成为新类别 [13] - 互联网数据规模成为瓶颈,强化学习与验证器(RLVR)在后训练阶段发挥关键作用 [13] - 模型训练为"代理"使其能够逐步思考、通过问题推理并使用外部工具 [13]
美股AI巨头&季报:值得关注的产业变化
2025-07-16 14:13
纪要涉及的行业和公司 - **行业**:美国AI行业、美国股票市场 - **公司**:英伟达(NVIDIA)、微软(Microsoft)、谷歌(Google)、OpenAI、苹果(Apple)、Snowflake、Autodesk、Workday、Intuent 纪要提到的核心观点和论据 英伟达(NVIDIA) - **核心观点**:NVLink Fusion产品及布局适应大客户定制需求,拓展业务空间,但大集群发展受供需影响,预计年底前有新大集群出现 [2][4][9] - **论据**: - NVLink从2016年的1.0发展到现在的5.0,基于Transformer架构开发了H系列芯片,NVLink Fusion提供两种定制解决方案,满足大客户定制需求并扩大加速计算范围 [2][3][4] - 与Marvel等合作,拓展合作伙伴群体,使产品多元化,但与Boston无法合作 [5][9] - 大集群发展因需求端变化和供应端限制而放缓,GB200和GB300低交付影响大集群进度,但预计年底前第三季度末会有至少50万张卡的新大集群用于模型训练 [8][9] 微软(Microsoft) - **核心观点**:Build大会以Agents为核心,提出AgentWeb概念,但其模型可靠性不如谷歌,与OpenAI关系破裂 [10][13][15] - **论据**: - 今年Build大会以Agents为核心,提出AgentWeb概念,预计明年会有相关成果出现 [10] - 过去一个季度生成的token数量约为100万,远低于谷歌每月处理的48亿token,模型方面不如谷歌可靠,且与OpenAI关系破裂 [11][15] 谷歌(Google) - **核心观点**:在AI领域领导地位强,商业变现表现较好,Gemini模型强大,AI模式和token处理能力值得关注 [12][13][15] - **论据**: - 从2014 - 2017年收购DeepMind开始确立AI领导地位,此次I/O大会基于大模型Gemini布局全面,涵盖基础模型、开发框架、芯片等,领导全球模型发展 [12][15] - 每月处理token量约48亿,是微软的约五倍,C端流量大,在AI商业化方面表现优于微软和亚马逊 [15] - 采用AI模式改变搜索交互方式,对AI生态有重要意义 [13] OpenAI - **核心观点**:收购I.O.公司引入Jony I设计硬件产品,有望争夺下一代互联网入口,但流量与谷歌、Meta相比不占优势 [17][20][21] - **论据**: - 花费65亿美元收购I.O.公司,引入曾参与设计苹果多款产品的Jony I设计硬件产品,预计2026 - 2027年推出,显示其对下一代互联网入口的重视 [17][18][20] - 流量约50 - 60亿,低于谷歌、Meta的30 - 50亿,收购可能是为了争夺下一代互联网流量入口 [21] Cloud4 - **核心观点**:模型能力强大,在任务执行时间和复杂性上有显著提升,为未来Agent发展提供思路 [23][27][28] - **论据**: - Opus 4、Sonic 4等产品在复杂任务、编码等方面表现出色,MADNESS在海外受欢迎,证明其模型能力 [24][28] - 任务执行时间从之前的40分钟提升到7小时,且有进一步延长的潜力,显示任务执行复杂性的飞跃 [26][27] - 提出未来Agent发展需结合上下文、长运行执行和合作等思路,强调与传统AI Agent的区别 [28] 其他重要但是可能被忽略的内容 - **行业发展节奏**:今年会从单Agent发展到多Agent,明年出现Agent平台,后续Agent间协议统一并建立网络,平台间存在竞争 [31] - **美国上市公司表现**:Snowflake表现超预期,股价上涨13 - 14点;Workday表现超预期,股价上涨12点;Autodesk与AI关联不大 [30]
从搜索到解决方案:解锁火山 DeepSearch 的“三连跳” MCP 玩法
歸藏的AI工具箱· 2025-04-24 17:34
火山开发者见面会发布内容 - 公司发布RTC硬件和DeepSearch服务 其中DeepSearch服务将AI搜索信息加工和再整理能力应用化 大幅降低开发者使用门槛 [3] - 公司正式发布豆包深度思考模型Doubao-1.5-thinking-pro和视觉理解模型Doubao-1.5-vision-pro 其中视觉推理能力表现突出 [5] - 推出方舟×RTC硬件解决方案 实现端侧自动唤醒与云端大模型语音能力打包 可快速升级智能设备对话能力 [5] - 深度搜索复合应用服务DeepSearch集成联网搜索、知识库、网页解析、Python代码执行器等丰富MCP服务 开发者无需配置即可直接调用 [5] DeepSearch服务功能特点 - 在旅游规划场景中 服务能精准搜索实时信息 如交通安排、行程顺序、危险项目注意事项等 避免输出景点介绍的冗余内容 [4] - 针对特定需求(如必须前往雨崩村和南极洛) 服务会分步骤精准搜索相关信息 避免一次性搜索导致上下文遗忘 [6] - 在新能源汽车行业数据查询测试中 服务诚实反馈未找到17-24号上险量数据 但准确提供13-20号数据 并合理组织产业新闻、总体数据、厂家动态等内容 [10] - 服务能根据问题复杂度自动调整任务拆解层数 最多支持10步 并支持通过提示词优化实现个性化 [16] 技术实现方案 - 底层同时挂载Doubao-1.5-thinking-pro、Doubao-1.5-pro和DeepSeek-R1等多模型 实现复杂逻辑与摘要生成的协同 [20] - 采用API网关安全鉴权 Supervisor Agent生成Planning并分配子任务 Work Agent调用外部能力的技术架构 [20] - 所有MCP插件符合统一协议 新插件可被Supervisor自动编排 开发者可一键复制广场模板并部署 [21] - 服务对外暴露OpenAI兼容接口 实现前端、Bot、业务后台的零改动集成 [21] 开发者生态建设 - 公司上线MCP Servers广场 提供大量MCP服务 支持一键体验和安装 并提供Trae等IDE的安装命令 [23] - 通过火山方舟平台 开发者可快速体验和应用DeepSearch等能力 大幅降低MCP使用门槛 [12][16][18] - 行业趋势显示 国内大厂正加速拥抱MCP技术 并通过生态整合降低使用门槛 使AI能力探索周期从月级缩短 [24]