智能体人工智能 - 财报，业绩电话会，研报，新闻

智能体人工智能

搜索文档

36氪· 2025-11-11 09:29

文章核心观点 - 智能体人工智能正在颠覆传统的大数据范式，从将计算资源部署到数据所在位置，转变为将数据主动引入以大型语言模型（LLM）为重心的智能计算平台 [1] - 数据工程师的角色和工作重点正在发生根本性转变，需要从构建僵化、预设的工作流程，转向创建灵活、情境感知的架构以支持人工智能代理 [27][29] - 行业正经历从以“构建者”为中心的模式向以“交互者”为中心的模式过渡，非技术用户能够通过人工智能代理直接与数据交互 [4] 数据使用方式的转变 - 企业应用和仪表盘的构建模式发生变化，从由技术用户创建以满足非技术用户需求，转变为非技术用户直接与数据交互并能够根据自身需求编写工具 [2][4] - 现有的SaaS应用程序正更原生地嵌入自然语言交互，具有前瞻性的开发者将AI代理嵌入应用程序，使其能够以工具调用的形式访问后端API [4] - 技术架构的重心从庞大的数据量转移到前沿人工智能模型（LLM），人工智能应用围绕LLM构建 [4][6] 对ETL/ELT流程的重新思考 - 现代人工智能的上下文窗口和工具调用能力正使许多传统的ETL/ELT流程过时，数据工程师需要彻底重新思考整个方法 [1] - ETL/ELT流程并未变得无关紧要，但可以依靠代理来解释模式、理解关系，并处理各种格式的数据，而无需进行大量的预处理 [7] - 需质疑每个数据规范化步骤的必要性，避免因过度处理、规范化和分散化而导致上下文信息难以传递 [9] 数据管理原则的转变 - 从优先数据收集转变为优先数据整理，因为情境式学习使得内容整理比资料收集更为重要，示例的质量比数量更为关键 [10] - 人工智能代理基于情境学习，即在其提示中提供一两个高质量示例，LLM可以有效地模仿这些示例 [10] - 数据工程师需要构建工具来找出最高质量、完整、准确且具有代表性的数据样本，并定期更新和验证这些示例 [12][13][14] 人工智能代理的基础设施需求 - 人工智能代理需要支持两种核心能力的基础设施：感知数据和根据数据采取行动 [15] - 基础设施需确保代理能够发现并使用工具，这意味着需要清晰的接口、完善的文档和可靠的执行 [15] - 需从人工智能代理的角度审核数据访问模式和工具，识别并消除导致运行不畅的环节 [17] 代理生成数据的管理 - 人工智能代理不仅消耗数据，还会生成大量数据，这些生成的内容（如输出、决策、代码、推理过程）也变成了需要管理的数据 [17][20] - 对代理生成的数据应与其他数据一样严格对待，需存储代理输出系统，并据此设计存储和访问模式 [20][21] - 这些代理生成的数据对于调试、审计、训练未来的代理以及理解系统行为具有价值 [20] 可观测性与训练的闭环 - 提升智能体性能的最快途径是实现可观测性和训练之间的闭环，需要双向管道将模型性能和可观测性与持续训练联系起来 [22] - 可观测性平台需要能够追踪数据质量指标，检测数据漂移和概念漂移，并监控关键的模型性能指标（如准确率、延迟和幻觉率） [22] - 需要建立完全自动化的重训练流程，在收到监控系统触发的事件时自动激活，进行模型重训练或微调，并进行评估和回归测试 [24] 数据工程师角色的演变 - 数据工程师需要保留决策日志和推理痕迹，并将代理生成的代码作为版本化工件进行管理 [26] - 过去十年构建数据基础设施的技能依然宝贵，但需要应用于创建能让代理自行设计工作流程的环境这一新目标 [29] - 数据工程的重要性并未降低，而是发生了变化，行业从僵化、预设的工作流程转向灵活、情境感知的架构 [27][29]

36氪· 2025-11-06 16:13

重新思考企业人工智能数据平台，并探索数据开发者平台以扩展这些人工智能系统。一概述让我们先来看看实际情况如何。很多企业已经在人工智能领域投入了大量资源。模型已经部署，辅助决策系统已经构建，仪表盘也实现了自动化。从表面上看，一切都很智能。但实际上，系统并没有真正自主运行。每一个决策仍然需要人工审批，系统需要更新，流程需要运行。这就是预测型人工智能；它很智能，但却很静态。它能预测下一步会发生什么，但永远不会采取下一步行动。现在，智能体人工智能应运而生。这类系统不仅预测结果，还能根据结果采取行动。它们理解业务背景，记住交互过程，无需等待指令即可决定下一步行动。它关注的不是"可能会发生什么"，而是"现在应该做什么"。而这正是大多数企业遇到的瓶颈。他们的数据平台是为了管理数据管道而构建的，而非为了承载数据的意义。它们可以传输数据，但无法传递意义。它们存储的是事实，而非背景信息。因此，即使人工智能变得越来越智能，其底层系统仍然是机械的、被动的、僵化的，等待有人按下"运行"按钮。这就是智能体人工智能所暴露出的差距：我们的平台从来就不是为自主而设计的，而是为协调而设计的。为了弥合 ...

36氪· 2025-11-04 19:13

行业范式转变 - 人工智能行业正从“越大越好”的模型规模竞赛，转向注重效率的小型语言模型部署 [1][4] - 企业人工智能部署进入生产阶段，40%至70%的企业级AI任务可通过小型语言模型更高效处理 [4] - 小型语言模型具备速度快10倍、部署维护成本降低5-20倍、更可靠及设备端处理注重隐私等特点 [4] 小型语言模型定义与特点 - 小型语言模型是参数通常少于100亿的轻量级模型，针对特定任务或设备端任务进行优化 [4][13] - 典型参数范围为1亿至30亿，示例包括Microsoft Phi-3 Mi、Mistral 7B、GPT-4o mini等 [13] - 核心优势包括快速推理、资源高效、成本效益高、注重隐私、易于微调及环保 [21] 大型语言模型对比 - 大型语言模型通常拥有100亿到1万亿以上参数，擅长处理复杂的通用任务 [14] - 示例包括参数达700亿的LLaMA 3 70B、估计约1万亿参数的GPT-4及数千亿参数的Claude 3 [15] - 与小型语言模型相比，大型语言模型资源消耗极高，但复杂任务处理能力更强 [15][19] 关键技术驱动因素 - 知识蒸馏等智能模型架构使小型模型在参数减少40%情况下保持97%性能 [20] - CPU优化运行时框架如llama.cpp、GGUF实现在标准CPU上接近GPU的效率 [11][27] - 量化技术将模型从16位转换为8位再至4位精度，显著降低内存需求并加快推理速度 [11][27] 成本与经济效益 - 智能体人工智能市场规模预计从2024年52亿美元增长至2034年2000亿美元 [5] - 小型语言模型部署相比大型语言模型可节省5-10倍成本，响应时间从500-2000毫秒提升至50-200毫秒 [35][36][37] - 银行利用特定任务小型语言模型进行欺诈检测，相比大型模型方案节省10到100倍成本 [34] 应用场景与部署 - 边缘计算部署涵盖智能手机、工业物联网传感器、医疗设备、自动驾驶车辆及智能家居系统 [30][32] - 混合部署模式结合大型语言模型负责复杂推理，小型语言模型管理高频次特定任务操作 [22][27] - GGUF格式实现单文件可移植性，支持混合精度量化，在CPU上高效运行 [25][28] 未来发展趋势 - 模块化AI生态系统由专门小型语言模型协作，针对推理、视觉或编码等特定任务优化 [39] - 小型语言模型低能源需求对可持续AI部署至关重要，减少AI应用的碳足迹 [40] - 移动芯片设计和小型模型优化技术进步使得复杂AI可直接在智能手机上运行，无需云连接 [41]

5月6日电，IBM与甲骨文扩大合作以推进智能体人工智能和混合云。

快讯· 2025-05-06 12:03

公司合作 - IBM与甲骨文扩大合作范围，重点推进智能体人工智能和混合云技术 [1]

申万海外科技英伟达 FY25Q4 财报梳理及业绩会交流纪要

2025-02-27 09:29

纪要涉及的行业和公司 - **行业**：科技、游戏、汽车、专业可视化、网络 - **公司**：英伟达、微软、谷歌、亚马逊、Oracle、xAI、META、思科、丰田、奥罗拉、大陆集团、艾昆纬、梅奥诊所、ARC 研究所、优步、Core Weave、OpenAI、DeepSeek、思爱普、ServiceNow、安世亚太、楷登电子、西门子纪要提到的核心观点和论据业绩情况 - **整体业绩**：FY25Q4 营收 393 亿美元（YoY +78%，预期 382 亿），Non - Gaap 净利润 221 亿（YoY +72%，预期 210 亿）；2025 财年营收 1305 亿美元，较上一年增长 114% [1][3] - **各业务业绩** - **数据中心业务**：2025 财年营收 1152 亿美元，较上一年增长超一倍；Q4 营收 356 亿美元，创历史新高，环比增长 16%，同比增长 93%，得益于 Blackwell 产品量产爬坡及 H200 产品环比增长 [4] - **网络业务**：收入环比下降 3%，与 GPU 计算系统配套业务表现强劲，占比超 75%；预计 Q1 恢复增长 [12] - **游戏及 AIPC 业务**：Q4 收入 25 亿美元，环比下降 22%，同比下降 11%；全年收入 114 亿美元，同比增长 9%；预计 Q1 收入环比强劲增长 [13] - **专业可视化业务**：Q4 收入 5.11 亿美元，环比增长 5%，同比增长 10%；全年收入 19 亿美元，同比增长 21% [15] - **汽车业务**：Q4 收入达创纪录的 5.7 亿美元，环比增长 27%，同比增长 103%；全年收入 17 亿美元，同比增长 5% [16] - **业绩指引**：FY26Q1 营收 430 亿（预期 422 亿），预计 FY26 年底达到 75%毛利率水平（FY25Q4 为 73.5%） [1] 业务亮点 - **数据中心业务** - **产品表现**：Blackwell 产品量产速度和规模史无前例，Q4 实现 110 亿美元营收；GB300 系列即将上线，下一代 Blackwell Ultra 将于 25H2 发布 [1][4] - **需求驱动**：Post - training 和模型定制、推理扩展推动需求增长；Blackwell 覆盖全 AI 市场，性能和创新速度快，实现最低 TCO 和最高 ROI [6][7] - **客户群体**：大型 CSP 贡献近一半数据中心收入，销售额同比增长近一倍；区域云服务收入占比上升；消费互联网业务收入同比增长两倍；企业业务收入同比增长近一倍；机器人、AV 与物理 AI 领域应用增多 [7][8][9][10] - **网络业务**：正从小型 NVLink 8 产品向大型 NVLink72 产品过渡，Spectrum X 和 NVLink 交换机收入增长；思科将整合 Spectrum X 技术推广以太网技术 [12] - **游戏及 AIPC 业务**：推出全新 GeForce RTX 50 系列 GPU，性能提升两倍，带来新渲染技术；DLSS 4 可提升帧率；发布搭载新架构笔记本电脑 GPU，续航延长 40% [13][14] - **专业可视化业务**：技术和生成式人工智能重塑设计等工作负载，推动对英伟达 RTX 工作站需求 [15] - **汽车业务**：自动驾驶汽车量产爬坡推动增长，丰田将基于英伟达打造下一代汽车，奥罗拉和大陆集团将大规模部署无人驾驶卡车 [16] 财务情况 - **FY25Q4 财务**：扩大 Blackwell 产品量产规模超预期，预计毛利率处于 70%出头水平，全面量产时有望降低成本、改善毛利率；环比 GAAP 运营费用增长 9%，non - GAAP 运营费用增长 11%；Q4 向股东返还 81 亿美元 [17] - **FY26Q1 展望**：预计总营收 430 亿美元，上下浮动 2%；预计 Blackwell 产品量产规模大幅提升，数据中心和游戏业务营收环比增长；其他收入费用预计约 1 亿美元；税率预计为 17%，上下浮动 1% [18] 市场与产品相关观点 - **训练与推理界限模糊影响**：预训练、后训练和推理阶段计算量都在增长，未来模型计算量可能大幅提升；英伟达架构通用，能运行各种模型，Blackwell 在各方面表现出色 [19][20][21] - **GB200 生产规模**：对 GB200 热情更高，已出货更多产品，成功扩大 Grace Blackwell 生产规模，Q4 实现约 110 亿美元营收，将继续扩大生产 [22] - **毛利率情况**：扩大 Blackwell 产品生产规模期间，毛利率处于 70%出头水平，全面量产可降低成本、提高毛利率，预计今年晚些时候达 70%中期水平 [24] - **需求持续性**：数据中心资本投资规模大，未来软件基于机器学习，有顶级合作伙伴预测和规划，初创企业带来新机遇，各领域人工智能发展处于早期阶段，需求将持续 [24][25] - **Blackwell Ultra 产品**：下半年推出，系统架构与现有 Blackwell 产品相同，过渡顺利；已与合作伙伴和客户规划，透露后续 Vera Rubin 产品信息 [26][27][28] - **GPU 与 ASIC 平衡**：英伟达架构通用，能端到端处理，应用广泛，性能提升节奏快，软件堆栈构建难度大，部署速度快，在市场竞争中优势明显 [28][29][30][31] - **地域业务增长**：人工智能成为主流，应用广泛，处于新时代开端，影响全球 GDP 比重，增长前景广阔；中国业务占比大致不变，规模约为出口管制前一半 [32][33][34] - **企业业务增长**：企业业务增长与大型 CSP 相似，企业既与云服务提供商合作，也自行构建业务；从长远看，企业业务增长规模更大，涉及智能体人工智能、物理人工智能和机器人系统等新领域 [35][36][37][38] - **设备更新换代**：不同架构产品因 CUDA 可编程性强，都有应用场景，可分配不同工作负载，已部署基础设施能得到充分利用 [39][40] 其他重要但是可能被忽略的内容 - 英伟达在为客户提供服务时将继续遵守出口管制规定，关税情况不明，等待美国政府计划进一步明确 [11][41] - 英伟达投资者关系网站提供新的财务信息人工智能智能体 [18]