Workflow
智能体人工智能
icon
搜索文档
如何让你的数据为人工智能做好准备
36氪· 2025-11-11 09:29
文章核心观点 - 智能体人工智能正在颠覆传统的大数据范式,从将计算资源部署到数据所在位置,转变为将数据主动引入以大型语言模型(LLM)为重心的智能计算平台 [1] - 数据工程师的角色和工作重点正在发生根本性转变,需要从构建僵化、预设的工作流程,转向创建灵活、情境感知的架构以支持人工智能代理 [27][29] - 行业正经历从以“构建者”为中心的模式向以“交互者”为中心的模式过渡,非技术用户能够通过人工智能代理直接与数据交互 [4] 数据使用方式的转变 - 企业应用和仪表盘的构建模式发生变化,从由技术用户创建以满足非技术用户需求,转变为非技术用户直接与数据交互并能够根据自身需求编写工具 [2][4] - 现有的SaaS应用程序正更原生地嵌入自然语言交互,具有前瞻性的开发者将AI代理嵌入应用程序,使其能够以工具调用的形式访问后端API [4] - 技术架构的重心从庞大的数据量转移到前沿人工智能模型(LLM),人工智能应用围绕LLM构建 [4][6] 对ETL/ELT流程的重新思考 - 现代人工智能的上下文窗口和工具调用能力正使许多传统的ETL/ELT流程过时,数据工程师需要彻底重新思考整个方法 [1] - ETL/ELT流程并未变得无关紧要,但可以依靠代理来解释模式、理解关系,并处理各种格式的数据,而无需进行大量的预处理 [7] - 需质疑每个数据规范化步骤的必要性,避免因过度处理、规范化和分散化而导致上下文信息难以传递 [9] 数据管理原则的转变 - 从优先数据收集转变为优先数据整理,因为情境式学习使得内容整理比资料收集更为重要,示例的质量比数量更为关键 [10] - 人工智能代理基于情境学习,即在其提示中提供一两个高质量示例,LLM可以有效地模仿这些示例 [10] - 数据工程师需要构建工具来找出最高质量、完整、准确且具有代表性的数据样本,并定期更新和验证这些示例 [12][13][14] 人工智能代理的基础设施需求 - 人工智能代理需要支持两种核心能力的基础设施:感知数据和根据数据采取行动 [15] - 基础设施需确保代理能够发现并使用工具,这意味着需要清晰的接口、完善的文档和可靠的执行 [15] - 需从人工智能代理的角度审核数据访问模式和工具,识别并消除导致运行不畅的环节 [17] 代理生成数据的管理 - 人工智能代理不仅消耗数据,还会生成大量数据,这些生成的内容(如输出、决策、代码、推理过程)也变成了需要管理的数据 [17][20] - 对代理生成的数据应与其他数据一样严格对待,需存储代理输出系统,并据此设计存储和访问模式 [20][21] - 这些代理生成的数据对于调试、审计、训练未来的代理以及理解系统行为具有价值 [20] 可观测性与训练的闭环 - 提升智能体性能的最快途径是实现可观测性和训练之间的闭环,需要双向管道将模型性能和可观测性与持续训练联系起来 [22] - 可观测性平台需要能够追踪数据质量指标,检测数据漂移和概念漂移,并监控关键的模型性能指标(如准确率、延迟和幻觉率) [22] - 需要建立完全自动化的重训练流程,在收到监控系统触发的事件时自动激活,进行模型重训练或微调,并进行评估和回归测试 [24] 数据工程师角色的演变 - 数据工程师需要保留决策日志和推理痕迹,并将代理生成的代码作为版本化工件进行管理 [26] - 过去十年构建数据基础设施的技能依然宝贵,但需要应用于创建能让代理自行设计工作流程的环境这一新目标 [29] - 数据工程的重要性并未降低,而是发生了变化,行业从僵化、预设的工作流程转向灵活、情境感知的架构 [27][29]
谈谈企业级人工智能数据平台的架构
36氪· 2025-11-06 16:13
重新思考企业人工智能数据平台,并探索数据开发者平台以扩展这些人工智能系统。 一 概述 让我们先来看看实际情况如何。 很多 企业已经在人工智能领域投入了大量资源。模型已经部署,辅助 决策 系统已经构建,仪表盘也实现了自 动化。从表面上看,一切都很智能。但实际上,系统并没有真正自主运行。每一个决策仍然需要人工审批,系统需要更新,流程需要运行。 这就是 预测型人工智能; 它很智能,但却很静态。它能预测下一步会发生什么,但永远不会采取下一步行动。 现在, 智能体人工智能 应运而生。这类系统不仅预测结果,还能根据结果 采取行动 。它们理解业务背景,记住交互过程,无需等待指令即可 决定下一步行动。它关注的不是"可能会发生什么",而是"现在应该做什么"。 而这正是大多数企业遇到的瓶颈。 他们的数据平台是为了管理数据管道而构建的,而非为了承载数据的意义。它们可以传输数据,但无法传递意义。它们存储的是事实,而非背 景信息。 因此,即使人工智能变得越来越智能,其底层系统仍然是机械的 、 被动的、僵化的,等待有人按下"运行"按钮。 这就是智能体人工智能所暴露出的差距:我们的平台从来就不是为自主而设计的,而是为协调而设计的。为了弥合 ...
垂直领域小型语言模型的优势
36氪· 2025-11-04 19:13
行业范式转变 - 人工智能行业正从“越大越好”的模型规模竞赛,转向注重效率的小型语言模型部署 [1][4] - 企业人工智能部署进入生产阶段,40%至70%的企业级AI任务可通过小型语言模型更高效处理 [4] - 小型语言模型具备速度快10倍、部署维护成本降低5-20倍、更可靠及设备端处理注重隐私等特点 [4] 小型语言模型定义与特点 - 小型语言模型是参数通常少于100亿的轻量级模型,针对特定任务或设备端任务进行优化 [4][13] - 典型参数范围为1亿至30亿,示例包括Microsoft Phi-3 Mi、Mistral 7B、GPT-4o mini等 [13] - 核心优势包括快速推理、资源高效、成本效益高、注重隐私、易于微调及环保 [21] 大型语言模型对比 - 大型语言模型通常拥有100亿到1万亿以上参数,擅长处理复杂的通用任务 [14] - 示例包括参数达700亿的LLaMA 3 70B、估计约1万亿参数的GPT-4及数千亿参数的Claude 3 [15] - 与小型语言模型相比,大型语言模型资源消耗极高,但复杂任务处理能力更强 [15][19] 关键技术驱动因素 - 知识蒸馏等智能模型架构使小型模型在参数减少40%情况下保持97%性能 [20] - CPU优化运行时框架如llama.cpp、GGUF实现在标准CPU上接近GPU的效率 [11][27] - 量化技术将模型从16位转换为8位再至4位精度,显著降低内存需求并加快推理速度 [11][27] 成本与经济效益 - 智能体人工智能市场规模预计从2024年52亿美元增长至2034年2000亿美元 [5] - 小型语言模型部署相比大型语言模型可节省5-10倍成本,响应时间从500-2000毫秒提升至50-200毫秒 [35][36][37] - 银行利用特定任务小型语言模型进行欺诈检测,相比大型模型方案节省10到100倍成本 [34] 应用场景与部署 - 边缘计算部署涵盖智能手机、工业物联网传感器、医疗设备、自动驾驶车辆及智能家居系统 [30][32] - 混合部署模式结合大型语言模型负责复杂推理,小型语言模型管理高频次特定任务操作 [22][27] - GGUF格式实现单文件可移植性,支持混合精度量化,在CPU上高效运行 [25][28] 未来发展趋势 - 模块化AI生态系统由专门小型语言模型协作,针对推理、视觉或编码等特定任务优化 [39] - 小型语言模型低能源需求对可持续AI部署至关重要,减少AI应用的碳足迹 [40] - 移动芯片设计和小型模型优化技术进步使得复杂AI可直接在智能手机上运行,无需云连接 [41]
5月6日电,IBM与甲骨文扩大合作以推进智能体人工智能和混合云。
快讯· 2025-05-06 12:03
公司合作 - IBM与甲骨文扩大合作范围,重点推进智能体人工智能和混合云技术 [1]
申万海外科技英伟达 FY25Q4 财报梳理及业绩会交流纪要
2025-02-27 09:29
纪要涉及的行业和公司 - **行业**:科技、游戏、汽车、专业可视化、网络 - **公司**:英伟达、微软、谷歌、亚马逊、Oracle、xAI、META、思科、丰田、奥罗拉、大陆集团、艾昆纬、梅奥诊所、ARC 研究所、优步、Core Weave、OpenAI、DeepSeek、思爱普、ServiceNow、安世亚太、楷登电子、西门子 纪要提到的核心观点和论据 业绩情况 - **整体业绩**:FY25Q4 营收 393 亿美元(YoY +78%,预期 382 亿),Non - Gaap 净利润 221 亿(YoY +72%,预期 210 亿);2025 财年营收 1305 亿美元,较上一年增长 114% [1][3] - **各业务业绩** - **数据中心业务**:2025 财年营收 1152 亿美元,较上一年增长超一倍;Q4 营收 356 亿美元,创历史新高,环比增长 16%,同比增长 93%,得益于 Blackwell 产品量产爬坡及 H200 产品环比增长 [4] - **网络业务**:收入环比下降 3%,与 GPU 计算系统配套业务表现强劲,占比超 75%;预计 Q1 恢复增长 [12] - **游戏及 AIPC 业务**:Q4 收入 25 亿美元,环比下降 22%,同比下降 11%;全年收入 114 亿美元,同比增长 9%;预计 Q1 收入环比强劲增长 [13] - **专业可视化业务**:Q4 收入 5.11 亿美元,环比增长 5%,同比增长 10%;全年收入 19 亿美元,同比增长 21% [15] - **汽车业务**:Q4 收入达创纪录的 5.7 亿美元,环比增长 27%,同比增长 103%;全年收入 17 亿美元,同比增长 5% [16] - **业绩指引**:FY26Q1 营收 430 亿(预期 422 亿),预计 FY26 年底达到 75%毛利率水平(FY25Q4 为 73.5%) [1] 业务亮点 - **数据中心业务** - **产品表现**:Blackwell 产品量产速度和规模史无前例,Q4 实现 110 亿美元营收;GB300 系列即将上线,下一代 Blackwell Ultra 将于 25H2 发布 [1][4] - **需求驱动**:Post - training 和模型定制、推理扩展推动需求增长;Blackwell 覆盖全 AI 市场,性能和创新速度快,实现最低 TCO 和最高 ROI [6][7] - **客户群体**:大型 CSP 贡献近一半数据中心收入,销售额同比增长近一倍;区域云服务收入占比上升;消费互联网业务收入同比增长两倍;企业业务收入同比增长近一倍;机器人、AV 与物理 AI 领域应用增多 [7][8][9][10] - **网络业务**:正从小型 NVLink 8 产品向大型 NVLink72 产品过渡,Spectrum X 和 NVLink 交换机收入增长;思科将整合 Spectrum X 技术推广以太网技术 [12] - **游戏及 AIPC 业务**:推出全新 GeForce RTX 50 系列 GPU,性能提升两倍,带来新渲染技术;DLSS 4 可提升帧率;发布搭载新架构笔记本电脑 GPU,续航延长 40% [13][14] - **专业可视化业务**:技术和生成式人工智能重塑设计等工作负载,推动对英伟达 RTX 工作站需求 [15] - **汽车业务**:自动驾驶汽车量产爬坡推动增长,丰田将基于英伟达打造下一代汽车,奥罗拉和大陆集团将大规模部署无人驾驶卡车 [16] 财务情况 - **FY25Q4 财务**:扩大 Blackwell 产品量产规模超预期,预计毛利率处于 70%出头水平,全面量产时有望降低成本、改善毛利率;环比 GAAP 运营费用增长 9%,non - GAAP 运营费用增长 11%;Q4 向股东返还 81 亿美元 [17] - **FY26Q1 展望**:预计总营收 430 亿美元,上下浮动 2%;预计 Blackwell 产品量产规模大幅提升,数据中心和游戏业务营收环比增长;其他收入费用预计约 1 亿美元;税率预计为 17%,上下浮动 1% [18] 市场与产品相关观点 - **训练与推理界限模糊影响**:预训练、后训练和推理阶段计算量都在增长,未来模型计算量可能大幅提升;英伟达架构通用,能运行各种模型,Blackwell 在各方面表现出色 [19][20][21] - **GB200 生产规模**:对 GB200 热情更高,已出货更多产品,成功扩大 Grace Blackwell 生产规模,Q4 实现约 110 亿美元营收,将继续扩大生产 [22] - **毛利率情况**:扩大 Blackwell 产品生产规模期间,毛利率处于 70%出头水平,全面量产可降低成本、提高毛利率,预计今年晚些时候达 70%中期水平 [24] - **需求持续性**:数据中心资本投资规模大,未来软件基于机器学习,有顶级合作伙伴预测和规划,初创企业带来新机遇,各领域人工智能发展处于早期阶段,需求将持续 [24][25] - **Blackwell Ultra 产品**:下半年推出,系统架构与现有 Blackwell 产品相同,过渡顺利;已与合作伙伴和客户规划,透露后续 Vera Rubin 产品信息 [26][27][28] - **GPU 与 ASIC 平衡**:英伟达架构通用,能端到端处理,应用广泛,性能提升节奏快,软件堆栈构建难度大,部署速度快,在市场竞争中优势明显 [28][29][30][31] - **地域业务增长**:人工智能成为主流,应用广泛,处于新时代开端,影响全球 GDP 比重,增长前景广阔;中国业务占比大致不变,规模约为出口管制前一半 [32][33][34] - **企业业务增长**:企业业务增长与大型 CSP 相似,企业既与云服务提供商合作,也自行构建业务;从长远看,企业业务增长规模更大,涉及智能体人工智能、物理人工智能和机器人系统等新领域 [35][36][37][38] - **设备更新换代**:不同架构产品因 CUDA 可编程性强,都有应用场景,可分配不同工作负载,已部署基础设施能得到充分利用 [39][40] 其他重要但是可能被忽略的内容 - 英伟达在为客户提供服务时将继续遵守出口管制规定,关税情况不明,等待美国政府计划进一步明确 [11][41] - 英伟达投资者关系网站提供新的财务信息人工智能智能体 [18]