AI代理
搜索文档
短短两天内,OpenAI发了四个大招
36氪· 2026-02-09 10:53
核心观点 OpenAI 在短时间内发布了一系列重大更新,包括新模型、新架构、新平台和新规范,标志着其AI代理技术从专用工具向通用“职员”的跃迁,并开始系统性地解决企业级规模化部署、多代理协同以及安全治理等关键问题 [1][31] 从编程代理到通用代理:GPT-5.3-Codex的能力跃迁 - **模型性能显著提升**:GPT-5.3-Codex融合了前代模型的编码与推理能力,推理速度提升约25%,并能处理长时间任务,用户可实时引导且模型不丢失上下文 [2] - **实现自我开发参与**:该模型是OpenAI首个在自身开发中发挥关键作用的模型,研究团队用它监控调试训练过程、定位基础设施问题、分析交互质量并构建可视化工具 [2] - **能力边界超越代码生成**:模型不仅支持软件开发生命周期全流程,其代理能力已延伸至制作PPT、电子表格、数据分析等通用知识工作 [6] - **计算机操控能力大幅增强**:在OSWorld-Verified基准测试中得分达64.7%,远超前代GPT-5.2-Codex的38.2%和GPT-5.2的37.9%,接近人类平均水平72%,且完成同等任务的token消耗量减少一半以上 [15] - **从专用工具变为通用代理**:模型已从编程代理专用工具转变为可在计算机上完成几乎任何工作的通用代理,能够端到端操控计算机 [3][16] 统一编程代理的“通用插座”:App Server - **标准化通信协议**:App Server是一套基于JSON-RPC构建、用于统一调度Codex的标准化通信协议,旨在让不同界面共享同一套核心逻辑 [17] - **定义三层对话原语**:协议自底向上定义了Item(条目)、Turn(回合)、Thread(线程)三层对话原语,以精准描述复杂的人机交互 [20][21] - **支持多种集成模式**:支持本地应用(如VS Code扩展)以子进程启动、网页端通过HTTP/SSE与云端容器通信、以及未来终端界面连接远程代理等多种部署方式 [21][22] - **成为主推标准方案**:OpenAI官方明确表示App Server将成为未来主推的标准集成方案,并在功能完整性与协议稳定性间取得平衡,其源码已随Codex CLI开源以降低接入门槛 [22] 弥合机会差距:企业级AI代理协作平台Frontier - **解决“AI机会差距”**:针对企业AI代理因缺乏上下文而彼此孤立、增加复杂性的问题,OpenAI推出Frontier平台,旨在帮助企业规模化构建、部署和管理AI代理 [23] - **赋予AI四项关键能力**:平台借鉴人类企业管理方法,使AI代理能够:1) 理解企业运作逻辑与共享业务知识库;2) 在受控环境中安全操作真实工具;3) 通过内置评估机制在实践中持续改进;4) 接受严格的身份和权限管控 [23][24][25][26] - **基于开放标准构建**:平台基于开放标准,允许企业将AI代理集成至现有系统,如通过ChatGPT界面、自动化工作流或Salesforce等业务软件发挥作用,无需推翻重来 [27][28] - **已有知名企业采用**:HP、Oracle、Uber等企业已成为该平台的第一批使用者,未来将拓展至医疗记录分析、客户数据整合等垂直场景 [28] 能力与责任:可信访问机制 - **推出网络安全可信访问计划**:针对前沿模型在网络漏洞发现与修复领域的双重用途潜力,OpenAI推出该计划,以平衡加速防御部署与防范技术滥用 [29] - **实施信任分级策略**:采用分级授权体系,个人用户可验证身份,企业可为团队批量申请,仅有实际成果的安全研究团队可参与仅限邀请的深度计划 [29] - **加强安全监控与资助**:授权用户需遵守安全政策,模型自动化监控系统会持续检测非法行为。同时,公司将网络安全资助计划规模提升至1000万美元API额度,以支持在开源软件和关键基础设施领域修复漏洞的团队 [29][30]
“AI.com”,7000万美元转手
财联社· 2026-02-08 08:18
域名交易与市场动态 - 互联网域名“AI.com”以7000万美元的天价完成交易,创下公开报道中最贵互联网域名纪录[1] - 此前的纪录是币圈公司Block.one以3000万美元购买“Voice.com”,排名第三的是360公司以1700万美元买入“360.com”[1] - 该域名此前曾选择性跳转至ChatGPT、谷歌Gemini、马斯克的xAI官网,在DeepSeek热潮期间也曾设置跳转至其官网[1] 买方背景与战略意图 - 买方为加密货币和股票交易平台“加密货币网”的联合创始人兼首席执行官Kris Marszalek[1] - Marszalek认为,从10到20年的长期视角看,人工智能将成为这一代人最伟大的技术浪潮之一,因此这是一次很好的投资[1] - 拥有“AI.com”域名被认为有助于在飞速增长的人工智能市场与潜在客户建立信任和认知[3] 新业务规划 - 公司计划利用“AI.com”发布一项针对消费市场的“个人AI代理”业务,该业务可用来发送信息、使用各种应用并进行股票交易[2] - 公司将在美国“超级碗”橄榄球总决赛期间投放广告正式推出该业务,今年“超级碗”广告价格为30秒1000万美元[1] - Marszalek剧透称,希望能提供类似于OpenClaw(曾用名Clawdbot、Moltbot)的功能,这是一款年初引发高度关注的开源AI代理[3] - 目前尚不清楚该业务是否会涉及自研大模型,还是调用各巨头的成熟产品[2] 公司的营销与扩张策略 - 高调交易和营销是公司扩张商业版图的核心打法,赞助体育行业和请名人代言在其崛起过程中发挥了重要作用[3] - 2021年,“加密货币网”以7亿美元签下了NBA洛杉矶湖人队主场的20年冠名权,该场馆现已更名为“加密货币网体育馆”[3]
华尔街分歧加剧:AI代理,会不会“吃掉”整个软件行业?
金十数据· 2026-02-06 10:43
核心观点 - 华尔街关注软件股近期大幅抛售是否被夸大,还是AI泡沫开始瓦解的信号[1] - 市场观点出现分歧:一方认为抛售过度,行业巨头不易被颠覆;另一方担忧跌势未止,可能预示更深层次问题[1][4] 市场表现与估值 - iShares Expanded Tech-Software Sector ETF (IGV) 本周迄今跌幅超过9%,自近期高点累计下跌接近30%[1] - IGV在2023年大涨逾58%,2024年上涨23%,2025年也小幅上涨5%以上[1] - IGV目前市盈率略低于40倍历史收益,较此前更具吸引力但难言便宜[4] - Jefferies数据显示,73%的软件股已处于超卖状态,创下8年来新高[2] - 从纳斯达克综合指数流出的资金规模达30万亿美元[6] 抛售原因与行业威胁 - Anthropic对Claude的最新更新引发担忧,认为具备代理能力的AI可能对企业级软件行业构成生存性威胁[1] - 软件股在过去几年涨势过于昂贵、交易过度拥挤后,投资者开始转向反向操作[1] - 此次抛售可能与去年DeepSeek发布开源AI模型引发的震荡类似,但担忧其持续性更强[1][4] 多头观点:抛售过度与买入机会 - 许多既有软件巨头不会轻易被具备代理能力的AI颠覆,正在积极开发自己的代理以提升软件功能性和盈利能力[1] - 部分市场人士将这轮回调视为买入机会,但建议谨慎挑选赢家并等待更深的回撤[2] - 花旗研究建议有选择地增持那些在AI交易另一侧仍具相关性的公司,偏好受益于超大规模数据体量的企业如微软、MongoDB和Snowflake[2][3] - Fundstrat认为抛售有些走在基本面前面,若软件公司能适应技术变化,抛售可能只是一次健康的调整[5] 空头观点:跌势未止与深层风险 - 即便短期反弹,软件股可能还需要更彻底的“出清”,市场底部往往低于历史中位数或平均水平[4] - 此次抛售可能比DeepSeek冲击更具持续性,指向整个科技板块更深层次的问题,包括加大资本开支和承担债务的超大规模云厂商[4] - 影响可能不止于软件股,持有私募信贷资产的公司如Blue Owl和Ares Management本周也分别下跌9%和16%[5] - 若软件公司无法重塑自身以适应AI,可能成为“AI工业化的第一批受害者”[5] 市场资金轮动 - 市场表现确认今年资金更偏向“实体经济”相关板块,如能源、工业和材料,这些板块受益于数据中心建设带来的需求[6] - 全球价值股有望跑赢,因资金在经济中持续轮动[6] - 截至周四,只有道琼斯工业平均指数本周上涨,等权重标普500指数也跑赢大盘,上涨0.7%[6]
1850亿美元“不得不花”,谷歌最新回应
华尔街见闻· 2026-02-05 13:30
核心观点 - AI军备竞赛远未结束,公司为支持前沿AI模型开发与满足云业务激增需求,计划进行巨额资本支出,这将对未来利润率构成压力,但管理层认为这是着眼于未来的必要投资,并阐述了AI商业化、与苹果合作等积极前景 [2][3][4][6][7][8] 资本支出与财务指引 - 公司给出2026年资本支出指引为1750亿至1850亿美元,且投资将随季度逐级增加 [3][7][8] - 巨额资本支出主要用于支持Google DeepMind的前沿模型开发及满足云客户激增需求,目前算力供应依然紧张 [8] - 预计2026年和2025年类似,约60%的资本支出将用于服务器,40%用于数据中心和网络设备等长周期资产 [9] - 随着基础设施投入增加,折旧费用将显著上升,预计2026年折旧增长率将进一步加速,对利润表构成持续压力 [4][10] AI商业化与产品进展 - Gemini App月活跃用户已超过7.5亿,自12月推出Gemini 3以来,每位用户参与度显著提高 [14] - 公司正在构建基于“AI代理”的全新商业模式,并提及“通用商业协议”,标志着从信息检索向替用户“执行任务”转变,预计2025年打基础,2026年消费者将能真正使用 [14][15] - 通过模型优化与效率提升,公司在2025年成功将Gemini的服务单位成本降低了78% [22] 市场定位与竞争回应 - 针对市场对“AI颠覆传统软件商业模式”的恐慌,公司反驳称Gemini是SaaS公司的AI引擎而非终结者,并列举数据:排名前20的SaaS公司中有95%以及排名前100的公司中有超过80%在使用Gemini,包括Salesforce和Shopify [11] - 公司确认与苹果达成深度合作,作为其首选云提供商,并基于Gemini技术开发下一代Apple Foundation模型,稳固了在iOS生态中的地位 [12][13] - 针对Gemini App是否会蚕食传统Google搜索流量的质疑,公司回应未看到任何蚕食证据,并称这是一个“扩张性时刻”,AI模式下的查询长度是传统搜索的三倍,在美国,自推出以来用户每日的AI模式查询量翻了一番 [15][16][17] 业务部门表现与战略 - 云业务营收增长48%,归功于AI基础设施优势,公司采用自研TPU与英伟达GPU并行的“两条腿走路”策略 [18][19] - YouTube广告收入增长9%,其短视频功能Shorts现在平均每日观看次数超过2000亿次 [20] - 在自动驾驶方面,公司确认对Waymo进行了新一轮巨额投入,Waymo筹集了迄今为止最大一轮融资,并将服务扩展到美国多个城市以及英国和日本,公司资助了Waymo本轮160亿美元投资中的很大一部分 [20] 运营效率 - 在内部效率方面,公司约50%的代码现在由编码代理编写,然后由工程师审查,这有助于工程师利用现有资源做更多事情、行动更快 [22]
科创100ETF鹏华(588220)红盘向上,AI代理推动CPU需求量上涨
新浪财经· 2026-01-22 10:10
行业核心动态 - 英特尔与AMD 2026全年的服务器CPU产能已基本售罄,计划调价10%-15% [1] - 因AI代理(agentic AI)对通用计算需求加速上涨,服务器芯片市场需求增速预计远超预期 [1] - 新一代CPU产品性能显著提升将驱动行业增长 [1] - 通用服务器进入更新周期、AI推理算力需求增长等因素共同推动CPU需求上涨 [1] 市场表现与数据 - 截至2026年1月22日09:35,上证科创板100指数成分股固德威上涨6.26%,聚辰股份上涨5.73%,华虹公司上涨5.04%,华峰测控上涨2.98%,思瑞浦上涨2.73% [1] - 科创100ETF鹏华(588220)上涨0.38%,最新价报1.57元 [1] - 上证科创板100指数前三大申万一级行业分别为电子(37.42%)、电力设备(14.02%)、生物医药(13.79%) [1] - 科创100中芯片概念(885756.TI)含量达55.15% [1] 指数与产品信息 - 科创100ETF鹏华紧密跟踪上证科创板100指数,该指数选取科创板市值中等且流动性较好的100只证券作为样本 [2] - 上证科创板100指数与上证科创板50成份指数共同构成上证科创板规模指数系列 [2] - 截至2025年12月31日,上证科创板100指数前十大权重股合计占比26.21% [2] - 前十大权重股包括华虹公司、东芯股份、源杰科技、睿创微纳、中科飞测、国盾量子、百济神州、仕佳光子、复旦微电、安集科技 [2] - 科创100ETF鹏华(588220)场外联接基金代码为A:019861;C:019862;I:022845 [3]
SaaS 已死数据底座永生,一个解决 AI 真实数据问题的产品融了 6000 多万美金
投资实习所· 2026-01-19 14:10
AI对软件行业形态的根本性变革 - 核心观点:AI大模型的出现,特别是AI代理的兴起,将终结当前SaaS全面开花的现状,并引发软件形态、价值及行业结构的根本性变革 [1][2][3] - AI被视为横向赋能层,将融入并改进所有应用 [1] - 软件行业将从“为人服务”转向“为AI代理服务”,面向人类消费的横向软件公司可能面临“灭绝级事件” [8][9] 通用人工智能(AGI)的发展路径与影响 - 预测2026年将成为通用人工智能(AGI)的功能性元年 [2] - AGI的核心是AI“解决问题”的能力,其发展关键趋势是“长视野代理”,AI将从“说话者”转变为“行动者” [2] - AI完成长任务的能力约每7个月翻一番,预计到2028年,AI代理将能可靠地完成专家一整天的工作量 [2] - 用户的角色将从独立贡献者转变为“管理代理团队”的管理者,各行各业都将出现专业的AI代理 [2] 未来软件生态的新架构 - 未来软件生态被比作计算机内存层级:基础知识(预训练)、推理能力(推理时间计算)、迭代执行(长视野代理) [4] - AI代理(如Claude Code)被比作DRAM(非持久性内存),充当“快速内存”处理信息、生成UI和执行工作流,过程是瞬时的 [5] - 传统软件/基础架构被比作NAND(持久性存储),角色转变为负责数据安全、长期存储和结构化输出的“事实来源” [5][6] - AI智能体及其上下文窗口将成为新的“快速内存”,基础设施软件则更接近持久内存 [6] 行业影响与价值转移 - 计算模式将变为短暂和瞬时的,每个计算周期是临时记录板,只有最终输出存入持久内存 [8] - 过去衡量软件好坏的标准(如工作流速度、UI、集成度)将贬值 [8] - 能提供持久信息的接口(如API)将变得极具价值,软件必须转向“为AI代理服务” [9] - Claude Code被视为AI时代的“第一个真正的网站”,将对软件行业很大一部分造成冲击 [9] 数据与基础设施的新机遇 - 专为AI而非人类构建的产品快速增长,例如一个为AI做的数据库ARR在一年内增长了6倍 [9][13] - 数据成为最有价值的底座,特别是真实、特定领域且不公开的数据,验证真实本身成为大生意 [9] - 一个专为AI提供特定领域数据的Infra产品,在短时间内获得超过6000万美元融资 [10] - AI继续进化的关键限制已从模型和算力转变为“可合法使用的高质量真实世界数据” [10]
谷歌开启AI购物意向截流战,电商格局要变天?
格隆汇APP· 2026-01-15 19:15
谷歌UCP协议的核心定位与特点 - 谷歌推出通用商业协议,旨在标准化AI代理与零售商之间的交互,是一项开源行业标准[4][5][9] - UCP协议为AI购物代理提供统一的商品发现、下单、支付和售后标准,使不同平台和商家能被通用Agent调用[5] - 该协议将用户决策入口从单个平台转移到AIAgent,实现从产品发现到售后处理的全流程自动化,消费者可通过自然语言直接购物[5] UCP协议相比OpenAI ACP的进步 - OpenAI此前推出的ACP协议是一个封闭生态,仅限于特定聊天框和接入其生态的商家[7] - 谷歌UCP协议则致力于成为整个行业的“水电煤”式基础设施,其定位类似于30年前定义互联网的HTTP协议[9][10] - UCP协议将购物入口彻底打散,依托谷歌全球30亿用户的分发体系,用户可在Gemini、Android全局搜索、YouTube等各处直接完成购物与结算[11][13] UCP协议的技术与体验优势 - 协议后台连接谷歌拥有500亿条数据的Shopping Graph,使其具备实时更新和推理能力的知识图谱,能理解动态库存、尺码建议等深度信息[14][15] - AI代理从“搜索”商品进化为像懂行店员一样“选择”商品[16] - UCP协议定义了AI代理如何代表用户处理退换货、修改配送等售后环节,使AI从“临时导购”进化为“私人采购助理”[18] UCP协议对商家的短期与长期影响 - 短期内,UCP协议为商家带来“流量开闸”,谷歌将其全球30亿用户的搜索、Gemini及Android底层流量导向接入UCP的商家,转化率有望迎来指数级飞跃[20][21][22] - 长期看,DTC品牌可能面临“参数化”陷阱,AI代理优先提取价格、材质、物流时效等硬指标进行比价决策,极度压缩用户与品牌的接触点,导致品牌个性与情感溢价被削弱[24][25] 对亚马逊的冲击与亚马逊的防御 - 谷歌UCP协议通过联手Walmart、Target等零售巨头,在用户产生模糊咨询到决策的中间地带实施“截流”,抢夺“第一意向权”,冲击亚马逊“搜索即购物”的流量闭环[28][29][30] - 亚马逊在UCP发布前夕启动了alexa.com的AI购物测试,试图通过升级Alexa的AI交互能力,深度融合Prime会员履约服务,防御流量入口被抢夺的风险[33][34][35] 中国市场的竞争格局 - 阿里通过“千问”App全面接入淘宝、支付宝等生态业务,在全球范围内率先实现一站式AI购物功能,该App上线两个月内月活跃用户数已突破1亿[39][43] - 字节跳动面临模式冲突,其内容电商根基是“逛”和感性冲动消费,而AI代理购物逻辑是极致的“效率”和理性指令,推进AI购物可能压缩用户刷短视频时间,影响现有内容电商转化闭环[41][42][44] 当前发展阶段与未来展望 - 目前无论是GPT还是Gemini的AI购物功能,都处于官宣后的“抢跑期”,离真正的“体验阶段”仍有距离[47][48] - 真正的商业爆发需等待功能彻底落地、消费者认可及真实数据闭环形成后,市场才会给出最终的估值溢价[48]
英伟达计算的炼金术:一个历史时刻:两场平台变革同时发生
英伟达· 2026-01-14 09:30
报告行业投资评级 * 报告未明确给出行业投资评级 报告的核心观点 * 计算行业正同时经历**加速计算**与**生成式AI**两大平台变革,整个技术栈将被彻底重塑 [7][8][9][11][14] * **物理AI**(理解物理定律并与世界交互的AI)是下一个前沿,其发展依赖于模拟、合成数据和新的计算架构 [26][118][127][129] * 英伟达通过构建从芯片、系统到软件的全栈平台,并推动开源模型与广泛的生态合作,旨在成为全球AI工厂的引擎和物理AI时代的基石 [33][84][161][319][409] 根据相关目录分别进行总结 行业变革与趋势 * 计算行业正同时经历**加速计算**与**生成式AI**两大平台变革,整个技术栈将被彻底重塑 [7][8][9][11][14] * 软件开发范式从“编写代码”转向“训练模型”,应用运行从CPU转向GPU,应用构建从“应用优先”转向“AI优先” [14] * 内容生成从“预编译”转向“实时生成每个像素与Token” [18] * 行业研发预算正大规模从传统方法转向AI方法,规模达**10万亿美元** [21][22] * **2025年**被视为关键发展年份,标志性趋势包括:代理系统(具备推理、规划与工具使用能力)、开源崛起以及测试时扩展(实时思考) [25][28][29][30] 英伟达的AI战略与模型布局 * 英伟达致力于建造自己的AI超算,目标是锻造世界顶级的开源模型 [33] * 公司构建了**NVIDIA开源模型矩阵**,包括Nemo Tron(混合SSM架构,实现极速推理)、OpenFold(理解蛋白质结构与生成)、ForecastNet(革新天气预测方式)等 [36][37][41][42] * 未来的核心原子单元是**AI代理**,其特点是超越记忆,走向推理,并能使用工具、进行研究与执行 [43][45][46][47] * 单一模型不够,未来将是**专家混合模型**的组合,并通过**智能体路由**技术进行调度 [49][51] * 英伟达提供蓝图,帮助企业利用其平台(NVIDIA NEMO)、工具/API、世界级开源与专有模型以及智能体路由技术,结合企业专属数据,构建专属AI [63][64][66][67][70][72][73][75][76] 物理AI(Physical AI)的挑战与突破 * 当前AI缺乏对物理世界的基本常识,而收集真实世界训练数据缓慢、昂贵且永不满足,存在巨大的**数据鸿沟** [99][104][107][109][110] * **模拟**是物理AI几乎所有工作的基础,没有模拟就无法感知物理反馈和评估效果 [118] * 英伟达推出**COSMOS:世界基础模型**,旨在成为物理AI的“ChatGPT”时刻 [123] * COSMOS通过**计算炼成数据**,生成基于物理规律、具有无限多样性的**合成数据**,以填补数据鸿沟 [127][129][130] * COSMOS具备生成式物理AI技能、对齐多模态信息、生成物理连贯视频、进行交互式闭环模拟以及推理、分析与预测等核心能力 [132] * 通过“**模拟中学习,现实中适应**”的范式,COSMOS能生成海量模拟里程,教会机器人适应每一种场景 [135][136][139][141] 生态合作与平台定位 * 英伟达定位为**世界领先平台的AI引擎**,其合作伙伴生态覆盖几乎所有主流科技与云服务公司,包括微软、亚马逊AWS、谷歌云、甲骨文、Adobe、Salesforce、ServiceNow等 [84][85][86][87][88][89] * 报告以个人AI助手“RICCI”为案例,展示了基于英伟达全栈技术(本地DGX、云API、开源模型)构建的智能体应用 [78][79] * 未来的交互界面将发生根本变化,**系统本身就是交互界面** [90] 物理AI的应用落地:以自动驾驶为例 * 进入物理世界标志着**一场新工业革命的开端** [158][159] * 英伟达的**DRIVE THOR**芯片是专为机器人系统设计的地基,具备双处理器冗余、最高功能安全等级和代码级安全认证 [161][163][164][167][168] * **Alpha Mayo**系统采用端到端训练,从摄像头输入直接推理行动输出,旨在解决传统方法难以应对的长尾场景难题 [171][175][176][177] * 英伟达与**梅赛德斯-奔驰达成战略合作**,计划于**2026年第一季度**实现全球上路,并通过OTA持续更新Alpha Mayo [179][180] * 自动驾驶技术可适用于所有机器人系统,预示着机器人产业的黄金时代 [197][198] * **NVIDIA OMNIVERSE**作为机器人的创世引擎,提供物理级精准仿真,用于在元宇宙中训练机器人并生成海量合成数据 [201][203][204][205][209] * 英伟达与**西门子达成战略合作**,将AI全栈技术集成到工业软件中,贯穿设计、生产、运营全生命周期,共同定义“未来工厂 = 巨型机器人”的新工业革命 [217][223][231] 下一代计算平台:VERA RUBIN * 面对AI需求的指数级增长和传统晶体管缩放定律的放缓,行业需要**激进的极端协同设计** [239][247][248] * **VERA RUBIN平台**已全面投产,其设计哲学是极致协同设计,累计投入**15,000工程师年** [252][254][256] * 单个VERA RUBIN计算模块集成2颗VERA CPU、4颗RUBIN GPU、4颗BLUEFIELD-4 DPU和8颗CONNECTX-9 NIC,采用零线缆、零风扇设计 [260][261][262][263][264] * **RUBIN GPU**采用MVF P4张量引擎,实现硬件级自适应精度,其晶体管数量和浮点性能相比Blackwell有显著提升 [269][270][271][274] * **VERA CPU**拥有88核,采用时空多线程技术,并具备强大的I/O性能,专为AI超算定制 [276][279][280] * 平台网络架构分为两部分:机架内采用**NVLINK 6 SWITCH**;AI工厂互联采用**SPECTRUM-X AI以太网**,可提升25%网络吞吐,显著降低网络成本 [285][287] * **BLUEFIELD-4 DPU**作为每个计算节点的标准配置,通过卸载虚拟化、安全等任务,让CPU和GPU专注于纯粹的AI计算 [291][293][294][296] * 平台采用直接液冷技术,使用**45℃温水进水**,能效高且无需数据中心冷水机组 [304][308][368] * VERA RUBIN平台在峰值推理性能、峰值训练性能上实现碾压式飞跃,是全球AI工厂的关键基础设施 [311][312][314][319] 全栈架构重构与性能经济学 * 为应对万亿参数模型和超长上下文带来的内存与带宽挑战,VERA RUBIN平台进行了全栈重构 [327][328][331][332][335] * 突破一:采用**硅光子连接**技术,通过台积电Co-op工艺将光模块直连芯片,实现高速互联 [343][344] * 突破二:发起**上下文内存革命**,抛弃传统南北向存储架构,在机架内由BLUEFIELD DPU驱动构建高速东西向流量,单个节点可提供**150 TB上下文内存**和**200 Gb/s节点内东西向带宽** [350][351][355][358][359] * 新架构使数据中心能效翻倍,预计节省约**6%** 的总电力消耗,并实现全系统可信计算安全 [371][373][375] * 相比上一代Blackwell,训练一个10万亿参数模型所需的系统数量大幅减少,极大缩短了抵达未来的时间 [387][388][391] * **每瓦性能等同于数据中心营收**,VERA RUBIN相比Hopper实现了显著的每瓦性能提升 [394][395][396] * 平台通过规模效应降低Token成本,其推理成本相比上一代大幅下降,体现了“买得越多,省得越多”的经济学 [400][401][403] 总结:全栈生态与未来 * 英伟达的布局贯穿**芯片、基础设施、模型、应用**全栈,并与英特尔、AMD、三星、联想、戴尔等硬件伙伴,以及汽车(通用、蔚来、小鹏)、工业(西门子)等垂直行业巨头建立了广泛生态 [409][414][415][416][420] * 其核心是驱动一场由**物理AI**定义的**新工业革命** [215][231]
花旗首选腾讯、阿里为核心AI概念股!港股AI开年狂飙,港股互联网ETF(513770)5日狂揽超3亿元
新浪财经· 2026-01-07 09:18
花旗对2026年中国互联网行业的三大主题展望 - 花旗研报指出,2026年中国互联网行业将聚焦三大主题:一是云端基础设施、模型堆栈和推理令牌使用的经常性收入增长;二是主要互联网企业竞相抢占AI聊天机器人的用户流量,以期未来生态系统变现;三是垂直领域企业部署自训练专有数据AI代理,以保持竞争优势并加强用户参与度和变现潜力[1][9] - 花旗首选腾讯控股及阿里巴巴-W作为核心AI投资概念股,印证头部企业AI落地实力,也凸显资本对AI驱动行业价值重估的信心[1][9] 港股互联网板块近期行情与资金流向 - 2026开年以来,港股AI涨势如虹,港股互联网ETF(513770)两个交易日场内价格累计上涨6.17%[1][9] - 资金积极加码,港股互联网ETF(513770)最新单日再获资金净流入1.31亿元,近5日资金累计净流入3.18亿元[1][9] 港股互联网ETF(513770)及其跟踪指数概况 - 港股互联网ETF(513770)及其联接基金被动跟踪中证港股通互联网指数,重仓阿里巴巴-W、腾讯控股等互联网龙头,两大权重股合计占比近30%[3][11] - 该指数前10大持仓汇聚AI云计算、大模型及各领域AI应用公司,合计占比超78%,龙头优势显著[3][11] - 指数前十大权重股包括:腾讯控股(权重15.42%)、阿里巴巴-W(14.50%)、小米集团-W(13.11%)、美团-W(12.03%)、快手-W(4.24%)、商汤-W(4.18%)、贝壳-W(3.91%)、京东健康(3.90%)、哔哩哔哩-W(3.49%)、金蝶国际(3.31%)[4][12] 港股互联网板块估值分析 - 经过2025年四季度的持续回调,截至2025年末,中证港股通互联网指数自10月以来已累计下跌18.55%[4][12] - 板块最新市盈率PE(TTM)仅24.43倍,位于近5年26.36%分位点的低位区间[4][12] - 该估值明显低于创业板指(40.77倍)和纳斯达克100指数(35.93倍),比恒生科技指数的估值分位数还要低,性价比优势凸显[4][5][12][13] 机构对板块后市观点 - 兴业证券表示,互联网龙头为中国AI领域领头羊,有望迎来内、外资共振做多[5][13] - 随着AI应用深化,有望上调互联网龙头的长期盈利增长中枢,从而推动“盈利预期上调”和“估值提升”的戴维斯双击[5][13] 其他相关投资工具提及 - 全市场首只香港大盘30ETF(520560)被提及,其采用“科技+红利”哑铃策略,重仓股既包括阿里巴巴、腾讯控股等高弹性科技股,也囊括建设银行、中国平安等稳健高股息股,被称为港股长期配置的理想底仓工具[5][13]
英伟达拟以最高30亿美元收购AI21 Labs,加速布局大模型与AI代理生态
环球网资讯· 2025-12-31 12:12
潜在收购交易 - 英伟达正与AI初创公司AI21 Labs就潜在收购展开深入谈判 交易估值预计在20亿至30亿美元之间 若按上限成交 将超过AI21在2023年上轮融资估值的两倍以上 [1] - 此次潜在收购紧随英伟达另一项重大技术合作之后 该公司近日宣布以200亿美元获得AI芯片初创公司Groq的技术授权 并吸纳其创始CEO及核心团队加入 [2] 目标公司概况 - AI21 Labs是一家专注于大型语言模型和AI代理开发工具的公司 核心产品包括开源长上下文模型系列Jamba以及面向企业开发者的Maestro平台 [1] - Jamba模型采用创新的混合架构 融合了传统Transformer机制与名为Mamba的状态空间模型 据称比同类模型快2.5倍 并大幅降低内存占用 [1] - Maestro是AI21的商业化支柱 年化收入约5000万美元 该平台帮助企业预处理结构化与非结构化数据 优化输入以供AI代理高效分析 并对生成结果进行准确性验证与格式化输出 [1] - AI21 Labs曾于2023年完成一轮由英伟达、谷歌、三星电子等共同参与的融资 并在今年早些时候低调完成3亿美元新融资 估值与前轮基本持平 [2] 战略意图与整合计划 - 英伟达有意将AI21的Maestro平台整合进其企业级AI软件套件NVIDIA AI Enterprise 以增强其在AI代理开发与部署领域的端到端能力 [2] - 此举将进一步丰富该套件中的预训练模型、开发工具及工作流管理功能 强化英伟达在生成式AI基础设施市场的领导地位 [2] - Groq专注于高性能推理处理器 其技术有望与英伟达现有GPU架构形成互补 [2] - 此次拟议收购表明英伟达正从“财务支持者”转向“战略整合者” 意图通过垂直整合关键AI软件能力 巩固其在大模型时代软硬协同的生态优势 [2]