Workflow
Nemotron 3 Super
icon
搜索文档
英伟达“龙虾”乐园即将开张
36氪· 2026-03-13 19:43
年度GTC大会概况 - 英伟达将于下周举行年度GTC大会,预计有来自全球**190多个国家和地区**的**3万余人**现场参会 [6] - 大会期间,GTC公园将全程举行“搭建龙虾”活动,与会者可在现场部署一个始终在线的AI助手 [1] - 公司鼓励与会者携带英伟达芯片驱动的设备参加,现场将提供硬件购买,并可将“龙虾”AI助手部署在云端 [4] 硬件产品与技术创新 - 公司掌门人黄仁勋的主题演讲是资本市场关注的重中之重 [8] - 硬件关注焦点包括:算力芯片路线图、潜在的推理芯片以及自研光通信产品 [8] - 美银证券分析师指出重点关注方向:延伸至费曼架构的最新产品路线图、一系列全新的协同设计且模块化拆分的产品(如CPX、LPU)、用于大规模扩展系统的自研光互连技术(如集成CPO的交换机) [8] - 分析师展望公司可能讨论**102.4T Spectrum-6交换机**(可与Rubin平台配套使用)以及**115T Quantum-X交换机**(采用共封装光学CPO技术) [8] - 公司可能与英特尔联合发布一款定制化x86 CPU,以扩大其在企业数据中心乃至消费级CPU市场的采用范围 [8] - 现场可购买的硬件包括个人超算DGX Spark,其售价达**4699美元**(约合人民币**3.2万元**) [4][6] 推理芯片与战略合作 - 市场猜测黄仁勋预告的“前所未见芯片”可能是与推理芯片公司Groq合作发布的**LPU** [9] - 推理被视为大规模推广AI应用的最后瓶颈之一,该芯片的发布意味着公司将正式应对谷歌、微软等公司的定制芯片竞争 [9] - 公司于去年底支付了**200亿美元**获得Groq的专利许可,同时Groq创始人、总裁及核心团队已加入公司,双方关系引发广泛关注 [9] 软件与AI平台 - 公司可能发布一个面向企业AI代理的开源平台,名为**NemoClaw**,旨在为企业提供结构化方式来构建和部署能自主执行多步骤任务的AI智能体 [12] - 公司本周发布了迄今为止最强大的开源权重AI模型**Nemotron 3 Super**,专为大规模运行复杂智能体系统设计 [16] 产业愿景与开放模型 - 黄仁勋将举行以“开放模型的现状与未来”为主题的圆桌谈话,邀请包括Cursor、Perplexity、OpenEvidence等AI新锐公司及前OpenAI CTO Mira Murati等行业领袖参与 [13] - 公司认为,过去一年AI领域最重要的变化之一是开放前沿模型的快速进展,开放式创新正在加速各行业进步 [16] - 据媒体挖掘,公司未来五年将累计投入**260亿美元**布局开源AI大模型研发,该规模是OpenAI训练GPT-4成本的**8倍有余** [16] 市场影响与预期 - 分析师不指望公司会正式给出未来两年的销售数据指引,但有关**Rubin架构**量产爬坡的消息可能对横盘多时的股价形成提振作用 [10] - 鉴于参会者中有不少专业开发者,今年的GTC大会不仅可能成为“龙虾大会”,甚至可能成为一场“斗虾大会” [6]
全球大公司要闻 | 半导体涨价潮再起,寒武纪首现年度盈利
Wind万得· 2026-03-13 08:42
全球半导体与AI产业动态 - 全球半导体产业酝酿新一轮涨价潮,德州仪器、恩智浦、英飞凌计划自4月1日起上调部分产品售价,其中德州仪器部分产品最高涨幅达85%,英飞凌主流产品预计涨价5%至15% [2] - 英伟达宣布未来五年投资260亿美元开发开源AI大模型,从芯片制造商向模型实验室转型,并发布Nemotron 3 Super模型,多项基准测试超越GPT-OSS [2] - 博通宣布其Tomahawk® 6系列交换机芯片已进入量产出货阶段,该芯片可助力AI网络实现卓越的扩展性能 [10] - 三星电子正推进2纳米制程HBM4E研发,并与AMD商讨HBM供应合作,同时已获得苹果折叠屏iPhone的12GB LPDDR5X DRAM订单 [12] - SK海力士作为创始合作伙伴加入应用材料价值50亿美元的下一代半导体研发中心,联合攻关适配AI场景的下一代存储芯片技术 [13] 大中华地区科技与汽车公司要闻 - 寒武纪2025年首次实现年度盈利,归母净利润20.59亿元,同比扭亏为盈,营业收入64.97亿元,同比增长453.21%,公司拟每10股转增4.9股并派发现金红利15元 [2] - 腾讯微信正在研发独立自有AI模型,已完成基础能力建设,预计2026年对外落地,该模型将用于接入微信小程序生态 [5] - 百度发布全球首款手机端龙虾应用“红手指Operator”,引发下载热潮,旗下萝卜快跑将首次实现千线级激光雷达上车应用,该独家前装定点由速腾聚创获得 [3] - 理想汽车2025年第四季度收入总额288亿元,同比减少35%,净利润2020万元,2025年全年营收1123亿元,净利润11亿元,连续三年盈利 [6] - 胜宏科技2025年实现营业收入192.92亿元,同比增长79.77%,归母净利润43.12亿元,同比增长273.52%,公司拟每10股派发现金红利20元 [6] 美洲地区科技与消费公司要闻 - xAI联合创始人离职潮持续,ZiHang Dai(戴子航)本周已离开,张国栋也表示计划在未来几天内离职,自今年1月以来已有多位联合创始人离职 [9] - 亚马逊计划将2026年Prime Day从7月提前至6月以刺激销售,并发行540亿美元企业债券获得投资者超额认购 [9] - 微软与Meta近期合计新增近千亿美元数据中心租赁承诺,推动全球云计算厂商未来数据中心租赁总金额突破7000亿美元,相关租金将在15-19年内分期支付 [9] - Meta宣布未来两年将推出四代自研MTIA AI芯片,每六个月迭代一次,用于生成式AI推理计算,并收购AI智能体社交平台Moltbook以整合至广告业务 [10] - 苹果宣布将庆祝公司成立50周年,拟扩大铝合金3D打印制程应用至iPhone、Apple Watch等产品线,折叠屏iPhone Fold 1TB版本定价约2万元 [10] - FedEx市值首次超越UPS,登顶美国包裹运输企业市值榜首 [10] 新能源汽车、机器人及能源领域进展 - 特斯拉第三代人形机器人亮相,计划年底启动生产,长期规划产能100万台,其无人驾驶出租车Cybercab已于上月正式下线,将于4月开始量产 [3] - 本田汽车下调2025财年业绩预期,预计全年经营亏损2700亿日元至5700亿日元,净亏损4200亿日元至6900亿日元,因电动汽车战略将产生最高达2.5万亿日元的费用 [12] - 中国电建联营体与阿布扎比未来能源公司签订阿联酋阿布扎比RTC2.1GW+7.75GWh光储项目EPC合同,合同金额约139.62亿元 [7] - LG新能源2025财年总营收23.67万亿韩元,同比下降7.6%,股东应占亏损1.07万亿韩元,公司宣布将于2027年量产新型磷酸铁锂电池,重点发力储能赛道 [13] 金融、支付及其他行业要闻 - 中信证券一家香港子公司及国泰君安国际控股有限公司分别被报道遭香港证监会及廉政公署调查,相关文件被带走,员工被问话或配合调查 [5][6] - 软银旗下日本移动支付巨头PayPay在美国纳斯达克上市,发行价每股16美元,开盘价19美元,总市值约1.7万亿日元,为日本企业赴美上市历史最大规模 [12] - 九龙仓集团2025年扭亏为盈,股东应占盈利5000万港元,2024年同期亏损32.24亿港元,基础净盈利41.04亿港元,同比增长46.68% [7] - 宝马集团2025年财务收入1334.53亿欧元,同比下降6.3%,税前利润102.36亿欧元,同比下降6.7%,预计关税和成本将拖累2026年盈利 [16] - 新西兰航空公司因伊朗局势导致航油价格飙升,将在5月初前削减5%的航班(约1100个),并已提高机票价格以对冲成本 [16] - 礼来日本公司将投资200亿日元扩建神户工厂以扩大药品产能,应对全球对糖尿病、肥胖症治疗药物增长的需求,预计2028年投产 [14]
OpenAI电商转化不足1%,苹果最贵折叠屏9月面世 | 财经日日评
吴晓波频道· 2026-03-13 08:29
美国通胀与货币政策 - 美国2月CPI同比上涨2.4%,环比上涨0.3% [2] - 2月核心CPI同比增速维持在2.5%,为近五年来最慢水平,环比增速从0.3%放缓至0.2% [2] - 住房价格环比上涨0.2%,同比上涨3%,其中租金仅环比上涨0.1%,为2021年1月以来最小月度涨幅 [2] - 市场预计美联储在3月会议上维持利率不变的概率为99%,交易员预计首次降息将在9月 [2] - 中东冲突导致全球能源价格飙升,为美国后续通胀走势增添变数,可能使美联储降息窗口期被动后移 [3] 全球能源市场动态 - 国际能源署(IEA)32个成员国同意释放4亿桶战略石油储备,以应对中东地区战争导致的供应中断风险,这是IEA史上最大的联合释储行动 [4] - IEA成员国共持有超过12亿桶公共应急石油储备及约6亿桶受政府管控的企业储备 [4] - 释储消息公布后,布伦特原油期货当日涨超6% [4] - IEA的释储行动无法覆盖霍尔木兹海峡封闭带来的全球原油供应缺口,短期内该海峡的实际通航情况是影响油价的最主要变量 [4] - 国际原油价格持续高位将推高全球通胀并拖累全球经济增速,加大各国央行货币政策调整难度 [5] 电力设备与变压器行业 - 国际能源署预测,到2030年全球数据中心的电力需求将增长一倍以上,达到约945太瓦时 [6] - 目前全球电力变压器的供应缺口高达30%,配电变压器的缺口也达到10% [6] - 2025年中国变压器出口总值达646亿元,比上年增长近36%,出口单台均价升至20.5万元,上涨约三分之一 [6] - AI基础建设叠加欧美老化电网升级周期,推动电力基础设施需求快速攀升 [6] - 中国变压器产业依托完整产业链,在成本和交货速度上具有优势,但在高端特高压装备等领域与全球领先水平仍有差距 [6][7] 消费电子与AI手机 - 苹果首款折叠屏手机iPhone Fold预计9月发布,国行起售价1.4万—1.5万元,顶配版或突破2万元 [8] - 苹果通过优化面板与轴承的适配逻辑,解决了屏幕中间出现永久性折痕的行业难题 [8] - 华为、小米、荣耀等国内手机厂商争相入局AI智能体(文中喻为“养龙虾”),以在存量市场中寻求差异化 [10] - 当前AI手机缺乏亮眼表现的一大原因在于难以实现跨应用调度,受限于用户隐私安全及与App厂商的利益冲突 [10] - AI基座能力凸显,巨头间的生态竞争可能会更加激烈 [11] 人工智能与科技巨头动态 - 英伟达宣布未来五年斥资260亿美元开发开源AI大模型,挑战OpenAI等公司市场地位 [12] - 英伟达发布拥有1280亿参数的开源模型Nemotron 3 Super,并公开了多项训练创新方法 [12] - 在美国主流AI大模型生态日趋闭源的背景下,英伟达逆势加码开源模型,旨在巩固行业话语权与生态构建 [13] - OpenAI试图将ChatGPT推向“交易入口”的商业化路径受阻,其产品“买”按钮点击率不足1%,远低于典型电商网站3%到4%的水平 [14] - OpenAI将重心转向“ChatGPT apps”模式,但交易链条与体验尚未闭环,商业化探索不顺利 [14] A股市场表现 - 3月12日A股市场探底回升,沪指跌0.1%报4129.1点,深成指跌0.63%,创指跌0.96% [16] - 沪深两市成交额2.44万亿元,较上一交易日缩量665亿元 [16] - 绿电概念爆发,化工、煤炭板块表现活跃,碳纤维概念延续强势 [16] - 美国启动新一轮301调查给A股带来外部不确定性,市场日内完成情绪修复 [16] - 全球原油供应链中断风险升温,推动煤炭、风电等能源替代板块走高 [16]
腾讯研究院AI速递 20260313
腾讯研究院· 2026-03-13 00:01
AI行业重大并购与战略布局 - 谷歌以320亿美元全现金完成对以色列云安全公司Wiz的收购,为其史上最大交易,较2024年初报价溢价近40% [1] - 此次收购核心逻辑是AI时代云攻击面扩大,谷歌计划联合此前收购的Mandiant打造“统一安全平台”,并将Gemini嵌入威胁情报排序 [1] - 英伟达披露未来五年将投入260亿美元构建开源AI模型,旨在通过开源生态绑定开发者至自家技术底座 [2] AI模型与开源技术进展 - 英伟达发布并开源120B参数MoE模型Nemotron 3 Super,采用混合Mamba-Transformer架构,原生支持100万token上下文,PinchBench得分85.6%登顶开源榜首 [2] - 该模型采用NVFP4格式预训练,适配Blackwell架构,B200芯片推理速度达H100的4倍,吞吐量为上代5倍以上 [2] - 阶跃星辰推出StepClaw,基于OpenClaw打造云端AI助手,提供5万个免费体验名额,包含5000万模型Tokens及云服务器资源 [5][6] AI企业应用与生产力工具 - Anthropic发布Claude for Excel和PowerPoint重大更新,实现跨文件全上下文共享,单一对话可同时操控多个工作簿和幻灯片 [3] - 新增“技能”功能将复杂业务流程转化为一键操作,预置财务审计、DCF模板、PPT润色等专业技能,支持企业自定义复用 [3] - 腾讯自研AI智能体WorkBuddy更新,支持微信扫码一键直连,并正式支持自动化定时任务,可定期生成日报周报、抓取竞品信息 [4] AI生成式内容与3D资产 - VAST发布Tripo P1.0模型,2秒内可生成拓扑规整、500至20000面的游戏级3D网格资产,效率较现有方案提升百倍以上 [7] - 该模型在原生三维空间中进行概率生成,顶点、边、面统一建模全局演化,生成资产可直接进入游戏引擎、仿真模拟和实时渲染流程 [7] AI行业趋势与市场洞察 - a16z最新Top 100 AI应用报告显示ChatGPT周活仅占全球人口10%,市场仍处早期,并指出记忆功能将成为AI产品核心优势 [8] - ChatGPT、Claude、Gemini三大平台定位分化明显,Claude深耕专业工作流,ChatGPT瞄准大众消费,Gemini侧重创意工具和存量用户转化 [8] - Ramp最新AI指数显示Anthropic已超越OpenAI成为美国企业首选,在产品性能和价格均非最优的情况下需求仍持续增长 [3] AI前沿研究与未来预测 - Anthropic内部研究人员透露已观察到AI递归自我改进的早期迹象,70%至90%的模型开发代码由Claude完成,预测完全自动化AI研究可能一年内实现 [9] - 马斯克最新访谈称AI“硬起飞”已在发生,递归自我改进中人类参与度正迅速降低,并预测未来10年全球经济规模增长10倍 [12] - Science子刊发表研究显示,AI育儿聊天机器人使儿童发育水平提升0.11个标准差,达到传统家访效果的约65%,而成本仅为传统模式的1/15 [10]
英伟达加大开源模型推广力度
新浪财经· 2026-03-12 20:48
公司战略与投资 - 公司计划在未来五年内投入260亿美元用于开发开源权重人工智能模型 [1][1] - 公司发布了其最新的Nemotron 3 Super模型,该模型拥有1280亿个参数 [1][1] 行业竞争与市场影响 - 公司发布新模型旨在与领先的人工智能研究实验室进行竞争 [1][1] - 公司此举同时旨在推动其核心产品图形处理器在市场的进一步采用 [1][1]
【太平洋科技-每日观点&资讯】(2026-03-13)
远峰电子· 2026-03-12 20:36
大盘指数与板块表现 - 3月12日,主要股指普遍下跌,上证指数跌0.10%,深证成指跌0.63%,创业板指跌0.96%,北证50跌1.12%,科创50跌1.24% [1] - TMT板块中,LED、安防设备、其他计算机设备领涨,涨幅分别为2.87%、0.27%、0.20% [1] - TMT板块中,其他通信设备、被动元件、军工电子Ⅲ领跌,跌幅分别为2.65%、2.40%、2.33% [1] 国内半导体与科技新闻 - 思特威推出1200万像素AI眼镜应用CMOS图像传感器SC1220IOT,采用55nm Stacked BSI工艺,支持低功耗常开功能 [1] - 艾森股份表示其光刻胶产品持续突破和放量,华东制造基地一期预计2028年产能释放 [1] - 工业富联2025年实现营收9028.87亿元,同比增长48.22%,其中云计算业务贡献66.75%收入,通信及移动网络设备贡献32.99%收入 [1] - 工业富联云计算业务中,AI服务器及高速网络设备需求旺盛,800G以上高速交换机全年营收同比增幅高达13倍 [1] - Gartner预测,到2030年,中国80%的本地AI基础设施将采用本土研发的AI芯片,目前这一比例仅为20% [1] 海外半导体与科技新闻 - Wolfspeed宣布其300毫米碳化硅技术平台有望在本十年末成为先进AI和高性能计算异构封装的基础材料支持 [2] - 罗姆通过与台积电合作,计划显著提升氮化镓功率器件的供应能力,以应对AI服务器、电动汽车等领域的需求增长 [2] - NXP或将从2026年4月1日起对部分产品进行价格调整,主要因原材料、能源、人工、物流等成本大幅上升 [2] - 全球FPGA龙头赛灵思与莱迪思相继发布涨价通知,涉及全系列主力产品,涨幅集中在10%-20%,新价格于2026年3月起执行 [2] AI资讯 - 百度智能云“红手指Operator”应用正式上线安卓市场,是全球首款手机龙虾应用,可实现打车、外卖订餐等跨App交互操作 [2] - 英伟达发布最强开源权重AI模型Nemotron 3 Super,拥有1200亿参数,吞吐量较前代提升5倍,准确率翻倍,配备100万Token超长上下文窗口 [2] - 百度智能云发布零部署OpenClaw服务DuClaw,用户无需选择镜像、部署服务器或配置API Key即可即开即用,并支持多款主流大模型灵活切换 [2] - 腾讯电脑管家推出基于OpenClaw打造的本地AI助手QClaw,支持Mac和Windows双端,核心亮点是零配置直接关联微信,可通过微信远程操控电脑完成任务 [2] “十五五”前沿行业追踪 - 【深空经济】中科宇航宣布力箭一号遥十二运载火箭已完成总装测试并通过出厂评审,计划近期执行“一箭八星”发射任务 [3] - 【量子计算】芬兰量子计算企业IQM向阿尔托大学交付了一台名为IQM Radiant的20量子比特量子计算机,并已进入科研运行阶段 [3] - 【具身智能】Faraday Future向美国得州NS Federation交付Master机器人并试点交付Aegis机器人,拓展“机器人+车辆+教育”等应用场景,公司明确首个交付季目标200台 [3] - 【新材料】德兴市润邦化工3万吨OCA光学胶项目进行环评拟批准公示,该项目拟投资5.5亿元,形成年产2万吨水性OCA光学胶、5000吨溶剂型OCA光学胶、5000吨可降解电子胶黏剂的生产规模 [3] 半导体现货市场价格 - 3月12日国际DRAM颗粒现货价格中,DDR5 16G (2G×8) 4800/5600盘平均价为39.400美元,日跌幅0.42% [4] - DDR4 8Gb (1G×8) 3200盘平均价为33.600美元,日涨幅0.60% [4] - DDR3 4Gb 512M×8 1600/1866盘平均价为6.381美元,日涨幅1.21% [4] - 3月12日百川盈孚半导体材料价格显示,6N高纯锌市场均价为2,030元/千克,日上涨20元/千克 [5] - 7N高纯锌市场均价为2,160元/千克,日上涨20元/千克 [5] - 7N高纯锌粒市场均价为2,230元/千克,日上涨20元/千克 [5] - 晶片衬底方面,2寸氮化镓衬底市场均价为10,800元/片,导电N型8寸P级单晶碳化硅衬底市场均价为59,000元/片,半绝缘6寸P级单晶碳化硅衬底市场均价为10,800元/片 [5]
龙虾热”席卷全球之际 黄仁勋携开源模型炸场! 英伟达(NVDA.US)全栈野心托起“AI牛市叙事
智通财经· 2026-03-12 20:05
公司战略与定位 - 公司推出专为超大规模AI智能体打造的开源大模型“Nemotron 3 Super”,旨在抓住AI代理浪潮,强化其从AI芯片供应商向“模型—工具链—云推理服务—AI生态系统”全栈平台转变的趋势 [1] - 公司的角色正从单纯的AI芯片供应商转变为“AI基础设施总承包商”,通过定义代理模型、推理栈、部署路径和企业工作流入口,扩展企业核心价值链 [8] - 公司凭借AI GPU算力体系与CUDA构筑的“超级AI护城河”因新模型的推出而变得更加坚实,其护城河正从“单一GPU性能与CUDA壁垒”上移至“模型架构—推理栈—GPU平台—企业部署”的整套AI系统能力 [10][11] 产品性能与技术细节 - Nemotron 3 Super在Pinchbench基准测试中表现卓越,在OpenClaw任务成功率上取得85.6%的高分,性能直逼Claude Opus 4.6与GPT-5.4等闭源模型 [1][10] - 该模型为1200亿参数混合专家模型,与上一代相比,推理性能提升3倍有余,吞吐量最高可提升至5倍,准确率最高可提升至2倍 [2] - 模型采用“高总参、低激活”设计,总参数120B,推理时仅激活12B,原生支持100万tokens上下文窗口,最小部署门槛为8张H100 80GB GPU [3] - 在8k输入/64k输出设置下,该模型的推理吞吐可达GPT-OSS-120B的2.2倍、Qwen3.5-122B的7.5倍 [4][11] - 在Blackwell平台上以NVFP4精度运行时,推理速度最高可达Hopper平台FP8的4倍,且不损失准确率 [6] 模型应用与客户部署 - AI搜索公司Perplexity已向其用户提供该模型用于AI智能体驱动的系统性搜索,并将其作为Computer中20个编排模型之一 [2] - CodeRabbit、Factory、Greptile等科技公司正将该模型集成到其AI代理服务中,以在更低成本下实现更高准确率与经营效率 [2] - 生命科学研究机构如Edison Scientific和Lila Sciences将利用该模型支持深度文献检索、数据科学和分子理解等复杂功能 [2] - Amdocs、Palantir、Cadence、达索系统与西门子等巨头正在积极部署并定制该模型,以实现电信、网络安全、半导体设计制造等领域的代理式自动化 [3] - 戴尔科技正将该模型引入Hugging Face平台的Dell Enterprise Hub,以推进企业多代理AI工作流的本地化部署;慧与科技也在将其引入agents hub [9] 行业趋势与市场影响 - 高通首席执行官预测2026年将是“AI代理之年”,数字生态系统将从以移动应用为中心转向以AI代理为中心 [4] - 全球科技巨头(亚马逊、Alphabet、Meta、甲骨文、微软)预计2026年AI相关资本支出将达到约6500亿美元,部分预测可能超过7000亿美元,同比增幅可能超过70% [18] - 摩根士丹利渠道调查显示,全球AI算力供需缺口每日以个位数级别大幅扩大,云计算巨头对AI工作负载的增长依然激进,预计2026年对英伟达产品的采购量将大幅增长80%以上 [14] - 围绕英伟达与AMD新品迭代的“AI牛市叙事”被视为全球股市中最具确定性的景气投资叙事之一,将带动电力、液冷散热、光互连等AI相关投资主题 [17] 财务与股价展望 - 公司当前市值约为4.5万亿美元,其向全栈平台转变的趋势可能推动股价再创历史新高 [1] - 截至周三美股收盘,公司股价收于186.03美元,此前历史最高点位为212.167美元 [12] - 摩根士丹利重申公司为半导体板块“首选”股票,维持“增持”评级与260美元目标价 [12] - TipRanks汇编的华尔街分析师平均目标价显示,市场普遍看好公司股价冲至273美元,意味着未来12个月上行潜力高达47% [12]
AI日报丨监管提示信托公司“小龙虾”潜在风险;马斯克推出特斯拉与xAI联合项目Macrohard;英伟达发布Nemotron 3 Super:吞吐量提升五倍
美股研究社· 2026-03-12 19:07
AI行业监管与安全动态 - 中国监管部门向信托公司提示OpenClaw开源智能体的潜在安全风险,要求进行排查[5] - 美国五角大楼设置例外条款,允许在“罕见且特殊的情况下”于淘汰期后继续使用Anthropic的AI工具,前提是对国家安全至关重要且无可行替代方案[7][8] 主要科技公司产品与战略发布 - 百度发布全球首款手机龙虾应用“红手指 Operator”,引发下载热潮导致后台资源紧张,公司正全力调配资源扩容[6] - 马斯克公布特斯拉与xAI的联合项目“Macrohard”或“Digital Optimus”,该系统结合xAI的Grok大模型与特斯拉的智能体,能模拟软件公司功能并处理实时屏幕与操作[10] - 英伟达发布拥有1200亿参数的开源模型Nemotron 3 Super,针对Blackwell架构优化,处理智能体AI系统时吞吐量最高可达前代模型的五倍,准确率提升两倍[11] - 英伟达计划在未来5年累计投入260亿美元(约合1788亿元人民币)推进开源AI大模型研发,资金将在未来18至24个月内逐步落地,首批自研模型最快于2026年底至2027年初问世[13] - Meta计划在2027年底前部署四代自研AI芯片(MTIA 300, 400, 450, 500),作为硬件来源多元化战略的一部分,同时坚持采购英伟达和AMD等传统硬件与投资专用芯片并行的双轨方案[12] 行业合作与竞争态势 - OpenClaw创始人对百度AI创新速度表示赞赏,并表达与百度共同开发龙虾的意愿[6] - Anthropic推出的Claude Cowork能自主完成基于电脑的任务,引发软件行业投资者对智能体AI颠覆现有商业模式的担忧[10] - 英伟达的Nemotron 3 Super模型目前已支持谷歌云和甲骨文,对亚马逊AWS和微软Azure的支持也将于近期上线[11]
英伟达豪掷260亿美元下场造AI模型,直接叫板OpenAI
硬AI· 2026-03-12 17:04
英伟达宣布巨额研发投资与战略转型 - 公司宣布未来五年将投入260亿美元研发开源AI大模型,标志着其从硬件巨头向全栈AI企业的战略转型 [2][3] - 此举旨在直接挑战OpenAI、Anthropic与DeepSeek等前沿AI实验室的市场地位 [3] - 从宏观视角看,这代表公司的战略重心从单纯的硬件与软件栈供应商,转变为能与顶级AI实验室直接竞争的全栈AI企业 [4] Nemotron 3 Super模型性能 - 新发布的Nemotron 3 Super拥有1280亿参数,规模与OpenAI GPT-OSS最大版本相当 [5][6] - 在人工智能指数综合评分中,Nemotron 3 Super获得37分,超越了GPT-OSS的33分 [6] - 在专门评估模型对OpenClaw控制能力的新型基准测试PinchBench中,该模型位列第一 [6] - 公司公开了提升模型推理、长上下文处理及强化学习响应能力的多项创新训练方法 [6] - 公司应用深度学习研究副总裁透露,近期已完成一个5500亿参数模型的预训练工作 [6] - 自2023年11月发布首个Nemotron模型以来,公司已陆续推出面向机器人、气候建模及蛋白质折叠等垂直领域的专用模型 [6] 硬件与模型双轮驱动战略 - 公司未来的AI模型将不仅服务于芯片研发,还将用于优化超算级数据中心的整体架构,以构建硬件架构路线图 [9][10] - 开源策略具有长远商业意义,公开模型权重及技术细节有助于形成围绕英伟达硬件生态的开发者网络,强化其芯片的市场黏性 [10] - 公司高管表示,帮助生态系统发展符合公司利益,此举是深度绑定硬件路线图的战略布局 [10] 行业评价与意义 - 行业研究人士对此次布局反应积极,艾伦人工智能研究所的研究员称自己是“Nemotron的铁杆支持者” [11][12] - 专注AI开放性的非营利机构创始人将这笔投资定性为里程碑式信号,认为这是公司对开放性信念的一次史无前例的表态 [12] - 通过开源策略深度绑定自家硬件生态,公司在挑战其他实验室的同时,旨在进一步巩固其在AI算力市场的绝对主导地位 [2][3]
“龙虾热”席卷全球之际 黄仁勋携开源模型炸场! 英伟达(NVDA.US)全栈野心托起“AI牛市叙事”
智通财经网· 2026-03-12 16:16
公司核心战略与产品发布 - 公司推出专为超大规模AI智能体打造的开源大模型“Nemotron 3 Super”,旨在以可扩展方式运行复杂的代理式AI系统 [1] - 此举强化了公司从单纯的AI芯片供应商向“模型—工具链—云推理服务—AI生态系统”全栈平台转变的趋势 [1] - 该模型总参数为1200亿(120B),采用混合专家模型架构,推理时仅激活120亿(12B)参数,上下文窗口原生支持100万tokens [2][3] - 模型设计工程意义明确:用MoE控制激活开销,用Mamba拉长上下文和吞吐,用Attention保住精确检索与推理稳定性,更偏向于作为“代理编排主脑” [4] - 模型本身是公司释放的“全栈信号”,将模型、优化、微服务生态、云端算力与部署合作伙伴整合进一个软硬件一体化的AI生态产品体系 [8] - 公司的角色正从“卖AI算力加速卡”扩展到“定义 agent 模型、推理栈、部署路径和企业工作流入口”,越来越像AI基础设施总承包商 [8][10] 产品性能与技术细节 - 在Pinchbench基准测试中,该模型稳坐开源第一,在OpenClaw任务成功率上取得85.6%的高分,性能直逼Claude Opus 4.6、GPT-5.4两大闭源模型 [1][10] - 与上一代Nemotron Super模型相比,推理性能提升3倍有余,吞吐量最高可提升至5倍,准确率最高可提升至2倍 [2] - 在8k输入/64k输出设置下,其推理吞吐可达GPT-OSS-120B的2.2倍、Qwen3.5-122B的7.5倍 [4][11] - 在公司的Blackwell平台上以NVFP4精度运行时,推理速度最高可达到Hopper平台FP8的4倍,且不损失准确率 [6][11] - 模型采用LatentMoE+Mamba-2+少量Attention的混合架构,共有88层、模型维度4096 [3] - 模型设计旨在解决企业部署多代理应用时的“上下文爆炸”(token量可达标准聊天至少15倍)和“思考税”(成本过高、响应迟缓)两大限制 [5] 市场应用与合作伙伴 - AI搜索公司Perplexity已向用户提供该模型,用于AI智能体驱动的系统性搜索,并作为其20个编排模型之一 [2] - CodeRabbit、Factory、Greptile等科技公司正将该模型集成到其AI代理服务中,以在更低成本下实现更高准确率和经营效率 [2] - Edison Scientific、Lila Sciences等生命科学与AI研究机构将利用该模型支持代理模式,用于深度文献检索、数据科学和分子理解等复杂功能 [2] - Amdocs、Palantir、Cadence、达索系统、西门子等公司正在积极部署并定制化该模型,以实现电信、网络安全、半导体设计制造等领域工作流程的代理式自动化 [3] - AI服务器制造商戴尔科技正将该模型引入Hugging Face平台的Dell Enterprise Hub,以推进企业多代理AI工作流的本地化部署 [9] - 另一AI服务器领军者慧与科技也在将Nemotron引入其agents hub,以确保代理式AI在企业中的可扩展落地 [9] 行业趋势与市场前景 - 高通CEO预测2026年将是“AI代理之年”,数字生态系统将从以移动智能手机和应用程序为中心,转向以AI代理为中心 [4] - 全球科技巨头对AI算力的资本开支激增,亚马逊、谷歌、Meta、甲骨文、微软预计2026年AI相关资本支出合计约6500亿美元,部分分析师认为可能超过7000亿美元,同比增幅可能超过70% [18] - 2023年至2026年间,上述五大科技巨头为打造AI算力基础设施的累计投入预计约1.5万亿美元,远超2022年之前整个历史统计期间累计的约6000亿美元 [18] - 摩根士丹利渠道调查显示,全球“AI算力供需缺口每日以个位数级别大幅扩大”,云计算超级巨头对AI工作负载的增长依然极其激进 [14] - 即便部分客户自研AI ASIC或采购AMD AI GPU,预计这些超级客户在2026年对公司产品的采购量仍将大幅增长80%以上 [14] - 当模型规模、推理链路与多模态/代理式AI工作负载推动算力消耗呈指数型扩张时,AI算力基础设施成为科技巨头资本开支主线,并带动电力、液冷散热、光互连等供应链投资主题 [17] 财务表现与分析师观点 - 公司当前全球市值最高,约4.5万亿美元 [1] - 截至周三美股收盘,公司股价收于186.03美元,此前历史最高点位为212.167美元 [12] - 摩根士丹利重申公司为半导体板块“首选”股票,维持“增持”评级与260美元目标价 [12] - TipRanks汇编的华尔街分析师平均目标价显示,分析师普遍看好公司股价冲至273美元,意味着未来12个月上行潜力高达47% [12] - 即将到来的GTC 2026大会将展示公司领先的技术路线图,其Vera Rubin架构与在物理AI领域的最新布局将开辟全新的市场总值空间 [14]