Workflow
具身AI
icon
搜索文档
下半年CCF-A/B类会议窗口期收窄,发一篇具身论文还来得及吗?
具身智能之心· 2025-06-29 17:51
下半年CCF会议投稿机会 - 错过上半年顶级会议投稿窗口可能导致研究成果发布延迟和错失学术交流机会 下半年CCF会议提供了关键替代渠道[1] - 高效利用投稿机会面临核心挑战 包括时间压力下确保论文质量 选题新颖性 实验严谨性 写作规范性和投稿策略匹配度[1] - 提供1v1指导课程帮助解决上述挑战 通过资深导师介入论文撰写与修改过程 提供个性化解决方案以提升论文竞争力[1] 论文辅导面向的痛点人群 - 计算机专业本硕博学生面临导师放养 缺乏科研指导[4] - 有科研需求需积累经验提升职称或学术成就的人群[4] - 人工智能领域从业者希望通过科研提升职场竞争力[4] - 考研申博留学需提升简历含金量的群体[4] 论文辅导解决的问题 - 解决导师放养导致的科研指导缺失问题[3] - 帮助建立科研思维和系统知识体系[3] - 掌握经典与前沿算法 形成清晰知识框架[3] - 实现模型理论与代码实践结合 提升实践能力[3] - 将baseline深化拓展形成个人论文成果[3] 论文辅导阶段与交付成果 - 选题阶段:导师引导构思或直接提供论文idea[5] - 实验阶段:全程指导实验设计 模型搭建 调参和idea验证[7] - 写作阶段:指导完成高质量论文写作 符合审稿人要求[9] - 投稿阶段:推荐合适期刊 提供精准投稿建议[14] - 录用阶段:确保论文在周期内完成录用[15] 辅导过程具体内容 - 选题阶段:梳理研究成果 提供文献 指导创新点构思[11] - 实验阶段:完成实验设计 数据处理 代码实现和结果分析[12] - 写作阶段:剖析优秀案例 搭建论文框架 润色论文内容[13] - 投稿阶段:筛选期刊会议 指导回复审稿意见[17] 课程服务与支持 - 腾讯会议在线1v1上课 微信群日常答疑[18] - 班主任全程督学跟进学习进度[16] - 私人群提供与主讲导师直接沟通渠道[24] - 线上语音会议结合文字/语音答疑[24] 课程交付成果 - 产出一篇目标区位的高质量论文[19] - 掌握完整科研流程和论文写作技巧[19] - 提升科研能力和专业素养[19] - 获得投稿选刊技巧和前沿技术认知[23] 课程指导周期 - 总周期=核心指导期+维护期 根据论文区位3-18个月不等[22] - CCF A/SCI 1区:核心36次课+9个月维护[22] - CCF B/SCI 2区:核心28次课+6个月维护[22] - CCF C/SCI 3区:核心28次课+6个月维护[22] - EI期刊/会议:核心24次课无维护期[22] - 硕士论文周期以学员需求为准[26] 课程特色亮点 - 主讲导师为顶会审稿人 提供全方位指导[24] - 每周1次45分钟1v1会议指导课[25] - 维护期通过微信群进行审稿意见答疑[25] - 提供基础课程供学员自主学习[28] - 专属沟通群配备导师和班主任答疑[28]
清华大学最新综述!具身AI中多传感器融合感知:背景、方法、挑战
具身智能之心· 2025-06-27 16:36
具身AI与多传感器融合感知 - 具身AI以物理实体为载体,通过动态环境实时感知实现自主决策和行动能力,是突破AI发展瓶颈、实现通用人工智能(AGI)的关键路径[3] - 多传感器融合感知(MSFP)对实现具身AI的稳健感知和准确决策能力至关重要,需融合视觉相机、毫米波雷达、激光雷达等多模态传感器数据[3] - 当前MSFP方法面临跨模态数据异质性、时空异步和传感器故障等固有挑战[4] 传感器数据与数据集 - 相机数据捕捉丰富外观特征但对光照敏感,激光雷达提供高精度3D点云但对天气敏感,毫米波雷达在恶劣天气性能良好[10] - KITTI数据集包含14,999张图像及相应点云,采集于德国卡尔斯鲁厄及附近城市[13] - nuScenes数据集在波士顿和新加坡采集,包含140万张相机图像、39万次LiDAR扫描和140万次雷达扫描[13] - Waymo Open数据集包括126万个3D边界框和118万个2D边界框,涵盖白天、夜间、黎明、黄昏和雨天场景[14] 感知任务 - 目标检测任务需准确定位和识别物体,2D检测输出类别和2D边界框,3D检测包括3D位置坐标、尺寸和航向角[16] - 语义分割任务将场景中的每个基本单元分类为语义类别[17] - 深度估计任务从传感器数据获取场景深度信息,为具身智能体提供3D几何理解[17] - 占用预测任务提供对3D空间的密集语义理解,通过离散化3D空间为体素预测占用状态和语义类别[17] 多模态融合方法 - 点级融合方法集成点云几何坐标信息与图像语义细节,如PointFusion、PointPainting等方法[23][24] - 体素级融合方法将LiDAR点云转换为规则网格,如CenterFusion、VPFNet等方法[25][26] - 区域级融合方法从2D图像和其他模态聚合特定区域信息,如AVOD、RoarNet等方法[28][29] - 多级融合方法从不同级别集成多模态信息,如MVX-Net、EPNet等方法[30][31] 多智能体融合方法 - 协作感知技术可集成多个智能体和基础设施的感知数据,解决遮挡和传感器故障问题[35] - CoBEVT通过稀疏Transformer生成BEV分割预测进行协作处理[35] - V2VNet基于图神经网络融合多辆车的中间特征表示[36] - When2Com框架学习构建通信组和通信时机,减少带宽使用[37] 时间序列融合方法 - 密集查询方法为高分辨率3D或BEV空间中的每个查询点分配固定位置,如BEVFormer、BEVFormer v2[40][41] - 稀疏查询方法因其效率、准确性和适用于稀疏感知任务而受欢迎,如StreamPETR、Sparse4D系列[42][43] - 混合查询方法结合密集和稀疏查询范式,如UniAD、FusionAD等方法[45][46] 多模态LLM融合方法 - 视觉-语言方法结合视觉和文本数据进行语义对齐,如X-Driver、Mpdrive等方法[50] - 视觉-LiDAR-语言方法集成视觉、LiDAR和语言数据进行3D空间理解,如DriveMLM、MAPLM等方法[51][52]
清华大学最新综述!当下智能驾驶中多传感器融合如何发展?
自动驾驶之心· 2025-06-26 20:56
具身AI与多传感器融合感知的重要性 - 具身AI是以物理实体为载体,通过实时感知实现自主决策和行动能力的智能形式,在自动驾驶、机器人群体智能等领域有广泛应用,是突破AI发展瓶颈、实现通用人工智能(AGI)的关键路径 [2] - 传感器数据理解是连接物理世界与数字智能的核心环节,具身智能体需要融合视觉相机、毫米波雷达、激光雷达(LiDAR)、红外相机和IMU等多模态传感器数据以实现全景感知 [2] - 多传感器融合感知(MSFP)对实现具身AI的稳健感知和准确决策能力至关重要,例如视觉相机易受光照变化干扰,而激光雷达在雨雾天气性能会大幅衰减 [2] 现有研究的局限性 - 当前基于AI的MSFP方法在具身AI中面临跨模态数据的异质性使得特征空间难以统一的挑战 [3] - 不同传感器之间的时空异步可能导致融合误差,传感器故障(如镜头污染、信号遮挡)可能导致多模态信息的动态丢失 [3][4] - 现有综述大多面向单一任务或研究领域,如3D目标检测或自动驾驶,缺乏对多智能体融合、时间序列融合等MSFP方法多样性的考虑 [4] 传感器数据 - 相机数据可捕捉物体的颜色、形状和纹理等丰富外观特征,但对光照条件敏感,在夜间和恶劣天气下图像质量显著下降 [7] - 激光雷达(LiDAR)数据直接输出包含空间几何信息的高精度3D点云,在3D感知中具有独特优势,但对天气敏感且点云数据稀疏不均匀 [7] - 毫米波雷达数据在恶劣天气下性能良好,可直接测量物体速度,但点云更稀疏难以准确描述物体轮廓 [10] 数据集 - KITTI包含14,999张图像及相应点云,数据采集车辆配备两台灰度相机、两台彩色相机、一个Velodyne 64线LiDAR等设备 [13] - nuScenes包括700个训练场景、150个验证场景和150个测试场景,总计5.5小时,包含140万张相机图像、39万次LiDAR扫描 [13] - Waymo Open包括感知和运动数据集,感知数据集中的注释包括126万个3D边界框、118万个2D边界框 [14] 感知任务 - 目标检测是通过传感器获取的数据准确定位和识别各种类型的物体,在3D目标检测场景中需包括目标的3D位置坐标、尺寸信息和航向角 [16] - 语义分割任务旨在将场景中的每个基本单元分类为语义类别,分割模型需要为每个基本单元分配相应的语义标签或类别概率分布 [16] - 深度估计旨在从传感器数据中获取场景的深度信息,为具身智能体提供3D几何理解,对路径规划和决策控制等下游任务至关重要 [16] 多模态融合方法 - 点级融合方法实现LiDAR点云与图像数据在单个点级别的特征融合,通过集成点云的几何坐标信息与图像的语义细节提高多模态感知精度 [21] - 体素级融合方法将不规则的LiDAR点云转换为规则网格,在保留几何信息的同时实现高效处理,相机图像被集成到基于体素的方法中以获得更好的感知能力 [23] - 区域级融合方法侧重于从2D图像和其他模态聚合特定区域的信息,在模态之间的空间对齐更容易实现的场景中特别有效 [28] 多智能体融合方法 - 协作感知技术可以集成来自多个智能体和基础设施的感知数据,对解决遮挡和传感器故障问题至关重要 [34] - CoBEVT是第一个通用的多智能体多相机感知框架,通过稀疏Transformer生成BEV分割预测以进行协作处理 [34] - V2VNet引入了一个基于图神经网络的框架,用于融合来自多辆车的中间特征表示 [35] 时间序列融合 - 密集查询方法为高分辨率3D空间或BEV空间中的每个查询点分配固定的光栅化空间位置,BEVFormer通过可变形注意力机制实现多个相机视图中的自适应特征交互 [44] - 稀疏查询方法因其效率、准确性和适用于稀疏感知任务而在行业中越来越受欢迎,StreamPETR通过对象查询系统地在帧间传播长期信息 [47] - 混合查询方法结合密集和稀疏查询范式,以平衡计算效率和全面的场景理解,UniAD将感知、预测和规划集成在一个统一的框架中 [51] MM-LLM融合方法 - 视觉-语言方法结合视觉和文本数据进行语义对齐,X-Driver利用具有思维链推理和自回归建模的多模态大型语言模型实现卓越的闭环自动驾驶性能 [57] - 视觉-LiDAR-语言方法将点云特征与文本特征对齐,DriveMLM采用时间QFormer处理多视图图像,有效捕捉不同视角之间的时间动态和空间关系 [59] - MAPLM将3D LiDAR点云数据投影到BEV图像,并通过视觉编码器提取特征,使强大的视觉模型的使用成为可能 [60]
专家访谈汇总:类人机器人训练,催生推理专用芯片
电子元件板块 - 电子元件板块近期涨幅超过5%,中京电子、沪电股份等个股涨停,反映资本市场对该板块景气度的强烈预期 [1] - 5G手机、智能穿戴设备等终端产品升级推动对高性能、小型化电子元件需求上升,5G手机中射频、滤波器等核心部件需求显著高于4G [1] - 国家政策支持电子元件产业,包括税收优惠、专项补贴等,旨在加快自主可控和关键技术突破 [1] - 国际贸易摩擦与供应链安全压力下,国产替代成为主线,国内厂商获得更大市场空间 [1] - 沪电股份全球PCB百强供应链扎实,深南电路在封装基板和高端装联领域有核心竞争力,中京电子等细分赛道成长性良好 [1] 算力与光通信 - 2024年新增资源超九成来自大型/超大型项目,高功率智算中心占比达40%,"东数西算"西部节点受益于电力、地价优势 [2] - 东山精密计划60亿元全资控股索尔思光电,其光模块覆盖10G~800G,客户包括数据中心、运营商与5G基站 [2] - 空芯光纤因超低延迟、超大带宽成为下一代通信关键赛道,2025年中国电信集采招标已明确推进 [2] - 新易盛、铖昌科技等公司在AI/5G应用落地逻辑下盈利与估值匹配度优,属"高增长、低估值"组合 [2] 东阳光投资纵慧芯光 - 东阳光拟9000万元投资纵慧芯光,持股2.575%,强调战略协同,结合液冷技术与光芯片提升数据中心解决方案竞争力 [2] - 纵慧芯光2024年亏损5830万元,2025年Q1亏损1532万元,未设业绩承诺,短期盈利能力弱 [2] - 东阳光2024年净利润同比下降44.54%,但2025年Q1同比增长超180%,主业改善支撑战略投资 [2] DDR4内存价格飙涨 - 三星、SK海力士、美光停止生产DDR4芯片转向DDR5/HBM,DDR4供应急剧收缩,5月价格单月暴涨53% [3] - 中国厂商如长鑫存储、长江存储迎来中低端DDR4市场份额快速提升窗口期,PC/消费类订单有望转移至国产阵营 [3] - 涨价为结构性机会,催化存储产业链国产替代,封测、模组等环节订单增长与ASP提升预期明确 [3] 人形机器人产业 - Token生成量暴涨驱动算力需求从G级跃升至TB级,催生推理专用芯片如NVIDIA Blackwell需求 [3] - 信息机器人与具身AI汇合,类人机器人训练转向Omniverse模拟训练+Thor部署 [3]
迈向通用具身智能:具身智能的综述与发展路线
具身智能之心· 2025-06-17 20:53
具身AGI的定义 - 具身AGI被定义为能够以人类水平的熟练度完成多样化、开放式现实世界任务的具身AI系统,强调其人类交互能力和任务执行能力 [3] 通用具身智能路线 - 论文提出从L1到L5的五级路线图,衡量和指导具身AGI的发展,每个级别基于四个核心维度:模态、类人认知能力、实时响应能力和泛化能力 [4] - L1(单一任务完成):机器人能够可靠地完成单一、明确定义的任务,但功能局限于特定任务领域 [7] - L2(组合任务完成):机器人能够处理组合任务,通过将高级人类指令分解为简单动作序列来执行,但能力仍限于预定义任务和技能库 [7] - L3(有条件的一般任务完成):机器人能够处理多种任务类别,表现出对任务、环境和人类指令的有条件泛化能力,但对全新或开放式任务的可靠性不足 [7] - L4(高度通用机器人):机器人展现出对广泛未见任务的稳健泛化能力,具备强大的多模态理解和推理能力 [7] - L5(全功能机器人):机器人能够满足人类日常生活的广泛需求,展现出类似人类的认知行为 [7] 现状和挑战 - 当前具身AI的能力处于L1和L2之间 [7] - 现有的具身AI模型大多仅支持视觉和语言输入,并且输出仅限于动作空间 [8] - 现有的机器人主要专注于任务特定的操作,缺乏高级的推理和社交互动能力 [11] - 大多数现有的具身AI系统以半双工方式运行,即在完全接收和处理指令后才开始行动,这使得它们在动态环境中表现不佳 [14] - 具身AI需要在推理和对话智能方面表现出色,类似于复杂的聊天机器人,并展示与人类偏好和伦理价值观的一致性 [17] L3∼L5核心能力组件 - 全模态能力:L3+机器人需处理超越视觉和文本的多模态输入(如听觉、触觉、热感等),并生成多模态响应(动作、语音、推理等) [18] - 类人认知行为:包括自我意识、社会关联理解、程序性记忆和记忆重组 [18] - 实时交互:现有模型因参数量限制难以支持全模态实时响应,且计算复杂度随序列长度平方增长 [19] - 开放任务泛化:当前模型依赖任务特定数据,缺乏物理规律的内化 [19] L3+机器人大脑框架 - 模型结构设计原则包括全模态流式处理和动态响应 [19] - 训练范式包括全模态从头训练、终身学习集成和物理导向训练 [20] 总结与未来挑战 - 具身AGI的发展路线图具有长期相关性 [20] - 未来挑战包括技术障碍以及伦理、安全和社会影响等方面的挑战 [20]
大摩解读“特马”开撕:马斯克精心设计,市场低估了他的能力,后续会有很多交易机会
华尔街见闻· 2025-06-11 14:45
马斯克的政治战略与特斯拉投资框架 - 马斯克近期关于美国"双赤字"的言论是精心设计的战略,旨在通过影响力将财政议题置于公众关注前沿 [2] - 摩根士丹利将马斯克的政治行动纳入特斯拉投资框架分析,认为其相信企业命运与国家财政实力紧密相关 [2] - 马斯克将美国主权信用比喻为"海上航船",强调国家财政健康是企业发展的终极锚点 [2] 马斯克的资产与市场影响力 - 马斯克拥有3000亿至3500亿美元资产(包括公开和私人资产),极小部分资产即可撬动国家政策讨论 [3] - 市场低估了马斯克的决心和承受负面冲击的能力,其参与政治活动对特斯拉的负面冲击是短期"牺牲" [3] - 马斯克目前管理5家公司,在唯一上市公司特斯拉中仅持有13%股份 [4] 特斯拉的股价波动与交易机会 - 若马斯克与总统分歧持续升级,特斯拉股价将面临更剧烈波动,但同时创造大量交易机会 [1][4] - 摩根士丹利维持特斯拉目标价410美元,较6月9日收盘价308.58美元存在33%上行空间 [6] 特斯拉在物理AI领域的长期前景 - 特斯拉在制造、数据收集、机器人/物理AI等领域的专业知识对美国保持具身AI竞争力至关重要 [5] - 摩根士丹利超配评级基于特斯拉在自动驾驶汽车、人形机器人等物理AI关键领域的能力 [6] - 预期不同实体间战略交叉合作时机临近,如Grok进入汽车、SpaceX装载Cybertruck等 [6] 特斯拉的市场定位 - 摩根士丹利维持特斯拉为美国汽车板块"首选股",看好其增长和利润机会远超传统电动汽车业务 [1][6] - 分析师认为特斯拉股价下跌是暂时的,长期前景仍被看好 [1]
大摩深度解码特斯拉(TSLA.US)股价冲800美元的催化剂:AI与中美自动驾驶博弈
智通财经网· 2025-05-21 18:21
特斯拉股价潜力 - 摩根士丹利重申特斯拉基准目标股价410美元 最乐观情景下目标价达800美元 当前股价343 82美元[1] - 特斯拉未来12个月股价上涨空间显著 主要基于FSD自动驾驶系统 Robotaxi网络及AI人形机器人业务[1] - 特斯拉AI人形机器人市场规模可能远超当前全球汽车市场[1] 特斯拉业务估值逻辑 - 传统汽车业务仅估值50-100美元/股 核心价值在于前沿业务组合包括AI大模型 自动驾驶网络 人形机器人等[2] - 牛市情景下总估值800美元 包括汽车业务130美元 能源业务885美元 共享出行263美元 网络服务248美元[3] - 基准情景总估值410美元 包括汽车业务75美元 能源业务557美元 共享出行90美元 网络服务160美元[3] - 熊市情景总估值200美元 包括汽车业务53美元 能源业务30美元 共享出行83美元 网络服务71美元[3] AI技术优势 - 特斯拉拥有Dojo人工智能超算系统 Optimus人形机器人体系 将成为AI纪元最大受益者之一[5] - FSD系统接入Grok大模型将提升智力等级 加速Optimus机器人发展[5] - 特斯拉开发了FSD自动驾驶 Dojo超级计算机和定制化AI芯片[5] 自动驾驶领域机遇 - 中美自动驾驶博弈将成为特斯拉估值扩张催化剂[6] - 特斯拉FSD系统可能以订阅模式渗透至美国传统车企[6] - 特斯拉庞大的美国道路数据及AI算力有望促成与中国企业深度合作[6] 人形机器人市场前景 - 人形机器人市场规模可能远超全球汽车市场[9] - 全球劳动力市场约40万亿美元 人形机器人替代潜力巨大[10] - 每1%美国劳动力被替代可创造3000亿美元价值 提升特斯拉股价约100美元[10] - 德银预计2035年人形机器人市场规模750亿美元 2050年达1万亿美元[19] 具身AI发展趋势 - 机器人正成为现实世界的真实代理人[10] - 电动化机器是AI大脑的实体插座[11] - 能自动化的机器终将被自动化[12] - 攻克汽车自动驾驶将解决万物自主运行问题[13] - 人形机器人只是数千种具身AI形态之一[14] - 具身AI潜在市场规模可能达十万亿美元级[17] 中美电动车竞争格局 - 中国厂商或已赢得电动车硬件及整车制造领域[22] - 特斯拉等美国厂商转向自动驾驶软件领域竞争[22] - 特斯拉有望成为中国电动车企在自动驾驶领域最强竞争对手[22] - 特斯拉可能在中国BEV制造技术美国本土化中发挥关键作用[23]
2050 年人形机器人市场达 5 万亿,中国领跑 10 亿台机器人革命,这些行业要被颠覆了
36氪· 2025-04-30 10:12
人形机器人市场规模预测 - 预计到2050年全球将有10亿台人形机器人投入使用,年收入达5万亿美元 [1][2] - 2050年人形机器人销售额预计达4.7万亿美元,是2024年全球前20大汽车OEM总收入(2.488万亿美元)的近两倍 [4] - 商业人形机器人到2050年预计达9.35亿台,占全球总量92% [10][11][12][13] 区域与收入等级分布 - 东亚及太平洋地区(含中国)2050年累计439,936台,占全球43%,中国贡献70%以上 [37] - 北美(美国为主)2050年累计86,866台,技术研发与高端应用中心 [38] - 高收入国家(含美国)2050年累计296,427台,服务业与家庭场景率先落地 [36] - 中高收入国家(含中国)2050年累计504,307台,中国占主导 [35] 产业链与公司布局 - 中国汽车电子制造商和供应商积极布局人形机器人领域,包括比亚迪、小鹏、小米等 [7][42] - 特斯拉在实体AI领域(自动驾驶、人形机器人等)的能力被看好,目标价410美元 [8][25][26][27] - 传统汽车零部件厂商如Hota Industrial、Sanhua等向机器人供应链转型 [7][42] 技术与成本趋势 - 家用人形机器人到2050年预计达8420万台,占总量8%,成本需从5万美元级降至1.5万美元级以提升可负担性 [20][21] - 中国在硬件制造(电机、传感器、结构件)领域建立领先地位,美国依赖AI算法与芯片 [39] - 技术进步、成本下降(如供应链成熟)和社会接受度提升将驱动2030年代后期至2040年代加速采用 [17] 对传统行业影响 - 人形机器人市场规模长期将显著超越全球汽车行业 [3][4] - 自主工业综合体(人形机器人、无人机、自动驾驶汽车等)崛起,传统制造业面临下行压力 [6] - 人形机器人可能重构劳动力市场,替代高危、重复性岗位 [39]
【环球财经】亚洲海湾信息技术展在新加坡开幕 中企人形机器人吸睛
中国金融信息网· 2025-04-25 14:48
展会概况 - 全球科技盛会海湾信息技术展(GITEX)首次登陆亚洲,GITEX Asia 2025于23日至25日在新加坡滨海湾金沙会展中心举行 [1] - 展会吸引来自70多个国家和地区的700余家企业参展,聚焦人工智能、机器人、网络安全、智慧城市等领域 [1] - 展会旨在推动区域数字经济合作,多家中国企业首次参展,展示具身AI、智能制造等最新成果 [1] 参展企业及展示内容 - 宇树科技展示人形机器人和仿生四足机器人,在主舞台表演吸引众多观众 [2] - 科大讯飞展位设计前卫,展示AI翻译、语音交互等技术应用 [2] - 中国电信主打"全球数字信息基础设施"概念,展位互动频繁 [2] - 中国移动以"AI驱动,未来启发"为主题,呈现数据中心与AI应用场景 [2] - 中国香港的AT-VIBE Technology展示智慧工业监控系统,服务客户包括中国银行(香港)、Manulife、香港特区政府多部门 [2] - 电竞硬件厂商七彩虹展出与巴塞罗那俱乐部联名产品,展现AI+娱乐融合趋势 [2] - 挪威的WAiYS展示拟人机器人与AI助手方案,聚焦"简化AI,迈向可持续未来" [2] 行业前景 - 世界经济论坛预测,到2030年东南亚数字经济规模有望达到1万亿美元 [3]
【电子】英伟达GTC2025发布新一代GPU,推动全球AI基础设施建设——光大证券科技行业跟踪报告之五(刘凯/王之含)
光大证券研究· 2025-03-22 22:46
英伟达GTC大会核心观点 - 提出Agentic AI作为AI技术发展的中间态 按照"Generative AI Agentic AI Physical AI"三阶段进化路线推进 [3] - 全球数据中心建设投资额预计2028年达到1万亿美元 Scaling Law发展需要更大规模算力资源投入 [3] 芯片产品规划 - Blackwell Ultra芯片2025年下半年供货 基于Blackwell架构 AI推理性能显著提升 [4] - GB300 NVL72机架级解决方案AI性能比GB200 NVL72提升1.5倍 已全面投产 [4] - Vera Rubin系列芯片为下一代AI平台 预计2026年下半年推出Vera Rubin 2027年下半年推出Vera Rubin Ultra [4] 光通信技术突破 - 推出115.2T的800G Quantum-x CPO交换机 采用微环调制器1.6T硅光CPO芯片 预计2025下半年上市 [5] - 基于CPO共封装光学平台打造Spectrum-x系列光交换机 包括128端口800G和512端口800G型号 [5] 软件与生态系统 - 推出AI推理服务软件Dynamo 支持Blackwell芯片实现推理性能飞跃 [6] - 发布NIM服务支持企业构建AI Agent 推出AI-Q(NVIDIA IQ Blueprint)框架 [6] - 推出DGX Spark个人AI超级计算机和GR00T N1人形机器人模型框架 [6] 大会规模与内容 - 包含1000多场会议 400多项展示和技术实战培训活动 [2] - 聚焦代理式AI 机器人 加速计算等前沿领域发展 [2]