Cosmos
搜索文档
英伟达计划推出面向企业的开源智能体平台NemoClaw
新浪财经· 2026-03-10 15:31
公司战略与产品发布 - 英伟达正计划推出一款名为NemoClaw的开源AI智能体平台,以顺应AI智能体工具日益高涨的流行趋势 [1][3] - 该平台将允许企业部署AI智能体为员工执行各类任务,且预计会搭载安全与隐私工具 [1][3] - 无论企业自身产品是否运行在英伟达芯片上,都可使用该平台 [1][3] 市场合作与商业模式 - 英伟达已开始向企业软件公司推介NemoClaw产品,寻求与Salesforce、思科、谷歌、奥多比、CrowdStrike建立合作关系 [1][3] - 由于平台预计为开源项目,合作伙伴或将免费使用,并可通过为项目贡献代码等方式获得提前访问权限 [1][3] - 目前尚不清楚是否已敲定任何正式合作,英伟达及其潜在合作伙伴尚未立即回应置评请求 [1][3] 行业趋势与竞争背景 - 随着企业从大语言模型转向更专业化、能独立推理、规划并执行复杂多步骤任务的工具,英伟达已开始加大对AI智能体的资源投入 [1][4] - 市场开始追捧所谓“Claw”类工具,这类开源AI工具可在用户设备本地运行,并执行连续任务 [2][4] - 此类AI智能体因OpenClaw(最初名为Clawdbot,后更名为Moltbot)在今年初走红而声名大噪,OpenAI最终收购了该项目并聘用了其开发者 [2][4] 公司技术布局与生态建设 - 近几个月来,英伟达已推出用于支撑AI智能体的基础模型,如Nemotron和Cosmos [1][4] - 英伟达扩展了NeMo平台,帮助客户管理AI智能体的完整生命周期——从数据整理、定制化,到监控与优化 [1][4] - 英伟达首席执行官黄仁勋在近期发言中称,OpenClaw“或许是有史以来最重要的软件发布之一” [3][4] 市场活动与时机 - 英伟达此举正值其下周将在圣何塞举办年度开发者大会之际,预计大会上将公布公司软硬件产品的相关发布与路线图 [3][4]
Nvidia plans open-source AI agent platform ‘NemoClaw' for enterprises: Wired
CNBC· 2026-03-10 13:52
公司战略与产品发布 - 英伟达计划推出名为“NemoClaw”的开源人工智能代理平台 以顺应AI工具日益增长的趋势 [1] - 该平台将使合作公司能够部署AI代理为员工执行任务 并预计包含安全和隐私工具 [3] - 无论公司的产品是否运行在英伟达芯片上 都能访问该平台 [4] 市场拓展与合作 - 公司已开始向企业软件公司推销该产品 寻求与Salesforce、思科、谷歌、Adobe和CrowdStrike建立合作伙伴关系 [2] - 由于平台预计开源 合作伙伴可能获得免费使用权 并以贡献项目换取早期访问权限 [3] - 目前尚不清楚是否已敲定任何正式合作伙伴关系 [2][3] 技术发展与行业背景 - 随着企业从大语言模型转向更专业化、能够对复杂多步骤任务进行推理、规划和独立行动的工具 英伟达已开始向AI代理投入更多资源 [4] - 公司近期发布了旨在驱动AI代理的基础模型 例如Nemotron和Cosmos [4] - 公司还扩展了其“NeMo”平台 该平台帮助客户管理从数据整理、定制到监控和优化的完整AI代理生命周期 [5] 竞争格局与市场趋势 - 英伟达对AI代理的兴趣 正值所谓的“Claw”类工具流行之际 这些是可在用户本地机器上运行并执行顺序任务的开源AI工具 [5] - OpenClaw(最初名为Clawdbot,后更名为Moltbot)在今年初崭露头角并使此类AI代理闻名 该项目最终被OpenAI收购 [6] - 专家已指出与OpenClaw新兴AI工具相关的诸多安全风险 而英伟达目前据称正以其AI代理平台瞄准企业客户 [6] 公司活动与展望 - 此举正值英伟达准备于下周在圣何塞举行年度开发者大会 预计大会将包含关于其硬件和软件产品的公告与路线图 [7]
特斯拉OptimusV3发布在即,重视具身智能产业链
国联民生证券· 2026-03-08 18:08
报告行业投资评级 - 推荐 维持评级 [5] 报告核心观点 - 特斯拉第三代Optimus人形机器人即将发布,有望推动具身智能产业加速发展,成为实现通用人工智能的重要载体 [13][14] - 政策与产业共振,国内具身智能在“大脑”(AI模型)和世界模型领域取得重要进展,发展前景可期 [26][28] - 投资建议围绕具身智能产业链展开,重点关注相关细分领域及公司 [4][34] 根据目录总结 1 具身智能 - **特斯拉Optimus V3进展**:特斯拉官宣第三代Optimus人形机器人将于2026年第一季度亮相,是首个面向大规模生产的通用型产品,能通过观察学习新技能,远期目标年产百万台,规模化后单台成本预计控制在2万美元 [13] - **产能与训练规划**:马斯克表示,Optimus第3代年产能目标100万台,第4代目标1000万台,并计划部署至少1万台甚至2-3万台进行真实场景下的自对弈训练 [14] - **与SpaceX协同**:Optimus与星舰发展密切相关,2026年火星任务将搭载Optimus机器人,用于测试关键技术,为后续人类任务铺路,至2033年预计有多达500艘Starship火箭着陆火星 [17][18] - **英伟达布局**:英伟达推出开源物理AI世界基础模型Cosmos,基于海量视频、驾驶/机器人数据及3D模拟预训练,旨在解决物理世界数据短板问题,并以Isaac平台+GR00T模型为核心构建机器人生态 [23][24][25] - **国内政策支持**:《2026年政府工作报告》将具身智能列为未来产业重点培育领域 [26] - **国内技术进展**: - 阿里达摩院发布RynnVLA-002模型,将视觉-语言-动作模型与世界模型统一,在LIBERO仿真基准测试中无预训练成功率高达97.4% [26][28] - 极佳视界开源具身世界模型GigaWorld-0,将世界模型生成数据在VLA训练中占比提升至90%,使模型在三大泛化维度上性能提升近300% [28] - 智元具身研究中心推出GenieReasoner系统,在ERIQ Benchmark的15个子任务中刷新性能SOTA纪录,平均推理准确率大幅提升并超过顶级闭源模型 [31][33] - **产业合作案例**:通智科技与宇树科技合作,打造“智脑-智体-场景生态”全链路具身智能解决方案 [33] 2 行业新闻 - **高通AI可穿戴**:高通在MWC 2026上以骁龙平台为核心打造全栈式个人AI解决方案,推动AI赋能XR、可穿戴等终端 [35] - **英伟达投资光学**:英伟达向Lumentum和Coherent各注资20亿美元,总投资40亿美元,聚焦硅光子、光互连与先进封装技术研发 [36] - **烽火通信AI服务器**:烽火通信在MWC发布G6201 V5与G420K V2两款AI服务器,分别主打高负载推理和全能训练 [37] - **视频生成成本**:火山引擎Seedance2.0价格公布,以纯生成模式核算,生成15秒视频单条成本约15元,进入“秒元时代” [38] 3 公司新闻 - **中科创达**:截至2026年2月28日,公司累计回购股份78.26万股,占总股本0.17%,使用资金4329.96万元 [3][39] - **银信科技**:控股股东一致行动人减持计划期限届满,未减持公司股份 [3][39] - **辰安科技**:非公开发行股票获国资委批复,拟发行不超过6979.1291万股,募资不超过14.19亿元,控股股东及实控人将变更 [40] - **恒华科技**:公司中标“隆化县100MW风电项目设计采购施工总承包(EPC)”项目 [41] 4 本周市场回顾 - **指数表现**:本周(03.02-03.06),沪深300指数下跌1.07%,中小板指数下跌1.76%,创业板指数下跌2.45%,计算机(中信)板块下跌5.48% [1][42] - **个股涨跌**: - 涨幅前五:华如科技(+33.23%)、南网数字(+26.53%)、科远智慧(+17.64%)、中科星图(+15.21%)、华是科技(+12.87%) [1][47] - 跌幅前五:杰创智能(-13.96%)、光环新网(-14.73%)、容知日新(-18.21%)、ST达华(-18.57%)、ST国华(-22.61%) [1][47]
阿里推出RynnBrain,机器人AI赛道再添猛将
搜狐财经· 2026-02-11 12:44
阿里巴巴推出机器人AI模型 - 阿里巴巴推出一款专为机器人打造的人工智能模型RynnBrain 旨在帮助机器人理解周围物理世界并识别各类物体 [1][3] - 该模型是公司切入机器人市场的重要抓手 并延续了其通义千问大模型系列的技术势头 [3] - 阿里巴巴将对RynnBrain采取开源策略 开发者可免费使用 这是公司向全球开发者推广其AI模型的关键方式 [4] 机器人技术与行业竞争格局 - 机器人技术属于“具身智能(物理AI)”范畴 包括自动驾驶汽车等依托AI的智能设备 [3] - 英伟达CEO黄仁勋认为AI与机器人是“数万亿美元级的增长机遇” [3] - 全球科技巨头都在研发这类AI“世界模型” 例如英伟达的“Cosmos”系列、谷歌DeepMind的Gemini Robotics-ER 1.5以及特斯拉的Optimus(擎天柱)专用AI [3] 中国机器人产业发展 - 在全球科技发展中 中国已将具身智能领域列为重点发展方向 [3] - 在人形机器人领域 中国企业展现出强劲的发展势头 多家企业计划在2024年扩大产能 推动该领域技术落地与规模化发展 [4]
China's Alibaba launches AI model to power robots as tech giants talk up 'physical AI'
CNBC· 2026-02-10 19:05
阿里巴巴推出机器人AI模型 - 阿里巴巴于周二发布了一款名为RynnBrain的人工智能模型 旨在为机器人提供动力 帮助机器人理解周围的物理世界并识别物体[2] - 该模型由阿里巴巴达摩院开发 演示视频显示机器人能够识别水果并将其放入篮子 这些任务涉及复杂的AI 用以控制机器人对单个物品的理解和运动[2] - 对于阿里巴巴而言 RynnBrain模型为其进入机器人市场提供了一个切入点 并延续了其通义千问系列AI模型的发展势头[3] 行业竞争格局与技术趋势 - 机器人技术属于“实体AI”范畴 包括依赖人工智能的机器 如自动驾驶汽车 这是中国在与美国争夺技术领导力过程中优先发展的领域[1] - 阿里巴巴并非唯一开发实体AI模型的公司 全球科技巨头都在开发此类AI“世界模型” 例如英伟达有“Cosmos”品牌下的模型 谷歌DeepMind有Gemini Robotics-ER 1.5 特斯拉的Elon Musk也在为Optimus设计AI[4] - 在仿人机器人领域 中国被视为领先于美国 相关公司计划在今年提高产量[5] 商业模式与市场前景 - 阿里巴巴对RynnBrain模型采用开源策略 开发者可免费使用 开源策略是阿里巴巴将其模型推广至全球开发者的关键[5] - 英伟达CEO黄仁勋曾表示 AI和机器人代表了“一个数万亿美元的增长机会”[3]
英伟达3D模型打造“AI建筑师特工队”,8位华人合著,包括千问实习生
36氪· 2026-02-03 19:44
英伟达3D-GENERALIST模型技术突破 - 公司宣布其全新3D通用模型3D-GENERALIST的论文将发表于2026国际3D视觉会议,该模型构建了一种建构3D世界的新范式[1] - 模型核心验证了“AI生成的3D合成数据”可规模化替代人工标注数据,能够大幅降低视觉模型预训练的成本[1] - 模型使用统一化框架,将3D环境生成的四大核心要素即布局、材质、光照、资产统一到序贯决策框架中[1] - 研究团队提出了基于CLIP评分的自改进微调策略,让模型在下一轮生成中能自主修正前序错误[1] 技术方案与架构 - 研究核心思路是将一个“设计师”扩展为一个“建筑师团队”,将搭房子工作细化并交给专门模块处理[14] - 具体流程:首先通过全景扩散模型生成360°引导图像作为“户型图”[14] - 随后执行“场景性策略”:利用HorizonNet提取房间基础结构,通过Grounded-SAM分割门窗区域,再由GPT-4o等VLM标注类型与材质,通过程序化生成构建带基础构件的3D房间[16] - 以VLM作为决策“大脑”,输出代码形式的动作指令(如添加资产、调整光照),通过API自动执行以实时更新3D房间[16] - 设计资产级优化策略:借助GPT-4o识别容器类资产,通过网格表面检测定位有效区域,引入Molmo-7B确定小物体放置像素点,再通过3D射线转换和碰撞检测实现物体独立交互[18] 关键支撑技术 - 引入自改进微调机制:模型每轮微调生成多个候选动作序列,通过CLIP评分筛选最优动作,再用其对VLM进行监督微调以提升自我修正能力[20] - 规范场景领域特定语言:定义类别、放置位置、材质、光照等核心描述符,确保VLM输出指令与工具API兼容[23] - 使用上下文库收录能提升CLIP对齐分数的动作代码片段,生成时随机采样以提升动作序列的多样性和有效性[23] 模型性能验证 - 在模拟就绪3D环境生成任务中,3D-GENERALIST的生成质量全面超越LayoutGPT、Holodeck、LayoutVLM等基线方法[24] - 物理合理性方面,无碰撞分数达99.0,边界内分数达98.0[24] - 语义一致性方面,位置连贯性分数为78.2,旋转连贯性分数为79.1,综合物理语义对齐分数达67.9,远高于基线最高值58.8[24] - 经3轮自改进微调后,3D-GENERALIST的CLIP分数达0.275,显著高于无微调版本(0.252)和无上下文库版本(0.237)[27] - 资产级策略生成的场景平均CLIP分数达0.282,高于基线方法的0.269[25] - 自改进微调技术降低了VLM的视觉幻觉率,在Object HalBench和AMBER基准测试中,微调后模型的幻觉相关指标均优于原始GPT-4o[27] 合成数据训练效果 - 使用3D-GENERALIST生成的合成数据预训练视觉模型,当使用86万条标签时,ImageNet-1K Top-1准确率达0.731,超过基于人工构建的HyperSim数据集(0.727)[28] - 当标签量扩展至1217万条时,ImageNet-1K Top-1准确率提升至0.776,接近基于50亿真实数据训练的Florence 2模型效果(0.786)[29] 研究团队背景 - 论文作者有8位华人,第一二作者都是中国留学生[2] - 第一作者Fan-Yun Sun是斯坦福大学AI实验室的计算机科学博士生,深度参与了英伟达研究院工作,并创办了AI游戏公司Moonlake[30][32] - Moonlake已从Threshold Ventures、AIX Ventures和NVentureS筹集了2800万美元(约合人民币1.95亿元)的种子资金[32] - 第二作者Shengguang Wu是斯坦福大学计算机科学系博士生,此前曾在Qwen团队担任研究实习生[34][37] - 清华“姚班”出身的斯坦福大学助理教授吴佳俊也名列作者之中[2][39] 行业应用与战略定位 - 在CES 2026上,公司将世界基础模型平台Cosmos正式定位为Physical AI的“底层代码”与“世界模拟器”[10] - 公司发布了Cosmos Reason 2,让AI不仅能生成世界,还能用自然语言进行链式因果推理[10] - 3D-GENERALIST技术旨在解决当前可交互3D环境创建的痛点,如现有技术仅生成整体3D图像,虚拟物体无法独立交互[13] - 该技术将传统分离的建模、布局、材质、光照等环节整合为统一的决策序列,显著提升了复杂3D场景的构建效率与物理合理性[46] - 技术验证了高质量合成数据规模化替代人工标注的可行性,有望降低下游视觉与机器人模型训练的成本门槛[46]
CB Insights:《2026年技术趋势研究报告》
欧米伽未来研究所2025· 2026-01-27 12:02
文章核心观点 全球知名科技市场情报公司CB Insights发布的《2026年技术趋势研究报告》揭示了正在重塑全球经济的深刻技术变革,报告基于对1300多家独角兽公司、1500多个技术市场及数千家初创企业的跟踪数据,通过多维度分析指出技术创新从实验室走向商业化的关键路径,其预测方法在去年14个趋势中有11个得到市场验证[1] 企业运营自主化 - 人工智能代理的投资回报率衡量是企业面临的挑战,63%的企业将生产力提升作为首要指标,58%关注时间节省和成本削减,但对收入影响的量化仍困难[2] - 测量困境催生了新一代初创企业,如软件工程分析平台Span推出能检测AI生成代码的专有模型并获得2500万美元A轮融资,流程智能平台Workhelix获得1530万美元投资[2] - AI代理平台已从试点迈入生产阶段,在1261家拥有商业成熟度评分的AI代理公司中,超过一半达到第3级“部署”阶段[3] - 金融服务业成为自主系统的理想试验场,在2025年AI代理合作关系中占据21%份额,其中合规与欺诈检测领域83%项目、实时情报81%项目、客户服务和索赔承保93%项目已进入全面部署阶段[3] 私有市场演变 - 全球超过1300家独角兽公司中,有12家估值高于标准普尔500指数中位数市值390亿美元,例如SpaceX估值4000亿美元、ByteDance 4800亿美元、OpenAI 5000亿美元[4] - 技术公司IPO平均年龄从2015年的12.2年延长至2025年的15.9年,增长了近4年[4] - 2025年独角兽公司主导了9笔超过10亿美元的收购交易,例如OpenAI以450亿美元收购Rockset,Ripple以10亿美元收购GTreasury[4] - 顶级AI初创企业以创纪录速度扩展到1亿美元年度经常性收入,Lovable用时不到10个月,xAI约20个月,Anysphere和Perplexity约30个月,而Databricks花了约45个月,OpenAI约70个月[4] - 监管环境变化促使华尔街加强私有市场布局,摩根士丹利收购Shareworks,施瓦布收购EquityZen[6] - AI和数据驱动方法在私有市场预测方面超越传统风险投资方法,CB Insights的Mosaic评分预测未来独角兽地位的有效性是Smart Money VC中位数成功率的4.7倍[6] 稳定币主流化 - 稳定币生态系统正在成熟,2025年获得融资的稳定币公司中49%处于部署或扩展阶段[7] - 机构对稳定币兴趣达到新高,财报电话会议中提及稳定币次数从2020年的21次激增至2025年的341次[7] - 银行在2025年支持了5家稳定币初创企业,这是自2022年以来的首次,包括花旗风险投资投资BVNK、汇丰银行投资Elliptic等[7] - 2025年稳定币技术并购交易达31笔,比2024年的8笔增长4倍,例如Ripple以10亿美元收购企业软件平台GTreasury,获得了进入120万亿美元企业财务市场的机会[7] - 沃尔玛、亚马逊、苹果、X和Airbnb等科技巨头正在探索发行自己的稳定币或采用加密货币[8] - 企业转向稳定币的驱动力包括即时结算、24/7可用性以及消除交换费用,其即时流动性可提高资本效率,而传统代理银行系统结算可能需要3到7天[8] 数据中心电网角色转变 - AI对电力的巨大需求正对电网造成压力,美国数据中心电力消费预计从2020年的108太瓦时增长到2024年的183太瓦时,并预计2030年达到426太瓦时[9] - 面对电网限制,大型科技公司和AI实验室正在建设现场发电设施,到2030年预计38%的数据中心运营商将使用现场发电作为主要电源,而2024年这一比例仅为13%[9] - 需求灵活性正从可选项变为强制要求,如果数据中心运营商能在1%时间内减少电网需求,当前电力系统可容纳到2035年的数据中心增量[9] - 新兴初创企业如Emerald AI(Mosaic评分741)正在实现电网响应型数据中心,其平台允许AI数据中心动态调整电力使用以支持电网稳定[10] 主权AI兴起 - 各国政府将本地AI发展列为优先事项,2024至2025年间中国启动约84亿美元国家AI基金,日本投资约650亿美元于半导体和AI领域,加拿大推出20亿美元主权AI计算战略,欧盟宣布2000亿欧元的InvestAI倡议,韩国预算68亿美元用于AI发展,印度为本地模型投入3.9亿美元并为计算基础设施设立12.5亿美元的India AI Mission[11] - 英伟达成为主权AI趋势的最大受益者,其2026财年有望实现超过200亿美元的主权AI收入,是去年的两倍多[11] - 自2022年以来,国际公司占英伟达合作伙伴关系的近一半,欧洲占23%,亚洲占18%[11] - 区域AI领导者将主权作为竞争优势,例如法国的Mistral AI强调符合欧洲数据保护标准,加拿大的Cohere强调数据隐私、安全性和监管合规[12] 医疗保健语音AI应用 - 语音AI开发平台已达到商业准备状态,2025年针对该平台的股权交易达创纪录的39笔,较2021年的14笔大幅增长[13] - 79%的私营语音AI公司正在部署或扩展其解决方案,38%处于部署阶段,另外38%在扩展阶段[13] - 领先平台正调整策略以应对医疗保健特定工作流程,例如ElevenLabs专门为美国医疗保健领域招聘企业客户主管,Retell AI的职位描述显示对医疗保健的垂直市场关注[13] - 在2025年最有前途的数字健康公司中,有7家正在部署语音AI代理,医疗保健的电话优先工作流程(如预约、登记、计费)为语音自动化创造了自然切入点[13] - 医疗保健行业面临到2028年美国10万名工作人员短缺,自适应语音代理将帮助提供者用更少资源做更多事情[13] - 信任和安全对采用至关重要,供应商强调人的因素以及安全和合规能力,例如使用专门的“安全主管”模型实时监控对话[14] 世界模型发展 - 世界模型代表AI的下一个前沿,这些系统从视频、图像和模拟中学习物理以预测未来状态,正吸引顶级AI人才[15] - 大型科技公司积极研发世界模型,Meta发布V-JEPA 2和CWM,Google的DeepMind推出Genie 3,英伟达发布Cosmos,微软推出Muse[15] - 构建世界模型需要丰富多模态训练数据,控制独特数据源的公司将拥有竞争优势,例如荷兰游戏平台Medal从1000万月活跃用户每年收集20亿个视频片段[16] - 自动驾驶汽车和机器人成为世界模型的首批商业战场,因为模拟降低了现实世界的风险、成本和部署时间[16] - 财报电话会议中提及“世界模型”的次数从2021年第一季度的几乎为零增长到2025年第四季度的约30次[16] 机器人协同工作 - 随着自动化规模扩大,技术堆栈正走向管理机器人、任务和跨环境流量的编排层成熟[17] - 亚马逊部署了100万个机器人,并部署用于多机器人协调的新基础模型DeepFleet,该模型将机器人旅行效率提高了10%[17] - 学习协调正在大规模取代基于规则的控制,DeepFleet从数十亿小时的机器人数据中学习优化协调[17] - 智能机器人协调将扩展到仓库之外,在工业自动化、多样化环境和国防领域均有应用案例[17] - 处于机器人智能前沿的开发者正推向编排,针对机器人基础模型开发商的股权交易从2021年的3笔激增至2025年的32笔[18] - Physical Intelligence在2025年8月获得3.14亿美元A轮融资,并在9月发布“RoboBallet”研究,该多机器人编排AI模型在轨迹质量上比传统基于规则的方法优25%[18]
计算机行业事件点评:2026:具身智能与机器人关键一年
国联民生证券· 2026-01-18 20:37
行业投资评级 - 推荐 维持评级 [8] 报告核心观点 - 2026年是具身智能与机器人发展的关键一年,行业落地进度正在加快 [4] - 科技巨头(如英伟达、特斯拉)正大力投入物理AI与人形机器人领域,推动技术发展与规模化部署,具身智能的长期潜力不断提升 [5][7] - 具身智能大脑和世界模型有望成为未来发展的重点 [11] 行业动态与事件总结 - **事件**:2026年1月15日,星动纪元与顺丰科技正式签约,达成深度合作,聚焦快递、仓储等物流场景,联合开展具身智能机器人技术方案的研发与应用推广 [4] - **合作模式**:双方采用“联合开发、落地推广”的模式,旨在推动具身智能机器人在顺丰供应链业务中规模化落地 [4] - **解决方案**:星动纪元凭借自研端到端VLA具身模型ERA-42,以及全尺寸双足人形机器人星动L7、半身模块M7,推出了覆盖“分拣-扫码-供件”全流程的具身智能仓储物流解决方案 [4] - **方案优势**:该方案可与客户物流系统深度协同,机器人能根据场景需求自适应操作,灵活应对多规格、动态化的作业需求 [4] 科技巨头进展总结 - **英伟达动态**: - 在CES2026大会上,英伟达CEO黄仁勋表示,物理AI的“ChatGPT时刻”快要来了,并推出了开源的物理AI世界基础模型Cosmos [5][6] - Cosmos模型已用海量视频、真实驾驶与机器人数据以及3D模拟做过预训练,能理解世界运行规律,实现生成内容、推理、预测轨迹等技能 [6] - 在人形机器人领域,英伟达发布了视觉语言动作(VLA)模型Nvidia Isaac GR00T N1.6,利用Cosmos的推理能力实现了对人形机器人的全身精准控制 [6] - 在开发工具方面,英伟达与Hugging Face达成深度合作,将GR00T和开源仿真框架Isaac Lab-Arena整合进LeRobot库中,简化从模拟训练到实体部署的工作流 [6] - **特斯拉动态**: - 马斯克表示,Optimus V3将解决手部灵活性、拥有AI大脑,并且有望实现量产 [7] - 马斯克声称,特斯拉的Optimus人形机器人将在短短三年内超越世界上最好的人类外科医生 [7] - 擎天柱大规模应用所需的时间或将为三年左右 [7] - 2026年的火星任务将搭载特斯拉的Optimus机器人,用于测试关键技术,为后续任务铺平道路 [7] - SpaceX计划在2028年发射多达20艘Starship火箭,为首次人类火星飞行提供支持,后续至2033年预计有多达500艘Starship火箭着陆火星 [7][11] 投资建议 - 建议重点关注斯菱股份、品茗科技、科大讯飞、中科创达、萤石网络、安联锐视、软通动力、虹软科技、中科信息、汉王科技等企业 [11]
一个全新的世界模型,终于让AI视频进入了“无限流”时代。
数字生命卡兹克· 2026-01-14 08:23
PixVerse R1实时世界生成模型的技术定位与特点 - 公司推出下一代实时世界生成模型PixVerse R1 能够根据用户输入的Prompt连续、实时地生成并改变视频流剧情 用户可在过程中随时用Prompt修改视频进程 每次输入后约2秒延迟 世界剧情即随之变化 若用户不进行干预 模型可自行无限、连续地生成视觉流 公司将其称为“实时世界生成模型” [2][3] 当前“世界模型”的主流定义与分类 - 行业对“世界模型”的定义较为宽泛 指能够用可持续的内部状态预测世界变化 并可被交互和验证的模型 该术语目前常被用于指代三类方向:视频生成模型、可交互的生成世界、面向机器人和自动驾驶的物理仿真基础模型 [4] - 行业现有的世界模型代表主要分为三个方向:以Google Genie 3为代表的 一次生成后可实时导航的动态视频世界模型 可维持24fps、720p及分钟级一致性 [7][8] 以李飞飞World Labs Marble为代表的 侧重于三维空间重建、生成与模拟的3D类世界模型 其核心在于3D表示和空间一致性 [12][14] 以英伟达Cosmos为代表的 专注于为自动驾驶、机器人等提供高保真物理仿真与合成数据的基础模型平台 [19] PixVerse R1的创新方向与产品体验 - PixVerse R1为世界模型领域补上了第四个方向:实时视频生成 并提供了可实测的Demo版本 [22][23] - 产品体验需邀请码进入 每个实时生成会话限时5分钟 主要原因是实时生成对算力消耗极大 [26][35] - 用户体验反馈极为积极 产品提供了预设模板(如卡通、1944、赛博朋克等)和自定义模式 用户可通过文本或语音输入Prompt实时引导剧情发展 创造了高度互动、充满惊喜和未知乐趣的体验 被形容为一种全新的娱乐形态 [31][40][42][44][45][48][54] 实时世界生成模型预示的行业未来 - 该技术可能重塑未来娱乐内容形态 电影、综艺、游戏等可能不再是固定时长的文件 而是由世界模型驱动的、永远流动的世界时间线 [56] - 未来的内容创作模式可能是:创作者提供一个起点和世界观设定 由世界模型自主演进剧情 观众则通过一句话、一个表情或一次选择来轻微影响剧情走向 最终实现同一宇宙下的不同时间支线体验 [57][58] - 该技术的出现被认为是AI模型发展历史上具有重要意义的一步 代表了新颖且极具未来感的发展方向 [62][64]
With Nvidia in the Limelight, Examine This Exciting ETF
Etftrends· 2026-01-13 02:14
英伟达在CES上的展示与行业地位 - 上周在拉斯维加斯举行的国际消费电子展(CES)提醒市场,英伟达是风向标股票,这与其作为全球市值最大公司的地位相符 [1] - 英伟达在CES上占据焦点地位,表明2024年将为风险承受能力较强的交易者提供大量机会,可以考虑Direxion Daily NVDA Bull 2X Shares(NVDU)这只旨在提供英伟达股票每日表现200%回报的ETF [2] 首席执行官演讲的核心技术主题 - 首席执行官黄仁勋讨论了三大主题:新的开放物理AI模型(包括新版本的Cosmos和GR00T)、用于下一代自动驾驶汽车开发的开源AI模型和工具Alpamayo系列的推出,以及Vera Rubin平台的进展(包含六款新芯片)[3] - 从半导体视角看,Vera Rubin平台的进展最为重要,黄仁勋确认Vera Rubin已投入生产,表明其仍按计划在2026年下半年上量,并强调了相比Grace Blackwell平台的显著性能提升 [3] 德意志银行分析师观点与产品性能 - 德意志银行分析师罗斯·西摩给予英伟达股票“持有”评级,但其215美元的目标价意味着较当前水平有两位数百分比的上涨空间,这表明短期交易者今年可能有理由关注NVDU [3] - 尽管Vera Rubin GPU每个机架的晶体管数量仅为前代的约1.7倍,但其系统效益表现为:相同成本下可处理10倍以上的令牌,或处理相同数量令牌的成本仅为十分之一,训练MOE模型所需的GPU数量仅为Blackwell的四分之一 [5] - 这凸显了机架级深度协同设计的优势,最终应会促使Vera Rubin的上量速度快于Grace Blackwell,部分原因是安装更简便 [5] 2026年产品催化剂与市场展望 - 经验丰富的交易者知道,像NVDU这样的杠杆ETF最佳使用方式是短期持有,表明这些基金通常是事件或头条新闻驱动的产品,而英伟达正是能满足这些需求的股票之一 [4] - 2026年显然是英伟达这家芯片巨头可能再次迎来强劲新产品的又一年 [4] - 英伟达在2026年的产品更新可能为交易者提供恰当利用NVDU所需的头条新闻 [5] - 关于即将推出的Vera Rubin架构及其系统级优势的更多细节,凸显了英伟达在越来越多应用和产品中作为AI市场领导者的地位 [6]