世界模型
搜索文档
中国银河证券:推理算力重要性提升 光模块等算力细分赛道发展再加速
智通财经· 2025-03-24 16:58
文章核心观点 中国银河证券认为英伟达GTC 2025大会后硬件发展带动软件及大模型高景气,推理应用发展刺激算力需求,算力相关板块有较大投资价值,建议关注运营商、光模块、光芯片及AIDC相关等细分子板块 [1][4] 推理算力增长情况 - 英伟达CEO称通往AGI、具身智能机器人、构建Omniverse与世界模型及虚拟“平行宇宙”均需算力,2024 - 2025年美国前四云厂采购GPU芯片数量成倍数增长 [1] - Semianalysis数据显示如今模型处理token数量是之前20倍,计算量是150倍,Blackwell性能比Hopper提高68倍,成本降87%,Rubin计划性能提升至Hopper 900倍,成本降99.97% [2] 英伟达软硬件发展情况 硬件方面 - 发布基于Blackwell架构的升级版Blackwell Ultra,强调推理端重大进展,可为数据中心提供50倍增收机会 [3] - 明确26 - 27年及更远期发展规划,硬件性能加速提升 [3] - 展示基于1.6T硅光引擎的CPO交换机系列,硬件端性能将持续高质量全方位提升 [3] 软件方面 - 发布专注简化推理部署和扩展的开放AI引擎栈Nvidia Dynamo,或开创推理软硬件效率新范式 [3] - 发布Nvidia Llama Nemotron,望以其推理模型为基础,通过NVIDIA AIQ架构探索相关方向形成生态闭环 [3] 投资建议 - 推理应用发展刺激算力需求,当前市场认为推理应用增长挤压算力板块成长空间的判断或偏离实际 [4] - 建议关注运营商如中国移动、中国联通、中国电信等;光模块如中际旭创、新易国盛等;光芯片如源杰科技、仕佳光子等;AIDC相关如光环新网、数据港等 [4]
杨立昆“砸场”英伟达:不太认同黄仁勋,目前大模型的推理方式根本是错的,token 不是表示物理世界的正确方式|GTC 2025
AI科技大本营· 2025-03-21 14:35
英伟达GTC 2025大会核心观点 - 杨立昆从视觉派角度否定当前主流语言派AI技术路线 认为token不是表示物理世界的正确方式 [8][9] - 杨立昆提出联合嵌入预测架构(JEPA)作为替代方案 强调需要在抽象表示空间而非像素层面进行预测 [14][15] - 杨立昆预测高级机器智能(AMI)可能在十年内实现 但当前大模型扩展路线是错误的 [19][20] AI技术发展方向 - 当前大语言模型已进入产业优化阶段 未来重点应转向机器理解物理世界、持久记忆、推理规划四大方向 [10][11][12] - 世界模型概念被提出 认为人类通过内部物理世界模型处理现实 未来AI需要完全不同架构 [13] - 系统1(快思考)与系统2(慢思考)的区别被强调 当前大模型仅实现系统1水平 [36][37] 硬件与计算技术 - 神经形态硬件和光学计算近期难有突破 量子计算应用前景受质疑 [39][43] - 内存计算技术在边缘设备如智能眼镜上有应用潜力 [40][41] - 视网膜处理机制被作为高效感知系统的生物参考 [43] 开源与创新生态 - Llama系列模型下载量超10亿次 开源模式推动行业创新 [30] - 全球分布式训练开源基础模型被认为是未来趋势 [32] - 中国科学家贡献被肯定 DeepSeek和ResNet案例显示创新可来自任何地方 [8][27] AI应用前景 - AI在医疗影像、自动驾驶等感知领域已产生实际价值 [20] - 科学研究和药物设计是AI最具潜力的应用方向 [20] - AI助手多样化发展需要开源平台支持 未来人机关系将转向管理者-虚拟员工模式 [32][58] 技术挑战与突破 - 残差连接等工程技巧对深度学习发展至关重要 [51] - 为JEPA架构寻找有效"配方"是当前主要挑战 [56] - 视频预测任务显示联合嵌入架构相比重建方法更具优势 [45]
范式集团创始人戴文渊:以“Agent +世界模型”赋能更多产业,加速通向AGI
IPO早知道· 2025-03-18 13:55
范式集团未来将剑指更多业务领域。 本文为IPO早知道原创 作者|Stone Jin 微信公众号|ipozaozhidao 据IPO早知道消息,在3月18日举行的范式集团发布会上,范式集团创始人戴文渊发布全新的集团 Logo,并分享了范式集团的 AGI 愿景与实现路径。 戴文渊强调:"范式集团未来将用'AI Agent+世界模型'的技术路径去赋能更多的产业,最终将大量 垂直的智能能力汇聚成为 AGI。" 因此, 通往 AGI 的路,就是不断提升 AI Agent 沟通能力,和不断丰富世界模型对各垂直细分领域 的认知,提升 AI 解决垂直领域的能力。 需要强调的一点是,我们所认为的世界模型和很多学者正在做的世界模型不同。当前绝大多数的世界 模型,在我们看来仅仅是3D空间模型,服务于具身智能。而 真正世界模型,远超具身智能的范畴, 包括认知从宏观到微观的世界,也包括认知人的内在需求,甚至包括所有的生命,即物理科学和生命 科学。 此前,我们更专注于企业市场,专注于企业软件中的垂直模型。我们虽然做出了一些成绩,但也意识 到智能的天花板也受限于企业市场。未来,我们要把格局放到整个市场,面向改造所有可能的业务, 当这些能力 ...
人形机器人的“iPhone时刻”快到了?
日经中文网· 2025-03-15 09:59
行业趋势与市场前景 - 生成式AI的快速发展正推动人形机器人实用化进程 行业观点认为人形机器人将迎来类似iPhone时刻的转折点[1] - 到2050年 全球人形机器人市场规模乐观预测将超过6亿台 花旗集团报告预测达到6.48亿台[1][4] - 2024年全球对人形机器人的风险投资超过14亿美元 激增至2023年的5倍以上 显示市场高度乐观[4] 技术驱动因素 - 生成式AI在多模态技术支持下能处理文字、语音和视频数据 有望应用于人机界面 实现人形机器人与人类自然交流[2] - 利用生成式AI基础技术创建"世界模型"虚拟空间 可高效收集机器人开发数据 英伟达CEO认为虚拟空间能低成本重现多种场景提高学习效率[2] 主要市场参与者 - 美国和中国企业主导人形机器人开发竞争 美国代表企业包括Apptronik和Figure AI 中国代表企业包括小鹏鹏行和宇树科技[1][5] - 美国Figure AI公司成立于2022年 企业价值已达到26亿美元 备受市场关注[5] - 美国Apptronik公司开发的Apollo机器人Beta版已开始生产 计划于2025年内向企业出货[3] 日本行业状况 - 日本作为曾运行全球近70%工业机器人的顶尖机器人大国 在当前人形机器人领域存在感较弱 英伟达展示的合作企业列表中仅安川电机一家日本公司[6] - 行业专家建议日本需要加强人才流动性 政府应更多支持研究机构人员独立创业 以利用其在机电一体化领域的人才优势[6] 平台化发展模式 - 英伟达设想自身提供平台用于开发各种人形机器人 类似iPhone成为技术平台后催生APP经济圈的模式[1][4] - 英伟达CEO主题演讲中展示14台不同企业开发的人形机器人 给人留下经济圈扩大的印象[5]
对话小马智行楼天城:只靠端到端无法通向 L4,模仿优秀司机令人绝望
晚点LatePost· 2025-01-09 18:41
技术路线演进 - 小马智行经历从Learning by Watching(模仿学习)到Learning by Practicing(实践学习)的技术路线切换,核心突破在于构建"世界模型"作为车端模型的训练工厂[7][17][18] - 模仿学习存在三大局限:无法学习驾驶意图、人类与AI安全标准双标、优秀司机数据导致反向优化[19][22][23] - 世界模型由数据生成器、评估体系、高真仿真和数据挖掘工具组成,其精度决定车端模型上限[26][27][35] 行业现状与竞争格局 - 2023年Robotaxi行业回暖标志:Waymo旧金山日均单量超出租车、百度武汉运营400+辆、小马智行达百辆级规模[14][15] - L4与L2技术路线分叉:L2依赖数据量(MPCI约300公里),L4追求安全性(MPCI需达10万公里级)[45][47] - 商业化临界点为1000台运营车辆可实现毛利,小马智行采取差异化策略追求更优成本结构[52][53] 核心技术创新 - 世界模型使事故率降至人类司机1/10,车端模型实现感知-预测-规控三模块端到端打通[36][37] - 数据生成技术突破:生成数据覆盖率与一致性超越真实路采数据,解决长尾场景覆盖难题[28][29] - 评价体系与自我演进引擎构成技术护城河,需2/3研发资源投入且经历两年无显性进展的攻坚期[31][39] 商业化进展 - 运营效率提升:接入高德后单车日均订单达15单,远程监控人车比突破1:3向1:30迈进[54][53] - 前装量产合作推进:与丰田、广汽合作降低车辆成本,通过出租车公司合作解决充电等运维问题[53] - 行业竞争态势:滴滴等新玩家入局但市场渗透率不足1%,现阶段以共同培育市场为主[54][66] 认知方法论 - 技术突破关键在坚持"黎明前的黑暗",疫情延缓行业节奏反而为转型创造窗口期[10][40][41] - 商业化需平衡节奏与价值,避免过早变现或过度追求理想化目标两个极端[65][66] - 结果导向思维:技术方法的优劣由最终成果验证,非理论先进性决定[67][68]
AI 月报:10 亿美元训练不出 GPT-5;低成本中国开源大模型走红;AI 幻觉不全是坏处
晚点LatePost· 2025-01-07 22:59
技术进展 - OpenAI训练GPT-5遇阻,已投入20个月和至少10亿美元算力成本,但性能提升未达预期,两次从头训练均未突破博士生水平目标[4] - 数据短缺迫使OpenAI采用人工生成数据(工程师/科学家每日5000字)和模型生成数据(o1模型)补充,但规模仍远低于GPT-4的10万亿字训练量[5] - o3模型在CodeForces编程竞赛得分比o1提升44%,数学测试EpochAI解决25.2%问题(其他模型<2%),但AGI评测得分因数据预训练存在争议[7][9] - 强化学习重要性提升,OpenAI推出RFT微调方法,LangChain报告显示人类反馈强化学习应用增长18倍[5][9] - 世界模型取得突破:DeepMind的Genie 2生成可交互虚拟场景,李飞飞团队实现AI图片转3D场景,CMU/英伟达开源机器人模拟系统Genesis[14] 行业竞争 - Google Gemini 2.0 Flash系列模型抢占Chatbot Arena前三,OpenAI首次失去榜首地位[18][21] - 中国开源模型崛起:DeepSeek-V3以578万美元训练成本逼近GPT-4o性能,Qwen2.5-plus超越Meta Llama 3.1[23][26] - 芯片领域博通市值破万亿美元,2024年AI收入增长220%至122亿美元,为Google/Meta等提供自研芯片方案[29] - 英伟达推出B300 GPU适配o系列模型,算力/显存提升50%,xAI计划将H100算力中心从10万张扩展至100万张[33][34] 应用与商业化 - OpenAI推出12项ChatGPT升级:订阅费最高2000美元/月,集成Sora视频生成、电话交互、生产力工具插件等功能[36] - Agent成为新趋势,Google Gemini 2.0专为Agent优化,YC预测其市场规模将比SaaS大10倍[12][13] - 大模型嵌入传统行业:Salesforce招聘2000人推广AI Agent,微软Phi-4模型(140亿参数)性能超越更大模型[38][12] - AI硬件进展:Meta计划为Ray-Ban眼镜增加屏幕,OpenAI重组机器人团队,中国预计2025年出现"百镜大战"[40] 投融资动态 - 21家AI公司获超5000万美元融资:中国智谱AI获30亿元(估值200亿元),阶跃星辰聚焦多模态模型,Liquid AI开发新型神经网络架构[42][43] - 基础设施领域Databricks融资86亿美元(估值620亿美元),Tenstorrent获7亿美元开发RISC-V架构AI芯片[44] - 应用层公司多成立于ChatGPT前:Zest AI(金融风控)、Tractian(工业设备监测)、Speak(语言学习)等获大额融资[46][47][48] 科学价值 - 大模型"幻觉"被科学家重新定义:加速抗生素研发(MIT)、生成全新蛋白质(诺奖得主Baker实验室获100项专利)[50][51]
小马智行 IPO,8 年坚持 L4 的少数派
晚点LatePost· 2024-11-28 22:57
公司上市与市场地位 - 小马智行于11月27日在纳斯达克挂牌上市,股票代码为“PONY”,发行价13美元,募资4.52亿美元,比原计划超募33% [4] - 公司是全球范围内实现全无人RoboTaxi运营的三家公司之一,另外两家是Waymo和百度 [4] - IPO前,公司共获得7轮融资,累计金额超过13亿美元,投资方包括红杉中国、IDG资本、五源资本、丰田汽车和沙特新未来城等 [5] 业务运营与财务表现 - 公司在“北上广深”四座一线城市运营,拥有一支超过250辆RoboTaxi的车队,累计自动驾驶里程超过3350万公里,其中全无人驾驶里程达390万公里 [5] - 除RoboTaxi外,公司核心业务还包括无人货运,其Robotruck车队累计完成的货运周转量达7.67亿吨公里,相当于2023年北京市全年货物周转量的1% [5] - 公司亏损正逐渐收窄,2022年调整前净亏损为1.48亿美元,2023年为1.25亿美元,2024年上半年为5178万美元,同比下降25.6% [5] - 公司在北京、广州和深圳均已开始RoboTaxi全无人商业收费运营,例如在北京提供大兴机场自动驾驶接驳收费服务 [9] 技术路线与研发历程 - 公司自创立之初就坚持L4级自动驾驶技术路线,并将业务主线清晰收束为RoboTaxi和干线无人货运两个场景,其“虚拟司机”的底层核心技术复用率超过80% [9] - 2020年,公司遇到研发瓶颈,花费约三分之二的研发精力自建了一套数据驱动的量化评估系统,为测算全无人实现时间提供了依据 [11] - 公司经历了技术路线的重大转变,从“Learning by Watching”转向“Learning by Practicing”,并构建了由生成器、评价矩阵、高真实性仿真环境和数据挖掘工具组成的“世界模型” [12] - 公司CTO楼天城认为,当前的L2+主流技术路线无法达到L4,因为L4的目标是安全性远超人类,而模仿人类驾驶的方式有时会带来负优化 [12] 战略合作与未来规划 - 公司与全球最大车企丰田建立了战略合作,丰田在2020年领投了公司5.454.62亿美元的CB轮融资,并持续提供RoboTaxi车辆 [9] - 公司与丰田合作研发的下一代L4级别自动驾驶车型铂智4X Robotaxi已发布,计划在2025至2026年于国内一线城市投放千台规模 [15] - 公司与北汽新能源基于极狐阿尔法T5车型合作研发全无人Robotaxi车型,目标尽快形成千台规模的运营能力 [15] - 公司将把成本下降作为未来两年最核心的目标,以实现单车盈利,从而继续扩大运营规模 [15] - 公司IPO募资的约40%将用于自动驾驶出行及货运服务的大规模商业化,约40%用于技术研发,约20%用于潜在战略投资和收购 [14]