世界模型

搜索文档
上海车展
数说新能源· 2025-04-24 14:29
1. 智能驾驶改名,企业强调安全 受前期事件影响,今天的发布会上主要公司的产品发布中都弱化了 对"智能驾驶"的宣传。例如比亚迪对"天神之眼"的宣传改为驾驶辅助。理想等企业在发布中也强调自己 产品能够提高紧急情况下用户的安全性。 2. 各种肤色的外国记者/博主增多,出海是企业主线 本次另一个感受是主要车企在SUV/MPV等热门车型 上发布的新品增多。国内市场产品同质化趋势加剧。但我们注意到来自欧美,日本,中东,东南亚等地 的记者和博主增多,反映中国智能电动车在海外市场还是极具竞争力。 3. 世界模型成为新技术趋势 在小鹏,理想,华为,地平线等各个车企和平台供应商的展示中都在强 调"世界模型"。企业在智能驾驶上的竞争从过去拼车端算力,到拼云端构建的世界模型(一个能够理解 物理世界规则的虚拟世界)的能力。 主机厂电芯采购:兼顾性能和成本 比亚迪出海:发力东南亚 往期推荐 加入社群 CATL :储能市场增长高于动力 添加半仙微信,备注"进群",邀请你加入锂电行业社群,获得行业最新动态、行业干货报 告和精准人脉。 本公众号基于分享的目的转载,转载文章的版权归原作者或原公众号所有,如有涉及侵权请及时告知,我们将予以核实并 ...
大模型驱动空间智能综述:具身智能体、智慧城市与地球科学的进展
欧米伽未来研究所2025· 2025-04-20 22:32
空间智能与大模型 - 空间智能是人类和机器对空间环境的感知、理解和运用能力,大语言模型(LLMs)展现出显著的空间智能潜力[2] - 大模型通过内化吸收(预训练数据)和外部调用(查询专业数据库)两种方式获取空间知识[3] - 大模型存在"幻觉"现象和知识动态更新困难等空间记忆方面的挑战[3] 空间推理能力 - 抽象空间推理包括定性空间推理、几何推理和图论推理三个关键方向[5] - 大模型在处理多步骤传递性推理和复杂几何逻辑推演时准确率显著下降[5] - 当前大模型主要利用语言建模能力"模仿"空间任务,而非真正拥有深层空间认知机制[5] 微观尺度应用(具身智能) - 多模态大语言模型(MLLMs)推动机器人空间感知与理解能力提升[7] - 大模型用于生成环境三维表征并规划复杂操作序列[7] - 机器人空间交互面临多模态信息融合和动态环境适应等挑战[7] 中观尺度应用(城市空间智能) - 大模型结合卫星影像、街景图片和POI数据理解城市功能特征[8] - 用于城市知识图谱构建、交通流优化和规划决策支持[9] - 面临数据异构性、动态环境适应和决策可解释性等挑战[9] 宏观尺度应用(地球空间智能) - 大模型处理地球观测数据用于气候变化预测和自然资源管理[10] - 在气候科学领域提升天气预报精度和极端天气预警能力[10] - 地理学应用中结合GIS工具增强专业空间分析能力[10] 未来研究方向 - 需要建立跨领域、跨尺度的通用空间智能评估框架[13] - 城市空间智能需发展实时数据整合和因果推理能力[13] - 地球空间智能需加强多学科数据融合和物理约束整合[13]
杨立昆“砸场”英伟达:不太认同黄仁勋,目前大模型的推理方式根本是错的,token 不是表示物理世界的正确方式|GTC 2025
AI科技大本营· 2025-03-21 14:35
英伟达GTC 2025大会核心观点 - 杨立昆从视觉派角度否定当前主流语言派AI技术路线 认为token不是表示物理世界的正确方式 [8][9] - 杨立昆提出联合嵌入预测架构(JEPA)作为替代方案 强调需要在抽象表示空间而非像素层面进行预测 [14][15] - 杨立昆预测高级机器智能(AMI)可能在十年内实现 但当前大模型扩展路线是错误的 [19][20] AI技术发展方向 - 当前大语言模型已进入产业优化阶段 未来重点应转向机器理解物理世界、持久记忆、推理规划四大方向 [10][11][12] - 世界模型概念被提出 认为人类通过内部物理世界模型处理现实 未来AI需要完全不同架构 [13] - 系统1(快思考)与系统2(慢思考)的区别被强调 当前大模型仅实现系统1水平 [36][37] 硬件与计算技术 - 神经形态硬件和光学计算近期难有突破 量子计算应用前景受质疑 [39][43] - 内存计算技术在边缘设备如智能眼镜上有应用潜力 [40][41] - 视网膜处理机制被作为高效感知系统的生物参考 [43] 开源与创新生态 - Llama系列模型下载量超10亿次 开源模式推动行业创新 [30] - 全球分布式训练开源基础模型被认为是未来趋势 [32] - 中国科学家贡献被肯定 DeepSeek和ResNet案例显示创新可来自任何地方 [8][27] AI应用前景 - AI在医疗影像、自动驾驶等感知领域已产生实际价值 [20] - 科学研究和药物设计是AI最具潜力的应用方向 [20] - AI助手多样化发展需要开源平台支持 未来人机关系将转向管理者-虚拟员工模式 [32][58] 技术挑战与突破 - 残差连接等工程技巧对深度学习发展至关重要 [51] - 为JEPA架构寻找有效"配方"是当前主要挑战 [56] - 视频预测任务显示联合嵌入架构相比重建方法更具优势 [45]
范式集团创始人戴文渊:以“Agent +世界模型”赋能更多产业,加速通向AGI
IPO早知道· 2025-03-18 13:55
范式集团未来将剑指更多业务领域。 本文为IPO早知道原创 作者|Stone Jin 微信公众号|ipozaozhidao 据IPO早知道消息,在3月18日举行的范式集团发布会上,范式集团创始人戴文渊发布全新的集团 Logo,并分享了范式集团的 AGI 愿景与实现路径。 戴文渊强调:"范式集团未来将用'AI Agent+世界模型'的技术路径去赋能更多的产业,最终将大量 垂直的智能能力汇聚成为 AGI。" 因此, 通往 AGI 的路,就是不断提升 AI Agent 沟通能力,和不断丰富世界模型对各垂直细分领域 的认知,提升 AI 解决垂直领域的能力。 需要强调的一点是,我们所认为的世界模型和很多学者正在做的世界模型不同。当前绝大多数的世界 模型,在我们看来仅仅是3D空间模型,服务于具身智能。而 真正世界模型,远超具身智能的范畴, 包括认知从宏观到微观的世界,也包括认知人的内在需求,甚至包括所有的生命,即物理科学和生命 科学。 此前,我们更专注于企业市场,专注于企业软件中的垂直模型。我们虽然做出了一些成绩,但也意识 到智能的天花板也受限于企业市场。未来,我们要把格局放到整个市场,面向改造所有可能的业务, 当这些能力 ...
人形机器人的“iPhone时刻”快到了?
日经中文网· 2025-03-15 09:59
英伟达CEO黄仁勋在主题演讲中介绍人形机器人(1月6日,美国拉斯维加斯,摄影:积田檀) 大约15年前,iPhone成为新的技术平台,APP经济圈因此繁荣起来。随着生成式AI的发展,有观点 认为人形机器人也将迎来"iPhone时刻"。中美竞争激烈,中国有小鹏鹏行、宇树科技;美国有 Apptronik、Figure AI…… 奥平和行: 以美国和中国为中心,人形机器人的开发竞争火热。随着生成式AI的迅速发展,人形机器 人的实用化时期日益临近,有观点认为将迎来人形机器人渗透至社会的"iPhone时刻"。针对人形机器人 的乐观预测认为,到2050年全球市场规模将超过6亿台。在这种情况下,作为"机器人大国"显示出存在 感的日本也将被迫做出应对。 1月6日,美国拉斯维加斯,在科技展会CES(国际消费电子展)现场发表主题演讲的美国英伟达CEO黄 仁勋展示了14台人形机器人,将现场气氛推向高潮。黄仁勋表示,"它们是我的朋友。借助我一直介绍 的技术,未来几年将会实现飞跃发展"。 人形机器人的历史始于1920年代,大约20年前本田的"ASIMO"和索尼的"QRIO"曾引发热门话题。 当时由于用途有限且价格昂贵,这些机器人未能普及 ...
对话小马智行楼天城:只靠端到端无法通向 L4,模仿优秀司机令人绝望
晚点LatePost· 2025-01-09 18:41
技术路线演进 - 小马智行经历从Learning by Watching(模仿学习)到Learning by Practicing(实践学习)的技术路线切换,核心突破在于构建"世界模型"作为车端模型的训练工厂[7][17][18] - 模仿学习存在三大局限:无法学习驾驶意图、人类与AI安全标准双标、优秀司机数据导致反向优化[19][22][23] - 世界模型由数据生成器、评估体系、高真仿真和数据挖掘工具组成,其精度决定车端模型上限[26][27][35] 行业现状与竞争格局 - 2023年Robotaxi行业回暖标志:Waymo旧金山日均单量超出租车、百度武汉运营400+辆、小马智行达百辆级规模[14][15] - L4与L2技术路线分叉:L2依赖数据量(MPCI约300公里),L4追求安全性(MPCI需达10万公里级)[45][47] - 商业化临界点为1000台运营车辆可实现毛利,小马智行采取差异化策略追求更优成本结构[52][53] 核心技术创新 - 世界模型使事故率降至人类司机1/10,车端模型实现感知-预测-规控三模块端到端打通[36][37] - 数据生成技术突破:生成数据覆盖率与一致性超越真实路采数据,解决长尾场景覆盖难题[28][29] - 评价体系与自我演进引擎构成技术护城河,需2/3研发资源投入且经历两年无显性进展的攻坚期[31][39] 商业化进展 - 运营效率提升:接入高德后单车日均订单达15单,远程监控人车比突破1:3向1:30迈进[54][53] - 前装量产合作推进:与丰田、广汽合作降低车辆成本,通过出租车公司合作解决充电等运维问题[53] - 行业竞争态势:滴滴等新玩家入局但市场渗透率不足1%,现阶段以共同培育市场为主[54][66] 认知方法论 - 技术突破关键在坚持"黎明前的黑暗",疫情延缓行业节奏反而为转型创造窗口期[10][40][41] - 商业化需平衡节奏与价值,避免过早变现或过度追求理想化目标两个极端[65][66] - 结果导向思维:技术方法的优劣由最终成果验证,非理论先进性决定[67][68]
AI 月报:10 亿美元训练不出 GPT-5;低成本中国开源大模型走红;AI 幻觉不全是坏处
晚点LatePost· 2025-01-07 22:59
技术进展 - OpenAI训练GPT-5遇阻,已投入20个月和至少10亿美元算力成本,但性能提升未达预期,两次从头训练均未突破博士生水平目标[4] - 数据短缺迫使OpenAI采用人工生成数据(工程师/科学家每日5000字)和模型生成数据(o1模型)补充,但规模仍远低于GPT-4的10万亿字训练量[5] - o3模型在CodeForces编程竞赛得分比o1提升44%,数学测试EpochAI解决25.2%问题(其他模型<2%),但AGI评测得分因数据预训练存在争议[7][9] - 强化学习重要性提升,OpenAI推出RFT微调方法,LangChain报告显示人类反馈强化学习应用增长18倍[5][9] - 世界模型取得突破:DeepMind的Genie 2生成可交互虚拟场景,李飞飞团队实现AI图片转3D场景,CMU/英伟达开源机器人模拟系统Genesis[14] 行业竞争 - Google Gemini 2.0 Flash系列模型抢占Chatbot Arena前三,OpenAI首次失去榜首地位[18][21] - 中国开源模型崛起:DeepSeek-V3以578万美元训练成本逼近GPT-4o性能,Qwen2.5-plus超越Meta Llama 3.1[23][26] - 芯片领域博通市值破万亿美元,2024年AI收入增长220%至122亿美元,为Google/Meta等提供自研芯片方案[29] - 英伟达推出B300 GPU适配o系列模型,算力/显存提升50%,xAI计划将H100算力中心从10万张扩展至100万张[33][34] 应用与商业化 - OpenAI推出12项ChatGPT升级:订阅费最高2000美元/月,集成Sora视频生成、电话交互、生产力工具插件等功能[36] - Agent成为新趋势,Google Gemini 2.0专为Agent优化,YC预测其市场规模将比SaaS大10倍[12][13] - 大模型嵌入传统行业:Salesforce招聘2000人推广AI Agent,微软Phi-4模型(140亿参数)性能超越更大模型[38][12] - AI硬件进展:Meta计划为Ray-Ban眼镜增加屏幕,OpenAI重组机器人团队,中国预计2025年出现"百镜大战"[40] 投融资动态 - 21家AI公司获超5000万美元融资:中国智谱AI获30亿元(估值200亿元),阶跃星辰聚焦多模态模型,Liquid AI开发新型神经网络架构[42][43] - 基础设施领域Databricks融资86亿美元(估值620亿美元),Tenstorrent获7亿美元开发RISC-V架构AI芯片[44] - 应用层公司多成立于ChatGPT前:Zest AI(金融风控)、Tractian(工业设备监测)、Speak(语言学习)等获大额融资[46][47][48] 科学价值 - 大模型"幻觉"被科学家重新定义:加速抗生素研发(MIT)、生成全新蛋白质(诺奖得主Baker实验室获100项专利)[50][51]
小马智行 IPO,8 年坚持 L4 的少数派
晚点LatePost· 2024-11-28 22:57
以下文章来源于晚点Auto ,作者晚点团队 晚点Auto . 从制造到创造,从不可能到可能。《晚点LatePost》旗下汽车品牌。 "看得到山顶,也要知道自己在接近山顶。" 11 月 27 日,小马智行正式在纳斯达克挂牌上市,股票代码为 "PONY",发行价为 13 美元,募资 4.52 亿 美元 ,比原计划超募 33%。 我们与小马智行的两位联创——CEO 彭军和 CTO 楼天城,聊了这 8 年的创业过程和小马智行独特的技术 判断。 7 年前的 2017 年 6 月,小马智行刚成立半年,组装出了自己的第一辆自动驾驶车,开始在硅谷道路上测 试。不久后,一位来访的投资人无预兆地冲到行驶的车辆前,想向同事证明自动驾驶技术的厉害。所有人 都吓了一跳,好在车成功自动刹停。 IPO 前,小马智行共获 7 轮融资,累计金额超 13 亿美元,投资方包括红杉中国、IDG 资本、五源资本、 丰田汽车、沙特新未来城等。 技术创业大致有两种,一种是有了技术,但需要找需求和场景;还有一类是,目标和愿景都很清晰,但实 现难度非常大。从业者一开始往往会低估困难,而随时间演进,又开始高估困难。 自动驾驶毫无疑问属于后者。彭军对能够带领小马 ...