Workflow
世界模型
icon
搜索文档
新力量NewForce总第4939期
第一上海证券· 2026-01-08 19:12
报告行业投资评级 * 报告为周报形式,未对互联网行业给出明确的整体投资评级,但提供了大量覆盖公司的具体评级 [4] * 在“公司估值与评级表”中,对众多互联网及科技公司给出了“买入”或“持有”的个股评级 [15][16] 报告核心观点 * 中国互联网与科技行业正全面深化AI战略,从技术探索转向商业化落地和生态竞争的关键阶段 [5][6][7][8][12] * 各大平台公司通过布局基础模型、开放生态、抢占入口等方式,加速AI技术与核心业务的融合,旨在构建新的竞争壁垒和增长引擎 [5][6][7][8][10] * AI大模型行业进入资本化新阶段,头部企业寻求上市,标志着行业叙事从技术故事转向商业价值兑现 [12][13] 主要公司动态与战略 阿里巴巴/高德地图 * 高德地图正式启动世界模型布局,计划推出新产品,旨在从导航APP转型为物理世界行动引擎 [5] * 高德为世界模型构建了坚实基础,拥有北斗系统提供的日均**9000亿次**定位数据、每日**15亿公里**导航里程及数十万亿级时空样本 [5] * 高德已完成组织架构调整,成立具身业务部,并推出一系列AI化产品,战略上从“找路”延伸到“找服务”,目标是成为连接数字与物理世界的核心枢纽 [6] 腾讯 * 微信小程序推出“AI应用及线上工具小程序成长计划”,为开发者提供全链路支持,包括免费云资源与**1亿**混元Token,以降低开发门槛,激活AI垂类应用创新 [7] * 该计划利用小程序开发周期短、社交传播性强的特点,旨在将微信小程序打造为国内AI应用创新与商业化的核心阵地 [7] 字节跳动 * 火山引擎成为2026年央视春晚独家AI云合作伙伴,旗下豆包大模型将承担用户互动主力角色 [8] * 截至2025年12月底,豆包大模型每日Token调用量达**63万亿**,同比增长超**10倍**,服务覆盖国内九成主流汽车品牌、八成头部券商及银行 [8] * 此次合作是对其AI云能力的一次高规格公开展示,旨在巩固用户优势并锁定AI入口 [8] 快手 * 快手旗下可灵AI在2025年12月流水环比增长**26%**,2026年1月3日的日流水达到2025年12月中旬平均水平的**2.5倍**,成为股价上涨的催化剂 [10] * 增长主要源于产品功能更新(如“音画同出”)及海外市场(如韩国、俄罗斯)的病毒式传播 [10] * 报告指出,此类模型流水通常呈跳点式增长,应理性看待后续数据,快手未来投资逻辑将围绕AI对广告业务的赋能及可灵的业务表现 [11] 大模型行业趋势 * 智谱与MiniMax两大AI大模型“独角兽”计划于2026年初在港交所上市,角逐“全球大模型第一股”,标志着行业进入商业化落地与资本化运作的关键转折点 [12] * 技术路径上,智谱聚焦文本基座模型,MiniMax走全模态并行路线;商业模式上,智谱以MaaS(模型即服务)为主,MiniMax主打“模型即产品” [12] * 资本方面,智谱累计融资超**83亿元**,IPO前估值**243.8亿元**;MiniMax累计融资约**15.55亿美元**,截至2025年9月末现金结余**10.46亿美元** [13] * 两家公司的上市或将引导行业叙事逻辑从“讲述技术故事”向“商业价值兑现”转变 [13] 公司估值与评级摘要(部分互联网及科技公司) * **腾讯 (700)**: 现价**624.5**港元,目标价**790**港元,评级**买入** [15] * **快手 (1024)**: 现价**73.75**港元,目标价**82.4**港元,评级**买入** [15] * **美团-W (3690)**: 现价**104.5**港元,目标价**153**港元,评级**买入** [15] * **小米集团 (1810)**: 现价**38.16**港元,目标价**50.2**港元,评级**买入** [15] * **阿里巴巴 (BABA)**: 现价**146.75**美元,目标价**199**美元,评级**买入** [16] * **百度-SW (9888)**: 现价**145.1**港元,目标价**107**港元,评级**买入** [15] * **网易 (NTES)**: 现价**141.55**美元,目标价**165**美元,评级**买入** [16] * **拼多多 (PDD)**: 现价**120.97**美元,目标价**148.9**美元,评级**买入** [16]
智源发布2026十大 AI技术趋势:认知、形态、基建三重变革,驱动AI迈入价值兑现期
中国经济网· 2026-01-08 18:00
行业技术范式重塑 - 人工智能演进核心正发生关键转移:从追求参数规模的语言学习,迈向对物理世界底层秩序的深刻理解与建模,行业技术范式迎来重塑 [1] - 基础模型的竞争焦点已从“参数有多大”转变为“能否理解世界如何运转” [12] - 2026年将是AI从数字世界迈入物理世界、从技术演示走向规模价值的关键分水岭 [14] 核心认知范式升维 - 世界模型成为AGI共识方向,行业共识正从语言模型转向能理解物理规律的多模态世界模型 [3] - 以Next-State Prediction为代表的新范式,正推动AI从数字空间的“感知”迈向物理世界的“认知”与“规划”,标志着AI开始掌握时空连续性与因果关系 [3][12] - 以世界模型和NSP为核心,AI开始学习物理规律,这为自动驾驶仿真、机器人训练等复杂任务提供全新的“认知”基础 [14] 智能形态实体化与社会化 - 具身智能正脱离实验室演示,进入产业筛选与落地阶段,人形机器人将于2026年突破Demo,转向真实的工业与服务场景 [4] - 头部科技公司的人形机器人正进入真实生产场景,标志着“具身智能”走出实验室 [14] - 多智能体系统将突破单体智能天花板,随着MCP、A2A等通信协议趋于标准化,智能体间拥有了通用“语言”,多智能体系统将在科研、工业等复杂工作流中成为关键基础设施 [5][14] 应用价值兑现双轨发展 - 在消费端,C端AI超级应用的“All in One”入口成为巨头角逐焦点,海外以OpenAI的ChatGPT与Google Gemini为引领,国内字节、阿里、蚂蚁等依托生态积极布局,AI时代的“新BAT”格局正在形成 [7][14] - 在企业端,AI应用在经历概念验证热潮后,因数据、成本等问题正步入“幻灭低谷期”,但随着数据治理与工具链成熟,预计2026年下半年将迎来转折,一批真正可衡量价值的MVP产品将在垂直行业规模落地 [6][14] - AI在科研中的角色正从辅助工具升级为自主研究的“AI科学家”,科学基础模型与自动化实验室的结合,将极大加速新材料与药物研发 [6] 关键使能技术发展 - 高质量真实数据面临枯竭,合成数据正成为模型训练的核心燃料,尤其在自动驾驶和机器人领域,由世界模型生成的合成数据将成为降低训练成本、提升性能的关键资产 [9] - 推理效率仍是AI大规模应用的核心瓶颈与竞争焦点,通过算法创新与硬件变革,推理成本持续下降,能效比不断提升,使得在资源受限的边缘端部署高性能模型成为可能 [8] - 为打破算力垄断与供应风险,构建兼容异构芯片的软件栈至关重要,繁荣的算子语言与趋于收敛的编译器技术正在降低开发门槛 [11] AI安全风险演进 - AI安全风险已从“幻觉”演变为更隐蔽的“系统性欺骗” [12] - 产业上,安全水位成为落地生死线,蚂蚁集团构建“对齐-扫描-防御”全流程体系,推出智能体可信互连技术及终端安全框架gPass [12] - 技术上,Anthropic的回路追踪研究致力于从内部理解模型机理,OpenAI推出自动化安全研究员 [12]
智源研究院发布2026十大AI技术趋势
经济观察网· 2026-01-08 17:08
核心观点 - 人工智能行业的技术演进核心正从追求参数规模的语言学习,转向对物理世界底层秩序的深刻理解与建模,行业技术范式迎来重塑 [1] 技术范式转移 - 行业共识正从语言模型转向能理解物理规律的多模态世界模型,从“预测下一个词”到“预测世界下一状态”的NSP范式标志着AI开始掌握时空连续性与因果关系 [1] - 以智源悟界多模态世界模型为代表验证了这一路径,推动AI从感知走向真正的认知与规划 [1] 具身智能与机器人产业化 - 具身智能正脱离实验室演示,进入产业筛选与落地阶段 [2] - 随着大模型与运动控制、合成数据结合,人形机器人将于2026年突破Demo,转向真实的工业与服务场景 [2] - 具备闭环进化能力的企业将在这一轮商业化竞争中胜出 [2] 多智能体系统与通信协议 - 复杂问题的解决依赖多智能体协同,多智能体系统将突破单体智能天花板 [2] - 随着MCP、A2A等通信协议趋于标准化,智能体间拥有了通用“语言”,Agent时代的“TCP/IP”初具雏形 [2] - 多智能体系统将在科研、工业等复杂工作流中成为关键基础设施 [2] AI在科学研究中的应用 - AI在科研中的角色正从辅助工具升级为自主研究的“AI科学家” [2] - 科学基础模型与自动化实验室的结合,将极大加速新材料与药物研发 [2] - 报告强调,我国需整合力量,加快构建自主的科学基础模型体系 [2] 市场竞争格局与超级应用 - C端AI超级应用的“All in One”入口成为巨头角逐焦点 [3] - 海外以OpenAI的ChatGPT与Google Gemini为引领,通过深度集成各类服务,塑造了一体化智能助手的新范式 [3] - 国内字节、阿里、蚂蚁等依托生态积极布局,蚂蚁推出的全模态AI助手“灵光”与AI健康应用“蚂蚁阿福”分别在超级应用与健康垂直领域进行探索 [3] - AI时代的“新BAT”格局正在形成 [3] 产业应用落地周期 - 企业级AI应用在经历概念验证热潮后,因数据、成本等问题正步入“幻灭低谷期” [4] - 预计2026年下半年将迎来转折,一批真正可衡量价值的MVP产品将在垂直行业规模落地 [4] 合成数据的重要性 - 高质量真实数据面临枯竭,合成数据正成为模型训练的核心燃料 [4] - “修正扩展定律”为其提供了理论支撑 [4] - 在自动驾驶和机器人领域,由世界模型生成的合成数据将成为降低训练成本、提升性能的关键资产 [4] 推理效率与成本优化 - 推理效率仍是AI大规模应用的核心瓶颈与竞争焦点 [5] - 通过算法创新与硬件变革,推理成本持续下降,能效比不断提升 [5] - 这使得在资源受限的边缘端部署高性能模型成为可能,是AI普惠的关键前提 [5] 开源生态与算力底座 - 为打破算力垄断与供应风险,构建兼容异构芯片的软件栈至关重要 [6] - 繁荣的算子语言与趋于收敛的编译器技术正在降低开发门槛 [6] - 以智源FlagOS为代表的平台,致力于构建软硬解耦、开放普惠的AI算力底座 [6] AI安全风险与防御 - AI安全风险已从“幻觉”演变为更隐蔽的“系统性欺骗” [7] - 技术上,Anthropic的回路追踪研究致力于从内部理解模型机理,OpenAI推出自动化安全研究员 [7] - 产业上,安全水位成为落地生死线,蚂蚁集团构建“对齐-扫描-防御”全流程体系,推出智能体可信互连技术(ASL)及终端安全框架gPass [7] - 智源研究院联合全球学者发布AI欺骗系统性国际报告,警示前沿风险 [7] - 安全正内化为AI系统的免疫基因 [7]
扫街榜上线100天用户超6.6亿后,高德再放大招
国际金融报· 2026-01-08 15:58
高德扫街榜上线百日核心业绩与升级 - 高德扫街榜上线100天,宣布三大重磅升级:发布全球首个“飞行街景”、推出全球首个动态生活服务榜单、引入好友关系链[1] - 自2025年9月10日上线以来,已从美食榜单发展为覆盖“吃喝玩乐”全场景的本地生活超级入口[1] - 累计吸引86万新商家入驻,带动商家订单量环比增长超330%,商家营业额增长超270%[1] - 用户规模突破6.6亿,推动高德APP单月新增4600万月活用户,月活用户数增至9.96亿[1] - 上线首日用户即超过4000万,上线100天累计用户规模突破6.6亿,成为全球用户规模最大、增速最快的生活服务榜单[1] 用户与商家增长及行业影响 - 2025年10月高德扫街榜日均DAU超过7000万,生活服务日均评论量达到了去年同期的3倍以上[2] - 扫街榜推动高德APP月活用户数从2025年9月的9.5亿增至10月的9.96亿,一个月内新增近4600万月活用户[2] - 高德APP已成为00后用户在出行服务类应用中的第一选择[2] - 以真实榜单重新定义线下服务评价体系,为商家创造公平发展机会[2] - 商务部研究院报告指出,扫街榜打造了公平普惠环境,带动行业健康发展,推动服务消费体验升级,促进“烟火经济”蓬勃发展[2] - 案例:老字号金鼎轩北京地坛店登顶相关榜单,2025年国庆期间门店客流同比增长40%[2] 技术升级:飞行街景与AR实景 - 基于自研世界模型,首推“飞行街景”功能,实现连续、动态、高拟真的实景导航与探店[3] - 商家仅需用手机拍摄上传视频和照片,即可免费生成专属飞行街景,助力线上“种草”转化为线下到店[3] - 故宫博物院的“飞行街景”已正式上线,高精度还原建筑与历史细节[4] - 将上线“AR实景”功能,用户扫街道可显示餐厅排名,扫餐厅可显示招牌菜,扫景点可浮现历史典故[4] - “飞行街景”是首次将世界模型用于普惠生活服务行业,开创全球先河[4] - 高德自研世界模型在国际权威评测基准WorldScore上综合得分位列第一,相关论文被ICLR 2025、NeurIPS 2025等顶会收录[4] 百万商家支持计划与AI技术价值 - 发布“百万烟火好店支持计划”,将投入数亿元算力资源,免费为100万烟火小店接入“飞行街景”[5] - 与全国百城合作,提供0门槛入驻、消费趋势洞察、地方美食节打造、专属出行补贴等系统性支持[5] - 高德世界模型的发布标志着AI技术从实验室走向现实生活与应用场景,将为商业和社会带来深刻变革[5] - 公司表示将持续推动空间智能服务演进,目标是成为用户与真实世界交互的触点,从生活服务超级入口延伸至真实世界的超级入口[5] 动态榜单体系升级 - 推出全球首个应季、应时、应地的动态生活服务榜单,实现全季节、全品类、全人群覆盖[5] - 基于高德10亿用户和日均2.9亿个行为序列,动态生成具有自然节律、地域特色的时令榜单,目前已生成6553个时令榜单[6] - 为满足不同人群兴趣爱好,生成了1550个品类榜单,包括爬山、徒步、露营等[6] - 上线全新“食仙榜”,覆盖全国12.8万道地方招牌菜,可查看城市菜品受欢迎度及各餐厅特色菜排序[6] 社交功能与全球化拓展 - 创新引入基于信任关系的推荐机制,上线“好友动态”功能,用户可优先看到好友评分、评价及动态[7] - 向10亿用户开放新建个人专属榜单功能,每位用户都可创建、署名并分享自己的各类榜单[7] - 高德扫街榜已完成全球化升级,目前已覆盖220多个国家和地区的近1700座城市,为海外用户提供当地指南[8]
随到随学!端到端与VLA自动驾驶小班课(视频+答疑)
自动驾驶之心· 2026-01-08 13:58
课程核心定位与目标 - 课程为端到端与VLA自动驾驶进阶实战教程,旨在推动端到端技术在工业界落地,助力学员理解端到端自动驾驶 [8] - 课程联合工业界专家开设,内容涵盖学术界与工业界最前沿的技术栈,包括BEV感知、视觉语言模型、扩散模型、强化学习等 [1] - 课程目标是使学员学完后能达到约1年经验的端到端自动驾驶算法工程师水平,掌握技术框架并能够复现主流算法 [13] 课程内容架构 - **第一章:端到端算法介绍** 概述端到端自动驾驶发展历史、概念起源、从模块化到端到端的演进,并分析一段式、二段式及VLA范式的优缺点与适用场景 [4] - **第二章:端到端的背景知识** 作为课程重点,详细讲解VLA涉及的大语言模型、扩散模型及强化学习,以及一段式端到端涉及的BEV感知,为后续学习奠定基础 [4][9] - **第三章:二段式端到端** 聚焦二段式端到端,解析其定义与出现原因,并讲解经典算法PLUTO、CVPR'25的CarPlanner及最新工作Plan-R1,对比其与一段式端到端的优缺点 [5] - **第四章:一段式端到端与VLA** 作为课程精华部分,涵盖基于感知、世界模型、扩散模型及VLA的一段式端到端子领域,探讨各方法如何解决端到端终极目标 [6] - **第五章:课程大作业 - RLHF微调** 提供RLHF微调实战,涉及预训练与强化学习模块搭建及实验,该技术可迁移至VLA相关算法,具有良好延展性 [7] 关键技术深度解析 - **BEV感知** 讲解其基础知识,以及如何基于BEV实现自动驾驶核心感知任务,如3D检测、车道线识别、OCC及轨迹预测与规划 [9] - **扩散模型** 讲解其理论知识,并指出基于扩散模型输出多模轨迹是当前学术界与工业界热点,多家公司正尝试落地 [9] - **视觉大语言模型与强化学习** 讲解VLM相关的强化学习技术,包括RLHF及其在VLM训练中的作用,以及上半年热门技术GRPO [9] - **一段式端到端细分领域** 详细讲解基于感知的方法(如UniAD、地平线VAD、CVPR'24的PARA-Drive)、基于世界模型的方法(如AAAI'25的Drive-OccWorld、OccLLaMA)、基于扩散模型的方法(如DiffusionDrive、Diffusion Planner、DiffE2E)以及基于VLA的方法(如小米ORION、慕尼黑工大OpenDriveVLA、ReCogDrive) [10] 课程实战与前沿应用 - 课程包含配套实战,例如在扩散模型小节配套讲解Diffusion Planner实战,在VLA小节选择小米ORION作为实战,该开源项目截至2025年7月已开放推理与评测模块 [10] - 世界模型被强调为近两年非常热的技术方向,因其应用广泛,可用于场景生成、端到端驾驶及闭环仿真 [10] - VLA被视为目前端到端自动驾驶的皇冠,上限高且难度大,因此行业招聘需求旺盛,代表了新一代自动驾驶量产方案的预研方向 [10] 讲师资质与课程特色 - 讲师Jason拥有C9本科与QS50博士学历,已发表2篇CCF-A论文及若干CCF-B论文,现任国内TOP主机厂算法专家,从事端到端、大模型、世界模型等前沿算法的预研与量产,并主持完成多项自动驾驶感知与端到端算法的产品量产交付 [2] - 课程内容基本为工业界和学术界的Baseline,兼顾经典工作与最新前沿进展 [1] - 课程为小班课,随到随学,提供视频与答疑服务 [1] 学员收获与面向人群 - 学员将掌握端到端技术框架,涵盖一段式、两段式、世界模型、扩散模型等方法 [13] - 学员将对BEV感知、多模态大模型、强化学习、扩散模型等关键技术有更深刻了解,并可复现扩散模型、VLA等主流算法框架 [13] - 学员能够将所学应用到项目中,真正搞懂如何设计自己的端到端模型,并可在实习、校招、社招中受益 [13] - 课程面向具备一定自动驾驶领域基础、熟悉Transformer大模型、强化学习、BEV感知等基本概念,并具备概率论、线性代数及Python、PyTorch语言基础的学员,学习需自备GPU,推荐算力在4090及以上 [11] 行业趋势与技能需求 - 端到端自动驾驶是学术界与工业界的前沿方向,VLA范式是目前发展的焦点 [1][10] - 第二章所涉及的背景知识被总结为未来两年求职面试频率最高的技术关键词 [5] - 基于扩散模型输出多模轨迹能更好地适应自动驾驶不确定的环境,是当前热点 [10]
商家拍几段视频,就能生成飞行街景,世界第一的高德世界模型到底是个啥?
搜狐财经· 2026-01-08 13:51
高德世界模型与飞行街景技术发布 - 公司发布自研世界模型“FantasyWorld”及全球首个“飞行街景”功能 [2][5] - 世界模型通过融合多源感知数据,将物理世界映射为连续、可计算、高度一致的数字空间 [3][5] - 该模型在国际权威评测基准WorldScore上综合得分位列第一,并在可控性、一致性等关键指标上保持领先 [6] - 相关技术论文已被ICLR 2025、NeurIPS 2025等全球顶级AI学术会议收录 [6] 飞行街景功能特点与商业模式 - 用户可在规划路线时,从街道视角无缝“飞入”餐厅内部,连续查看环境、停车位及包厢陈设 [2] - 公司宣布将投入价值数亿元的算力资源,为100万个商家全部免费接入飞行街景 [8] - 商家仅需用手机拍摄几段简短店内视频和门头照片,最快几小时内即可自动生成实景店铺,极大降低采集门槛 [8][9] - 该功能被视为一种“技术平权”,将竞争焦点从“谁更会包装”转向“谁的店更好”的本质 [8] 技术定位与竞争优势 - 公司强调其世界模型是“事实AI”,严格依据真实影像资料还原,AI是“空间的还原者”而非“自由创作的画家”,以应对AI生成中的幻觉问题 [3][9] - 与传统高成本、难规模化的3D建模方式不同,该方案是AI驱动的工业化生产流程,提升了自动化生成能力 [9] - 为保持数字世界与现实世界同步更新,公司建立了“动静结合”的感知系统,利用街景采集、用户导航数据及UGC内容驱动感知并自动触发更新 [9] 产品生态拓展与市场表现 - 基于世界模型,公司扫街榜将在今年一季度上线“AR实景”功能,允许用户扫描街道或门店,在实景画面上叠加餐厅评分、推荐菜等信息 [4][8] - “飞行街景”功能已衍生至文旅场景,例如故宫博物院已上线该功能,提供沉浸式“云游览”体验 [10] - 高德扫街榜当天还宣布推出全球首个应季、应时、应地的动态生活服务榜单,并新增好友动态和个人榜单功能 [11] - 数据显示,高德扫街榜用户规模已突破6.6亿,上线100天累计吸引86万新商家入驻,商家营业额环比增长超270% [11]
谷歌的遗憾,被高德弥补了
雷峰网· 2026-01-08 13:33
文章核心观点 - 高德地图在全球范围内率先规模化落地了“飞行街景”功能,实现了谷歌曾展示但未落地的“沉浸式视图”概念,这标志着在AI驱动的空间智能时代,技术落地能力和生态支撑正超越单纯的技术前瞻性,成为竞争的核心[3][4] - 高德凭借自研世界模型、更低的成本路径以及“数据+模型+场景”的闭环,在技术场景化应用上实现了对谷歌的阶段性领先[6][9][10] - 高德的成功得益于其将前沿AI技术与本地生活等具体场景深度融合的能力,以及背靠阿里生态所构建的完整商业履约体系,这补足了谷歌的短板[12][13] 落地为王,AI时代的竞争新焦点 - 地图行业正从提供静态路线向理解并动态再现真实世界的复杂空间关系进化,高德与谷歌均已完成全面AI化并转向空间智能[6] - 高德的“飞行街景”已实现规模化落地,而谷歌的“沉浸式视图”因神经渲染技术成本高昂,仍未能规模化应用[2][6] - 高德采用基于自研世界模型的“生成式”技术路径,仅需用户上传视频图片即可生成地理图景,极大降低了成本,使规模化成为可能[6] - 高德世界模型在国际权威空间智能评测基准WorldScore中综合得分位列第一,其真实世界还原度处于全球领先水平[7] - 高德拥有真实世界数据与空间理解的“稀缺性”,并形成了“数据+模型+场景”的闭环,能快速将AI技术转化为产品功能[8][9] 生态竞合,高德扫街榜的价值跃迁 - “飞行街景”等AI功能正推动高德“扫街榜”从解决信息信任的1.0阶段,向构建可信任、可交互、可沉浸的立体体验闭环的2.0阶段跃迁[12] - 谷歌在AI基础研究、全球数据覆盖和操作系统生态上领先,但其核心业务缺乏覆盖线下服务、本地生活、电商交易的完整履约体系,难以实现线上线下深度融合[12] - 高德依托AI+扫街榜,构建了“技术推动场景升级,场景数据反哺技术优化”的正向循环,并背靠阿里生态,天然连接本地生活、电商物流和移动支付,使技术创新能真正落地普惠[13] - 中国公司的优势在于应用落地,许多技术虽起源于国外,但在中国得到了更快、更广泛的应用,“飞行街景”的规模化落地即为典型案例[14] - 高德此前推出的红绿灯倒计时、车道级导航、鹰眼守护预警系统等基于空间智能的功能,已在国内普及,但在海外尚未落地[14]
英伟达Alpamayo对智能驾驶行业影响
2026-01-08 10:07
纪要涉及的行业或公司 * **行业**:智能驾驶(自动驾驶)行业 [1] * **公司**: * **英伟达 (NVIDIA)**:发布开源大模型Alpaca (Apache Maestro),旨在构建软硬件一体化生态 [1][2][4] * **主机厂/车企**:蔚来、小鹏、理想、比亚迪、奔驰、通用、上汽、广汽、奇瑞、吉利、宝马、奥迪、大众、福特、捷豹路虎等 [3][6][14][15][17][18][19] * **芯片厂商**:高通、德州仪器 (TI)、地平线、黑芝麻 [7][15] * **算法/方案供应商**:Momenta、大疆、卓玉、青州、千里科技等 [1][7][17][18] * **Robotaxi公司**:Waymo、特斯拉 [13] * **其他**:华为 [15] 纪要提到的核心观点和论据 * **英伟达Alpaca模型的技术特点与性能** * 模型为多模态视频语言动作模型,输入多摄像头视频和传感器信息,输出自然语言因果推理链和未来轨迹点 [2] * 采用结构化标注协议和FlowMatting技术优化轨迹生成,降低推理时延 [1][2] * 在复杂路口等长尾数据集上性能提升12% [1][2] * 封闭道路越界率从17%降至11% [1][2] * 危险近距离交汇场景危险率从4%降至3% [1][2] * 在RTS6,000架构下整体耗时99毫秒,满足车规级100毫秒闭环要求 [2] * 在服务器A100芯片上推理延迟约125毫秒,在实车SOR Ultra 750 TOPS芯片上延迟约60毫秒(约16帧) [8] * **英伟达的战略意图与生态影响** * 通过开源Alpaca模型,构建从数据标注、模型选择到工程化优化的软硬件一体化生态系统,推动其芯片广泛落地 [1][4] * 生态模式类似于安卓与苹果的竞争关系 [1][4] * 基于英伟达生态的主机厂可加速方案上车,但需支付许可费和一次性开发费 [1][6] * 对国内自研厂商(如蔚来、小鹏、理想)影响较小,主要因国内场景差异及英伟达本地化工程不足,但可借鉴其思路 [1][6][7] * 对与高通等合作的第三方算法厂商(如卓玉、青州)构成利空,市场空间可能被挤压 [1][7] * 开源版本参数较小(如7B、3B、5B),主要用于展示范式,大规模闭源版本仍由英伟达掌握 [9] * **面临的挑战与成本** * 数据标注成本高昂,需要大量人工标注 [2][5] * 工程复杂度高,需进行参数裁剪、蒸馏及算力协同优化 [2][5] * **2026年智能驾驶技术发展趋势** * 2026年是从少数头部企业向行业普及的关键拐点,重点在于工程化优化和数据训练闭环 [1][10] * 世界模型与VLA/VA架构结合将成为许多企业的选择,并逐步渗透至低价位车型 [1][12] * 将催生新功能,如拍照找车、复杂语音控车、托管驾驶等 [12] * **主要车企与技术供应商动态** * **Waymo**:自研芯片BMC已完成流片,与上汽合作车型预计2026年第三季度推出 [3][14] * **比亚迪**:自研芯片预计2026年第四季度流片,将搭载于后续新车型,并计划升级B系列平台至猛犸塔方案 [3][15] * **奇瑞**:2026年按猎鹰战略推出车型,基本不再自研,旗下各品牌平台采用不同供应商方案(如高通、大疆、地平线、Momenta) [17] * **吉利**:低端车型由吉利研究院主导,中高端车型主要依靠千里科技,极氪保持独立开发 [17] * **外资车企**:奔驰、通用等绑定英伟达生态的企业,其高端智驾落地有望因OpenMA生态开源而加速 [3][19] * **竞争格局与技术水平对比** * 英伟达模型目前在美国表现相当于特斯拉FSD V12水平,要达到V13水平需7-8个月迭代周期 [21] * 在国内,要达到小鹏VLA 2.0水平至少需要一年时间,因长尾场景更复杂、标注要求更高 [21] * 高通在座舱领域强势,但算法支持有限,需绑定算法供应商以提供有竞争力的解决方案 [7] * **其他重要进展** * **特斯拉FSD入华**:已被允许在中国训练,处于合规云采购完成阶段,预计2026年Q2或Q3有大版本推出,但效果可能不及FSD V14 [23] * **L4/Robotaxi**:实现理想中的L4级别自动驾驶仍需长时间运营迭代,长尾场景挑战仍存 [13] 其他重要但是可能被忽略的内容 * **芯片平台拓展外资客户的关键窗口期**:2026年是关键窗口期,若某平台芯片能成功量产并通过外资主机厂严格认证,2027年有望吸引更多外资品牌使用 [20] * **数据采集与标注的核心地位**:对于开展Robotaxi业务,数据采集后的标注是核心操作,是最重要的一环 [22] * **奥特曼模型影响的差异性**:该模型对海外车厂更友好,因提供完整解决方案;对国内领先的车厂影响相对较小 [24] * **未来模型表现的依赖性**:奥特曼模型未来表现取决于用户贡献,但在国内生态中,涉及隐私的高质量数据难以开源共享,成果未必能普惠 [25] * **技术架构演进路径**:2024年理想提出双模型架构,2025年8-9月左右各大厂商转向纯VLA架构,2026年将是VLA加世界模型版本的重要年份 [11]
昆明10684家“烟火好店”登上高德扫街榜
新浪财经· 2026-01-08 06:24
高德扫街榜产品升级与市场表现 - 公司宣布启动“百万烟火好店支持计划”,计划持续至2025年12月31日 [1] - 自2025年9月10日发布以来,主动入驻高德的餐饮商家数超过86万家 [1] - 入驻商家的订单数环比增长超330%,营业额环比增长超270% [1] 昆明地区具体运营数据 - 截至2025年12月31日,昆明美食类商家上榜总数达10684家 [1] - 其中103家餐厅登顶“状元榜”,46家跻身“烟火小店榜” [1] - 昆明美食行业线上日均流量较2025年8月环比增长109%,订单量增长184%,交易额提升165% [1] 产品功能与技术升级 - 2026年高德扫街榜将全面升级,核心亮点之一是推出全球首个“飞行街景”功能 [2] - “飞行街景”依托高德自研世界模型,是世界模型在普惠生活服务行业的首次应用 [2] - 该功能可实现连续、动态、高拟真的实景导航与探店,用户可沉浸式俯瞰场所内外部实景 [2] - 公司将上线“AR实景”功能,用户扫描街道可获取餐厅排名、推荐菜等实用信息 [2] 商家与用户参与机制 - 公司开放免费自助上传通道,商家仅需智能手机拍摄上传店内视频和门头照片,即可生成专属“飞行街景” [2] - 用户在高德App搜索“飞行街景”即可体验该功能 [2] - 动态榜单功能有助于用户发现地道风味,提升消费体验 [1]
高德扫街榜发布会上,一个细节很多人都没有注意到!
新浪财经· 2026-01-08 04:18
高德扫街榜产品升级与功能发布 - 高德扫街榜召开发布会,公布了上线百日以来的成绩,并宣布进行全面升级,推出新功能[1] 基于世界模型的新功能“飞行街景” - 高德扫街榜基于世界模型规模化落地应用,推出了“飞行街景”功能[3] - 该功能允许用户在出行前以第一视角飞越城市街区,从高空俯瞰门店周边街道情况,如停车位设施,并能实地探访门店包厢环境、座位分布等,实现“所见即所得”[6][8] - 该功能的科技落地速度极快,从媒体报道高德布局世界模型到新产品面世时间很短[6] 产品功能的市场定位与价值主张 - “飞行街景”功能旨在解决用户痛点,即线上店铺信息与线下实际情况严重失真的问题,帮助用户在出发前掌握门店最真实的情况[6][8] - 与海外巨头谷歌的世界模型相比,高德的世界模型侧重点不同:谷歌更注重游戏创新与游玩体验,而高德则侧重于解决老百姓的真实生活问题[8] - 公司认为科技进步的意义在于解决实际问题,成为大众需要的科技,这比单纯追求技术领先更有价值[9]