量子位
搜索文档
高通万卫星:混合AI与分布式协同是未来 | MEET2026
量子位· 2025-12-11 19:37
AI应用演进的四个阶段 - 行业将AI应用演进梳理为四个阶段:感知AI、生成式AI、智能体AI和物理AI [3][9] - 感知AI是第一阶段,包括传统的自然语言处理、语音降噪、图片识别和分割等技术,多年前已在终端侧商业化落地 [13] - 生成式AI是第二阶段,随ChatGPT兴起,基于大量数据预训练并在人类监督下完成具体任务,如文生图、聊天机器人、翻译等 [14] - 智能体AI是第三阶段,能在几乎没有人类监督的情况下进行自主行动、预测、意图理解与任务编排,产业正呈现从生成式AI向智能体AI演进的路线 [18][19] - 物理AI是第四阶段,AI能理解真实物理世界并根据物理定律做出反馈,目前尚处于研究和探索初期 [20][21][22] 终端侧AI的现状与趋势 - 终端侧AI模型尺寸正不断增大:手机可支持近100亿参数,PC支持约200亿参数,车载场景可部署200亿至600亿参数模型 [23] - 终端侧模型质量持续提升,今年初已将支持思维链和推理能力的模型完全部署在端侧 [25] - 端侧模型支持的上下文长度显著增长:从两年前的1K至2K,到去年的4K,再到今年已能支持8K至16K典型用例部署,特殊场景下已实现128K上下文窗口的端侧部署 [26][27] - 终端侧AI正从单一文字模态,向支持文本、图片、视频、音频、语音等多模态甚至全模态演进 [28] 端侧AI的优势与核心挑战 - 在端侧运行大模型的最大优势之一是个性化,能在离数据产生最近的地方做推理,有利于保护用户隐私和安全,且完全免费、无需网络连接 [31][32] - 端侧运行大模型面临三大核心挑战:内存限制约束了模型能力上限;带宽限制影响AI推理速度和用户体验;在手机等高集成度设备上对能效控制提出极致要求,功耗过高易触发温控机制 [34][35] 高通公司的端侧AI技术破局之道 - 通过量化和压缩技术应对内存限制:从8 bit、4 bit到今年实现2 bit量化压缩,使端侧支持的模型尺寸越来越大,占用内存越来越小 [37] - 采用并行解码技术应对带宽限制:先在端侧运行较小的草稿模型一次性推理出多个token,再由原始大模型校验,以提高大语言模型的token生成速率,改善用户体验 [37][40][42] - 通过先进的NPU(包括eNPU架构)和领先的异构计算系统,推动端侧AI从被动式服务向主动式、个性化服务迈进 [37] 智能体AI的构成与用例 - 智能体AI是更复合、更复杂、更主动式的AI服务,其实现需要多个基础模块:一个具有推理能力的大模型以理解用户意图;以及调用本地或云端API执行任务的能力 [45][46][47] - 智能体AI用例示例:用户通过自然语言交互,智能体理解“发布微博”意图后,可自动打开微博APP、搜索照片、根据用户偏好加滤镜并完成发布,整个过程可全部运行在端侧 [50][52] 未来AI体验:分布式协同与混合AI - 未来将实现跨设备的分布式个性化大模型推理:算力较小的设备(如智能眼镜、手表)可通过Wi-Fi或蓝牙与算力较大的设备(如手机、PC、汽车)连接,共享本地数据并将大模型推理任务转移 [54] - AI体验将向混合AI方向发展:在终端侧运行垂类、高效的模型,提供更安全、个性化的服务;在云端运行更大尺寸的模型,提供能力更强、更通用的服务 [55][57] - 公司将凭借低时延、高速且安全的连接技术,确保混合AI场景下的端云协同 [58]
张亚勤院士:基础大模型最终不超过10个,十年后机器人比人多 | MEET2026
量子位· 2025-12-11 17:00
文章核心观点 新一轮人工智能是信息智能、物理智能和生物智能的融合,在规模定律驱动下,智能从模式识别“涌现”为生成式与推理式AI,并正快速演化为智能体范式[2][3][12] 以ChatGPT和DeepSeek为里程碑,AI发展正从预训练时代迈向以推理为核心的“DeepSeek时刻”,并在高效率、低成本和开源生态中加速落地[4][11][12][14] 未来5-10年,产业将进入“智能体互联网”时代,智能体将取代大部分SaaS和App,成为人机交互的默认形态,这也是通往通用人工智能(AGI)的必经之路[6][12][38][40] AI发展范式演进 - **新一轮AI的本质是三大智能融合**:即信息智能、物理智能和生物智能的融合,本质上是原子、分子和比特的融合[2][8][12] - **智能涌现的关键驱动**:在规模定律(Scaling Law)持续作用下,当参数规模、数据体量与算力跨过阈值,智能从鉴别式AI“涌现”为生成式AI,再走向以智能体为代表的新范式[3][10][11] - **两大里程碑事件**:ChatGPT通过统一表征与token化,将文本、语音、图像乃至蛋白质、点云等数据纳入同一空间,实现了从鉴别式AI到生成式AI的跨越[4][10] DeepSeek则以高效率、高性能、低价格和开源路径,将大模型从“预训练时代”推向以推理为核心的“DeepSeek时刻”[4][11][14] AI发展的五大趋势 - **趋势一:生成式AI正快速演化为智能体**:智能体是近两年AI领域最重要的创新,其任务长度在过去七个月增长了两倍,准确度已大于50%,与人类对齐[15][17][18] - **趋势二:规模定律重心转移**:规模定律在预训练阶段已放缓,更多智能发展转移至后训练、推理和智能体阶段[19] 推理的单位成本在过去一年下降了10倍,而智能体本身的算力要求一年增长了10倍,两者成本效应相互平衡[19] - **趋势三:从信息智能走向物理与生物智能**:大语言模型正走向视觉语言动作模型(VLA)[20] 无人驾驶在2024年已到达“ChatGPT时刻”,预计到2030年(DeepSeek时刻),约10%的新车将拥有L4级无人驾驶能力[20] 机器人是未来最大赛道之一,预计未来10年左右,机器人的数量将超过人类数量[21] - **趋势四:AI风险同步放大**:随着智能体的出现,AI相关的风险至少翻倍[22] - **趋势五:开源成为主流生态**:开源将成为更大、更主要的平台和生态,预计约80%的模型为开源,20%为闭源[23] 未来产业格局:智能体互联网 - **基础大模型如操作系统般收敛**:基础大模型相当于AI时代的操作系统,全球范围内最终将收敛到不超过10个,主要由中美两国引领[6][12][23][35] - **智能体取代传统软件形态**:智能体会取代今天的大部分SaaS和手机App,成为企业和个人与世界交互的默认形态[6][30] 未来的企业架构将包含GPU、大模型、数据以及由人和智能体共同构成的人力资源[25] - **形成新的产业架构与经济形态**:产业将重构为“基础模型+垂直/边缘模型+智能体网络”的新格局[12][23] 智能体不仅在形成网络,也在形成新的经济形态[25] 整个产业规模将比PC时代、移动时代大一个、两个甚至三个数量级[37] - **是通往AGI的必经之路**:智能体互联网是未来5-10年最大的发展方向,也是实现通用人工智能(AGI)的必经之路,需要新的算法体系如记忆体系、世界模型等[12][38][40] 预计未来五年,现有的自回归架构、Transformer、Diffusion等技术可能被颠覆[41] 技术应用与展望 - **医疗智能体案例**:清华大学已开发出全球首个医疗智能体无人医院,利用多智能体网络模拟三甲医院,能在两天内完成相当于医院两到三年的病例处理,且准确度更高[31][33] 智能体主要作为医生的助理,未来每位医生都可能拥有自己的智能体[34] - **AGI实现时间表**:预计需要15-20年时间,依次完成从信息智能到物理智能,再到生物智能的跨越[12][42]
量子位编辑作者招聘
量子位· 2025-12-11 14:54
编辑部 发自 凹非寺 量子位 | 公众号 QbitAI AI热潮还在汹涌,但如果你还不知道如何参与……那为什么不来 量子位 呢? 我们是一家以 追踪AI新进展 为核心的内容平台,经过8年积累,目前拥有顶流影响力,广泛且备受认可的产业资源,以及时代风口的最佳观 测和学习生态位。 目前,我们有 三大方向 岗位招聘,希望你是 (或者能成为) 这三个方向的内容专家: 岗位均为全职,工作地点:北京中关村。 岗位面向: 加入我们,你可以获得: 以下是岗位详情: 所有岗位不同能力层级职位均在开放,欢迎结合个人履历和经验申请。 AI产业方向 岗位职责: AI产业方向 :关注基建层创新,包含芯片、AI Infra、云计算; AI财经方向 :关注AI领域创投和财报,跟踪产业链资本动向; AI产品方向 :关注AI在应用和硬件终端方向的进展。 社招:覆盖编辑、主笔、主编各个层级,按能力匹配岗位; 校招:应届毕业生,接受实习且可转正。 参与核心采访,对话产业专家、技术大牛、撰写AI云落地案例。 任职要求: AI财经商业方向 岗位职责: 任职要求: AI产品方向 岗位职责: 任职要求: 站在AI浪潮之巅 :第一时间接触和了解AI领域最新 ...
英伟达GPU被SpaceX送上太空!在天上训练卡帕西的NanoGPT
量子位· 2025-12-11 14:54
核心观点 - 人类首次在太空轨道上成功训练并运行了AI大模型 这标志着太空计算与AI融合的重大技术突破 其核心驱动力在于突破地球能源与基础设施的瓶颈 为AI算力发展开辟新路径 [2][7][13] 太空AI首秀事件 - 事件由初创公司Starcloud主导 通过SpaceX火箭将搭载英伟达H100芯片的Starcloud-1卫星发射升空 [6] - 在轨卫星上成功运行了谷歌的开源大模型Gemma 并获得了其回应 [4][9] - 首次在太空中直接训练了大语言模型 即前OpenAI联合创始人Andrej Karpathy打造的NanoGPT 训练数据使用了莎士比亚全集 [4][9] 太空计算的发展目标与规划 - Starcloud公司的长期目标是建造基于太阳能面板的轨道数据中心 规划算力达5GW 并预期其造价与运营成本将显著低于地球数据中心 [10] - 公司计划在2026年10月的下一次发射中携带更多英伟达H100芯片 并将Blackwell平台送入太空 [11] - 公司CEO指出 转向太空发展的核心原因是地面面临的能源限制 太空在土地、制冷方面约束更少 且有持续充足的太阳能供给 [12][13] 行业参与与竞争格局 - 谷歌CEO表示计划将TPU发射至太空 最早的两颗卫星预计2027年初启程 [15] - 中国科研机构与企业在该领域早有布局 自2019年起便开始探索太空智能计算 [16][17] - 2024年 中科天算团队完成大模型在轨部署 国星宇航联合之江实验室成功发射全球首个太空计算星座“三体计算星座”首批12颗卫星 并于9月实现常态化商业运行 [18] - 2024年11月 中科天算发布“天算计划” 提出在近地轨道建设算力达10 EOPS的万卡超级智能体集群 [19]
纯文本驱动视频编辑,清华&华为&中科大实现无需掩码/参考帧就能精准移除/添加对象
量子位· 2025-12-11 14:54
LoVoRA团队 投稿 量子位 | 公众号 QbitAI 近年来,基于扩散的视频生成模型的最新进展极大地提高了视频编辑的真实感和可控性。然而,文字驱动的视频对象移除添加依然面临巨大挑 战: 不仅需要精准定位目标对象,还要同时保持背景连续性、时序一致性以及语义匹配。 现有大多数方法在推理时必须依赖用户提供的掩码或参考帧来确定编辑区域,这不仅增加了使用门槛,也限制了模型在真实场景中的实用性和 泛化能力。 为了解决上述难题,清华&华为&中科大团队提出 LoVoRA (Learnable Object-aware Localization for Video Object Removal and Addition)——一个真正意义上文本驱动、无需掩码和参考帧的视频对象移除与添加框架。 LoVoRA 能够仅凭文本提示精准定位编辑区域,并进行时序一致、背景自然的视频编辑,无需任何人工掩码或外部控制信号。大量实验和用 户评测表明,LoVoRA 在编辑质量、背景一致性、时序稳定性等指标上均优于现有基线方法。 数据集构建 现有的基于指令的视频编辑数据集,例如InsViE, Ditto, Senoritia, ICVE-SFT等 ...
MEET2026挤爆了,AI圈今年最该听的20+场演讲&对谈都在这
量子位· 2025-12-11 14:54
组委会 发自 凹非寺 量子位 | 公众号 QbitAI DeepSeek炸翻全场,世界模型开启通向AGI之路,"Agent元年",具身智能全面开花,豆包手机让AI终端热度再上一个台阶…… MEET2026智能未来大会是由量子位主办的行业峰会,近30位产业代表与会讨论。线下到场参会观众近1500人,线上直播观众350万+,获得 了主流媒体的广泛关注与报道。 AI世界里原本散落全年的高能节点,在今天,被集中点燃。 在 量子位ME ET202 6 智能 未来大 会 上,这些被全年刷屏的关键词,又一次被工业界、学术界、投资圈的大咖们高频拆解,激情对线。 会场里座无虚席,过道被"站票"填满。台上是学术界和行业内的第一线操盘手,台下是来自大厂、独角兽、科研机构和资本方的长期关注者 们。 屏幕另一头,线上观众在弹幕里叫好不断,一整天都维持在热度高位。 来,跟着量子位碳基编辑一起,把这场大会抛出的关键信号好好捋一捋。 2025年的AI,在发展,在分裂,在重构,迫使所有参与者给未来一个明确站队方向。 今天的MEET2026智能未来大会舞台,把所有力量&分歧&野心&机会同时摆上桌面。 从云到端,从模型到Agent,从软到硬,在这 ...
仿真数据也能Scaling!虚实结合训练,端到端性能全面提升|中科院x港大x小米汽车
量子位· 2025-12-11 09:33
来自香港大学OpenDriveLab、中科院自动化所、小米汽车的联合团队提出了一种解决方案—— SimScale 。 自动驾驶数据荒怎么破? OpenDriveLab 投稿 量子位 | 公众号 QbitAI 该方案 通过真实世界仿真生成关键场景,以及真实仿真协同训练策略,首次揭示了自动驾驶仿真数据的规模效应 。 现实世界难以提供足够的关键与长尾场景,采集到的大多是价值有限的常态片段,导致 数据越多、提升越难 。 因此,自动驾驶的瓶颈不在规模,而在缺乏能系统生成关键场景并支撑大规模训练的新路径。 无需更多真实数据, 只靠扩大仿真数量,一样能持续突破任何端到端驾驶模型的性能上限 。 为什么要有SimScale? 因为让大模型屡创新高的Data Scaling,在自动驾驶场景中失灵了—— 为此,SimScale应运而生。 什么是SimScale? SimScale是一个能"无限扩张世界"的仿真生成框架,通过高保真神经渲染,自动制造多样化反应式交通场景与伪专家示范。 它也是一套让仿真与真实"相互增益"的训练策略,使各种端到端模型都能越训越强,鲁棒性与泛化性全面提升。 它还是一份首次系统揭示自动驾驶仿真规模效益的"实践 ...
Meta公开抄阿里Qwen作业,还闭源了...
量子位· 2025-12-11 09:33
文章核心观点 - Meta公司计划于明年春季发布一款代号为“Avocado(牛油果)”的闭源AI模型,标志着其从长期坚持的开源战略向闭源模式进行重大转变 [1][2][3][10][11] - 这款闭源模型在训练过程中使用了包括阿里巴巴Qwen在内的第三方开源模型进行优化,此消息刺激阿里巴巴美股盘前一度上涨4%,收盘涨幅2.53% [4][5][6] - Meta的战略转向源于其开源路线的挫折(如Llama 4的失败)以及内部权力结构的重组,以新任首席AI官亚历山大王为代表的闭源拥护者掌握了AI话语权 [11][22][31] Meta的战略转向与“牛油果”模型 - Meta预计在明年春季发布代号为“牛油果”的新AI模型,该模型将是闭源的 [2][10] - 此举意味着Meta进行了一百八十度的战略转向,放弃了其长期以“开源”为核心叙事、并自比“AI时代的安卓系统”的发展路线 [11][12][14] - 新模型在训练过程中使用了多款第三方模型进行优化,其中包括阿里巴巴的Qwen、谷歌的Gemma以及OpenAI的gpt-oss [13][16] - 计划走向闭源的Meta,通过使用开源模型来训练自己的闭源模型,这一做法被解读为印证了当前开源阵营的崛起 [13] 市场反应与行业影响 - 彭博社关于Meta使用阿里巴巴AI训练闭源模型的消息引发市场强烈反应,阿里巴巴美股盘前一度上涨4%,收盘涨幅2.53% [6] - 市场观点认为,此事件凸显了阿里巴巴等公司在开源AI领域的领先地位和影响力 [9][15] Meta内部重组与权力更迭 - 2025年4月,Llama 4的发布未能达到预期,且陷入榜单排名“作弊嫌疑”的争议,成为一次重大挫折 [22] - Llama 4失败后,Meta公司高层开始下达“少谈开源,少提Llama”的指令,并逐步边缘化相关团队成员 [22][28] - 公司进行了大规模重组和裁员,FAIR实验室整组被裁,包括研究科学家总监田渊栋在内的开源路线支持者离职 [28] - AI领域的知名人物LeCun于11月离职,原因之一是Meta不再为其提供足够资源,离职前内部甚至要求员工“雪藏”他及其开源理念 [29][30] - 随着田渊栋、LeCun等人的离开,新任首席AI官亚历山大王彻底掌控了Meta的AI话语权,他是闭源模型的坚定拥护者 [21][31] - 亚历山大王通过一笔高达143亿美元的交易从Scale AI加入Meta [23] - 扎克伯格如今将自己定位为“王的导师”,并将公司最重要、最烧钱的产品项目之一亲自交到亚历山大王手上 [32] “梦之队”的组建与TBD实验室 - Llama 4失败后,扎克伯格亲自挂帅开启“梦之队”招聘计划,为顶尖AI人才提供高额薪酬,年薪一度飙到数亿美元 [23] - 扎克伯格求贤若渴,甚至亲自带着自己煮的南瓜汤上门游说OpenAI的核心研究员 [25] - 这批招募来的明星研究员组成了Meta的“超级智能实验室”旗下的TBD Lab,该实验室是此次战略转折的重要操盘手 [20][26] - 扎克伯格对TBD Lab极为看重,投入大量时间,并将该团队成员安排在自己办公桌附近以便随时了解进展 [27][33]
乐奇Rokid这一年,一路狂飙不回头
量子位· 2025-12-10 20:02
梦瑶 发自 凹非寺 量子位 | 公众号 QbitAI 2025的硬件战场一开局就跑偏到眼镜上,而冲到最前面的,叫 乐奇Rokid 。 据IDC预测,2025年中国智能眼镜出货量预计同比暴涨107%,冲到275万台,手机厂说要重做交互,创业公司跟着一起涌过来,连车企都忍 不住来占个"眼镜位"。 满地都是新品,满眼都是入局者,智能眼镜正从极客玩具变成一门真正的抢手生意,在这场从年初卷到年尾的百镜混战里,有一家创业公司始 终稳稳站在「节奏」的前面。 今年2月, 乐奇Rokid 创始人 祝铭明 一句"发言稿就在我的眼镜里"让乐奇Rokid火爆出圈,之后Rokid Glasses五天售出 4万台 的渠道成 绩、Kickstarter 401万美元 的众筹纪录,像连环重拳一样砸进行业里。 不到一年, 乐奇Rokid 在产品、生态、全球化上的几次关键落子,让智能眼镜这条赛道的节奏和坐标系都悄悄换了版,越来越多厂商开始不 自觉地对齐它的路径。 而 乐奇Rokid 的2025,比这一串数字呈现的故事,更完整,也更耐看。 今年智能眼镜的路子被乐奇Rokid跑明白了 今年看一轮又一轮的智能眼镜新品,会发现行业的重心已经悄悄换了方向 ...
这是2025年度AI十大趋势,4个维度10大结论,“开源AI进入中国时间”
量子位· 2025-12-10 18:54
组委会 发自 MEET2026 量子位 | 公众号 QbitAI 刚刚,《2025年度AI十大趋势报告》在 MEET2026智能未来大会 上正式发布。 报告由量子位智库打造,基于对全球AI技术发展、产业应用和社会影响的深度调研与分析,全面呈现了人工智能领域的最新现状与未来发展趋 势。 十大趋势重塑AI发展格局 报告指出,2025年AI正从"工具时代"迈向"伙伴时代",其发展将深刻重塑经济结构、社会形态和人类生活方式,并有十大关键趋势结论: 算力基建化:数据中心需求狂飙,算力经济是智能产业第一大引擎 芯片AI化:AI原生需求重塑芯片创新,大市场大生态打开时代芯机遇 预训练决定大模型格局梯队,架构创新决定预训练水平 大模型落地进入推理时间,推理需求倒逼模型创新 信息AI应用期,物理AI研发期,具身智能成合流风口 AI重塑流量入口:PC互联网、移动互联网、Agentic互联网 多模态成AI应用落地关键:视频、3D、代码依次展现生产力 AI硬件百端齐放:PC手机汽车眼镜玩具,焕脑正当时 AI4S突破加速AGI实现,AI数理化触及博士水平 开源AI进入中国时间,AGI拥有中国路线 报告通过对十大核心趋势的系统梳理,为企 ...