空间智能
搜索文档
中美AI巨头都在描述哪种AGI叙事?
腾讯研究院· 2026-01-14 16:33
文章核心观点 - 2025年人工智能领域的技术发展标志着“暴力美学”时代的终结,行业从单纯依赖堆砌参数转向深化基础研究,以突破通用人工智能的瓶颈 [5] - 技术进步主要集中在流体推理、长期记忆、空间智能和元学习四大领域,旨在解决模型在即时推理、长期记忆和视觉处理等方面的能力偏科问题 [6] - 通过测试时计算、新型记忆架构、世界模型和元学习等方向的突破,行业在“补短板”方面取得了显著成功,为模型能力的整体提升和未来演进奠定了基础 [7] 流体推理的进化 - **测试时计算的范式革新**:智能被重新定义为不仅是参数的函数,也是时间的函数,以OpenAI o1和DeepSeek R1为代表的模型通过在推理阶段投入更多计算资源进行“慢思考”,实现了推理能力从0到8的质变 [11][12][13] - **强化学习工程优化**:强化学习在提升推理能力中扮演关键角色,其工程可拆分为探索策略、评分系统和参数更新算法三部分,2025年后两部分有明显发展 [15] - **评分系统革新**:基于可验证奖励的强化学习和稀疏奖励指标全面崛起,通过给予模型对错结论作为奖励信号,使其能自发探索推理过程,大幅提升了在数学、代码等领域的能力 [16][17] - **参数更新算法革新**:GPRO算法流行,它通过让模型生成一组答案并计算平均分来替代传统的评论家模型,节省了50%的显存,成为国内各家公司在2025年延展的基础框架 [19] - **强化学习存在天花板**:研究发现强化学习的性能增长符合S型曲线而非幂律,存在性能天花板,但其工程实践(如使用长思维链和大批量大小)已变得更加精确和可预测 [21][23] 记忆与学习 - **记忆能力是短板**:长期记忆存储是通往通用人工智能得分中仍为0的能力分支,缺乏记忆导致模型无法在现实中自我学习,且个性化体验难以实现 [25][26] - **Titans架构突破**:这是一个深度的神经长期记忆模块,能在推理时实时更新自身参数,根据输入信息的“惊奇度”决定存储内容,并引入遗忘机制,从根本上挑战了Transformer的无状态假设 [28][29][30][31] - **Nested Learning架构**:将模型参数按低、中、高频率分层更新,使整个模型参数非冻结,能够持续学习和保有长期记忆,其成本低于传统的监督微调和强化学习方法 [31][33] - **RAG的模型化演进**:检索增强生成系统从静态资料库演变为具备反思与进化能力的系统,例如ReMem引入了“行动-思考-记忆-优化”的全链路处理,能对记忆进行修剪、重组和清理,实现经验复用 [35][36][38] - **克服灾难性遗忘**:通过稀疏记忆微调等方法,模型在注入新知识时仅更新部分参数槽位,在TriviaQA任务中仅导致11%的旧知识遗忘,远优于全量微调的89% [39][40] - **策略蒸馏进步**:在策略蒸馏结合了强化学习的采样和监督微调的密集反馈,让学生模型在自己的“犯错分布”中学习,提供了一种低成本且避免遗忘的参数更新方式 [42] 空间智能与世界模型 - **视觉处理能力提升**:在Sora 2、Veo 3等视频生成模型爆发的推动下,视觉处理能力从2024年的0分提升至2025年的5分,模型开始展现出对物理规律的掌握 [45] - **自监督生成模型的缩放定律**:视觉自回归模型和扩散Transformer被证实遵循特定的缩放定律,例如DiT模型对批量大小和学习率高度敏感,但遵循特定定律后能力可大幅提升 [46][47] - **原生多模态的优势**:研究发现,尽管训练效率较低,但原生多模态架构在参数利用率上可能比晚期融合架构有更高的性能上限 [49] - **VAE的替代方案**:SVG模型通过直接用图像理解模型代替变分自编码器,统一了语义空间,据称训练效率提升6200%,并在多项指标上击败了扩散Transformer和SDXL [50] - **符号主义的世界构建**:以李飞飞团队Marble平台为代表,其基于3D高斯泼溅等技术,从多模态输入生成可探索的3D空间表示,追求更稳定和可控的生成效果 [53][55][56] - **预测即理解的路径**:Meta的V-JEPA 2通过预测被遮挡的视觉内容来学习物理规则的表征,在使用超100万小时视频训练后,模型展现出了反事实预测的能力 [57][58][59] 元学习 - **元学习的核心价值**:赋予模型“学习如何学习”的能力,使其能通过少量样本快速适应新问题,是实现低成本快速适应和应对未知世界的关键 [62][63] - **对上下文学习的重新审视**:有研究认为上下文学习可能只是激活了预训练知识而非真正学习,这与元学习理念不同,但2025年出现了利用改进的上下文框架进行元学习的新尝试 [64][65] - **测试时计算催生隐式元学习**:研究证明模型在推理时的长思维链探索本质上是寻找最优路径,通过优化探索策略(如最小化累积遗憾)可以引导模型学会如何分配算力进行有效思考 [66][69] - **显式元学习系统的探索**:例如DiscoRL系统,通过内外双层循环让AI自主发现学习算法,其发现的Disco57算法在雅达利基准上击败了人类设计的顶级算法,并展现出强大的泛化能力 [70][72] - **中训练路径**:介于预训练和强化学习之间,让智能体通过自主探索产生后果并反思,以建立因果模型,在复杂环境中的成功率平均提升9.6% [72][73] 其他关键技术进展 - **对抗数据与算力瓶颈**:行业通过混合专家模型、合成数据与强化学习结合来突破瓶颈,例如利用DeepSeek-R1生成的长思维链数据对小模型微调,效果优于人类专家编写的数据 [81][82] - **数据质量重于数量**:研究表明数据达到一定规模后存在冗余,筛选前10%最长、最复杂的推理路径样本进行训练,其效果可匹配甚至超越全量数据集 [83] - **合成数据与模型崩溃**:大规模使用合成数据可能导致模型崩溃,但通过自我验证机制过滤(如设定置信度阈值)或使用另一个模型作为裁判进行清洗,可以有效缓解此问题 [85][86] - **小模型能力的飞跃**:蒸馏技术的进步是关键,包括针对混合专家模型的特化蒸馏方案(学习所有专家的“暗知识”)以及思维融合蒸馏(提取多个教师模型的稳健推理逻辑) [88][90][92] - **注意力机制演进**:多头潜在注意力及其变体普及,用于降低显存占用;线性注意力通过混合架构(如Kimi Linear的3:1设计)在性能上首次全面超越全注意力,并在1M上下文解码时吞吐量达到全注意力的6.3倍 [94][96] - **连续空间建模**:大型概念模型和连续自回归语言模型等尝试打破离散词元的限制,通过预测连续概念向量来提升语义带宽和推理速度 [97][100] 2026年可能的技术方向 - **记忆工程化实践**:记忆技术预计将在2026年迎来大规模工程化落地,涉及架构层革新或现有RAG、监督微调技术的精修,以实现持续学习和个性化智能体 [103][104] - **标准架构变革**:模型架构可能向分区、分层、增加功能层(如记忆层)的混合架构演进,以更贴近人脑运作模式,补齐能力短板 [105][106] - **自进化AI的探索**:在记忆、合成数据和元学习等技术完善的基础上,能够让AI进行自我对弈、自我算法优化的自进化研究将在2026年产生更多可能性 [107][112]
李飞飞引领空间智能革命 五一视界(6651.HK)卡位物理AI赛道
中金在线· 2026-01-14 15:33
行业趋势与核心观点 - 空间智能是AI发展的核心方向,其价值在于让AI建立对物理世界的理解、预测与主动交互能力,实现从“理解文字”到“交互世界”的跨越 [1][2] - 斯坦福大学教授李飞飞在CES 2026上展示的技术突破,基于少量手机图像快速生成持久存在、可导航且物理一致的三维虚拟世界,揭示了该领域的商业化前景 [1] - 空间智能技术可广泛赋能机器人模拟、游戏开发、智能驾驶等多个领域 [2] - 中国科技企业五一视界已构建全链条物理AI闭环生态,为空间智能的规模化应用提供了成熟范本 [1] 公司技术生态与战略 - 公司长期深耕“物理AI”战略,其技术方向与李飞飞强调的空间智能核心高度相似 [2] - 公司已构建“合成数据-空间智能模型-仿真训练平台”的全链条物理AI闭环生态,在商业化落地中走在行业前列 [2] - 公司的物理AI生态已在智能驾驶、交通枢纽、智慧工厂、智慧能源等多个领域落地标杆案例,将技术价值转化为产业效能 [5] 合成数据能力 - 合成数据的质量与技术路径是空间智能落地的核心基础 [3] - 公司凭借多年数字孪生重建经验,积累了海量高质量3D资产库,并掌握了行业内全面的合成数据技术路径,涵盖物理仿真及图形渲染、3DGS/4DGS辐射场重建、世界模型生成路线,是中国少数掌握全栈路径的企业之一 [3] - 公司生成的合成数据严格遵循真实世界物理规律,光照、材质、碰撞反馈及动态交互均高度还原现实 [3] - 公司合成数据真实率达90%,场景可控性与多感知一致性均实现100%,动力仿真、激光雷达仿真、摄像机仿真的可信度分别高达95%、95%及90% [3] 空间智能模型架构 - 公司在空间智能模型构建上创新性采用3DGS+空间智能模型双引擎架构,定义了空间智能体构建与演进的新范式 [4] - 该架构能创建高保真数字孪生环境,并为智能体打造具备“理解-规划-预测-反馈”能力的强化学习环境 [4] - 公司于2025年8月推出的Clonova空间智能交互平台,具备强大的上下文感知及个性化内容生成能力,能“算空间+知物理”,具备类似人类的逐步推理能力,形成“感知-决策-生成”的自主闭环 [4] 仿真训练平台与落地实践 - 仿真训练平台是空间智能落地的关键载体 [4] - 公司基于海量真实数据构建高置信度仿真环境,实现了从传统图形仿真到数据驱动的跨越 [4] - 通过引入4DGS重建+生成技术,其下一代仿真技术体系让基于真实数据的闭环仿真成为可能,可高效支持智能体的强化学习训练 [4] - 在自动驾驶领域,公司已赋能全球超百家智驾主机厂、Tier1、检测机构、高校及科研院所提供仿真训练闭环解决方案 [4]
商道创投网·会员动态|流形空间·完成超亿元天使+轮融资
搜狐财经· 2026-01-14 00:19
公司融资与估值 - 流形空间于近日完成超亿元天使+轮融资 融资由君联资本和同创伟业领投 哈勃投资等多家机构跟投 [2] 公司背景与团队 - 流形空间成立于2025年5月 是一家专注于通用空间世界模型研发的高科技企业 [3] - 公司创始人武伟博士曾是商汤科技早期核心成员 主导过开悟世界模型的研发 [3] - 投资方君联资本认可团队的专业背景和执行力 认为其为项目未来发展提供了有力保障 [5] 核心技术产品 - 公司核心产品为WorldScape模型 该模型通过海量第一人称视角视频数据进行预训练 能够预测并模拟空间内的物理反馈 [3] - WorldScape模型旨在使机器人从旁观者变为改造者 [3] - 公司在低空经济领域取得显著进展 其AirScape子模型能让无人机在复杂场景下实现自主穿梭 [3] - 投资方认为WorldScape模型在空间智能领域具有创新性 并已展现出强大的技术壁垒 [5] 融资用途与战略规划 - 本轮融资将主要用于技术研发与产品迭代 以进一步优化WorldScape模型的性能和应用场景 [4] - 融资还将用于加大市场拓展力度 推动产品在更多行业的落地应用 以提升市场占有率 [4] 行业环境与投资逻辑 - 当前政府出台了多项政策支持人工智能与机器人技术的发展 行业从业者正推动技术从实验室走向市场 [6] - 投资方君联资本认为公司的技术实力和市场潜力是吸引投资的关键因素 其在低空经济等领域的成功应用展现了商业价值 [5] - 创投机构管理人对流形空间的技术创新高度认可 出资人期待基金管理人能够在该领域精准布局 [6] - 本轮融资被视作空间智能领域的重要事件 [6]
从洗碗工到“AI教母”,她又预言了下一个十年
36氪· 2026-01-13 15:31
文章核心观点 - 人工智能领域的顶尖科学家李飞飞提出,AI发展的下一个关键方向是“空间智能”,她认为大语言模型受限于语言本身,而真正的智能机器需要理解物理世界的深度、距离、遮挡与重力等空间信息 [1] - 李飞飞创立的World Labs于2025年末发布了首款商用“世界模型”Marble,该公司在2024年成立后融资超过2.3亿美元,估值超过10亿美元 [2] - 李飞飞的职业生涯贯穿了AI从实验室到产业爆发的全过程,其推动建立的ImageNet数据集被视为结束了人工智能寒冬并开启了AI黄金时代的关键,如今她正致力于构建一个新时代的“ImageNet”以推动空间智能发展 [2][6][9][10] 李飞飞的个人背景与职业生涯 - 李飞飞16岁随父母移民美国,家境困顿,曾在餐馆打工时薪2美元,每天只睡4小时学习,最终以SAT 1250分、数学满分的成绩获得普林斯顿大学物理学全额奖学金 [3][4] - 她在加州理工学院攻读博士时,同时研究神经科学和计算科学,专注于让机器学会“看”的视觉研究领域 [5] - 其职业生涯经历了从学界到产业的转换,曾担任斯坦福人工智能实验室(SAIL)主任,并于2017年加入Google Cloud担任AI/ML首席科学家兼副总裁 [9] ImageNet的创立与行业影响 - 在2005-2009年的人工智能寒冬期间,李飞飞坚信数据是AI质变的关键,决心构建一个涵盖“全世界所有物体”的庞大图像数据库,即ImageNet [6] - 项目初期面临巨大困难,手动标注需90年,后借助亚马逊众包服务解决了海量图像标注的效率难题 [8] - 2009年,ImageNet论文亮相,数据库包含5247个类别、320万张标记图片 [8] - 2012年,AlexNet模型在ImageNet挑战赛中以领先第二名41%的优势夺冠,将Top-5错误率从26%降至15%,证明了优质数据预训练的重要性,该时刻被视为AI发展史上的“奇点”之一 [9] - 李飞飞免费开放ImageNet数据库,推动了深度学习闸门的打开,被誉为结束了AI寒冬并拉开了人工智能黄金时代的序幕 [9][10] 对AI发展趋势的判断与空间智能 - 李飞飞指出大语言模型(如ChatGPT)存在局限性,受制于语言本身,而“语言即世界”是一种偷换概念,信息不仅包括语言,还包括空间信息 [1][10] - 她认为AI的下一个十年是“空间智能”,若AI无法理解物体的深度、距离、遮挡与重力,就永远无法真正“具身” [1] - 其判断源于长期的跨学科研究,包括认知神经科学、计算机视觉以及对生物视觉起源的思考 [1][5] - 空间智能被视为实现通用人工智能(AGI)所需的多把钥匙之一,AGI的发展是一个渐进的过程 [12] World Labs与空间智能的研发进展 - 李飞飞于2024年创立World Labs,开始研发空间智能,并于2025年末发布了首款商用“世界模型”Marble [2][11] - 她承认生成三维空间在技术上存在挑战,目前仍处于早期阶段,但笃定未来一到两年内空间智能会爆发 [11] - 该公司的目标是构建一个能够理解并生成三维物理世界信息的模型,类似于为新时代打造一个“ImageNet” [10][11]
2025,AI行业发生了什么?
经济观察报· 2026-01-12 19:48
文章核心观点 AI行业在2025年进入“下半场”,发展重点从单纯追求模型规模和算力,转向重新定义问题、重塑评估方式及探索更优发展路径[4]。行业呈现出多模态融合、具身智能爆发、算力竞争升级、范式争议涌现、智能体崛起、开源生态繁荣、商业模式革新、治理规则博弈、大国竞合加剧以及年轻技术领袖掌权等十大趋势,标志着AI技术正从能力展示阶段迈向与产业深度融合的效率兑现阶段[5][6][31]。 多模融合 - 多模态AI发展从“拼装式”组合方案转向设计“原生多模态”模型,从训练之初就让模型在统一体系内处理文本、图像、音频、视频等信息[8] - 下一代AI的突破重点在于构建对真实世界的内部模型,即“世界模型”与“空间智能”,使AI能进行可推理、可行动的统一表征,并在脑中“预演”行动后果[9][10] - 多模态模型成为头部企业主战场,能力从“能看图”推进到“看得准、看得全、看得懂流程”,并能将视觉理解转化为可执行动作,越来越多地介入真实任务本身[10] - 据Gartner预测,到2030年,**80%** 的企业软件将在其产品中植入多模态AI能力[10] 具身爆发 - 具身智能(Embodied AI)在2025年真正走向市场,行业叙事从“能不能做到”转向“规模化、稳定工作、进入岗位”[12] - 国内外企业如宇树、优必选、波士顿动力、Apptronik等明确宣布产品进入量产与商业化试点阶段,按“百台级”、“千台级”规划供应链[12] - 据IDC估算,2025年全球在仓储、制造、巡检等岗位的试点应用,较2024年增长了**数倍**[12] - 人形机器人成本显著下降,据美国银行研究院数据,典型价格已降至每台约**3.5万美元**,比2023年下降至少**40%**[13] 算力竞争 - 算力竞争从“规模导向”的资本驱动资源争夺,升级为“效率导向”的长期综合博弈[16] - 部分公司如谷歌通过自研TPU芯片,在核心模型训练中大规模替代GPU,以降低对英伟达的依赖并构建自主算力体系[16] - 算力设施全面“基础设施化”,智算中心围绕AI负载设计,网络拓扑以并行训练为核心,选址需评估电力、能耗与时延[17] 范式争议 - 理论界对持续投入算力的理论基础——“规模法则”出现系统性反思,认为单纯扩大自回归大模型不会自然通向通用智能,且面临收益递减[19] - 反对者(如杨立昆、安德烈·卡帕斯、伊利亚·苏茨克维)认为未来突破更可能来自训练范式、数据结构与推理机制的创新,而非参数规模本身[19][20] - 支持者(如德米斯·哈撒比)认为规模仍是多模态和复杂推理任务的重要前提,通向更高智能需在世界模型、规划与推理结构上进行方向修正[20] 代理崛起 - AI智能体(Agent)在2025年崛起,代表产品如Manus,能够理解目标、拆解任务、调用工具并执行操作,全程无需人工干预[22] - 智能体改变了人机交互方式,从“人去找功能”转向“任务驱动系统”,显著降低了学习和使用成本[22] - 智能体的成熟得益于大模型推理能力增强以及MCP、ANP、A2A等协议使工具调用与外部系统接入标准化[23] - 智能体将重组业务流程,使组织结构从围绕“人”设计转向围绕“任务”组织,商业模式可能从按调用量付费转向按任务与结果付费[23] 开源盛世 - 开源模型在2025年从边缘力量演变为全球创新的基础设施,在性能、生态与采用率上全面逼近甚至部分超越闭源模型[26] - 近两年新发布的大模型中,开源或“开放权重”模型已占据多数,在私有部署、微调和智能体等场景中占据主导[26] - 中国力量在开源生态中表现突出,以DeepSeek与Qwen为代表的模型在工程效率、推理成本与可部署性上形成优势,2025年全球开源模型使用中,中国来源已接近**三成**[27] 商业革新 - AI行业在2025年摸索出新的商业路径,形成分工清晰的产业生态,从单一技术竞赛转向“效率兑现”[29][31] - 技术底层:算力、训练与推理被标准化为可计量的“生产要素”,通过算力租赁、API与推理服务形成稳定收入,单位成本下降、单位调用价值上升[30] - 平台服务层:“结果作为商品”(OaaS)模式崛起,定价转向按任务、流程或结果收费,成为利润潜力最大、竞争最激烈的地带[30] - 应用层:垂直行业价值释放,AI深度嵌入软件开发、企业运营、金融分析等业务流程,成为企业的长期系统投入[30] 规则博弈 - AI治理在2025年全面展开,核心矛盾在于创新与规则之间的横向张力,以及不同制度体系之间的纵向博弈[33] - 治理从“静态合规”转向“动态校准”,通过分层、分阶段、可调整的方式(如“沙盒”、“分级管理”)与技术演进保持同步[33] - 全球主要经济体治理路径分化:美国倾向将治理视为“护栏”,优先关注国家安全与极端风险;欧盟强调通过系统化规则塑造发展方向;中国强调发展秩序与场景适配,规则与产业推进同步调整[34] 大国竞合 - AI国际竞争从企业层面上升到国家层面,围绕技术路径定义权、芯片与算力供应链掌控权以及标准制定权展开[36] - 美国在核心技术(如问题定义权、模型性能)和高端芯片设计、软件生态上保持主导[36] - 中国路径强调在既有技术框架下,通过工程优化、系统集成和真实场景反馈,在训练效率、算力调度、具身智能与产业级应用上形成优势[36] - 欧盟通过基础研究网络、跨国科研项目与评测体系在关键概念与方法论层面保持影响力[36] - 竞争格局呈现“高强度竞争中的有限合作”,较量核心在于谁能构建并长期运转一整套技术与产业体系[37] 少帅掌兵 - 2025年AI行业出现年轻科学家被赋予指挥权的趋势,一批三十岁出头甚至二十多岁的技术领袖开始直接影响公司工程架构与战略路径[38][39] - 代表性案例包括腾讯任命27岁的姚顺雨为首席AI科学家,小米启用“95后”罗福莉负责核心研发,Meta引入Scale AI创始人亚历山大·王担任首席AI官[39] - 这一趋势反映了AI进入“下半场”后发展逻辑的变化:技术边界从把模型做大转向重新定义问题与评估方式,更需要来自一线、敢于快速试错的年轻技术派[4][39]
亿道信息(001314) - 2026年1月12日投资者关系活动记录表
2026-01-12 18:28
公司业务概览 - 公司是一家以产品定义和研发设计为核心的智能电子产品及解决方案提供商 [2] - 公司主要业务分为加固智能终端和消费类智能终端两大类产品 [2] 产品线详情 - 加固智能终端形态包括加固笔记本电脑、加固平板、加固类手持终端及各式加固工控产品 [2] - 加固智能终端已应用于智能制造、交通运输、能源勘探、公共事业等多样场景 [2] - 消费类产品包括PC、平板、AIoT及XR/AI穿戴类产品 [2] - 消费类产品主要服务全球区域性龙头品牌及企业客户 [2] - 公司可为客户提供从方案设计、产品研发到整机服务的全流程服务 [2] 研发与销售重点 - 公司旗下亿道数字(亿道研究院)专注于人工智能、感知技术、空间智能领域,旨在推动人机交互进步 [3] - 目前产品结构中,笔记本电脑系列的销售收入占整体营业收入比重较高 [3]
华为鸿蒙智家闵登峰:“好房子”时代空间智能提升住宅产品力构建消费者持续关怀|产品力100峰会后记
克而瑞地产研究· 2026-01-12 13:06
行业趋势:住宅智能化加速渗透 - 精装房智能化配套率从2020年的5%跃升至2024年的30%,预计2025年达到40%左右[5] - 华为鸿蒙智家C端智能化签单占比从2021年的0.1%快速增长至2025年的33%,五年实现数百倍增长[5] - 地产新建住房的智能化已成为不可逆转的趋势,并形成了行业共同成长的良性生态[5] 空间智能核心特质:从“控制工具”到“主动管家” - 传统智能家居存在功能单一、被动响应、数据孤岛、无法持续升级等痛点,本质仍是“控制工具”[6] - 真正的空间智能需具备四大特质:简单易学、体验可预期、具备智慧感知与意图理解能力、可进化成长[6] - 实现目标需以360°全场景包裹消费者,覆盖不同生活节律与家、小区、办公室等空间的无缝衔接[6] 空间智能三大核心技术方向 - 感知是基础,需构建“空间建模 + 环境感知 + 用户画像”的立体体系,实现全屋可视、环境数据捕捉与用户习惯匹配[6] - 交互是桥梁,打造“自动 + 语音 + 触控”多元体验,华为鸿蒙智家用户语音月活率超97%,老人和孩子是核心使用者[7] - 生态是关键,核心在于“集成”而非单纯连接,注重跨品牌、跨品类深度集成,甚至将智能衣柜、可变墙体等空间本体纳入生态[7] 华为鸿蒙智家的行业实践与未来展望 - 华为已与华润、华发等全国超10家TOP地产企业共建共创,打造了数字孪生系统、“科技会所+智慧社区+智能家居”等标杆方案[8] - 通过预开发与预集成,将空间智能深度内嵌于住宅产品,形成从入门到全屋的全场景智能体验[8] - 未来发展方向是实现“高可靠 + 可成长”的持续服务能力,通过产品升级、生态开放、软件迭代,让智能逐步成为与水电同等重要的住宅标配[8] - 空间智能的终极价值在于以隐形技术构建持续关怀的居住空间,推动“好房子”时代加速到来[8]
当AI拥有了“空间脑” ——读《空间智能》
上海证券报· 2026-01-12 02:51
空间智能的概念与理论框架 - 空间智能被定义为融合感知、理解、推理和行动于一体的完整认知系统,超越了传统计算机视觉的局限 [2] - 其核心框架由三大支柱构成:作为基础层的三维感知、作为核心层的空间推理以及作为表达层的多模态生成 [2] - 三维感知强调对深度、体积、位置和姿态等空间属性的全面理解,超越了二维图像处理 [3] - 空间推理使系统能够进行物理规律推断和因果关系分析,涉及对空间关系、物理交互和时间演化的深度理解 [3] - 多模态生成赋予系统基于空间理解创造新内容和行为的能力,例如根据一句指示生成三维建筑模型 [3] 技术演进与发展路径 - 空间智能技术遵循从“单一感知”到“整合理解”,最终迈向“创造性交互”的演进路径,类比人类认知发展过程 [4] - 技术发展经历了从二维静态处理,向二点五维、三维,最终向包含动态物理属性的四维表示的演进 [4] - 四维表示整合了时间维度,使系统具备预测和推理能力,例如预测一个球从桌上滚落后的物理行为 [5] - 技术发展特征表现为从静态重建到动态交互的深化,从简单识别到深层次场景理解的跃迁 [5] - 现代空间智能系统的核心突破在于“场景理解”,即理解物体之间的关系、功能和潜在交互方式 [5] 产业发展与投资周期 - 产业投资热潮可置于技术革命发展周期中解读,2016年前后的VR投资热潮被视为“安装期”的典型表现 [6] - 投资周期经历了变化:2010年代初期为VR第一波热潮,2017年至2019年转向AR企业级应用,2020年后因远程协作需求和芯片技术进步进入更成熟阶段 [6] - 投资主体呈现多元化,包括传统风险投资、企业风险投资、政府基金和战略投资者 [6] - 平台布局能催化生态繁荣,形成“平台投资—创业活跃—用户增长—平台升级”的正向循环,即“创新飞轮”效应 [7] - 以苹果Vision Pro为例,其1亿美元的开发者基金和技术实验室网络吸引了开发者并孵化了初创公司,如三维内容平台Polyspatial在6个月内完成2500万美元A轮融资 [7] 商业化模式与应用案例 - 商业模式呈现多样性,例如Matterport采用“硬件补贴+服务订阅”模式以降低空间数字化门槛 [7] - 在医学领域,使用HoloLens进行医学培训的学生错误率降低40%,学习效率提高35% [9] - 在教育领域,芬兰的空间智能课程试点项目显示,学生在空间思维、学科知识理解和创造性问题解决等方面能力有显著提升 [9] - 增强现实(AR)等技术在应用中仍面临设备重量、续航限制、视野范围局限、工作流整合和用户接受度等现实挑战 [9] - 技术普及也带来隐忧,如设备使用引起的不适感、教师培训需求、技术设施差异导致的教育不平等 [9] 人机协同新范式与未来展望 - 人机关系正经历从简单辅助到深度融合的根本性转变,重新定义人类与智能系统的关系 [8] - 前沿研究如麻省理工的Mosaic系统和DeepMind的Project Insight表明,人类与机器可通过优势互补形成能力增强的整体系统 [10] - 人机协同系统的设计核心原则包括意图理解、适应性辅助和自然交互 [10] - 触觉反馈技术和情绪计算的引入,使机器能感知情绪并提供逼真物理反馈,推动协同走向更深层次 [10] - 研究显示约65%的用户在使用人工智能系统初期表现出不恰当的信任水平,技术设计需考虑人类心理和行为特点 [10] - 空间智能被视为人类认知宇宙、理解宇宙乃至与宇宙互动的全新范式,将重塑人类与宇宙的关系 [11]
深度|AI教母李飞飞:AI绝对是一种文明级技术;人们正在忽视“人”在AI中的重要性
Z Potentials· 2026-01-10 11:49
文章核心观点 - 李飞飞博士的成长经历、学术背景与人文思考共同塑造了她对人工智能发展的独特视角,她强调AI的发展史是集体智慧的结晶,而非单一英雄的旅程 [9][27] - ImageNet的成功源于在正确时机提出了“大数据”的关键科学假设,并结合了众包等创新方法,其标志着现代AI诞生的关键拐点 [20][21][29] - 当前AI浪潮中,技术本身和增长被过度讨论,而“人”的核心地位——包括人的尊严、主体性和在AI发展中的发言权——被严重忽视 [38][41] - 李飞飞博士创立的WorldLabs致力于开发空间智能(spatial intelligence),这是继语言智能后下一个关键的AI前沿,旨在赋能创作、设计、机器人仿真等多个领域 [45][47][56] - 面对AI的未来,培养“学习如何学习”的能力比传统学位更重要,同时需要重新设计教育评估体系,以引导人们善用AI工具实现能力倍增 [57][58][60] 个人背景与成长经历 - 李飞飞博士的童年是一段“双城记”,在北京出生,成都长大,15岁移民美国新泽西 [13] - 其父亲热爱自然、充满童心,对成绩和奖项完全不关心,这与许多人对“中国父母”的刻板印象不同 [14] - 其母亲非常自律,要求专注,并展现了在陌生环境中生存下去的坚定信念 [16] - 高中数学老师Bob Sabella是其重要的导师,曾牺牲午休时间一对一为其补课,这体现了教育者的巨大付出 [16] - 在普林斯顿大学本科期间,她同时在校园图书馆打工(时薪约6美元)并帮助家庭经营干洗店长达七年,这段经历赋予了她关注社会各阶层的广泛视角 [8][17] ImageNet的诞生与意义 - ImageNet是一个在2007年至2009年间构建的大规模计算机视觉数据集,旨在用于训练和评估视觉智能 [20] - 其真正意义在于标志着大数据时代的关键拐点,在此之前的AI领域并未真正使用“大数据”,发展处于停滞(即“AI寒冬”) [20] - 现代AI的诞生源于三大关键要素在2012年的汇聚:ImageNet提供的大数据、GPU提供的并行计算能力以及神经网络算法 [21] - ImageNet的灵感部分来源于心理学研究,例如Irv Biederman教授关于儿童视觉学习能力的工作,体现了跨学科思想碰撞的重要性 [26] - 项目成功的关键在于将“视觉物体分类”定义为正确的科学假设,而不仅仅是追求数据规模 [29][31] ImageNet的执行与挑战 - 构建ImageNet面临的核心挑战是需要对数千万张高质量图像进行人工标注,工作量巨大 [32] - 团队最终采用亚马逊的Mechanical Turk平台进行众包,利用全球在线人力进行大规模并行处理,从而标注了数十亿张图像并筛选出1500万张高质量图像 [34] - 为确保数据质量,团队设计了多步骤质量控制机制,包括前置测试和混入已知答案的“黄金标准”图片进行隐性监控 [36] - 正确的激励机制设计对于防止标注者作弊(如在每张图都标出熊猫)至关重要 [35][36] 对当前AI发展的观察与批判 - AI是一种“文明级技术”,对美国经济影响深远,有说法称去年美国4%的GDP增长中有50%(即2个百分点)可归因于AI [38] - 当前讨论过于聚焦技术、增长与少数“天才”,而忽视了无数代科学家、工程师和跨学科研究者的集体贡献 [27][28] - 人们正在忽视“人”在AI中的核心地位:是人创造、使用并受AI影响,人也应拥有对AI发展的发言权,人的尊严不应被剥夺 [9][41] - 李飞飞博士自称为“务实的乐观主义者”,不相信乌托邦或末日论两种极端,并指出美国与西欧对AI的担忧比其他地区更甚 [43] WorldLabs与空间智能 - WorldLabs是李飞飞博士创立的公司,致力于构建下一代AI,其技术核心是开发空间智能(spatial intelligence) [45] - 空间智能是人类观察、理解并与三维世界互动的能力,例如将三明治装袋、粉刷房间或在山地徒步 [47] - 相比语言智能,AI在空间智能方面仍处于非常早期的阶段 [47] - WorldLabs的模型(代号Marble)允许用户通过文字或图片提示,快速生成可探索的三维世界,应用于舞台布景设计、电影VFX、游戏开发、教育及机器人训练模拟等领域 [48][50][51] - 该技术也在精神病学研究(如暴露疗法)中得到应用,可以低成本模拟各种触发环境 [53] 被低估的趋势与未来能力 - **空间智能的重要性被低估**:当前讨论过度集中于语言和大语言模型,而对三维世界建模的能力支撑着从娱乐、沉浸式体验到机器人仿真等广泛应用 [56] - **AI对教育的影响被低估**:AI将极大加速学习效率,可能改变以学校和学位为核心的人力资本评估体系 [56] - **AI对经济结构的复杂影响被低估**:关于AI对劳动力市场的讨论常在乌托邦和末日论间摇摆,而中间复杂、现实的过渡状态(各类岗位的深刻变化)被政策制定者和社会低估 [57] - **“学习如何学习”的能力变得至关重要**:在AI时代,个人使用工具快速学习和自我升级的能力、开放态度比传统学位更受重视 [57] - 教育评估体系需要革新,重点不应是监管AI使用,而是明确展示工具的标准与人类学习者应达到的更高标准 [60] 人文思考与教育理念 - 物理学习教会她的不仅是知识,更是提出大胆问题的勇气和热情,这后来成为其科研的指引 [9][22] - 她鼓励每个人寻找属于自己的“北极星”——即个人的梦想、使命与激情,这构成了生命力的核心 [61] - 在AI时代,教育的核心旅程之一是学会认识自己,并确立和追寻自己的北极星 [61]
高德闪电战:改变本地生活行业的 100 天
晚点LatePost· 2026-01-08 18:17
文章核心观点 - 高德地图推出的“扫街榜”产品在短时间内取得了现象级的用户和商户增长,验证了其“基于真实行为的数据决策”路径的有效性[3] - 该产品通过整合真实导航行为数据、AI技术和创新功能(如飞行街景),正在重塑本地生活信息服务的标准,并推动高德从工具向“本地生活超级入口”及“空间智能体”演进[4][13] - 公司的长期战略是将其对物理世界的深刻理解能力(空间智能)产品化为“AMAP AI Inside”,成为各类智能设备与现实世界交互的底层基座[14] 扫街榜的爆发式增长与市场验证 - 产品于2025年9月10日上线,首日用户规模超4000万,上线23天累计用户达4亿,3个月后累计用户规模超6.6亿[5] - 2025年10月,扫街榜日均活跃用户数突破7000万,超越同期日活约3100万的大众点评[3] - 上线百日内,超过86万家线下商户主动入驻,入驻商家营业额环比增长超270%[3] - 产品增长带动高德APP整体月活跃用户在2025年10月达到9.96亿的新高[4] - 产品爆发力在商家端具体可感,例如广西北海“越乡小厨”餐馆登上全国美食榜首后,国庆三天叫号数从500多号冲至800号;重庆“红九格”火锅成为“状元郎”后,100天收入超过过去半年[5] - 超过30个省市的政府单位主动与高德展开合作[5] 核心竞争优势与产品逻辑 - 核心优势在于拥有全网最大规模的真实行为数据源,如用户“专程导航前往”、“到达后复访”、“特定地点搜索”等数据,这些数据具有天然的“抗刷性”[6] - 相比传统UGC或付费内容可能被刷单,基于强意图导航行为的数据更能刻画真实的物理世界[6] - 产品增长曲线经历了“脉冲-沉淀-稳态”三阶段,标志着其从“热点工具”成功转化为“生活服务平台”[7][8] - 团队在百日内收到560万条用户反馈,并基于其中3753条具体建议完成了超过100项产品优化,形成了敏捷的“听劝”机制[8] 2026年产品升级:深化真实与降低决策门槛 - 2026年1月7日,扫街榜宣布全面升级,发布全球榜单、数千个时效动态榜单,并开放用户“建榜”的社区能力[4] - 推出“飞行街景”功能,利用自研“世界模型”AI技术,允许用户以鸟瞰视角预览街道和店铺实景,解决“空间真实”问题,实现“预演体验”[9] - 商家只需拍摄一段几十秒视频,AI即可自动高保真建模,该功能免费开放,24小时内超过20万商家预约[10] - 榜单颗粒度细化至数万道菜品和数千个细分场景,以解决用户个性化需求与客观榜单之间的矛盾[11] - 官方榜单仍以客观导航数据为唯一底座,用户自建榜单则提供个性化表达空间,两者结合旨在推动更丰富的客观共识[11] - 升级围绕三个维度:数字(更细、更广)、信任(同好、朋友)、科技(实景、空间),核心目标是呈现更全面的真实世界以降低决策门槛[11] 战略愿景:从超级入口到空间智能基座 - 高德的野心是整合数亿用户真实行为数据与理解物理世界的AI,构建本地生活的“超级入口”和一个能感知、思考并行动的“空间智能体”[13] - 公司将高德比作一个智能体:AI入口是“大脑”,飞行街景是“眼睛”,扫街榜是“判断力”,精准导航是“四肢”,从而将搜索、评价、预览和行动打通成闭环[13] - 公司战略指向“空间智能”,旨在构建一个与现实世界实时同步、能够自我进化的“活”的数字孪生世界[14] - 提出“AMAP AI Inside”战略,旨在将公司二十年来积累的对物理世界的认知能力,像云服务一样输出,成为自动驾驶汽车、配送机器人等所有需与现实世界交互的智能设备的底层空间智能引擎[14][15] - 在阿里生态中,高德定位为擅长解决“怎么去、怎么做”的行动问题,与通义千问大模型的知识能力形成深度咬合,提升阿里本地生活的整体活力[15]