空间智能
搜索文档
投资新风口:物理AI+空间智能,极智嘉-W成物理AI产业链核心标的
智通财经· 2025-11-17 17:04
行业趋势与定位 - 空间智能被定位为人工智能的下一个前沿,是推动人工智能从语言智能向物理智能跨越的核心引擎 [1] - 物理人工智能作为融合世界模型、物理仿真引擎与具身智能的系统性工程,正成为数字孪生、具身智能落地的核心基石 [1] - 智能驾驶与具身智能是物理人工智能最具想象空间的两大应用领域 [1] - 智能仓储凭借商业化落地成熟度高、场景需求刚性强、价值兑现路径清晰的核心优势,成为具身智能和物理人工智能技术走向规模化应用的核心突破口 [1] 公司技术核心与产品 - 公司被认定为物理人工智能产业链中需要理解行业知识及物理处理逻辑以实现价值变现的整机厂商核心标的 [1] - 物理人工智能的实现依赖世界模型、物理仿真引擎、具身智能控制器三大技术协同 [2] - 公司全球首发的具身智能无人拣选工作站及全流程无人拣选方案,由自主研发的具身智能基座模型驱动,采用感知-策略分层架构,实现虚拟决策到物理执行的全链路闭环 [2] - 该基座模型基于千万级仓储真实数据预训练,具备覆盖数万级库存单位且无需后训练、48小时快速部署、百毫秒级推理支持7×24小时作业等核心优势 [2] - 拣选效率较人工实现倍增,投资回报周期为1至2年 [2] 公司市场地位与商业化实力 - 公司已服务全球超过850家大客户,业务覆盖40余个国家,连续6年稳居全球最大仓储履约机器人企业领导地位 [2] - 研发团队汇聚高校博硕士人才,核心专利覆盖机器人软硬件、人工智能算法等关键领域 [3] - 公司在欧洲、美洲、亚太等关键市场建立本土团队,设有超过52个服务站点与12个备件中心,提供7x24小时技术支持 [3] - 2024年公司实现收入24.1亿元,稳居港股机器人板块收入体量首位 [3] - 2025年上半年公司录得营收10.25亿元,同比增长31.0%,经调整税息折旧及摊销前利润首次转正,达1162.1万元,成为港股机器人赛道首家达成该盈利指标的企业 [3] - 2024年整体客户复购比例达74.6%,关键客户复购率高达84.3%,2025年上半年整体复购率进一步攀升至80%以上 [3] 未来战略方向 - 随着拣选环节已实现全流程无人化,公司下一步将攻克机械手打包环节技术,向彻底实现全流程无人仓的战略目标迈进 [4] - 公司以具身智能技术为核心、全流程方案为载体、全球化服务为支撑,走出了物理人工智能商业化的仓储路径 [5] - 全流程无人仓的全面实现将进一步释放物理人工智能产业价值 [5]
李飞飞最新播客:从洞穴实验理解世界模型|Jinqiu Select
锦秋集· 2025-11-17 16:43
文章核心观点 - AI的本质是“智能”的延伸,而非“人工”,是人类理解世界能力的拓展[3][10] - 推动AI发展的核心三要素始终是数据、神经网络和GPU算力,这一组合构成了现代AI的基石[6][24][26] - 当前AI发展的关键瓶颈和未来机遇在于“世界模型”,其旨在解决机器在空间、视觉和行动上理解世界的难题,是连接语言智能与具身智能的桥梁[3][34][40] - 单纯依靠大数据和算力扩展的“苦涩教训”路径在机器人等具身智能领域可能行不通,因为面临数据难以获取、物理系统复杂性等独特挑战[4][47][48] - 公司World Labs发布的全球首个大规模世界模型Marble,展示了生成可导航、可交互三维世界的技术能力,并在影视制作、游戏开发、机器人模拟等领域展现出应用潜力[39][53][59][60] AI发展历程与驱动要素 - AI学科诞生于20世纪50年代,经历了从早期逻辑系统、专家系统到机器学习、神经网络的发展阶段[16][17] - 2006至2007年启动的ImageNet项目,通过整理1500万张网络图片和22000个概念分类,为AI提供了关键的大规模数据集[23] - 2012年成为深度学习与现代AI的开端,多伦多团队利用ImageNet数据、NVIDIA的两块GPU,成功训练出在物体识别上取得突破的神经网络[23][24] - 在2016年前后,科技公司曾因市场接受度问题而避免使用“AI”一词,这一情况在约2017年后发生根本性逆转[28][29][30] - ChatGPT的成功本质仍是数据、神经网络和GPU三要素共同作用的结果,而非技术路径的根本改变[25][26] 世界模型的概念与重要性 - 世界模型是一种基础能力,旨在让机器能够推理、互动并创造世界,其核心是从二维信息理解三维甚至四维世界的能力[3][34][41] - 与大型语言模型不同,世界模型关注的是空间智能,对于机器人、自动驾驶、科学发现(如从二维X射线衍射图推理三维DNA结构)等领域至关重要[40][44] - 公司World Labs于2022年开始布局世界模型研究,认为其与语言模型同等重要甚至互补,是AI未来的关键方向[3][39][53] - 世界模型的应用可显著提升效率,例如在影视虚拟制作领域,有案例显示其能将制作时间缩短40倍[59] 机器人与具身智能的挑战 - 在机器人领域应用“苦涩教训”(即简单模型+大数据)面临两大挑战:训练数据与输出动作难以完美对齐,以及机器人作为物理系统的复杂性[4][47][48] - 机器人训练数据稀缺,尤其缺乏体现真实三维动作的数据,网络视频虽有价值但存在对齐问题,需补充遥操作或合成数据[47][48] - 机器人更接近自动驾驶汽车,不仅需要“大脑”(算法模型),还需要“身体”(硬件)和具体的应用场景,其产品化涉及供应链、硬件成熟度等多方面因素[4][49] - 与在二维平面上运动的自动驾驶汽车相比,在三维世界中行动并操控物体的机器人面临更长的技术发展路径[49] World Labs与Marble产品进展 - World Labs由四位深耕技术研究的联合创始人资助,团队约30人,主要为研究员和研究工程师,致力于将前沿模型与产品结合[53][65] - 公司推出的产品Marble是全球首款允许通过文本或图像提示生成可导航、可交互三维世界的模型[53][54] - Marble采用点状可视化设计,旨在帮助用户理解模型运行并提升体验愉悦感,该特性受到用户积极反馈[55] - 目前Marble已应用于电影虚拟制作、游戏开发、机器人模拟训练及心理学研究等多个领域,展现出横向应用潜力[59][60] - World Labs的技术路线强调空间智能超越二维视频生成,专注于在深度空间中创造、推理和互动[63] 对AGI与未来技术发展的看法 - AGI(人工通用智能)更像一个营销词汇而非严谨科学概念,AI本身即是追求机器像人一样思考和行动的“北极星”目标[32][33] - 当前技术路径(扩展数据、算力、模型)虽能继续推进,但仍需重大创新以解决AI在抽象推理、情感智能、科学发现(如推导物理定律)等方面的不足[34][35][36] - 人类智能以极低功耗(约20瓦)完成复杂任务,这凸显了生物智能的高效性与当前AI技术的差距[52] 人才与行业生态观察 - AI领域竞争激烈,主要体现在模型、技术和高成本人才的争夺上[67][68] - 对于职业发展,建议关注自身热情、团队使命和所能产生的影响,而非过度纠结细节或盲目追逐热点[71][72] - 斯坦福以人为本AI研究所(HAI)的建立,旨在推动AI在科研、教育、政策等领域的负责任发展,并加强科技界与政策制定者(如华盛顿、布鲁塞尔)的沟通[73][74]
首款商用世界模型Marble发布,空间智能再进一步
国投证券· 2025-11-17 15:53
报告行业投资评级 - 行业投资评级为“领先大市-A” [8] 报告核心观点 - 首款商用世界模型Marble正式发布,其生成的持久化、可下载3D环境显著减少了场景变形与不一致性 [1][12] - 世界模型是以3D维度表征真实世界运行规律的AI系统,具备生成性、多模态性和交互性三种核心能力 [2][13] - 全球科技巨头在世界模型技术层取得密集突破,包括腾讯的混元3D世界模型1.0、Google DeepMind的Genie 3以及特斯拉的“世界模拟器” [3][14] - 空间智能是AI从“读写”到“构建”的关键,短期赋能创造力工具,中期有望成为机器实现真正智能的底层能力 [4][15] - 国内世界模型/物理AI产业链正在形成,建议关注相关产业链标的 [5][16] 行业重要动态与技术进步 - World Labs推出的Marble模型支持通过文字、照片、视频、3D布局或全景图生成可编辑、可下载的3D虚拟场景 [1][12] - 腾讯混元3D世界模型1.0融合全景图像合成与分层3D重建技术,支持使用者在3D场景中“沉浸式漫游” [3][14] - Google DeepMind的Genie 3能基于文本提示实时生成交互式虚拟环境,以每秒24帧、720p分辨率保持数分钟高保真度,并能回溯长达一分钟的历史时序信息 [3][14] - 特斯拉“世界模拟器”利用端到端神经网络生成高度逼真驾驶场景,用于自动驾驶与人形机器人训练 [3][14] - 李飞飞团队在空间智能领域的ReKep成果使用了奥比中光的RGB-D相机FemtoBolt,为机器人交互提供3D视觉数据支撑 [5][16] - Meta首席AI科学家杨立昆因战略分歧离职,计划创立专注于世界模型研发的新公司 [24] - OpenAI发布GPT-5.1版本,包含Instant和Thinking两个核心模型,优化了对话与推理能力 [25] - IBM发布120量子比特处理器Nighthawk,并公布2026年实用化路线图 [26] - 我国成功搭建“天衍-287”超导量子计算机,处理特定问题速度比最快超算快4.5亿倍,并即将全球开放云服务 [27] 市场行情回顾 - 本周计算机板块指数下跌3.72%,相对上证综指跑输3.54% [17][18] - 计算机板块年初至今涨幅为26.74% [18] - 本周计算机行业指数在中信30个行业指数中排名第28,在TMT四大行业中排名第2 [20] - 本周计算机个股中,ST峡创周涨幅达33.10%,位列涨幅榜首;淳中科技周跌幅为17.43%,位列跌幅榜首 [22] 投资建议与关注标的 - 建议关注奥比中光(3D视觉感知龙头) [5][16] - 建议关注智微智能(机器人大小脑控制器) [5][16] - 建议关注索辰科技(发布物理AI产品) [5][16] - 建议关注阿尔特(布局机器人赛道) [5][16]
瑞幸咖啡拟重新在美上市;段永平回应为何不买特斯拉丨Going Global
创业邦· 2025-11-16 18:53
出海四小龙动态 - 速卖通海外双11开卖当天至少有200个品牌销售额远超亚马逊日均水平达到2倍以上,其中EDIFIER、70mai、iGPSPORT等品牌销售额达亚马逊日均6到10倍[5] - 速卖通启动"超级品牌出海计划"让品牌以亚马逊一半成本实现更高成交,被业内视为唯一可能在品牌赛道与亚马逊竞争的平台[5] - TikTok Shop东南亚双11大促总交易额同比增长2.3倍,11月11日单日GMV同比激增60%创峰值纪录,平台发起超22万场直播且短视频带动GMV实现175%增长[6] - Lazada旗下LazMall在双11首日销售额较平日增长约10至11倍[6] 大公司战略动向 - 前DeepSeek研究员罗福莉加入小米参与Xiaomi MiMo推理大模型研发,致力于构建AGI(通用人工智能)[8] - 瑞幸咖啡CEO透露公司正全力推进重回美国主板上市,目前已在纽约曼哈顿开设5家门店[11] - 瑞幸大股东大钲资本考虑竞购可口可乐旗下Costa咖啡,估值约10亿英镑(13亿美元),而可口可乐2018年收购价为39亿英镑(51亿美元)[12][13] - CPE源峰向汉堡王中国注入3.5亿美元初始资金,若交易成功将持有83%股权,资金用于门店扩张、营销及菜单创新[19][20][21] - 滴滴自动驾驶与阿布扎比投资办公室达成战略合作,加入SAVI产业集群,计划拓展中东市场,预计SAVI到2045年贡献440亿迪拉姆GDP和4万个就业岗位[21][23][24] 科技与AI前沿 - 李飞飞提出空间智能是AI下一个前沿,指AI系统通过理解三维空间和时间实现感知、推理和行动的能力,其团队开发的Marble平台可快速生成可探索3D环境[15][16][17] - 成立仅一年的机器人公司K-Scale Labs因融资失败倒闭,现金储备仅40万美元,其双足行走机器人售价1.5万美元,公司估值曾达5000万美元[26] - OpenAI在四地试点ChatGPT群聊功能,支持最多20人协作,周活跃用户达8亿,公司已调整ChatGPT社交行为使其根据语境判断应答时机[27][28] - 苹果推出小程序合作伙伴计划,将开发者收益抽成降至15%,与微信就小程序手续费达成一致[30] 航天与高端制造 - 蓝色起源新格伦火箭首次执行NASA发射任务,成功部署两艘火星探测器,火箭高约320英尺(97.5米),助推器成功着陆大西洋驳船[31][33] - 新格伦火箭是蓝色起源深空计划核心,研发历时约十年,此次成功有望挑战SpaceX在发射行业的主导地位[33]
AI周报 | OpenAI推出GPT-5.1;李彦宏回应AI泡沫争议
第一财经· 2025-11-16 10:08
大模型技术演进 - OpenAI推出GPT-5.1,新模型包含GPT-5.1Instant和GPT‑5.1Thinking,重点在于提升回答的“人味”和“情绪价值”,例如在回应压力或尴尬场景时提供更具同理心的反馈 [1] - 相比GPT-5直接提供建议,GPT-5.1会先表达理解再给出建议,此次更新的核心是让人工智能说“人话”,在智力水平大幅提升存在挑战的背景下,提升“情商”成为重要方向 [1] - 李飞飞团队推出首款商用世界模型Marble,该模型能通过单张图片、视频或文本提示创建高保真、持久的3D世界,并支持大规模多模态输入,被定位为构建空间智能未来的基础 [7] AI产业生态与价值分配 - 百度李彦宏提出AI产业结构正从“正金字塔”转向“倒金字塔”,认为芯片不直接产生价值,应用才产生价值,健康的生态应是模型产生芯片10倍的价值,应用创造100倍的价值 [2] - AI的价值在于场景深耕而非底层硬件堆砌,从技术到应用的价值跃迁是AI可持续发展的关键,只有解决真实需求的应用才能兑现AI的商业价值 [2] - AI编程初创公司Cursor完成23亿美元D轮融资,投后估值达293亿美元,公司年化收入突破10亿美元,自2025年初以来收入增长100倍,显示出AI应用层的巨大价值潜力 [5][6] 巨头战略调整与资源投入 - Meta首席AI科学家杨立昆计划离职创业,背景是扎克伯格将公司AI重点从长期基础研究转向快速推出模型和产品,反映出巨头在AI竞争中的战略调整 [3] - 腾讯最新季度资本开支为129.83亿元,环比和同比分别减少32%和24,公司表示目前GPU资源完全够用,这可能意味着其近期放缓了AI基础设施建设速度 [8] - Anthropic计划投资500亿美元在美国建设AI基础设施,首批设施将于2026年投入运营,其竞争对手OpenAI等也在进行数十亿美元级别的数据中心投资 [13] AI硬件与基础设施市场 - AMD首席执行官苏姿丰表示,目标是在数据中心AI芯片市场获得“两位数”份额,预计到2030年数据中心芯片与系统市场规模将扩大至1万亿美元 [10][11] - 存储产品价格在双十一期间未降价甚至反扑,京东电脑内存金榜前十名产品价格相比10月初普遍上涨,超40%涨幅的有9款,反映出AI计算消耗存储产能导致供不应求 [12] - OpenAI的Sora项目日均烧钱约1500万美元,年化成本或超50亿美元,其项目负责人坦言目前的经济状况完全不可持续,凸显AI大模型运营的高成本挑战 [9] AI硬件产品与交互入口竞争 - 百度重新杀回AI眼镜战场,推出售价2299元的小度AI眼镜Pro,以拍摄、AI翻译、识物、备忘、录音为主要卖点,搭载多模态AI助手,争夺未来人机交互入口权 [4] - 在生成式AI浪潮与硬件技术突破下,智能眼镜被视为随身的“AI助理”,科技巨头正积极布局这一硬件形态 [4]
美股“反转”背后:重磅经济数据发布时间确定,12月降息概率跌破50%;孙正义的“OpenAI 炼金术”;巴菲特首次买入谷歌,持仓市值达49亿美元 | 一...
每日经济新闻· 2025-11-15 13:40
美股市场动态 - 美股市场于11月14日出现“V型反转”,道指一度跌超500点,纳斯达克一度跌近2%,但随后纳指转涨,最终标普500跌0.05%,道指跌0.65%,纳指涨0.13% [8][9] - 半导体芯片股逆势拉升成为市场情绪回暖主因,闪迪一度涨近10%,美光科技一度涨超7%,英伟达一度跌超3%后转涨1%,主要受三星电子将部分内存芯片价格较9月上调30%-60%的消息推动 [8] - 本周美股三大指数涨跌不一,道指累涨0.34%,纳指累跌0.45%,标普500指数累涨0.08% [41] 宏观经济与美联储政策 - 关键经济数据发布日程确定,美国9月非农就业报告将于11月20日发布,第三季度GDP修正值将于11月26日发布,但10月份消费者物价指数等部分数据发布仍存不确定性 [4][9] - 多位美联储官员对12月降息持谨慎态度,叠加经济数据不确定性,市场对美联储12月降息的预期已降至50%以下 [4][9][11] - 美国国会预算办公室计算显示,政府“停摆”使美国第四季度年化GDP增速被拉低1.5个百分点,造成约70至150亿美元的不可逆经济损失 [9] 软银集团战略与财务状况 - 软银集团在2025财年第二财季清仓其全部3210万股英伟达股票,套现58.3亿美元,以追加投资OpenAI [4][13][14] - 该集团第二财季净利润高达166亿美元,同比翻倍,其中146亿美元收益源于OpenAI估值从2600亿美元增长至5000亿美元 [13][17] - 在146亿美元的OpenAI投资收益中,有80亿美元源于对“远期合约”的会计处理,软银承诺于12月以2600亿美元估值追加投资225亿美元,但资金尚未支付便计入了利润 [19][21][24] - 财报发布后三个交易日,软银股价累计下跌12.8%,市值蒸发4.16万亿日元(约合269亿美元),自11月以来股价累计下跌近27% [13][15] 知名投资机构持仓变动 - 巴菲特旗下伯克希尔·哈撒韦在第三季度首次建仓谷歌A股,买入近1785万股,持仓市值达49.3亿美元,使其成为伯克希尔第十大持仓 [4][31][32] - 伯克希尔同期减持苹果公司股票近4179万股,减持比例约15%,苹果持仓占比从50%以上降至22.69%,但仍是其第一大持仓,市值约606.6亿美元 [32] - 全球最大对冲基金桥水在第三季度大幅减持英伟达约65.3%(从723万股降至251万股),并减持谷歌A(超50%)、微软(超35%)、META(48%)和亚马逊(近10%) [33] - 桥水同期大规模增持标普500ETF-IVV,增持比例高达75%,显示出防御性策略倾向 [33] 科技行业与AI领域动态 - 甲骨文股价连续五周下跌,本周累跌6.86%,较9月历史高点跌超35%,市值蒸发3488亿美元,市场担忧其激进的资本支出导致长期债务从一年前的750亿美元激增至约960亿美元 [41] - AI需求以“非线性速度”增长,到2028年可能导致美国出现高达20%的电力缺口,潜在缺口达13至44吉瓦,相当于超过3300万美国家庭的用电量 [40] - 微软首席执行官表示,公司策略并非押注为单一AI模型公司提供低利润算力,而是通过放缓扩张节奏以配合英伟达技术迭代速度,避免被单代技术的4~5年折旧期“困住” [39] - AI初创公司World Labs推出生成式3D世界生成系统Marble,其首席执行官指出AI发展的下一步关键在于赋予其“空间智能”,而非追求更大的语言模型 [38] 大宗商品与加密货币市场 - 本周纽约期金累涨1.86%至4084.4美元/盎司,纽约期银累涨4.69%至50.6美元/盎司,全球实物黄金ETF在10月流入达82亿美元,已连续五个月实现流入 [43] - 花旗集团预测在概率为30%的牛市情景下,金价可能在2027年底达到6000美元/盎司,但也给予50%的概率认为金价在2026年将回落至3650美元/盎司 [43] - 比特币本周跌超9%,一度跌破95000美元,24小时内加密货币市场超22万人被爆仓,爆仓总金额达10.77亿美元,分析指出市场已进入“确认的熊市阶段” [43][44]
李飞飞「世界模型」正式开放,人人可用, Pro版首月仅7元
36氪· 2025-11-14 21:36
产品发布与定位 - World Labs公司推出的Marble世界模型正式上线,面向公众开放使用[3][4][21] - 该产品是首个能创建持久化、可下载3D环境的世界模型,区别于实时生成模型[21] - Marble提供AI原生编辑工具和混合3D编辑器,用户可先构建空间结构框架再由AI填充细节[23] 核心技术功能 - 模型支持通过单张2D图片或简短文字提示生成完整的3D世界[34] - 支持多图像提示技术,能将针对世界不同部分的多样化提示图像无缝融合成统一3D世界[39][40] - 具备多模态输入能力,可接收照片或短视频素材组合生成包含现实空间元素的3D世界[44] - 内置AI原生世界编辑工具Chisel,支持移除物体、修饰区域、改变视觉风格等精细操作[47][52] 产品体验与效果 - 生成内容可任意旋转镜头、放大缩小,效果逼真类似3A游戏大作[11] - 支持将生成的世界导出为高斯溅射点、三角网格模型及视频格式[56][58][62] - 通过集成THREE.js的渲染器Spark,可在浏览器中实时渲染高斯溅射点[57] 商业模式与定价 - 目前提供免费版、标准版(20美元/月)、专业版(95美元/月)三档付费计划[82][84] - 免费版本限生成4个世界且仅支持图片上传,专业版最多可生成75个世界[82][83] - 下载作品及部分高级功能(如高质量网格创建、视频增强)需充值或订阅高级计划[22][87]
数字科技产业观察 | 双周要闻(2025年10月28日—11月14日)
每日经济新闻· 2025-11-14 16:53
部委政策导向 - 国务院办公厅提出加快场景培育和开放以推动新技术、新产品、新业态产业化应用,强调场景是连接技术和产业的重要载体 [1] - 工信部部署制造业中试平台建设,目标到2027年底基本建立现代化中试平台体系并初步形成全国制造业中试服务网络 [1] - 工信部启动2025年人工智能产业及赋能新型工业化创新任务揭榜挂帅工作,聚焦人工智能产业发展底座及"人工智能+制造"等重点方向 [1] 教育科技融合 - 教育部等七部门鼓励在科技教育中探索"双师课堂"和基于元宇宙虚拟实验室的"未来课堂" [2] - 课程资源将紧密围绕人工智能及量子信息等科技前沿领域,并加强前沿科技成果向课程教学资源转化 [2] 数据基础设施与物流 - 国家发展改革委等十部门推动物流数据开放互联,发布我国首张物流公共数据共享开放清单,十大类物流数据将向社会共享开放 [3] 地方数字化实践 - 江苏省政府支持利用人工智能、大数据、数字孪生等技术为体育赛事活动提供全链条场景创新,并建立赛事经济与体育消费大数据平台 [4] - 广东省文化和旅游厅征集智慧旅游优质项目,范围涵盖元宇宙沉浸式体验新空间及5G+AR直播等新一代信息技术在文旅场所的创新应用 [5][6] 行业应用与赛事 - "人工智能未来设计大赛・2025文旅应用赛"全国总决赛有49个优秀作品晋级,展示AI在文旅领域的创意应用 [7] - 小象智合展示AI时代包装产业从设计到交付的一站式服务新模式、新业态 [8] - 零克云参与北京1ms城市算力网存算分离拉远推理现网试验,在50km全光链路上部署政务客服智能体 [8] 前沿技术突破 - Neuralink脑机接口技术已植入12人累计使用超2000天,患者能力显著提升并计划进行首次升级或双芯片植入 [9] - 中国医疗AI模型MedGPT在引入"安全性"与"有效性"双轨评价体系的测评中以总分0.895的成绩位列第一 [10] 技术融合与产业洞察 - 张荣院士指出AI深度赋能将推动Micro-LED技术发展与生产效率新突破,而Micro-LED成熟也将反哺AI技术 [11] - 焦李成院士认为下一代遥感系统将演化为具备理解、推理与生成能力的智能体,实现从数据到决策的协同学习建模 [12][13] - 李飞飞提出空间智能将定义AI下一个十年发展方向,需构建超越大模型的世界模型 [14] 技术应用案例 - DeepMind开发的AI模型以80%概率提前3天锁定5级飓风"梅利莎"的路径和强度,今年首次被美国国家飓风中心使用 [15] - 华为云推出Versatile智能体平台与CloudDevice云终端协同,致力于解决大模型行业落地面临的开发门槛高、场景碎片化等痛点 [16]
李飞飞长文火爆硅谷
投资界· 2025-11-14 16:01
文章核心观点 - 空间智能是人工智能发展的下一个前沿领域,将推动大语言模型实现下一次质的飞跃 [4][6] - 构建具备空间智能的“世界模型”是解锁AI在创造力、机器人、科学、医疗和教育等领域潜力的关键技术路径 [8][16][18] - 世界模型需具备生成性、多模态和交互性三大核心能力,其技术挑战远超以往,但应用前景将深刻重塑人类与物理及虚拟世界的交互方式 [4][18][21] 空间智能的定义与重要性 - 空间智能是人类认知的脚手架,支撑着从日常动作到科学发现等一系列与物理世界互动的基础能力 [11][14] - 当前AI(如多模态大语言模型)的空间能力远未接近人类水平,在估计距离、方向、大小及预测物理规律等任务上存在根本性局限 [14][15] - 缺乏空间智能导致AI与物理现实脱节,无法安全驾驶汽车、引导家庭与医院中的机器人,或创造全新的沉浸式学习与娱乐体验 [16] 世界模型的核心能力与技术挑战 - 生成性:模型需能生成遵守物理定律、空间一致的虚拟世界,并保持世界状态的连贯性 [4][18][19] - 多模态:模型需能处理从图像、视频、深度图到文本指令、手势、动作等多种形式的输入 [4][19][20] - 交互性:模型需能根据输入的动作或目标,预测并输出世界的下一个状态 [4][20] - 技术挑战规模超越以往,需克服在通用训练任务函数、大规模多模态训练数据以及新型模型架构与表征学习等方面的巨大壁垒 [21][22][23] 世界模型的应用潜力 - 创造力:赋能电影人、游戏设计师、建筑师等创作者快速构建、迭代和探索三维世界,变革叙事与沉浸体验 [26][28][29] - 机器人:通过生成高质量仿真数据,扩展机器人学习,实现具备空间感知能力的人机协作伙伴及多样化的具身形态 [30][31][32] - 科学、医疗与教育:在科学研究中模拟实验、在医疗领域加速药物研发与辅助诊断、在教育领域实现沉浸式学习,增强人类专长与发现能力 [33][34][35] 行业发展趋势与公司进展 - World Labs公司成立于2024年初,致力于世界模型的基础性突破,其开发的Marble平台是全球首个可通过多模态输入生成一致性3D环境的世界模型 [8][23][26] - 行业共识认为,下一代世界模型将使机器在空间智能上达到新层次,开启AI理解与创造世界的时代,需要整个AI生态系统的集体努力 [24][26][27]
罗福莉C位亮相小米,离职DeepSeek后首次官宣
猿大侠· 2025-11-14 12:11
罗福莉加入小米事件概述 - 罗福莉正式官宣加入小米,出任MiMo团队负责人 [1][4] - 罗福莉在X平台宣布将带领团队推动多模态空间智能发展,这是实现通用人工智能的关键一步 [4] 事件背景与时间线 - 2023年底已有传闻称雷军以千万年薪将罗福莉从DeepSeek挖至小米 [5][10] - 2023年12月25日DeepSeek-V3版本上线并宣布全面开源 [6] - 2023年12月26日媒体曝出小米正在组建GPU万卡集群 [7] - 2023年12月31日雷军在跨年直播中披露小米AI野心,汽车业务步入正轨后全力进军AI [8][9] - 上月小米AI团队论文作者栏已出现罗福莉名字,但标注为独立研究者 [11][13] 罗福莉专业背景 - 本科毕业于北京师范大学计算机专业,硕士就读于北京大学计算语言学 [15] - 曾任职阿里巴巴达摩院机器智能实验室研究员,负责开发多语言预训练模型VECO及AliceMind项目开源 [17] - 2022年加入DeepSeek母公司幻方量化,后担任DeepSeek深度学习研究员,参与研发DeepSeek-V2等模型 [17] - 学术论文总引用次数超过1.1万次,2024年新增约八千次引用 [18] - 在DeepSeek最新的Nature封面论文中列名,明确了对模型的工作贡献 [19] 小米AI战略方向 - MiMo是小米推进大模型研发的核心招牌,目标指向空间智能 [23][24] - 空间智能旨在从语言世界走向物理世界,具备感知、推理、生成与行动能力,实现比特世界与原子世界的智能贯通 [24][26] - 该技术愿景与小米人、车、家全生态战略天然适配 [26] - 罗福莉的官宣明确了小米MiMo团队的前沿方向 [24]