Marble
搜索文档
计算机行业周报:Cowork获得永久记忆,AI协作迎来范式革新
华鑫证券· 2026-01-28 10:45
报告行业投资评级 - 行业评级:推荐(维持) [1] 报告核心观点 - 报告认为,AI智能体(Agent)的爆发式增长将直接转化为对CPU等算力硬件的海量需求,因此维持对AI算力板块的看好 [5][6][54] - 报告指出,Claude Cowork获得“永久记忆”功能,标志着AI正从对话工具演变为具备长期知识积累与持续学习能力的智能工作伙伴,AI协作迎来范式革新 [1][4][33] - 报告强调,表征自编码器(RAE)新架构为生成式AI技术开辟了高效、简洁的全新发展路径,谢赛宁团队的突破性研究打开了多模态统一模型的想象空间 [3][21][25] 根据相关目录分别总结 1. 算力动态 - **Tokens跟踪**:2026年1月19日至25日,周度token调用量为7.22T,环比下降5.62% [15];市场份额前五名为:Google(22.5%)、xAI(13.7%)、Anthropic(12.7%)、OpenAI(12.2%)、Deepseek(10.8%)[15] - **算力租赁价格**:上周价格平稳,例如腾讯云A100-40G配置(16核+96G内存)价格为28.64元/时,价格环比上周变化为0.00% [21][23] - **产业动态**:谢赛宁团队提出表征自编码器(RAE)新架构,在0.5B至9.8B参数全尺度下全面超越主流VAE方案,训练迭代次数仅为VAE的1/4,GenEval评测实现4.0倍加速 [3][21][24] 2. AI应用动态 - **周流量跟踪**:本期(2026.1.17-1.23)AI网站周访问量前三为ChatGPT(1327.0M)、Bing(789.2M)、Gemini(485.1M)[31];Gemini访问量环比增长3.43%,增速第一 [31] - **产业动态**:Anthropic为Claude Cowork注入“永久记忆”功能,通过“知识库”机制实现信息的分类、持久化存储与动态更新 [4][33][34];Cowork模式将成为Claude的默认工作空间,界面重心转向以工作流为中心的协作平台 [36] 3. AI融资动向 - **WorldLabs融资**:AI公司WorldLabs正洽谈最高5亿美元新一轮融资,投后估值预计达50亿美元,较2024年的10亿美元估值提升4倍 [4][43];该公司由李飞飞创立,专注于空间智能与大型世界模型,已推出产品Marble和WorldAPI [4][43][44] 4. 行情复盘 - **指数表现**:上周(2026.1.19-1.23),AI算力指数日涨幅最大值为2.39%,日跌幅最大值为-1.72% [48] - **个股表现**:AI算力指数内部,龙芯中科上周涨幅最大,为+33.07%;光迅科技跌幅最大,为-6.86% [48][51];AI应用指数内部,蓝色光标上周涨幅最大,为+26.15%;易点天下跌幅最大,为-18.84% [48][53] 5. 投资建议 - **核心逻辑**:全球AI服务器需求激增,TrendForce预计2026年全球AI服务器出货量同比增长超28%,带动整体服务器市场增长12.8% [5][54];英特尔与AMD的2026年服务器CPU产能接近售罄,计划涨价10%-15% [5][54] - **需求分析**:CPU在AI智能体工作负载中至关重要,其处理任务耗时占总时延的80~90% [5][54];IDC预计,活跃Agent数量将从2025年的约2860万增长至2030年的22.16亿,年复合增长率达139%;年执行任务总数从2025年的440亿次增长至2030年的415万亿次,年复合增长率达524% [6][54] - **建议关注公司**:报告建议中长期关注四家公司:迈信林(688685.SH)、唯科科技(301196.SZ)、合合信息(688615.SH)、能科科技(603859.SH)[6][55]
李飞飞世界模型公司一年估值暴涨5倍,正洽谈新一轮5亿美元融资
36氪· 2026-01-26 08:45
公司融资与估值动态 - World Labs正以约50亿美元估值进行新一轮融资,融资规模最高可达5亿美元 [1] - 若融资完成,公司估值将从2024年的10亿美元跃升至50亿美元,实现一年多时间5倍增长 [2] - 此前公司已完成累计2.3亿美元融资,估值达到10亿美元 [3] - 公司成立于2024年4月,当月完成首轮融资,估值约2亿美元 [3] - 2024年6-7月,公司完成由NEA领投的1亿美元融资,估值超10亿美元,跻身独角兽 [6] 投资方背景 - 早期投资方包括Andreessen Horowitz (a16z) 和 Radical Ventures [6] - 后续融资投资方包括英伟达、沙特Sanabil Investments、新加坡淡马锡 [6] - 个人投资者包括Google首席科学家Jeff Dean、演员兼投资人Ashton Kutcher、AI教父Geoffrey Hinton [6] 技术路线与产品 - 公司核心研发方向为“世界模型”,旨在构建能在三维世界中导航和决策的AI系统,即“大世界模型” [6] - 世界模型致力于让AI理解真实物理世界的结构与演化方式,而非仅生成图像 [6] - 公司已推出首款3D世界生成模型Marble,可根据文本或图像提示生成可探索的3D世界 [7][9] - Marble采用3D高斯溅射技术,用数百万计的半透明点表示场景结构,兼顾渲染效率与视觉效果 [9] - 该模型同时输出“碰撞网格”,专用于物理仿真和机器人模拟 [9] - 公司提供Chisel工具,允许用户先用简单几何体搭建骨架,再生成不同风格的细节版本 [9] - 公司近期开放了World API,开发者可通过文本、图像或视频在应用中生成可探索的3D世界 [9] 战略愿景与行业定位 - 公司创始人认为世界模型是实现空间智能的关键,是继大语言模型之后AI下一个十年的核心主线 [10] - 具备空间智能的世界模型需拥有三种能力:生成遵守物理定律的世界、处理多模态输入、预测世界随时间演变或互动的状态 [11] - 世界模型被视为“基础设施型能力”,其影响将扩散至多个方向 [12] - 应用方向包括AIGC(如3D资产生成、游戏世界构建、影视制作)和具身智能(如机器人、仿真环境) [12][13] - 在具身智能领域,世界模型提供对环境的可预测表示,是叠加有效决策与控制的基础 [13] 行业竞争格局 - 世界模型领域存在不同技术路线,前Meta首席科学家Yann LeCun创办的AMI Labs正以约35亿美元估值进行融资 [15] - LeCun的路线采用隐式世界模型,基于联合嵌入预测架构在抽象潜在空间中预测世界演化,而非还原每个像素 [16] - 当前世界模型版图大致分为三层:可观看编辑的世界界面(如Marble)、可反复试错的模拟器、以状态与预测为核心的认知世界模型(如JEPA路线) [18] - 资本押注反映了对不同世界模型技术路径的前瞻性布局 [18]
李飞飞世界模型公司一年估值暴涨5倍!正洽谈新一轮5亿美元融资
量子位· 2026-01-25 14:00
World Labs新一轮融资与估值跃升 - 公司正在以约50亿美元估值进行新一轮融资,融资规模最高可达5亿美元[1] - 若融资完成,公司估值将从2024年的10亿美元跃升至50亿美元,实现一年多时间5倍重估[2] - 此前公司已完成累计2.3亿美元融资,估值达到10亿美元[2] - 公司成立于2024年4月,当月完成首轮融资,估值约2亿美元[2] 公司历史融资与投资方 - 首轮投资方包括Andreessen Horowitz(a16z)和加拿大投资机构Radical Ventures[5] - 2024年6–7月,公司完成一轮1亿美元融资,由NEA领投,估值被抬升至超过10亿美元[5] - 历史投资方还包括英伟达、沙特阿拉伯的Sanabil Investments、新加坡主权基金淡马锡[5] - 个人投资者包括Google首席科学家Jeff Dean、演员兼投资人Ashton Kutcher、AI教父Geoffrey Hinton[6] 公司核心业务:世界模型 - 公司正在研发能够在三维世界中进行导航和决策的AI系统,构建“大世界模型”[8] - 目标并非“生成一张好看的图”,而是让模型真正理解真实物理世界的结构与演化方式[9] - 世界模型被视为继大语言模型之后,AI下一个十年的核心主线,是一种“基础设施型能力”[16][17] 产品与技术:Marble与World API - 公司于去年11月推出首款3D世界生成模型Marble[10] - Marble可以根据文本或图像提示,直接生成可探索的3D世界[12] - 技术采用3D高斯溅射,用数以百万计的半透明点表示场景结构,在保持较高渲染效率的同时实现更细腻的视觉效果[14] - Marble同时输出“碰撞网格”,专门用于物理仿真和机器人模拟[15] - 提供Chisel工具,用户可先用简单几何体快速搭建骨架,再生成不同风格的细节版本[15] - 公司近期开放了World API,开发者可通过文本、图像或视频直接生成可探索的3D世界[15] 世界模型的应用前景与能力框架 - 真正具备空间智能的世界模型需要三种能力:生成、多模态、交互[22] - 生成能力指能创造遵守物理定律、空间一致的世界[22] - 多模态能力指能处理从图像、视频到动作的多模态输入[22] - 交互能力指能预测世界随时间演变或互动的状态[22] - 应用方向包括AIGC(如3D资产生成、游戏世界构建、影视制作)和具身智能(如机器人、仿真环境)[22] - 以具身智能为例,世界模型提供对环境的可预测表示,是叠加有效决策与控制的基础[18] 行业竞争格局与技术路线 - 前Meta首席科学家Yann LeCun创办的AMI Labs传闻融资估值可能达到35亿美元[20] - LeCun的路线更偏向“内在认知”,采用隐式世界模型,基于JEPA在抽象的潜在空间中预测世界演化,而非还原每一个像素[21] - 世界模型技术版图大致分三层:可观看、可编辑的世界界面(如Marble);可反复试错的模拟器(如谷歌DeepMind的Genie 3);以状态与预测为核心的认知世界模型(如LeCun的JEPA路线)[27][24] - 资本押注的是对不同世界模型技术路径的提前下注[24]
“AI教母”李飞飞初创公司World Labs拟融5亿美元,估值50亿美元
搜狐财经· 2026-01-23 10:50
公司融资与估值 - 初创公司World Labs正在进行新一轮融资洽谈,目标估值约为50亿美元(约合349亿元人民币)[1] - 本轮融资预计将为公司带来约5亿美元(约合34.9亿元人民币)的新增资金,但交易尚未最终敲定[3] - 公司于2024年结束隐身并完成2.3亿美元(约合16.05亿元人民币)融资,当时估值约为10亿美元(约合69.8亿元人民币)[1] 公司技术与产品 - World Labs主要致力于开发能够理解、导航并对三维世界进行决策的AI工具,其技术方向被称为“大型世界模型(Large World Models)”[3] - 2024年晚些时候,公司推出了首款产品Marble,该模型可根据图像或文本提示生成三维世界[3] 公司投资方与背景 - 公司现有投资方包括Andreessen Horowitz、NEA、Radical Ventures,英伟达旗下的风险投资部门也已参与投资[1] - 其他投资方还包括沙特阿拉伯的Sanabil Investments以及新加坡主权投资机构淡马锡控股[5] - 参与公司2024年融资轮的个人投资者包括谷歌DeepMind首席科学家Jeff Dean、演员兼投资人阿什顿·库彻以及前谷歌人工智能研究员杰弗里·辛顿[5] - 公司创始人李飞飞被称为“AI教母”,她于2006年主导创建了包含超过1500万张图像的ImageNet项目,推动了人工智能技术发展[4] - 李飞飞目前是斯坦福大学教授,并担任斯坦福以人为本人工智能研究院的联合创始主任[4] 行业趋势与竞争 - 随着投资者开始寻求超越大语言模型的下一代AI技术突破,世界模型等相对尚处早期阶段的方向正受到更多关注[3] - 由前Meta研究员杨立昆创办的世界模型初创公司AMI Labs正吸引潜在投资者,其融资轮估值可能达到35亿美元(约合244.3亿元人民币)[4]
李飞飞的World Labs联手光轮智能,具身智能进入评测驱动时代!
量子位· 2026-01-19 11:48
文章核心观点 - 具身智能行业正面临模型进步速度远超评测能力的瓶颈,规模化评测成为关键制约因素[18][20][22][23] - 为解决此问题,行业两大关键基础设施公司——李飞飞旗下的世界模型公司World Labs与仿真合成数据公司光轮智能宣布合作,标志着具身智能正式迈入“评测驱动时代”[1][2][76] - 双方合作基于“数字表亲”理念,分工明确:World Labs的Marble产品解决高保真3D环境生成的规模问题,光轮智能则提供与真实物理对齐的资产及评测闭环,共同构建可规模化运行的仿真评测系统[3][45][49][51] World Labs(世界模型公司)分析 - 公司由AI领域权威人物李飞飞创立,成立仅两年已融资数亿美元,股东包括Andreessen Horowitz、英伟达、Databricks、Adobe等顶级风投与AI生态公司[4][5][17] - 公司选择“空间智能”作为AGI发展路线,旨在构建能感知、生成、推理并与环境互动的世界模型,以突破大语言模型的智能天花板[6][7] - 核心产品Marble是一款可视化世界模型,仅需一句话、一张图片或一段视频等轻量输入,即可生成高保真、持久、可下载的3D环境,支持导出多种格式,并内置AI世界编辑器Chisel[8][9][11][12][14] - Marble主要服务于视觉特效、游戏开发等领域,实现了“一句提示→生成3D世界→一键导出至Unity”的生产力链路,但其生成的世界缺乏物理参数,需与物理引擎结合才能用于机器人训练与评测[15][16][36] 光轮智能(仿真合成数据公司)分析 - 公司是当前最炙手可热的具身智能基建公司,与英伟达关系紧密,深度参与其仿真系统底层共建,是Newton物理引擎的早期验证者和开发合作者[54][55] - 公司在仿真合成数据市场占有率极高,服务了全球前三的世界模型公司,国际主要具身团队的仿真资产和合成数据80%以上来自光轮智能[58][59] - 公司构建了三位一体的自研仿真技术体系:1)自研GPU物理求解器,支持百万级自由度并行计算;2)全自动虚实对标物理测量工厂;3)将真实物理特性规模化映射为SimReady资产与场景[52] - 基于其基础设施地位,公司推出了工业级仿真评测平台RoboFinals,并与英伟达联合打造了开源仿真评测框架Isaac Lab Arena,致力于成为行业评测标准[63][64] 行业瓶颈与解决方案 - 具身智能模型迭代速度极快(几乎每隔一两周),现有学术基准已无法准确评估其能力,行业缺乏有效的规模化评测手段[20][22][23] - 在真实物理环境中测试机器人成本高昂、难以规模化,且存在安全风险,仿真被视作规模化评测具身智能的唯一可行路径[24][27][28][29] - 李飞飞提出的数据金字塔框架中,仿真合成数据被视为最具可扩展性的主干数据形态,是解决数据与评测这一根本约束的关键[31][32][35] - 传统追求“数字孪生”(一比一复刻真实世界)的仿真方式成本极高、无法规模化,行业转向“数字表亲”理念,即追求物理与空间结构可信,细节允许近似[42][43][44][45][46] World Labs与光轮智能的合作细节 - 合作本质是“世界模型×仿真基础设施”的历史性交汇:World Labs解决“世界从哪来”,光轮智能解决“进步怎么被衡量”[3] - 分工明确:Marble负责将环境创建时间从数周压缩到数分钟,解决环境生成的规模问题;光轮智能则承担仿真中最难的部分——提供与真实物理对齐的资产及构建评测闭环[47][49] - 合作旨在构建一个世界、行为、评测高度耦合的闭环系统,使仿真成为一个可重复运行、可持续扩展的数据生产系统,让规模化评测第一次真正成为可能[50][51] - 此次合作有深厚的学术渊源,李飞飞在斯坦福时期推动的BEHAVIOR系列研究及其2025年的BEHAVIOR Challenge,早已为具身智能建立长期、可扩展的评测工程奠定基础[38][40][41] 评测驱动时代的行业意义 - 随着众多大模型公司、机器人本体公司及行业巨头涌入,具身智能路线高度分叉,行业亟需能指引方向的“路标”或“北极星”[65][67][68][69][70] - 好的评测不仅能评估模型能力,更能提前发现技术瓶颈、反向塑造研究方向,是具身智能发展中必须与模型同步扩展的系统级能力[71][72] - 作为仿真与评测基础设施提供商,光轮智能处在所有技术路线之上而非其中,这使其最适合承担客观的行业评测角色[73][74] - World Labs与光轮智能两大关键基建的联手,串联起从环境生成到物理仿真再到规模化评测的全链条,有望推动具身智能行业进入以评测为驱动的新发展阶段[75][76]
一个全新的世界模型,终于让AI视频进入了“无限流”时代。
数字生命卡兹克· 2026-01-14 08:23
PixVerse R1实时世界生成模型的技术定位与特点 - 公司推出下一代实时世界生成模型PixVerse R1 能够根据用户输入的Prompt连续、实时地生成并改变视频流剧情 用户可在过程中随时用Prompt修改视频进程 每次输入后约2秒延迟 世界剧情即随之变化 若用户不进行干预 模型可自行无限、连续地生成视觉流 公司将其称为“实时世界生成模型” [2][3] 当前“世界模型”的主流定义与分类 - 行业对“世界模型”的定义较为宽泛 指能够用可持续的内部状态预测世界变化 并可被交互和验证的模型 该术语目前常被用于指代三类方向:视频生成模型、可交互的生成世界、面向机器人和自动驾驶的物理仿真基础模型 [4] - 行业现有的世界模型代表主要分为三个方向:以Google Genie 3为代表的 一次生成后可实时导航的动态视频世界模型 可维持24fps、720p及分钟级一致性 [7][8] 以李飞飞World Labs Marble为代表的 侧重于三维空间重建、生成与模拟的3D类世界模型 其核心在于3D表示和空间一致性 [12][14] 以英伟达Cosmos为代表的 专注于为自动驾驶、机器人等提供高保真物理仿真与合成数据的基础模型平台 [19] PixVerse R1的创新方向与产品体验 - PixVerse R1为世界模型领域补上了第四个方向:实时视频生成 并提供了可实测的Demo版本 [22][23] - 产品体验需邀请码进入 每个实时生成会话限时5分钟 主要原因是实时生成对算力消耗极大 [26][35] - 用户体验反馈极为积极 产品提供了预设模板(如卡通、1944、赛博朋克等)和自定义模式 用户可通过文本或语音输入Prompt实时引导剧情发展 创造了高度互动、充满惊喜和未知乐趣的体验 被形容为一种全新的娱乐形态 [31][40][42][44][45][48][54] 实时世界生成模型预示的行业未来 - 该技术可能重塑未来娱乐内容形态 电影、综艺、游戏等可能不再是固定时长的文件 而是由世界模型驱动的、永远流动的世界时间线 [56] - 未来的内容创作模式可能是:创作者提供一个起点和世界观设定 由世界模型自主演进剧情 观众则通过一句话、一个表情或一次选择来轻微影响剧情走向 最终实现同一宇宙下的不同时间支线体验 [57][58] - 该技术的出现被认为是AI模型发展历史上具有重要意义的一步 代表了新颖且极具未来感的发展方向 [62][64]
从洗碗工到“AI教母”,她又预言了下一个十年
36氪· 2026-01-13 15:31
文章核心观点 - 人工智能领域的顶尖科学家李飞飞提出,AI发展的下一个关键方向是“空间智能”,她认为大语言模型受限于语言本身,而真正的智能机器需要理解物理世界的深度、距离、遮挡与重力等空间信息 [1] - 李飞飞创立的World Labs于2025年末发布了首款商用“世界模型”Marble,该公司在2024年成立后融资超过2.3亿美元,估值超过10亿美元 [2] - 李飞飞的职业生涯贯穿了AI从实验室到产业爆发的全过程,其推动建立的ImageNet数据集被视为结束了人工智能寒冬并开启了AI黄金时代的关键,如今她正致力于构建一个新时代的“ImageNet”以推动空间智能发展 [2][6][9][10] 李飞飞的个人背景与职业生涯 - 李飞飞16岁随父母移民美国,家境困顿,曾在餐馆打工时薪2美元,每天只睡4小时学习,最终以SAT 1250分、数学满分的成绩获得普林斯顿大学物理学全额奖学金 [3][4] - 她在加州理工学院攻读博士时,同时研究神经科学和计算科学,专注于让机器学会“看”的视觉研究领域 [5] - 其职业生涯经历了从学界到产业的转换,曾担任斯坦福人工智能实验室(SAIL)主任,并于2017年加入Google Cloud担任AI/ML首席科学家兼副总裁 [9] ImageNet的创立与行业影响 - 在2005-2009年的人工智能寒冬期间,李飞飞坚信数据是AI质变的关键,决心构建一个涵盖“全世界所有物体”的庞大图像数据库,即ImageNet [6] - 项目初期面临巨大困难,手动标注需90年,后借助亚马逊众包服务解决了海量图像标注的效率难题 [8] - 2009年,ImageNet论文亮相,数据库包含5247个类别、320万张标记图片 [8] - 2012年,AlexNet模型在ImageNet挑战赛中以领先第二名41%的优势夺冠,将Top-5错误率从26%降至15%,证明了优质数据预训练的重要性,该时刻被视为AI发展史上的“奇点”之一 [9] - 李飞飞免费开放ImageNet数据库,推动了深度学习闸门的打开,被誉为结束了AI寒冬并拉开了人工智能黄金时代的序幕 [9][10] 对AI发展趋势的判断与空间智能 - 李飞飞指出大语言模型(如ChatGPT)存在局限性,受制于语言本身,而“语言即世界”是一种偷换概念,信息不仅包括语言,还包括空间信息 [1][10] - 她认为AI的下一个十年是“空间智能”,若AI无法理解物体的深度、距离、遮挡与重力,就永远无法真正“具身” [1] - 其判断源于长期的跨学科研究,包括认知神经科学、计算机视觉以及对生物视觉起源的思考 [1][5] - 空间智能被视为实现通用人工智能(AGI)所需的多把钥匙之一,AGI的发展是一个渐进的过程 [12] World Labs与空间智能的研发进展 - 李飞飞于2024年创立World Labs,开始研发空间智能,并于2025年末发布了首款商用“世界模型”Marble [2][11] - 她承认生成三维空间在技术上存在挑战,目前仍处于早期阶段,但笃定未来一到两年内空间智能会爆发 [11] - 该公司的目标是构建一个能够理解并生成三维物理世界信息的模型,类似于为新时代打造一个“ImageNet” [10][11]
深度|AI教母李飞飞:AI绝对是一种文明级技术;人们正在忽视“人”在AI中的重要性
Z Potentials· 2026-01-10 11:49
文章核心观点 - 李飞飞博士的成长经历、学术背景与人文思考共同塑造了她对人工智能发展的独特视角,她强调AI的发展史是集体智慧的结晶,而非单一英雄的旅程 [9][27] - ImageNet的成功源于在正确时机提出了“大数据”的关键科学假设,并结合了众包等创新方法,其标志着现代AI诞生的关键拐点 [20][21][29] - 当前AI浪潮中,技术本身和增长被过度讨论,而“人”的核心地位——包括人的尊严、主体性和在AI发展中的发言权——被严重忽视 [38][41] - 李飞飞博士创立的WorldLabs致力于开发空间智能(spatial intelligence),这是继语言智能后下一个关键的AI前沿,旨在赋能创作、设计、机器人仿真等多个领域 [45][47][56] - 面对AI的未来,培养“学习如何学习”的能力比传统学位更重要,同时需要重新设计教育评估体系,以引导人们善用AI工具实现能力倍增 [57][58][60] 个人背景与成长经历 - 李飞飞博士的童年是一段“双城记”,在北京出生,成都长大,15岁移民美国新泽西 [13] - 其父亲热爱自然、充满童心,对成绩和奖项完全不关心,这与许多人对“中国父母”的刻板印象不同 [14] - 其母亲非常自律,要求专注,并展现了在陌生环境中生存下去的坚定信念 [16] - 高中数学老师Bob Sabella是其重要的导师,曾牺牲午休时间一对一为其补课,这体现了教育者的巨大付出 [16] - 在普林斯顿大学本科期间,她同时在校园图书馆打工(时薪约6美元)并帮助家庭经营干洗店长达七年,这段经历赋予了她关注社会各阶层的广泛视角 [8][17] ImageNet的诞生与意义 - ImageNet是一个在2007年至2009年间构建的大规模计算机视觉数据集,旨在用于训练和评估视觉智能 [20] - 其真正意义在于标志着大数据时代的关键拐点,在此之前的AI领域并未真正使用“大数据”,发展处于停滞(即“AI寒冬”) [20] - 现代AI的诞生源于三大关键要素在2012年的汇聚:ImageNet提供的大数据、GPU提供的并行计算能力以及神经网络算法 [21] - ImageNet的灵感部分来源于心理学研究,例如Irv Biederman教授关于儿童视觉学习能力的工作,体现了跨学科思想碰撞的重要性 [26] - 项目成功的关键在于将“视觉物体分类”定义为正确的科学假设,而不仅仅是追求数据规模 [29][31] ImageNet的执行与挑战 - 构建ImageNet面临的核心挑战是需要对数千万张高质量图像进行人工标注,工作量巨大 [32] - 团队最终采用亚马逊的Mechanical Turk平台进行众包,利用全球在线人力进行大规模并行处理,从而标注了数十亿张图像并筛选出1500万张高质量图像 [34] - 为确保数据质量,团队设计了多步骤质量控制机制,包括前置测试和混入已知答案的“黄金标准”图片进行隐性监控 [36] - 正确的激励机制设计对于防止标注者作弊(如在每张图都标出熊猫)至关重要 [35][36] 对当前AI发展的观察与批判 - AI是一种“文明级技术”,对美国经济影响深远,有说法称去年美国4%的GDP增长中有50%(即2个百分点)可归因于AI [38] - 当前讨论过于聚焦技术、增长与少数“天才”,而忽视了无数代科学家、工程师和跨学科研究者的集体贡献 [27][28] - 人们正在忽视“人”在AI中的核心地位:是人创造、使用并受AI影响,人也应拥有对AI发展的发言权,人的尊严不应被剥夺 [9][41] - 李飞飞博士自称为“务实的乐观主义者”,不相信乌托邦或末日论两种极端,并指出美国与西欧对AI的担忧比其他地区更甚 [43] WorldLabs与空间智能 - WorldLabs是李飞飞博士创立的公司,致力于构建下一代AI,其技术核心是开发空间智能(spatial intelligence) [45] - 空间智能是人类观察、理解并与三维世界互动的能力,例如将三明治装袋、粉刷房间或在山地徒步 [47] - 相比语言智能,AI在空间智能方面仍处于非常早期的阶段 [47] - WorldLabs的模型(代号Marble)允许用户通过文字或图片提示,快速生成可探索的三维世界,应用于舞台布景设计、电影VFX、游戏开发、教育及机器人训练模拟等领域 [48][50][51] - 该技术也在精神病学研究(如暴露疗法)中得到应用,可以低成本模拟各种触发环境 [53] 被低估的趋势与未来能力 - **空间智能的重要性被低估**:当前讨论过度集中于语言和大语言模型,而对三维世界建模的能力支撑着从娱乐、沉浸式体验到机器人仿真等广泛应用 [56] - **AI对教育的影响被低估**:AI将极大加速学习效率,可能改变以学校和学位为核心的人力资本评估体系 [56] - **AI对经济结构的复杂影响被低估**:关于AI对劳动力市场的讨论常在乌托邦和末日论间摇摆,而中间复杂、现实的过渡状态(各类岗位的深刻变化)被政策制定者和社会低估 [57] - **“学习如何学习”的能力变得至关重要**:在AI时代,个人使用工具快速学习和自我升级的能力、开放态度比传统学位更受重视 [57] - 教育评估体系需要革新,重点不应是监管AI使用,而是明确展示工具的标准与人类学习者应达到的更高标准 [60] 人文思考与教育理念 - 物理学习教会她的不仅是知识,更是提出大胆问题的勇气和热情,这后来成为其科研的指引 [9][22] - 她鼓励每个人寻找属于自己的“北极星”——即个人的梦想、使命与激情,这构成了生命力的核心 [61] - 在AI时代,教育的核心旅程之一是学会认识自己,并确立和追寻自己的北极星 [61]
年度重磅 | 2025影响力女性图鉴:她们发明了自己的战场
新浪财经· 2026-01-07 16:26
人工智能与科技行业 - World Labs创始人李飞飞于2025年11月13日推出首款产品Marble,由多模态世界模型提供支持,旨在构建空间智能未来基础,通过单张图片、视频或文本提示创建高保真3D世界 [1] - 李飞飞认为,若AI仅限于处理文本,将无法真正理解或与物理世界互动,成为数字世界的囚徒,因此致力于让AI像人类一样理解三维世界和物体物理属性 [2] - DeepSeek的女性工程师团队在2025年初以R1模型震撼全球,打破了女性不适合底层算法的陈旧偏见,证明了在硬核智力竞技场上性别并非重要参数 [4] - 前OpenAI首席技术官米拉·穆拉蒂创立的思维机器实验室以120亿美元估值成功募集20亿美元种子轮融资,致力于构建更安全、可靠、可协作的AI [20] - 思维机器实验室于2025年10月发布首款产品Tinker API,通过开源工具降低研究人员微调大模型的门槛,赋能研究社区 [21] - 华为轮值董事长孟晚舟在2025年为华为锚定“引领”与“重构”的新坐标,指出算力是AI发展的核心驱动力,并致力于通过系统架构创新提供可持续的澎湃算力 [28] - 2025年,华为鸿蒙生态5.0以上终端设备超过3600万,乾崑智驾为超140万辆乘用车赋能,昇腾AI生态已汇聚3000多家伙伴与400万开发者 [28] - 中国县城和乡村的女性数据标注员群体,在山西永和、陕西宜君等县域的数字就业中心,女性员工占比高达八成以上,为顶级大模型进行最基础的数据标注工作 [24] 消费电子与高端制造行业 - 立讯精密董事长王来春带领公司完成从传统代工厂到技术平台型企业的转身,持续加码研发,与核心客户共建实验室,深入参与产品定义与技术共创 [33] - 在消费电子市场趋于饱和背景下,立讯精密持续扩大市场份额,攻克高精密制造难点,成为苹果等巨头的重要合作方,并瞄准汽车电子、通信系统、AI硬件等新领域 [34] - 王来春规划立讯精密30%的产品要进入“无人区”,即全球领先、无现成对标、技术自主的领域,为中国高端制造赢得下一个时代主动权 [34] - 王来春连续第三年荣登《财富》杂志“中国最具影响力的商界女性”榜首,其个人财富在《2025胡润女企业家榜》中达855亿元,位列第四,十年间增长七倍 [34] 饮料与消费品行业 - 宏胜饮料集团总裁宗馥莉在2025年进行数字化改革和品牌年轻化,于5月申请新商标“娃小宗”,旨在建立完全由自己定义的新产品载体 [16] - 2025年9月,宗馥莉辞去娃哈哈集团董事长等核心职务,进行战略重组,将主战场从管理旧系统转向构建新枢纽,将权力基础转移至其长期经营的宏胜饮料集团 [16] - 宏胜饮料集团是一个覆盖研发、生产、包装、物流全产业链的独立平台,宗馥莉通过控制供应链命脉,持续影响娃哈哈的未来,并致力于用数字化重塑整个产业基础设施 [16] 体育与运动商业 - WNBA球星凯特琳·克拉克在2025赛季让联盟收视率和赞助费翻倍,刷新多项历史纪录,如单场25分、10助攻场次历史第一,并于8月成为Nike篮球最新签名运动员 [11] - 网球运动员郑钦文在2025年1月成为迪奥全球品牌大使,系中国体育明星首度获此殊荣,同月与蚂蚁集团完成续约,3月加入Beats全球代言人家族 [13] - 据《福布斯》统计,2025年郑钦文以2260万美元年收入位列全球女运动员收入榜第五位,其中2100万美元(约93%)来源于代言赞助,远超160万美元的赛场奖金 [13] 文学与内容产业 - 诺贝尔文学奖得主韩江的作品《素食者》和《不做告别》在2025年引发全球关于女性身体主权和历史创伤的讨论,后者英译本在年初登上《纽约时报》畅销书榜 [7] - 2025年,韩江全新散文集《光与线》发售,该作长172页,收录其诺奖获奖感言、未发表诗歌、散文及花园日记等 [7] - 作家李娟的作品《我的阿勒泰》在2025年荣获中国版权金奖作品奖,其文学精神成为连接个体灵魂与广阔自然的精神灯塔 [37] 娱乐与媒体行业 - 2025年,中国脱口秀舞台上的女性演员解构月经羞耻、母职惩罚等结构性问题,双胞胎喜剧演员颜怡颜悦推出新专场《新型关系2.0》 [8] - 民间“家政女工脱口秀”在2025年涌现,这群劳动者将日常辛酸编织成段子,展现了底层生命力的爆发 [8]
美国CES展开幕,14句重要论断
吴晓波频道· 2026-01-07 08:30
文章核心观点 - CES 2026展现了人工智能技术从云端走向物理世界的协同进化趋势,物理AI、混合AI、空间智能等概念共同勾勒出AI发展的全景图,其核心是让AI理解并安全地与现实世界互动[3][9][11][26] - 全球AI巨头在CES上阐述了差异化的战略路径:英伟达强调物理AI与全栈能力,AMD聚焦高性价比算力以突破算力瓶颈,英特尔则主推混合AI与边缘计算以保障隐私和低延迟[11][21][22][23] - 中国企业已成为全球AI生态中不可或缺的关键参与者,在应用创新、硬件制造、特定技术领域及开源生态方面展现出显著优势,并有望在机器人、智能驾驶等硬件领域引领创新[8][20][27][28] 行业趋势与巨头战略 - **物理AI成为焦点**:英伟达创始人黄仁勋认为AI必须理解物理世界的常识才能与现实互动,并预言“物理AI的ChatGPT时刻即将到来”,其商业逻辑在于现实世界的天花板比线上世界更大[9][11][13] - **算力需求急剧增长**:AMD董事长苏姿丰指出,为让AI无处不在,需要在未来几年内将全球算力提升一百倍,或未来五年内提升超过十倍,以解决“算力荒”问题[11][14] - **混合与边缘计算兴起**:英特尔强调混合AI与端侧计算的重要性,以满足医疗、金融、工业等领域对数据隐私、低延迟和零断网的需求,其本质是让AI能力下沉至终端设备[11][14][23] - **技术路径分化**:英伟达追求绝对性能,AMD追求性价比,英特尔追求边缘普及,这预示着未来2-3年芯片领域将展开激烈的价格战与性能战,算力成本有望大幅下降[21][22] - **从理解到交互的范式转移**:AI正从“被动理解世界的系统”走向“帮助我们与世界互动的系统”,李飞飞提出的“空间智能”与黄仁勋定义的“行动交互”标志着AI交互方式的根本变革[11][16][21] 关键产品与技术方向 - **机器人(具身智能)**:被视为物理AI的典型代表,CES 2026现场机器人企业中中国企业占比过半,包括宇树、智元、追觅等,2026年预计是人形机器人和AI定义汽车爆发的一年[8][20][21][25] - **AI PC与智能设备**:AMD展示了针对PC的Ryzen AI 400系列,英特尔则通过在PC和边缘设备部署NPU来构建AI时代的“毛细血管”,推动AI在终端普及[22][23] - **自动驾驶**:2026年被认为是自动驾驶L3量产的时刻,黄仁勋也提及了开源的自动驾驶模型AIpamayo,以建立模型信任[13][18] - **世界模型与开源**:李飞飞展示了商用世界模型Marble,旨在生成持久、可导航的3D世界,黄仁勋预测开源模型可能在未来超越OpenAI成为生成Token的第一大群体[13][15][18] 市场与生态发展 - **用户规模爆炸式增长**:AI活跃用户数量已从最初的100万人跃升至超过10亿,预计未来将增长到超过50亿人,像手机和互联网一样融入生活方方面面[14] - **算力与经济增长挂钩**:OpenAI总裁格雷格认为,未来一个国家的GDP增长将很大程度上由其可用算力决定[14] - **AI代理(Agent)崛起**:2026年被视为AI代理元年,AI将从反应式智能体转变为能够主动、端到端地帮助用户完成任务的系统[17] - **成本下降推动普及**:随着英伟达Rubin架构及AMD/Intel方案的推出,AI推理成本将大幅下降,使AI应用从奢侈品变为便宜好用的工具[25] 中国企业的角色与机遇 - **应用创新的主战场**:中国拥有庞大且多元的应用场景(如电商、社交、智慧城市、制造业),能将全球领先的AI技术与本土洞察结合,催生世界级应用创新[27] - **硬件产业链的关键一环**:中国在全球电子制造和供应链中占据核心地位,是服务器、AI终端设备、数据中心实现大规模交付不可或缺的力量[28] - **特定领域的技术突破者**:在AI芯片设计(如华为昇腾)、自动驾驶(如百度Apollo)、机器人等领域,中国企业通过聚焦垂直领域有望实现差异化技术突破[28] - **开源生态的积极贡献者**:中国科技公司正积极拥抱开源,向全球贡献代码、模型(如DeepSeek)和数据集,提升在全球技术社区的影响力[28] - **“AI中国链”与“AI中国环”**:AI产业链意义上的“AI中国链”已成型,技术与应用意义上的“AI中国环”也已闭环,中国企业有望为世界提供更多解决方案[20]