多模态
搜索文档
谷歌挑战英伟达,摩尔线程、沐曦内部人士怎么看?
第一财经· 2025-12-18 22:06
文章核心观点 - 谷歌发布自研TPU引发市场对AI硬件技术范式从通用GPU转向专用芯片的讨论 英伟达市值一度蒸发超千亿美元[3] - 行业专家认为 GPU与TPU等专用芯片是“通才与专才”的分工 将长期共存而非简单替代[4][6] - AI算力的核心竞争力已从单卡算力转向大规模集群系统与全栈解决方案[7][8] 行业技术路线与竞争格局 - 谷歌能做TPU得益于其全栈整合能力 将模型跑在自家芯片上优化以实现成本性价比最大化 但绝大部分企业不具备此垂直整合能力[4] - GPU保持优势的原因在于其灵活度是“甜点” 能处在AI算法快速迭代的创新前沿[5] - 未来是多模态的 需要“理解世界 用三维构建世界 超高清传输世界” 全功能GPU的“图算一体”能力在跨域支持所有计算范式上具有不可替代的优势[5] - 英伟达在计算领域的“王者”地位得益于其建立的CUDA生态 能够联合所有开发者建设生态[5] - 任何芯片架构没有高低优劣之分 关键看场景 GPU和ASIC的架构几十年前就已存在 是超级稳态[6] - 当前大模型迭代速度非常快 按周计 按月计 任何基础模型远未到达收敛的时间点 通用GPU的泛化能力和适配性仍是核心竞争力[6] - 客户应用场景分散且层出不穷 GPU和类似TPU这样的ASIC会长期共存[6] - 未来超大型云服务公司可能在算法收敛稳定到一定阶段时选择定制专门的TPU 并在能力溢出时与其他厂商合作[6] 公司战略与实践 - 摩尔线程会继续坚持全功能GPU图算一体的路线[5] - 摩尔线程正在搭建自己的MUSA生态[5] - 摩尔线程目前有多个投入生产的千卡集群在运行 已处于生产期 支持训练和推理[7] - AI大模型的运行关键不在单卡算力 卡间互联的网络通信是非常复杂的架构 摩尔线程致力于提供端到端全栈的解决方案[7] - 沐曦认为AI基础设施的最大挑战在于明确产品本质 客户最终需要的是一个能够可靠支持大规模模型训练 推理与服务的通用算力平台 而非孤立的单卡或服务器[8] - 沐曦已在全国范围内部署了数千卡规模的集群 并成功完成了从传统模型到MoE模型乃至非Transformer架构模型的训练任务[8] 市场反应与行业地位 - 谷歌新一代AI模型Gemini 3系列发布后 英伟达市值一度蒸发超千亿美元[3] - 华尔街将英伟达推上市值榜首 证明了通用性GPU在当前历史阶段的主流地位[6] - 对于英伟达股价近期的波动 有观点认为这或是一种很好的“砍价方式”[6]
阿里妈妈发布MUSE:用多模态搞定十万级超长行为序列,并开源Taobao-MM数据集
机器之心· 2025-12-16 12:11
文章核心观点 - 阿里妈妈与武汉大学团队提出了一种名为MUSE的新型多模态搜索框架,旨在解决推荐系统对用户超长历史行为序列(如10万至百万级)建模能力不足的问题,通过利用图像和文本等多模态信息,系统性提升终身用户兴趣建模的质量与可用长度 [1][4][6] - MUSE框架已在阿里妈妈展示广告精排模型中全量上线,实现了对10万长度用户原始行为序列的建模能力,并在线上A/B实验中带来了显著的CTR提升(+12.6%)和业务收益(RPM +5.1%, ROI +11.4%) [6][36] - 该工作不仅提出了创新的算法与工程协同设计,还开源了首个包含“长行为序列+高质量多模态embedding”的大规模公开数据集Taobao-MM,以推动业界和学界在相关方向的研究 [1][6][41] 技术背景与问题 - 当前主流CTR建模,特别是以SIM/TWIN为代表的两阶段长期行为建模框架,虽将可用历史行为长度扩展至万级别,但收益边际提升已变得困难,尤其在检索精度受限时,序列从万级往上扩展效果提升会明显趋缓 [2] - 用户行为序列极长(在淘宝中轻松达到百万级),但受限于在线延迟、存储和算力,实际部署模型通常只能使用最近几千条行为,或进行粗粒度截断 [3] - 现有ID-based建模方法存在局限:长尾和过期item的ID embedding质量不佳,而它们在“终身历史”中占比很高;模型主要学习“ID共现关系”,而非用户真实的内容兴趣 [3][15] MUSE框架核心洞察与设计 - **核心设计原则**:GSU(通用搜索单元)应保持“简单”,而ESU(精确搜索单元)需要“丰富+融合” [12] - **对GSU的洞察**:在有高质量多模态embedding的前提下,GSU只需要一个轻量的余弦(cosine)相似度检索就足够好,复杂的检索结构收益低且不具性价比 [17] - **对ESU的洞察**:多模态序列建模与ID融合非常关键,ESU对多模态embedding的质量极其敏感,远高于GSU [18][19] - **表征预训练**:底层采用SCL多模态预训练,通过结合用户真实“搜索-购买”行为进行对比学习,使得到的embedding同时具备内容语义和行为相关性 [23] MUSE框架技术详解 - **多模态GSU**:使用SCL embedding进行简单的余弦相似度计算和Top-K检索,从用户10⁵~10⁶级历史行为中筛选出最相关的几十条,过程高效且无复杂Attention [24][26] - **多模态增强ESU**:采用SimTier与SA-TA双路并行建模 [25] - **SimTier路径**:将目标item与历史行为的多模态相似度序列压缩为一个“相似度直方图”,形成紧凑的语义兴趣分布向量,计算开销极小 [26][33] - **SA-TA路径**:在标准的ID-based Target Attention基础上,融合多模态余弦相似度及其与ID打分的交互项,形成最终的attention score,以缓解长尾item打分失真问题 [27][28][30] - **最终输出**:SimTier输出的多模态兴趣向量与SA-TA输出的ID兴趣向量拼接,作为“终身兴趣表示”输入给上层CTR模型 [30] 工程落地与性能 - **延迟控制关键**:将GSU从Ranking关键路径中剥离,进行异步预取,其延迟被Matching阶段遮蔽,从而在引入10万行为序列和多模态信息的同时不增加在线延迟 [32][35] - **具体两阶段设计**: 1. Pre-fetching阶段:与Matching并行,从远端存储拉取用户100K行为的多模态embedding并缓存至GPU显存 [36][42] 2. 相似度计算与Top-K选择阶段:在Ranking前快速计算相似度,得到Top-K行为ID和相似度序列供ESU使用,计算量小且可与特征处理并行 [36][42] - **效果验证**:线上A/B实验显示,相比仅使用5K长度行为的ID-only基线(SIM),MUSE(行为长度100K)带来CTR提升12.6%、RPM提升5.1%、ROI提升11.4% [36] - **离线消融实验**:序列越长,MUSE带来的收益越大;多模态增强ESU在所有长度上都显著优于ID-only ESU,且长度越长优势越明显 [36] 对业界的启发与可复制经验 - **GSU优化**:优先学习高质量的item图文embedding,并用多模态余弦检索替代GSU的ID-only检索,这是性价比最高的第一步,无需在GSU阶段设计复杂结构 [38] - **ESU增强**:将多模态信息引入ESU是关键,可逐步推进:引入轻量的“相似度直方图”模块(如SimTier);在现有DIN/TWIN的attention中融入多模态相似度作为辅助打分(类似SA-TA) [38] - **工程架构**:解决超长序列和多模态引入的I/O瓶颈是重点,可借鉴MUSE模板:将GSU抽成独立服务与Matching异步并行;将embedding就近缓存;确保Ranking阶段计算轻量 [39] - **落地路线**:对于拥有长行为日志(>> 万条)、丰富内容特征且ID-only模型收益见顶的业务,可先提升表征质量,用多模态支撑GSU检索,再在ESU中融合多模态信号,作为“轻量版MUSE”的起点 [46] 开源数据集Taobao-MM - **数据集价值**:这是首个同时具备“长行为序列+高质量多模态embedding”的大规模公开数据集,旨在支持“长序列 × 多模态”方向的研究,减少业界和学界自建数据的成本 [41][44] - **主要特点**:用户行为序列最长1K(开源版,内部实验支持100K);提供128维SCL多模态embedding;数据规模约1亿样本、近900万用户、3500万级item [43]
“2025商汤科技AI论坛”:多模态、具身智能与“AIinX”落地加速
环球网· 2025-12-15 16:16
论坛概况与核心主题 - 2025年12月9日,商汤科技与香港科技园公司在香港科学园联合主办“2025商汤科技AI论坛”,主题为“模型智未来” [1] - 论坛聚焦大模型演进、多模态融合、具身智能落地及AI驱动的产业范式转移,吸引全球AI研究者、企业决策者与生态伙伴参与 [1] 行业趋势与公司战略定位 - 商汤科技CEO指出,AI正经历大规模技术浪潮,从感知走向生成,从云端走向端侧,并加速迈向具身智能与世界模型 [3] - 公司定位为根植香港、服务全球的AI原生企业,致力于连接国家AI战略与全球创新网络 [3] - 香港科技园CEO认为,商汤从初创到全球领先的跃迁,是香港具备孕育世界级科技企业土壤的例证 [3] 技术演进与核心突破 - 行业经过三年爆发式发展,下一步需聚焦实现真实场景中的价值闭环和寻找下一次原始创新 [3] - 商汤披露三项底层架构关键突破:NEO原生多模态融合架构,实现文本、图像、视频、3D等模态的统一表征;跨视角预测训练范式,提升模型对空间关系与动态场景的理解能力;SekoTalk高效推理系统,显著降低多模态推理延迟以支撑实时交互 [3] - 这些技术推动大模型从“AI for X”(为某领域提供工具)向“AI in X”(深度嵌入业务流程)演进,为构建能与物理环境持续交互、自我演进的智能体奠定基础 [5] 产品升级与业务应用 - 伴随大模型渗透,视觉AI迎来二次增长曲线,商汤正式发布“商汤方舟”平台升级路线,从算法库转向“视觉智能体工厂” [5] - 新方舟平台通过“平台化+模型化+智能体化”架构,满足智慧城市对“分析→洞察→决策”全链路的需求 [5] - 大模型正在重构视觉AI生产流程,使现场工程师也能参与模型调优,部署周期从月级缩短至天级 [5] 市场落地与商业影响 - 在企业应用层面,AI已从效率工具升级为商业模式重塑引擎 [7] - 商汤亚太区过去六年已服务近500家客户,其中70%保持深度合作,本地化部署成为关键成功因素 [7] - 公司CFO指出,AI不仅是技术,更是基础设施,并相信香港能持续诞生影响世界的科技创新 [7] - 随着多模态、具身智能与行业大模型加速融合,AI正从实验室走向产线、机场、家庭与城市治理 [7]
商汤科技日日新Seko系列模型与寒武纪完成适配
新浪财经· 2025-12-15 14:10
公司产品发布 - 商汤科技于12月15日正式发布Seko2 0 这是行业首个多剧集生成智能体 [1] - 该产品依托于商汤自研的日日新Seko系列模型 [1] 技术合作与适配 - 商汤日日新Seko系列模型已完成对国产AI芯片寒武纪的适配 [1] - 此次适配实现了国产算力对AIGC核心场景的支持从语言到多模态的关键跨越 [1] - 适配完成后 双方还将在多个方向共同进一步展开深度优化 [1]
“连姥姥都问我,你知道DeepSeek吗?”
第一财经· 2025-12-12 09:11
文章核心观点 - MiniMax创始人闫俊杰在访谈中反思了公司在面对DeepSeek等竞争对手时的挑战与应对 核心在于承认自身认知不足与执行不坚决 并强调了坚持技术驱动路线、重视人才激励以及对中国AI人才优势的信心 他认为大模型行业参与者将越来越少 但市场在扩大 未来成功的关键在于想象力与坚持[3][6][8][12][13][14] 创始人反思与竞争认知 - DeepSeek的广泛认知给MiniMax带来巨大触动 创始人闫俊杰反思团队在某些关键节点上降低了要求、思考不够深入、选择不够坚定 而竞争对手DeepSeek则拥有独特的认知和长期技术积累[3][5][6] - 公司经历的大部分挑战最终都转化为如何提升自身能力的问题 团队在受到打击时反而能变得更好是做得比较好的方面[6] 公司治理与人才激励 - 面对士气低迷 公司恢复信心的方式包括:拆解问题并用第一性原理论证可行性以鼓舞士气 以及通过发钱让员工的努力被看见和反馈 发钱被认为是管用的[7] - 2025年9月 MiniMax启动了百万美元期权激励计划 根据贡献程度向员工提供几十万美元到几百万美元不等的激励 覆盖模型算法、产品、市场、增长、职能等多个岗位 并计划对突出贡献者进行即时期权激励[7] 技术路线与产品战略 - DeepSeek的出现可能让MiniMax对技术路线更加坚定 公司经历了约半年的迷茫 纠结于技术驱动与复制移动互联网经典增长路线之间 最终认定在AGI赛道上 公司只能选择技术驱动的方式 尽管风险更高[8] - MiniMax独特的打法是ToC和出海 其角色陪伴类应用Talkie在海外获得了大量用户 目前用户量最大的产品是Talkie 而收入方面最大的是视频和API[8] - 针对外界对公司布局大语言模型、语音、视频等多模态业务的“不聚焦”质疑 创始人认为真正的AGI一定是多模态输入输出 团队计划先将每个模态走通 再在接下来几个月整合到下一代模型中 并援引OpenAI的Sora2作为多模态融合的成功范例[9][10] 行业格局与中外对比 - 国内大模型与海外顶尖模型的技术差距在缩小 但投入成本远低于海外 例如 谷歌、OpenAI、Anthropic和xAI的估值可能是中国公司的100倍 技术或许只领先5% 但投入可能在50至100倍之间[12] - 中国AI人才是重要的优势 推动DeepSeek取得成功以及MiniMax内部起到关键作用的人才基本都来自本土 且往往是他们的第一份工作 创始人认为 如果中国年轻人中出现本土技术天才 可能成为AI领域的突破点[12] - 根据MacroPolo的报告 来自中国的顶尖AI研究人员占比从2019年的29%提升到了2022年的47%[12] 未来展望与行业判断 - 创始人认为 明年做大模型的公司会更少 行业已从“百模大战”演变为仅剩几家公司 在一个越来越大的市场里 参与者越来越少 只要能持续迭代并证明价值 资金就不是最重要的问题[13] - 目前大模型尚未进入存量竞争 也不会出现一两家通吃的局面 不同模型有不同特点 例如OpenAI长于推理对话 Anthropic强于代码和Agent 谷歌在多模态方面领先 而中国模型在效果上或许差5% 但成本可能是海外的1/10[13] - AI行业不是互联网的延续 大模型时代真正的产品是模型本身 未来各岗位边界将变得模糊 最核心的竞争力是想象力 谁拥有最好的想象力、最能坚持、对社会价值大 谁就会成功[14]
美团AI转向,前字节视觉模型AI平台负责人潘欣加入|36氪独家
36氪· 2025-12-11 21:37
美团AI战略与人才布局 - 前闪极AI合伙人、前字节视觉大模型AI平台负责人潘欣近期已加入美团,负责多模态AI创新工作,主导了LongCat App等多个相关应用的开发[4][5] - 2025年美团在AI人才招聘上积极性未减,招聘集中在模型训练方面,标准很高,人才主要来自阿里通义、Seed以及腾讯混元团队[7] - 当前美团金融线、客服线、电商线等业务正在大力招聘AI应用人才,集中在后训练和商业化落地[11] - 原“光年之外”团队(GN06)负责人刘炯已调任至美团,直接向美团平台负责人李树斌汇报,近期该团队招聘力度有所减少[11] 美团AI战略框架 - 公司创始人王兴将美团AI战略定位为“积极进攻而非消极防御”,并首次披露了AI大模型LongCat的相关进展[5] - 公司AI战略建立在三个层面:AI at work(将AI用于员工工作和运营)、AI in products(用AI改造既有2B和2C产品服务并打造AI原生产品)、Building LLM(积极投入资本支出完善自研基座模型能力)[6] - 2025年第二季度起,在外卖大战压力下,公司将有限的资源优先放在了基座模型的训练上[7] 美团AI基座模型与开源进展 - 2025年至今,公司密集发布了一系列基座模型和应用,基本完成了从语言模型到视觉、音频、视频的全模态基座建设[8] - 具体发布包括:6月发布首款AI编程产品Nocode;9月发布并开源大语言模型LongCat-Flash-Chat及推理模型LongCat-Flash-Thinking;10月发布并开源视频生成模型LongCat-Video;11月发布开源全模态模型LongCat-Flash-Omni;12月发布并开源三款图像模型LongCat‑Image、LongCat‑Image‑Dev、LongCat‑Image‑Edit[10] 美团AI业务应用聚焦 - 基座能力建设是为公司主营业务AI化铺路,2025年下半年起,公司在AI应用侧明显提速,并更加聚焦于主线业务的AI化改造[8] - 例如,10月公司向餐饮商家推出了“袋鼠参谋”、“智能掌柜”等AI工具,并向行业所有商家免费开放[9] - 此前公司的AI应用创新以独立的AI To C应用为主(如Wow、妙刷),如今这些To C探索已有所收缩[11]
自驾世界模型剩下的论文窗口期没多久了......
自动驾驶之心· 2025-12-11 08:05
行业趋势与研究方向 - 近期自动驾驶世界模型相关论文爆发式增长,涌现出MindDrive、Think Before You Drive、U4D、SparseWorld-TC、AD-R1、Percept-WAM等多项工作 [1] - 根据顶会接收规律,选题多为局部突破与可验证改进,并紧贴当年主旋律,例如2024年为多模态,2025年为视频生成 [1] - 参照2026年各大顶会中稿论文,预测今年年底至明年上半年的主旋律极有可能是世界模型,当前布局该方向具有前瞻性优势 [1] 公司业务与服务定位 - 公司提供自动驾驶、具身智能、机器人等方向的论文辅导服务,旨在帮助学生冲击高区或顶会论文发表 [2] - 服务内容包括掌握技术脉络、复现模型、产出1篇论文初稿及投稿指导 [2] - 公司旗下拥有自动驾驶之心、具身智能之心、3D视觉之心等多个技术自媒体平台,是国内最大的AI类技术自媒体平台之一 [3] - 公司深耕自动驾驶、具身智能、机器人等交叉学科领域多年,拥有国内顶尖的学术资源 [3] 服务团队与过往业绩 - 公司拥有超过300名专职于自动驾驶/具身智能方向的导师,导师来自全球QS排名前100的院校,并发表过多篇顶会、子刊及A/B会论文 [5] - 近3年累计辅导学员超过400名,中稿率高达96% [5] - 过往成功案例显示,学员覆盖博一至在职等不同阶段,辅导周期在2至4个月,成果发表于NEUROCOMPUTING(2区)、CVPR(顶会)、emnlp(顶会)等多种期刊与会议 [6] 服务内容与价值主张 - 服务旨在解决学生科研中的常见痛点,如导师指导不足、知识体系零散、对投稿流程不熟悉等 [4][7] - 具体帮助包括建立科研思维、系统掌握经典与前沿算法、结合模型理论与代码实践、将baseline深化拓展形成个人论文 [7] - 提供个性化论文指导、导师实时互动、录播无限回看、免费课后答疑及24小时无时差上课等服务 [13] - 提供从选题、调研、idea验证、代码、实验、润色、投稿到中稿的一站式科研服务,目标覆盖CCF-A/B/C、SCI1-4区及EI会议 [13] 目标客户与附加价值 - 主要服务方向包括三维重建、relighting、NVS、SLAM、点云处理、VLA、机器人导航、计算机视觉等 [10] - 目标学员需自带简历并具备一定的PyTorch基础 [10] - 服务满足多种需求,包括积累科研经验、提升职称、提高学术成就;提升人工智能领域从业者竞争力以助升职加薪;以及为考研、申博、留学提升简历含金量 [14] - 优秀学员有机会获得清北、MIT等名校推荐信,或被推荐至相关实验室实习;表现突出者可获内推至阿里达摩院、华为诺亚方舟等企业研发岗位 [19] 服务模式与保障 - 服务采用班主任全程督学模式,跟进学习进度 [17] - 提供精准导师匹配系统,根据学员研究方向、目标期刊和基础水平,从300多名导师中筛选3至5位最契合人选供学员选择 [18] - 为零基础学员提供基础课程,通过系统学习,据称6个月可完成一篇小论文 [17] - 提供预收定金后与名师meeting的机会,并承诺若不满意可免费更换老师或退款 [19]
AI应用下一个突破口在哪
北京商报· 2025-12-10 23:44
文章核心观点 - AI产业正从“工具时代”迈向“伙伴时代”,发展重点从上半场的想象力转向下半场的执行力 [1] - 量子位智库发布的《2025年度AI十大趋势报告》基于基础设施、模型进化、应用版图等四部分进行总结,其中应用相关趋势占四席,涉及流量入口、多模态、AI硬件和AGI [1] 基础设施与算力经济 - 算力经济是智能产业第一大引擎,全球对AI算力的需求以前所未有的速度增长,直接推动超大规模数据中心建设,这些数据中心演变为由单个AI公司主导的集成了海量计算、存储和网络资源的算力工厂 [3] - 云计算厂商的投资重点从传统通用计算资源向满足AI需求的专用算力基础设施倾斜,与AI企业的合作模式从简单资源租赁演变为深度绑定的战略合作关系 [3] - AI原生需求正在重塑芯片创新:GPU主导地位受挑战,NPU在端侧普及,ASIC/FPGA迎来增长 [3] - 中国正加速构建自主可控的算力生态,国产“芯片+SDK+框架”方案已在千亿级模型训练中得到验证,DeepSeek等模型针对昇腾芯片深度优化,标志着全栈国产化能力迈入新阶段 [3] 模型进化与创新 - 预训练决定大模型格局梯队,架构创新决定预训练水平,在算力约束下,混合专家模型(“大参数、小激活”)成为主流选择,中国头部模型团队普遍采用这一思路 [4] - 2025年大模型落地进入“推理时间”,模型在多模态深度推理、自适应推理、边缘推理加速等方面持续突破,任务复杂度推动推理框架持续进化 [4] - 物理AI与具身智能迎来研发热潮,世界模型与VLA(视觉—语言—动作)框架成为技术焦点,具身智能正从小规模商业订单走向更广泛的应用探索 [4] - 智源研究院发布的多模态模型Emu3.5是世界模型的基座,人工智能正从语言学习进入多模态、世界学习的新阶段 [5] - 自变量机器人自主研发的“Great Wall”模型系列已实现从感知到高精度操作的端到端控制,在复杂任务中展现出强大的泛化能力 [6] 应用版图扩大 - AI正在重塑流量入口,Agent从“人找服务”转向“服务找人”,成为下一代交互范式,AI智能体具备感知、规划、决策、执行的闭环能力,正逐步取代传统App,操作系统亦向超级Agent演进 [7] - 新一代AI系统能够同时处理和理解文本、图像、声音、视频等多种信息类型,实现跨模态的关联理解和生成,为创意内容生成、智能交互等应用开辟新可能 [7] - AI应用的关键价值在于释放高价值劳动力,将人类精力转移到具有实质性价值的核心任务和战略性工作上,报告预测未来2—3年内,随着技术能力成熟,AI会成为相关产业的标准工具 [7] - AI硬件赛道受关注,轻量化模型和边缘计算技术成熟,推动AI能力向手机、汽车、IoT设备等终端普及,端侧AI解决了数据隐私、网络延迟和成本效率三大核心问题 [7] 具身智能的商业化进展 - 优必选与国内AI大模型公司签订人形机器人销售合同,总金额超过5000万元,除了提供机器人硬件,还将开放数据接口与技术能力,支持合作方将其自有AI大模型与机器人本体进行集成与二次开发 [4] - 优必选工业人形机器人Walker S2已启动量产与交付,首批数百台已投入汽车制造、智能制造、智慧物流、具身智能数据中心等产业一线应用,目前Walker S2产能每月已超过300台,预期全年交付量将超过500台 [5]
谷歌掀“美国版DeepSeek冲击”,投资人拆解算力赛道前景|华尔街观察
第一财经资讯· 2025-12-04 18:09
谷歌AI进展与市场影响 - 摩根士丹利报告显著上调谷歌自研AI芯片TPU的产量预测,预计到2027年达500万片,2028年达700万片,较此前预测的300万片和320万片大幅提升 [1] - TPU产量提升预计将为谷歌带来约130亿美元营收增量及0.40美元的每股收益提升 [1] - 谷歌最新大型语言模型Gemini 3完全由其TPU训练,在训练成本和效率上相比英伟达GPU更具优势 [1] - 谷歌母公司Alphabet股价冲破320美元,年初至今涨幅接近70%,市值逼近4万亿美元,市盈率从年内14倍翻倍至逼近28倍 [1] 谷歌的核心竞争优势 - 谷歌被投资经理视为最接近通用人工智能的企业,具备算力保障与数据两大关键优势 [2][4] - 算力优势源于自身强劲现金流,无需外部融资即可获取充足GPU [4] - 数据优势在于沉淀了数十年的搜索、视频、安卓移动等浅层与深层数据,是AI训练的核心“养料” [4] - 谷歌拥有“一体化”生态系统优势,包括搜索、Gmail、Workspace、Android,利于将AI融入数十亿用户工作流程 [5] - 谷歌联合创始人佩奇回归主抓AI,结合DeepMind技术,有望推出超越ChatGPT的产品 [4] 对英伟达及AI硬件格局的影响 - 市场担心谷歌AI进展,导致英伟达市值蒸发超千亿美元 [1] - 英伟达持股的数据中心运营商CoreWeave股价从历史高位下跌近50%,其竞争对手Nebius股价也持续下行 [7] - 分析认为TPU作为专用计算芯片,在特定推理场景有优势,但无法取代GPU的通用计算地位,两者是互补而非替代关系 [2][7] - 在AI解决“情商问题”(处理非确定性、概念性内容)的背景下,英伟达GPU是关键支撑,扮演“情商调动总协调师”的角色 [7][8] - 英伟达在算力领域的主导刚起步,行业资本开支上升趋势有望维持,其市盈率接近20倍,估值被认为合理 [8] AI投资格局与市场观点 - 巴菲特旗下伯克希尔·哈撒韦于2025年三季度首次建仓谷歌母公司Alphabet,持仓规模达43亿美元,引发市场震动 [4] - 当前大模型竞争格局从“谁拥有最智能的聊天机器人”转向“谁拥有最集成的一体化工作流程”,谷歌两者兼备 [5] - OpenAI面临挑战:若在多模态消费者功能上与谷歌竞争,将陷入消耗战;若退守企业市场,则面临谷歌通过生态系统渗透的威胁 [5] - 市场开始担心AI投资性价比,但认为AI是类似工业革命的重大变革,不能以单一企业短期收支衡量整个行业 [6] - 多位投资经理仍长期持有AMD和英伟达,认为以目前市盈率减持不明智,但短期内不利因素不太可能消失 [9] AI应用端的投资机会 - 未来投资者目光将更多聚集于AI应用端,因为应用端是“资本开支的接收者”和被AI真正赋能的部分 [10] - 垂直应用领域如教育、医疗、文创、通用办公等都可能跑出独角兽 [11] - 中国企业在AI应用层,特别是在用户体验打造方面占据优势,得益于庞大用户群体 [11] - 以哔哩哔哩为例,其被看好的原因包括:用户规模达3.6亿且具备消费力、内容生态适合知识类长视频与AI赋能、游戏与广告业务增长潜力清晰 [11] - 高盛、摩根士丹利等机构已发布报告提高哔哩哔哩目标价,看好其广告变现潜力与AI带来的效率提升 [11]
速报!MEET2026嘉宾阵容再更新,观众报名从速
量子位· 2025-12-04 13:57
大会概况 - 会议名称为量子位MEET2026智能未来大会,将于2025年12月10日在北京金茂万丽酒店举行 [1][119] - 大会主题为“共生无界,智启未来”,关注以AI为代表的智能科技如何穿透产业、学科与场景的边界 [2] - 大会将聚焦强化学习、多模态、芯片算力、AI+行业、AI出海等前沿技术与产业落地进展 [3] - 内容涵盖学术前沿与商业落地的碰撞,以及来自基础设施、模型、产品产业的领先技术成果 [4] - 大会将权威发布人工智能年度榜单与年度AI趋势报告 [5][116] - 作为年度影响力科技商业峰会,每年吸引上千名科技从业者参与,百万观众线上围观,近百家合作媒体联合曝光 [121][122] 人工智能年度榜单 - 量子位发起的“人工智能年度榜单”已成为AI行业最具影响力榜单之一 [117] - 2025年榜单将从公司、产品、人物三大维度评选五类奖项 [117] 年度AI趋势报告 - “年度AI趋势报告”将提名正在释放巨大潜力的十大AI趋势 [118] - 报告将结合技术成熟度、落地现状、潜在价值等因素对各趋势进行深入分析,并提名代表机构与最佳案例 [118] 参会嘉宾阵容 - **张亚勤**:清华大学智能产业研究院院长,中国工程院院士,曾任百度公司总裁,数字视频和人工智能领域世界级科学家 [11][12] - **孙茂松**:清华大学人工智能研究院常务副院长,欧洲人文和自然科学院外籍院士,主持多项国家级科研项目 [15] - **王仲远**:北京智源人工智能研究院院长,曾任职于快手、美团、Facebook、微软亚洲研究院,发表论文100余篇 [19] - **王颖**:百度集团副总裁,负责文库事业部、网盘事业部,曾任职搜狗公司高级副总裁 [23][24] - **韩旭**:文远知行WeRide创始人兼CEO,带领公司于2024年登陆纳斯达克,2025年登陆香港交易所 [27][28] - **Daniel Povey**:小米集团首席语音科学家,IEEE Fellow,著名开源语音识别工具Kaldi的提出者和主要维护者 [33] - **方汉**:昆仑万维董事长兼CEO,拥有31年互联网从业经验,中文Linux奠基人之一 [36][37] - **尤洋**:潞晨科技创始人兼董事长,新加坡国立大学校长青年教授,曾获福布斯30岁以下精英榜(亚洲)等荣誉 [42][43] - **杨帆**:商汤科技联合创始人、执行董事、大装置事业群总裁,主导人工智能基础设施建设与服务体系打造 [45] - **万卫星**:高通公司AI产品技术中国区负责人,负责高通智能终端侧人工智能引擎软硬件的规划及生态系统建设 [48][49] - **陈晓建**:亚马逊云科技大中华区产品部总经理,拥有超过20年企业级业务经验,中国公有云服务早期探索者 [53][54] - **Dennis Yue**:Google Cloud大中华区企业与中国初创业务负责人,在云计算和IT服务领域拥有超过30年领导经验 [58] - **朱宁**:上海交通大学上海高级金融学院金融学教授,全球知名的中国经济金融专家,研究涵盖行为金融学等领域 [62][63] - **赵俊博**:浙江大学百人计划研究员、博士生导师,蚂蚁集团资深技术专家,聚焦大模型、世界模型和合成数据技术 [67] - **喻友平**:中关村科金总裁,曾任百度智能云副总裁,提出“平台+应用+服务”大模型落地三级引擎战略 [71][72] - **刘凡平**:RockAI CEO,主导并实现国内首个非Transformer架构大模型,首倡以“群体智能”理念推动通用人工智能 [75][76] - **乔梁**:太初元碁联合创始人兼首席运营官,清华大学计算机系博士,获评2024年度“算力中国·青年先锋人物” [80][81] - **王潜**:自变量机器人创始人兼CEO,致力于研发由端到端大模型驱动的通用机器人 [84][85] - **姚欣**:PPIO联合创始人兼CEO,P2P-Streaming协议发明人,曾创办覆盖全球4.5亿用户的网络电视平台PPTV [88][89] - **毛健**:云徙科技COO/副总裁,拥有20多年管理咨询和技术落地经验,主导企业运营超级智能体产品研发 [93][94] - **屠静**:卓世科技创始人兼CEO,曾任百度地图、百度糯米、百度APP核心高管,具备丰富的AI行业实践经验 [99][100] - **杜知恒**:小宿科技联合创始人兼CEO,曾任家办CIO、红杉中国对冲基金创始成员,曾在高瓴资本、百度等企业任职 [104][105] - **赵天成**:联汇科技CEO兼首席科学家,其研发的Om多模态大模型是国内首个通过工信部信通院评测认证的预训练大模型 [108][109] - **徐达峰**:蚂蚁集团平台体验技术部负责人,资深前端技术专家,致力于通过AI驱动前端研发范式革新 [113][114]