行业与公司 - 英伟达、特斯拉、OpenAI、惠普、戴尔、超微、苹果、Meta、博通、字节跳动、微软、Anthropic、Alchip、Marvell 核心观点与论据 英伟达的 Project Digit AI 盒子 - 应用场景:轻量级预训练模型、模型的 Fine-tune 以及推理业务,适合参数体量较小或数据量较小的模型训练和常规推理[1] - 市场定位:主要面向中小型 2B 用户,适合中小规模企业、开发者、高校及初创公司等专业用户[2] - 优势:低部署成本、即插即用、支持英伟达生态系统[2][3] 英伟达的 GB200 NVL72 晶盾 - 设计特点:通过晶圆级别的互联和 die 之间的互联,提升计算密度,减少系统级占用空间[4] - 发展阶段:仍处于初期阶段,对机房设计、系统级设计、散热和供电等方面提出更高要求[4] 英伟达的 test time scaling 法则 - 影响:提升 GPU 在推理计算中的优势,支持更多业务场景,确保在大模型发展过程中保持并扩大市场份额[6] 英伟达的 Cosmos 世界模型 - 与特斯拉 FSD 的竞争:目前难以直接竞争,但为车企提供基于英伟达架构进行自动驾驶开发的新途径[7] - 策略:从单纯销售自动驾驶芯片转向提供端到端解决方案[7] 英伟达的 GR00T 与特斯拉 Optimus 的竞争 - 市场机会:人形机器人市场尚处于初步兴起阶段,机会和空间巨大[8] - 竞争关系:英伟达希望早早进入市场,与特斯拉保持合理竞争关系[8] 特斯拉的 Optimus 机器人 - 生产目标:未来三年生产 50 万台 Optimus 机器人,目标具有实现可能性[9] OpenAI 的机器人进展 - 计划:2025 年宣布机器人产品,2026 年正式发布[10] - 合作:与第三方合作伙伴共同开发完整端到端解决方案[10] 惠普的订单与优势 - 订单:斩获 X.AI 十亿美金订单[11] - 优势:深度定制化合作能力,早期参与设计过程,积极响应客户需求[11] 惠普的液冷交付能力 - 解决方案:自研液冷交付解决方案,具备应对大规模交付能力[12] OpenAI 的 ASIC 进展 - 目标:替代部分英伟达 GPU,满足未来业务需求[13] - 量产时间线:2026 年大规模部署[13] 苹果的 Baltra AI 服务器芯片 - 专注领域:推理业务[14] - 进展:预计今年底或明年初完成首批回片[14] Meta 的 MTIA 订单 - 版本:第一个版本性能未达预期,第二个版本计划于 2026 年开始上量[15] 字节跳动的 ASIC 项目 - 进展:设计思路不断调整,预计 2026 年完成[16] - 合作:与博通合作存在不确定性[16] 字节跳动的订单预期 - hwj 订单:主要用于推荐广告搜索模型训练[17] - shenteng 订单:涉及传统 AI 领域业务,计划进入大模型训练领域[17] hwj 的出货预期与产能分配 - 出货预期:重点保障字节的订单,产能主要依赖 SMIC[18] - 产能分配:如果 SMIC 良品率提升,将交付 10 万片,否则保障 6 万片[18] hwj590 的良率问题 - 提升情况:近期有所提升[19] 690 芯片的设计与生产进展 - 进展:正在设计中,预计春节后有小批量返回[20] Trainium 3 的信息 - 量产时间点:2025 年开始部署[20] 微软投资 Anthropic 的考量 - 原因:因 Copilot 产品不太成功,需要选择未来合作伙伴[21] - 考量:扶持 Anthropic 以便未来自身开发不理想时仍有平台厂商和基础底座厂商合作[21] OpenAI 的负面新闻 - 问题:奥特曼的作风问题、GPT-5 的推迟、吹哨人事件等[21] - 影响:公司战略方向转变,商业化气息愈加浓厚,引发行业内广泛诟病[21] Trainium 3 的制造商 - 制造商:Alchip[22] - 竞争:Marvell 仍在争取这一项目[22]
AI大厂发展方向会议纪要
AIRPO·2025-01-16 11:30