核心观点 - 谷歌发布Gemma 4开源大模型与特斯拉AI5芯片流片完成,分别从软件和硬件层面为端侧AI产业提供了新的增量逻辑,标志着端侧AI产业的重要拐点 [1][2] - 端侧AI正在从单点突破走向生态竞争,头部企业在模型轻量化与端侧算力上的持续投入,正在降低终端部署门槛,为芯片、模组、终端及应用等产业链环节提供明确的技术路径与合作基础,AI端侧产业链有望持续受益 [2][8] 软件层面:谷歌Gemma 4模型发布 - 谷歌发布专为高级推理与智能体工作流打造的Gemma 4开源大模型,推出四种规格:高效20亿参数版(E2B)、高效40亿参数版(E4B)、260亿混合专家模型(MoE)与310亿稠密模型(31B) [2][3] - 310亿参数模型在行业标准Arena AI文本榜单中位列全球开源模型第三 [3][5] - E2B和E4B小模型可在手机、树莓派等端侧设备上完全离线、近零延迟运行;在Pixel手机和Raspberry Pi上,新模型的推理速度提升了4倍,电池消耗降低了60% [3][6] - 谷歌将Gemma 4全系迁移至商业友好的Apache 2.0协议,允许自由用于个人、商业和企业用途,无需支付版税,这降低了硬件厂商自研模型的门槛,可能催生大量端侧AI原生应用 [2][6] - Gemma 4的发布是端侧AI产业的重要拐点事件,其小模型在手机上实现了离线运行、接近零延迟响应且功耗较低,同时具备处理复杂推理任务的能力,使终端设备拥有了不依赖云端、可随时调用的高级智能 [2][6] 硬件层面:特斯拉AI5芯片进展 - 特斯拉已完成下一代AI5自动驾驶芯片的流片工作,该芯片部分场景性能较前代AI4提升40倍 [2][7] - AI5单芯片AI算力接近2500TOPS,内存容量达144GB;其中原始算力较前代提升8倍,内存容量提升9倍,芯片专门针对Transformer引擎优化 [7] - AI5将由三星、台积电分别在美国本土的工厂代工,预计2027年启动量产 [7] - AI5最初计划用于特斯拉无人出租车项目,目前主要应用场景包括擎天柱机器人、特斯拉超级计算机集群及自动驾驶系统 [7] - AI5流片的成功是端侧算力的重要进展,表明端侧算力正在成为海外科技巨头们的必争之地 [2][7]
策略点评:AI端侧迎来模型催化新逻辑