Workflow
国产大模型与AI芯片联盟,意义有多重大?
观察者网·2025-07-30 20:03

模芯生态创新联盟成立 - 10家国产大模型、AI芯片和算力加速企业联合成立联盟,探索从大模型开发阶段适配国产AI芯片[1] - 联盟首批成员包括华为昇腾、沐曦、壁仞科技、燧原科技、天数智芯、无问芯穹、寒武纪、摩尔线程、硅基流动等近10家厂商[3] - 上海企业在联盟中占据半壁江山,体现上海高科技产业软硬结合与产业链一体化优势[1][23] 阶跃星辰Step 3模型突破 - 发布新一代多模态推理大模型Step 3,在国产芯片上推理效率最高达DeepSeek-R1的300%[3][8] - 基于NVIDIA Hopper架构芯片分布式推理时,实测吞吐量较DeepSeek-R1提升超70%[8] - 采用多矩阵分解注意力(MFA)架构,键值缓存用量较DeepSeek多头注意力机制降低93.7%[13] 国产芯片适配策略革新 - 颠覆传统开发顺序,在模型开发阶段主动适配国产芯片特性,避免硬件滞后于模型迭代[10] - 针对国产芯片制程工艺和HBM性能相对落后的现状,优化算法设计[10] - Step 3算术强度特性与昇腾910B高度匹配,解码效率超过华为盘古Pro MoE模型[11] 国产芯片训练挑战 - 国产芯片适配主要集中于推理环节,训练环节仍存在显著困难[15] - 国内最大全国产算力集群为科大讯飞与华为共建的"飞星二号",达万卡级别,总算力仍逊于英伟达集群[16] - 无问芯穹与上海算法创新研究院基于3000卡沐曦GPU集群,实现百亿参数模型600小时不间断训练[16] - 需重构底层工具链以适配不同芯片架构,工具链开发人才稀缺[17] 多模态技术商业化前景 - 多模态被视为下一代技术突破方向,基础架构创新空间较大[20] - 阶跃星辰预计2024年营收达10亿元,对比智谱同年收入约2-3亿元且亏损20亿元[22] - 已发布十余款多模态模型,覆盖语音、视觉、图像编辑、视频生成等垂直领域[22] - 智能终端Agent覆盖超一半头部国产手机厂商,与吉利合作实现端到端语音大模型首次量产上车[22] 上海AI产业生态优势 - 上海人工智能企业达24733家,较上年增长5.1%,新增注册资本超1000万企业104家[24] - 坐拥中芯国际、华虹等晶圆厂及长三角HBM先进封装产能,支撑GPU产业发展[24] - 上海模速空间孵化器日均Token调用量突破100亿[24] - 国有资本积极参与早期投资,如上海国投先导基金投资壁仞科技及阶跃星辰[24]