模型发布与技术特点 - DeepSeek-V3.2-Exp模型于9月29日正式发布并开源,引入稀疏Attention架构,据称能有效降低计算资源消耗并提升模型推理效率 [1] - DeepSeek大幅下调API价格,降价幅度超过50% [1] 国产AI芯片适配进展 - 华为昇腾宣布基于vLLM/SGLang等推理框架完成DeepSeek-V3.2-Exp的0day支持适配部署,并向开发者开源所有推理代码和算子实现 [1] - 寒武纪同步实现对DeepSeek-V3.2-Exp的适配,依托DeepSeek Sparse Attention机制叠加寒武纪的极致计算效率,可大幅降低长序列场景下的训推成本 [1] - 海光信息宣布其DCU实现对DeepSeek-V3.2-Exp的无缝适配和深度调优,模型在海光DCU上展现出优异性能 [1] 市场反应与板块表现 - 受消息提振,9月30日市场早盘震荡拉升,科创50指数表现强势,AI芯片和华为昇腾概念活跃 [2] - 截至下午1点30分,品茗科技涨超19%,铂科新材涨超14%,恒烁股份涨超11%,云天励飞-U和昆仑万维等跟涨 [2] 行业意义与发展趋势 - 业界分析指出此次软硬件“双向奔赴”的意义远超单点技术突破,标志着国产AI生态从“可用”向“好用”演进,形成从底层算力到上层应用的闭环 [2] - 通过芯片与模型的联合创新,自主可控的技术链条降低了对外部供应链的依赖,为行业提供更具竞争力的软硬件一体化解决方案 [2] - 大模型与生成式AI正快速从云端走向消费终端,各巨头加紧构建软硬件一体的AI生态,短期有望提升产品附加值和用户黏性 [2] - 长期看谁能率先打造出“AI+硬件”的杀手级应用,谁就能在下一波计算平台竞争中占得先机,这也将成为资本市场衡量科技公司成长性的关键指标 [2]
DeepSeek新模型上线,昇腾、寒武纪、海光等宣布适配