消息称 DeepSeek V4 模型打破惯例:华为等国内厂商可早期访问,不让英伟达 AMD 先用
DeepSeek V4模型发布策略与行业动态 - DeepSeek在即将进行重大模型更新前,未向美国芯片制造商英伟达和AMD展示其即将推出的旗舰模型,这打破了行业标准做法[1][4] - 相反,DeepSeek V4向包括华为技术有限公司在内的国内供应商提供了早期访问权限[1][4] - AI开发者通常会将主要模型的预发布版本分享给英伟达和AMD等芯片制造商,以确保其软件在广泛使用的硬件上高效运行[1][5] DeepSeek V4模型技术规格与测试进展 - 消息源报道称DeepSeek正在测试V4 Lite模型,代号为"Sealion-lite",上下文窗口为100万tokens,并原生支持多模态推理[1][5] - DeepSeek更新后已开始灰度测试最高1M(百万)Token的上下文长度[2][5] - 最新DeepSeek的知识库已经更新到2025年5月,在非联网状态下可准确输出2025年4月的新闻[2][5] 行业合作模式与供应链变化 - DeepSeek之前曾与英伟达的技术人员密切合作[1][5] - 对于其即将推出的模型,DeepSeek没有向英伟达和AMD提供访问权限,而是给予包括华为在内的中国厂商几周的时间来适配其芯片[1][5] - 英伟达和AMD拒绝评论相关报道,DeepSeek和华为也未回应评论请求[1][5]