老黄开年演讲「含华量」爆表,直接拿DeepSeek、Kimi验货下一代芯片
36氪·2026-01-07 09:35

行业趋势:中国AI模型在全球舞台崛起 - 在2026年CES英伟达主旨演讲中,中国大模型Kimi K2、DeepSeek V3.2及Qwen位列全球开源大模型前列,性能逼近闭源模型,标志着中国AI的高光时刻[1] - 在权威评测中,中国开源模型表现强势,例如在Nathan Lambert与Florian Brand发布的「2025年度开源模型回顾」中,DeepSeek、Qwen和Kimi包揽Top 3[26] - 中国AI模型的国际影响力与落地应用加速,例如OpenAI前CTO的新产品Thinker官宣接入Kimi K2 Thinking,其技术实力正被全球核心圈层接纳[24] 技术架构:MoE(混合专家)成为主流 - 自2025年以来,超过60%的开源AI采用了MoE架构,该架构自2023年初推动LLM智能水平提升近70倍[16] - 在权威机构Artificial Analysis排行榜上,最智能的TOP 10开源模型全部采用MoE结构[16] - DeepSeek-R1、Qwen3和Kimi K2代表MoE路线下顶级规模的尝试,仅需激活少量参数,大幅减少计算量和HBM显存带宽压力[2] 性能突破:推理性能与成本实现指数级优化 - 在英伟达下一代Rubin架构暴力加成下,Kimi K2 Thinking推理吞吐量直接飙升10倍,token成本暴降到原来的1/10[4] - 在SemiAnalysis InferenceMax测试中,DeepSeek-R1将每百万token的成本降低10倍以上,Mistral Large 3同样获得十倍加速[12] - 实测显示,Kimi K2 Thinking在GB200 NVL72上性能可以暴增10倍[9],这种降本增效宣告AI推理即将进入真正的「平价时代」[6] 模型能力:中国模型展现独特技术优势 - Kimi K2 Thinking在Anthropic的严苛行为基准测试中,凭借极低的被误导率,摘得「表现最佳的非美国模型」桂冠[21] - Kimi K2 Thinking支持「数百步稳定工具调用」,并通过开源模型实现「交错思考」,标志着模型逻辑链条的进一步成熟[34] - 中国模型正从追求基准测试高分转向提升实际体验,例如Qwen从「冲榜」闻名进化为优质模型,K2 Thinking原生采用4bit精度以更高效支持长序列RL扩展[32] 竞争格局:开源模型对闭源巨头形成压力 - 中国实验室正以惊人速度发布模型,大幅压缩了最强闭源模型与开源之间的代差,「更早发布」成为一种巨大的先发优势[31] - 开源模型的激增让美国闭源实验室倍感压力,仅靠基准测试分数已无法解释「为什么付费更好」[35] - 中国模型在全球市场的「心智份额」正切走越来越大的一块蛋糕,DeepSeek、Qwen和Kimi已成为东方技术实力的代表品牌[33][35] 算力需求:模型规模与计算需求持续暴涨 - 在计算需求暴涨的背景下,480B的Qwen3和1TB的Kimi K2成为代表性模型,验证了参数规模每年以十倍量级scaling[6] - 如此巨大规模的MoE模型单GPU无法部署,而英伟达GB200 NVL72能破解这一难题[16] - DeepSeek R1和Kimi K2 Thinking的实测结果,证明了英伟达Blackwell超算性能的强大[19]