小步快跑的腾讯混元：闯入全球前八背后

腾讯混元大模型最新进展与全球地位 - 腾讯混元大模型在Chatbot Arena榜单首次杀入全球前八，跻身第一梯队，其Turbo S模型评分紧跟DeepSeek，是国内唯二进入前八的模型 [1] - 混元Turbo S在LMSYS Chatbot Arena上获得1356分，在23个自动化基准测试中平均得分77.9% [1] 模型技术架构与性能突破 - 混元Turbo S是业界首个大规模混合Mamba-MoE架构模型，融合了Mamba处理长序列的高效率与Transformer卓越的上下文理解能力 [1][5] - 模型总参数达5600亿，在保持高运算效率的同时实现了性能最大化 [5] - 创新采用自适应长短思维链机制，面对简单问题自动激活“无思考”模式以节省成本，面对复杂问题则切换至“思考”模式进行深度推理 [5] - 受益于自适应CoT机制，混元Turbo S在所有评估模型中实现了极具成本效益的输出生成 [6] 多模态模型快速迭代与性能 - 混元3D生成模型全新升级，总参数量从1B提升至10B，有效面片数增加超10倍，几何分辨率达到1024 [8] - 混元图像2.0模型实现实时生图，达到毫秒级响应，显著快于行业领先模型所需的5到10秒每张图 [8] - 混元图像2.0在GenEval基准测试上的准确率超过95%，超过其他同类模型 [9] - 基于Turbo S基座，新发布视觉深度推理模型T1-Vision，支持多图输入并具备原生长思维链，整体效果相比此前级联方案提升5.3%，理解速度提升50% [9] - 新发布端到端语音通话模型混元Voice，响应速度相比级联方案提升超过30%，降至1.6秒 [9] 业务深度整合与应用落地 - 混元大模型的定位是与腾讯业务深度结合，成为业务增长的放大器，而非打造独立超级应用 [3] - 混元能力已深度融入微信、QQ、腾讯元宝、腾讯会议、腾讯文档等核心产品 [3][10] - 混元图像生成能力已助力腾讯广告平台进行广告设计，混元3D模型助力游戏设计等行业创新 [10] - 公司通过腾讯云向外输出模型能力，帮助企业和开发者创新提效 [10] - 腾讯元宝等多款产品火速接入DeepSeek-R1模型，两周内微信、QQ浏览器、腾讯文档等十余款应用完成整合，实现混元与DeepSeek的“双模型自由切换” [3] 组织战略与资源投入 - 腾讯进行组织调整，拆分模型团队与应用团队，让大模型团队聚焦底层技术，应用团队创新体验 [12] - 将QQ浏览器、搜狗输入法等更多产品汇入CSIG，共同构建面向大模型时代的AI新矩阵 [12] - 对混元研发体系进行全面重构，拆分为“大语言模型部”与“多模态模型部”，分别专注文本核心能力与图像、3D等多模态技术突破 [12] - 2024年，腾讯资本开支同比暴涨386%至767.6亿元，2025年一季度单季资本支出进一步攀升至274.8亿元，全年预计接近千亿规模 [13] - 公司对AI是长期投入，旨在构建以技术护城河为核心的“百年工程”，推动从“应用巨头”向“AI基础设施商”转型 [13] 开源生态与未来规划 - 混元坚定拥抱开源，持续推进多尺寸、多场景的全系模型开源 [14] - 混元已实现图像、视频、3D、文本等在内的全模态开源，其中混元3D模型在Hugging Face下载量超过160万 [14] - 未来计划推出多尺寸混合推理模型，从0.5B到32B的dense模型，以及激活13B的MoE模型，适配企业与端侧不同需求 [14] - 混元图像、视频、3D等多模态基础模型及配套插件模型也将持续开源 [14]