小步快跑的腾讯混元:闯入全球前八背后

腾讯混元大模型最新进展与全球地位 - 腾讯混元大模型在Chatbot Arena榜单首次杀入全球前八,跻身第一梯队,其Turbo S模型评分紧跟DeepSeek,是国内唯二进入前八的模型 [1] - 混元Turbo S在LMSYS Chatbot Arena上获得1356分,在23个自动化基准测试中平均得分77.9% [1] 模型技术架构与性能突破 - 混元Turbo S是业界首个大规模混合Mamba-MoE架构模型,融合了Mamba处理长序列的高效率与Transformer卓越的上下文理解能力 [1][5] - 模型总参数达5600亿,在保持高运算效率的同时实现了性能最大化 [5] - 创新采用自适应长短思维链机制,面对简单问题自动激活“无思考”模式以节省成本,面对复杂问题则切换至“思考”模式进行深度推理 [5] - 受益于自适应CoT机制,混元Turbo S在所有评估模型中实现了极具成本效益的输出生成 [6] 多模态模型快速迭代与性能 - 混元3D生成模型全新升级,总参数量从1B提升至10B,有效面片数增加超10倍,几何分辨率达到1024 [8] - 混元图像2.0模型实现实时生图,达到毫秒级响应,显著快于行业领先模型所需的5到10秒每张图 [8] - 混元图像2.0在GenEval基准测试上的准确率超过95%,超过其他同类模型 [9] - 基于Turbo S基座,新发布视觉深度推理模型T1-Vision,支持多图输入并具备原生长思维链,整体效果相比此前级联方案提升5.3%,理解速度提升50% [9] - 新发布端到端语音通话模型混元Voice,响应速度相比级联方案提升超过30%,降至1.6秒 [9] 业务深度整合与应用落地 - 混元大模型的定位是与腾讯业务深度结合,成为业务增长的放大器,而非打造独立超级应用 [3] - 混元能力已深度融入微信、QQ、腾讯元宝、腾讯会议、腾讯文档等核心产品 [3][10] - 混元图像生成能力已助力腾讯广告平台进行广告设计,混元3D模型助力游戏设计等行业创新 [10] - 公司通过腾讯云向外输出模型能力,帮助企业和开发者创新提效 [10] - 腾讯元宝等多款产品火速接入DeepSeek-R1模型,两周内微信、QQ浏览器、腾讯文档等十余款应用完成整合,实现混元与DeepSeek的“双模型自由切换” [3] 组织战略与资源投入 - 腾讯进行组织调整,拆分模型团队与应用团队,让大模型团队聚焦底层技术,应用团队创新体验 [12] - 将QQ浏览器、搜狗输入法等更多产品汇入CSIG,共同构建面向大模型时代的AI新矩阵 [12] - 对混元研发体系进行全面重构,拆分为“大语言模型部”与“多模态模型部”,分别专注文本核心能力与图像、3D等多模态技术突破 [12] - 2024年,腾讯资本开支同比暴涨386%至767.6亿元,2025年一季度单季资本支出进一步攀升至274.8亿元,全年预计接近千亿规模 [13] - 公司对AI是长期投入,旨在构建以技术护城河为核心的“百年工程”,推动从“应用巨头”向“AI基础设施商”转型 [13] 开源生态与未来规划 - 混元坚定拥抱开源,持续推进多尺寸、多场景的全系模型开源 [14] - 混元已实现图像、视频、3D、文本等在内的全模态开源,其中混元3D模型在Hugging Face下载量超过160万 [14] - 未来计划推出多尺寸混合推理模型,从0.5B到32B的dense模型,以及激活13B的MoE模型,适配企业与端侧不同需求 [14] - 混元图像、视频、3D等多模态基础模型及配套插件模型也将持续开源 [14]

小步快跑的腾讯混元:闯入全球前八背后 - Reportify