Workflow
混元Voice
icon
搜索文档
腾讯混元亮相WAIC 2025,发布3D世界模型及系列开源模型
观察者网· 2025-07-27 13:22
腾讯混元3D世界模型1.0发布 - 公司正式发布并开源混元3D世界模型1.0,这是业界首个开源可沉浸漫游、可交互、可仿真的世界生成模型 [1] - 该模型融合全景图像合成与分层3D重建技术,支持文字和图片输入,几分钟内即可生成高质量、风格多样的可漫游3D场景 [1] - 过去需要专业建模团队数周才能完成的3D虚拟世界构建,现在大幅简化 [1] 技术特点与创新 - 采用"语意层次化3D场景表征及生成算法",将复杂3D世界解构为不同语意层级,实现前景与背景、地面与天空的智能分离 [9] - 输出标准化的3D Mesh资产,兼容Unity、Unreal Engine、Blender等主流工具 [9] - 在文生世界、图生世界的美学质量和指令遵循能力等关键维度全面超越当前SOTA开源模型 [13] 应用场景 - 游戏开发:极大简化3D场景构建流程,输入简单指令即可快速生成包含建筑、地形、植被的完整3D场景 [3] - VR应用:生成的场景可无缝导入Vision Pro等虚拟头显,带来沉浸式体验 [7] - 数字内容创作:普通用户无需建模经验,通过一句话或一张图即可快速生成360°沉浸式视觉空间 [7] 模型生态与开源计划 - 除3D模型外,公司还披露了包括端侧混合推理语言模型、多模态理解模型、游戏视觉模型等在内的一系列开源计划 [1] - 将在月底开源0.5B、1.8B、4B、7B混合推理模型,以及多模态理解模型混元-large-vision和游戏视频生成框架混元GameCraft [16] - 混元3D系列模型社区下载量超过230万,已成为全球最受欢迎的3D开源模型 [18] 模型性能与行业地位 - 混元3D 2.5模型质感大幅提升,在上海人工智能实验室6月评测中排名全球第一 [16] - 全球首个AI设计智能体Lovart已首选调用混元3D模型的API接口 [16] - 知名3D打印公司拓竹科技旗下的模型平台MakerWorld也已接入混元3D模型 [16] 基座模型进展 - 混元旗舰模型TurboS保持每月一个版本的快速迭代,在全球大模型权威排行榜上稳居前列 [13] - 混元T1综合能力国内领先,在项目级代码生成、高难度数学推理、文本写作等方面表现突出 [14] - 多模态理解模型混元Vision在LMArena Vision全球榜单中获得国内榜首,中文能力稳居全球第一梯队 [14]
腾讯亮相首届国际通用人工智能大会
环球网资讯· 2025-05-26 20:08
通用人工智能大会 - 首届国际通用人工智能大会在北京召开,汇聚国内外一流高校学者及企业技术领袖,推动通用人工智能技术发展 [1] - 公司首席科学家在主论坛作主题报告,杰出科学家详细介绍混元多模态大模型 [1] 混元大模型技术迭代 - 混元模型矩阵全面升级,推出视觉深度推理模型T1-Vision和端到端语音通话模型混元Voice [1] - 混元TurboS在全球大语言模型评测平台排名全球前八,国内仅次于DeepSeek [3] - 混元TurboS在代码、数学等理科能力进入全球前十,代码能力提升24%,竞赛数学成绩提升39% [3] - 混元T1在竞赛数学效果提升8%,常识问答提升8%,复杂任务Agent能力提升13% [3] 多模态模型进展 - 混元T1-Vision支持多图输入,理解速度提升50%,效果提升5.3% [4] - 混元Voice响应速度提升30%,延迟降至1.6秒,拟人性和情绪应用能力提升 [5] - 混元图像2.0实现毫秒级生图,GenEval基准测试准确率超95% [5] - 混元3D v2.5几何模型精度提升10倍,纹理贴图达4K,文生3D在17个类目中占15个第一 [5] - 混元游戏视觉生成模型提升游戏美术设计效率数十倍 [5] 开源与产业应用 - 混元3D模型Hugging Face下载量超160万,计划推出多尺寸混合推理模型 [7] - 混元训练营已有超200家合作伙伴报名,提供免费模型资源及技术支持 [7] - 混元深度融入公司核心产品,并通过腾讯云对外输出模型能力 [7]
腾讯混元上新:多模态和智能体,两手都要抓 | 最前线
36氪· 2025-05-22 16:01
腾讯大模型战略升级 - 腾讯混元大模型迎来全面升级 包括旗舰快思考模型混元TurboS和深度思考模型混元T1的新迭代版本 [1] - 基于TurboS基座推出视觉深度推理模型T1-Vision和端到端语音通话模型混元Voice [1] - 同步上新混元图像2.0 混元3D v2.5及混元游戏视觉生成等一系列多模态模型 [1] 混元TurboS模型性能 - 混元TurboS在Chatbot Arena排名全球前八 国内仅次于DeepSeek [2] - 代码和数学等理科能力进入全球前十 [2] - 采用大规模混合Mamba-MoE模型 理科推理提升超10% 代码能力提升24% 竞赛数学成绩提升39% [2] 混元T1模型进展 - 深度思考模型混元T1持续快速迭代 在元宝App上线后实现多项能力提升 [6] - 竞赛数学效果提升8% 常识问答提升8% 复杂任务的Agent能力提升13% [6] 多模态模型突破 - 混元视觉深度推理模型T1-Vision支持多图输入 具备原生长思维链 [8] - 整体效果提升5.3% 理解速度提升50% [8] - 混元Voice语音模型响应速度提升超30% 降至1.6秒 [8] - 混元图像2.0在主观画面质量和美学层面被认为"AI味"最少 [8] 智能体平台战略 - 将大模型知识引擎升级为"腾讯云智能体开发平台" [12] - 整合RAG技术和全面Agent能力 帮助企业激活私域知识和构建专属智能体 [13] - 大模型显著提升语义理解 上下文建模 内容切分等能力 [14] - 多模态模型发展使视觉+文本协同任务成为可能 [14] 开源与业务应用 - 混元3D模型在Hugging Face下载量超过160万 [16] - 计划推出多尺寸混合推理模型 适配企业与端侧不同需求 [16] - 混元已深度融入微信 QQ 腾讯元宝 腾讯会议 腾讯文档等核心产品 [17]
腾讯首次完整披露大模型战略,各业务全面拥抱AI
21世纪经济报道· 2025-05-21 14:40
腾讯大模型战略发布 - 腾讯首次完整披露大模型战略 在2025腾讯云AI产业应用峰会上全面升级大模型矩阵产品 包括自研混元大模型 AI云基础设施 智能体开发工具 知识库及场景应用等 [1] - 公司高管表示AI持续落地将使每家企业成为AI公司 每个人成为AI加持的超级个体 过去一年腾讯各项业务已全面拥抱AI 并观察到产业对大模型的庞大需求 [1] - 未来将加大AI投入力度 重点加速大模型创新 智能体应用 知识库建设 基础设施升级 目标打造"好用的AI" [1] 混元大模型技术进展 - 混元T1自年初上线元宝App后持续迭代 基于TurboS基座新推出视觉深度推理模型T1 Vision和端到端语音通话模型混元Voice 近期将推出实时视频通话AI体验 [2] - 混元已实现图像 视频 3D 文本等全模态开源 未来计划推出多尺寸混合推理模型 包括0.5B到32B的dense模型和激活13B的MoE模型 [2] - 将持续开源多模态基础模型及配套插件模型 包括图像 视频 3D等方向 [2] AI产业发展趋势 - 生成式AI已跨过"可用性"门槛 正从"可用"向"好用"转变 从"部分人用"向"人人能用"发展 [1] - 产业对大模型API调用量和算力需求快速增长 需在交互体验 执行能力 内容准确性 落地成本等方面持续升级 [1] - 优化模型可提升性能与交互体验 智能体赋予独立执行能力 知识库减少模型幻觉 基础设施优化降低训推成本 [1]
腾讯智能体开发平台发布,科创人工智能ETF华夏(589010)涨0.29%翻红
每日经济新闻· 2025-05-21 13:52
市场表现 - 科创人工智能ETF华夏(589010)上涨0 29% 持仓股中邮科技上涨17 89%领涨 凌云光上涨5 72% 复旦微电上涨5 3% 有方科技下跌2 79%领跌 麒麟信安 当虹科技等个股跌幅靠前 [1] 行业动态 - 腾讯云推出智能体开发平台 接入DeepSeek-R1 V3模型和联网搜索 计划推出世界模型混元3D场景模型 并开源企业级混合推理模型 端侧混合推理模型 多模态基础模型 近期已推出混元T1 Vision 混元Voice 混元图像2 0模型等大模型产品 [1] 配置价值分析 - A股处于库存周期弱企稳 产能周期持续出清阶段 基本面复苏动能偏弱 货币政策宽松下剩余流动性或维持高位 融资等交易型资金偏好科创方向 [2] - 中美达成阶段性关税协定 全球投资者风险偏好回暖 科技方向拥挤度回落 市场关注度有望提升 [2] - 中长期产业催化密集 AI(阿里 腾讯 DeepSeek等发布新一代大模型) 机器人 智能驾驶等领域有望逐步释放业绩 并购重组新政下可关注科创板块细分领域整合机会 [2] ETF产品特性 - 科创人工智能ETF华夏(589010)紧密跟踪科创人工智能指数 精选AI核心资产 凭借高研发强度与政策倾斜 叠加科创板制度优势 提供低门槛 高弹性的AI投资机会 [2]
腾讯计划开源多个模型!
第一财经· 2025-05-21 10:28
腾讯云智能体开发平台及大模型产品更新 - 腾讯云于5月21日推出智能体开发平台,该平台接入DeepSeek-R1和V3模型,并支持联网搜索功能 [1] - 公司计划近期推出世界模型混元3D场景模型,同时将开源企业级混合推理模型、端侧混合推理模型和多模态基础模型 [1] - 近期腾讯大模型产品批量更新,包括推出视觉深度推理模型混元T1 Vision、端到端语音通话模型混元Voice以及混元图像2.0模型等 [1]