混元Voice

搜索文档
腾讯混元亮相WAIC 2025,发布3D世界模型及系列开源模型
观察者网· 2025-07-27 13:22
作为此次发布的亮点之一,腾讯混元3D世界模型1.0融合了全景图像合成与分层3D重建技术,同时支持 文字和图片输入,实现了高质量、风格多样的可漫游3D场景生成。过去需要专业建模团队数周才能搭 建的3D虚拟世界,现在只需一句文字或一张图片,几分钟内即可生成。 混元世界模型1.0应用概览(VR,游戏开发,场景编辑,物理仿真等) 对游戏开发者而言,混元3D世界模型极大简化了3D场景构建流程,只需输入"一座中世纪城堡,城堡塔 楼宏伟壮阔,城堡周围是一座石头雕像,石头铺成的路以及美丽的花朵,卡通风格"等简单指令,模型 即可快速生成包含建筑、地形、植被的完整3D场景。输出的Mesh文件可用于游戏原型搭建或关卡设 计,还能灵活调整前景物体、更换天空背景,满足个性化创作需求。 (生成界面演示:生成3D场景资产可二次编辑) 7月27日,2025世界人工智能大会腾讯论坛上,腾讯正式发布混元3D世界模型1.0,并宣布全面开源。这 是业界首个开源可沉浸漫游、可交互、可仿真的世界生成模型,为游戏开发、VR、数字内容创作等领 域带来了全新的可能性。 除3D模型外,腾讯混元还披露了包括端侧混合推理语言模型、多模态理解模型、游戏视觉模型等在内 ...
腾讯亮相首届国际通用人工智能大会
环球网资讯· 2025-05-26 20:08
通用人工智能大会 - 首届国际通用人工智能大会在北京召开,汇聚国内外一流高校学者及企业技术领袖,推动通用人工智能技术发展 [1] - 公司首席科学家在主论坛作主题报告,杰出科学家详细介绍混元多模态大模型 [1] 混元大模型技术迭代 - 混元模型矩阵全面升级,推出视觉深度推理模型T1-Vision和端到端语音通话模型混元Voice [1] - 混元TurboS在全球大语言模型评测平台排名全球前八,国内仅次于DeepSeek [3] - 混元TurboS在代码、数学等理科能力进入全球前十,代码能力提升24%,竞赛数学成绩提升39% [3] - 混元T1在竞赛数学效果提升8%,常识问答提升8%,复杂任务Agent能力提升13% [3] 多模态模型进展 - 混元T1-Vision支持多图输入,理解速度提升50%,效果提升5.3% [4] - 混元Voice响应速度提升30%,延迟降至1.6秒,拟人性和情绪应用能力提升 [5] - 混元图像2.0实现毫秒级生图,GenEval基准测试准确率超95% [5] - 混元3D v2.5几何模型精度提升10倍,纹理贴图达4K,文生3D在17个类目中占15个第一 [5] - 混元游戏视觉生成模型提升游戏美术设计效率数十倍 [5] 开源与产业应用 - 混元3D模型Hugging Face下载量超160万,计划推出多尺寸混合推理模型 [7] - 混元训练营已有超200家合作伙伴报名,提供免费模型资源及技术支持 [7] - 混元深度融入公司核心产品,并通过腾讯云对外输出模型能力 [7]
腾讯混元上新:多模态和智能体,两手都要抓 | 最前线
36氪· 2025-05-22 16:01
腾讯大模型战略升级 - 腾讯混元大模型迎来全面升级 包括旗舰快思考模型混元TurboS和深度思考模型混元T1的新迭代版本 [1] - 基于TurboS基座推出视觉深度推理模型T1-Vision和端到端语音通话模型混元Voice [1] - 同步上新混元图像2.0 混元3D v2.5及混元游戏视觉生成等一系列多模态模型 [1] 混元TurboS模型性能 - 混元TurboS在Chatbot Arena排名全球前八 国内仅次于DeepSeek [2] - 代码和数学等理科能力进入全球前十 [2] - 采用大规模混合Mamba-MoE模型 理科推理提升超10% 代码能力提升24% 竞赛数学成绩提升39% [2] 混元T1模型进展 - 深度思考模型混元T1持续快速迭代 在元宝App上线后实现多项能力提升 [6] - 竞赛数学效果提升8% 常识问答提升8% 复杂任务的Agent能力提升13% [6] 多模态模型突破 - 混元视觉深度推理模型T1-Vision支持多图输入 具备原生长思维链 [8] - 整体效果提升5.3% 理解速度提升50% [8] - 混元Voice语音模型响应速度提升超30% 降至1.6秒 [8] - 混元图像2.0在主观画面质量和美学层面被认为"AI味"最少 [8] 智能体平台战略 - 将大模型知识引擎升级为"腾讯云智能体开发平台" [12] - 整合RAG技术和全面Agent能力 帮助企业激活私域知识和构建专属智能体 [13] - 大模型显著提升语义理解 上下文建模 内容切分等能力 [14] - 多模态模型发展使视觉+文本协同任务成为可能 [14] 开源与业务应用 - 混元3D模型在Hugging Face下载量超过160万 [16] - 计划推出多尺寸混合推理模型 适配企业与端侧不同需求 [16] - 混元已深度融入微信 QQ 腾讯元宝 腾讯会议 腾讯文档等核心产品 [17]
脑机接口,新突破!百度一季度收入324.52亿元;关于苹果,微信支付确认→
新华网财经· 2025-05-22 08:38
今日导读 - 国内首例"闭环脊髓神经接口"植入手术由浙大二院联合多家机构完成,标志着脊髓神经接口及神经功能重塑领域重大技术突破 [1] - 百度2025年Q1营收324.52亿元(YoY +3%),调整后营业利润53.3亿元超预估48.9亿元,调整后EBITDA利润率22% [1] - 苹果Apple Store线下零售店新增微信支付支持,此前2018年已接入支付宝,线上App Store于2016年支持支付宝 [1][9] 宏观政策 - 深圳龙岗区成立全国首个人工智能政府直属机构,发布《AI龙岗三年行动计划》及具身智能机器人城区建设方案 [3][5] - 八部门联合印发小微企业融资支持措施,强调无还本续贷政策落实,要求银行通过展期/调整还款安排缓解企业周转压力 [3][4] - 上交所试点公司债券续发行及ABS扩募业务,允许使用有效期内注册文件快速备案以提升市场流动性 [4] 行业数据 - 2025年1-4月SUV销量前十企业合计销售311万辆(占总量69%),仅长城汽车和特斯拉同比下滑 [5] - 国内金饰价格重返千元/克以上:周大福足金1008元/克(+26元)、周生生1007元/克(+25元)、老庙黄金1004元/克(+27元) [8] 资本市场 - 中毅达股价3月10日至5月20日累计涨幅312.9%,公司提示基本面未变且2024年亏损,市净率显著高于行业 [8] - 瑞银看好中国股票外资回流逻辑,认为港股配置价值优于A股,近期香港IPO反映海外资金对中国核心资产兴趣 [8] - 纳芯微询价转让485.18万股,定价163.15元/股,获6家机构全额认购且不涉及控制权变更 [11] 科技动态 - Google与XREAL联合发布Project Aura AR眼镜,整合Android XR生态、轻量化硬件及高通XR芯片技术 [9] - 腾讯云推出智能体开发平台并接入多款大模型,计划开源混合推理模型及发布3D场景世界模型 [13] - 谷歌开发者大会发布Veo3视频生成AI、Imagen4图像生成器及Gemini2.5 Pro的DeepThink模式 [17] 公司财报 - 微博2025年Q1总营收3.969亿美元(28.83亿元),调整后运营利润1.295亿美元(9.43亿元)超预期,MAU达5.91亿 [14] - 香奈儿2024年销售额下滑5.3%至187亿美元,净利润跌28.2%至34亿美元,为2017年来首次非疫情因素下滑 [15] - 万科拟以不超过60亿元万物云股票质押置换深铁集团42亿元借款,需股东大会审议通过 [15] 战略合作 - 美图与阿里巴巴签署2.5亿美元可转债协议(年利率1%),并将在电商/AI/云计算领域合作 [16] - 阿里大文娱更名虎鲸文娱集团,旗下阿里影业拟更名大麦娱乐,强调优酷与大麦娱乐为核心业务 [13] - 恒瑞医药H股发行价定为44.05港元/股,预计5月23日在港交所上市 [16] 其他动态 - 格力电器董事长董明珠与前秘书孟羽童将于5月23日合体直播 [13] - 福田汽车收到新能源汽车中央补助资金1.24亿元,直接冲减应收补贴款 [16] - 机甲格斗擂台赛5月25日在杭州举行,宇树科技作为合作方参与人形机器人格斗表演及竞技 [10]
腾讯首次完整披露大模型战略,各业务全面拥抱AI
21世纪经济报道· 2025-05-21 14:40
腾讯大模型战略发布 - 腾讯首次完整披露大模型战略 在2025腾讯云AI产业应用峰会上全面升级大模型矩阵产品 包括自研混元大模型 AI云基础设施 智能体开发工具 知识库及场景应用等 [1] - 公司高管表示AI持续落地将使每家企业成为AI公司 每个人成为AI加持的超级个体 过去一年腾讯各项业务已全面拥抱AI 并观察到产业对大模型的庞大需求 [1] - 未来将加大AI投入力度 重点加速大模型创新 智能体应用 知识库建设 基础设施升级 目标打造"好用的AI" [1] 混元大模型技术进展 - 混元T1自年初上线元宝App后持续迭代 基于TurboS基座新推出视觉深度推理模型T1 Vision和端到端语音通话模型混元Voice 近期将推出实时视频通话AI体验 [2] - 混元已实现图像 视频 3D 文本等全模态开源 未来计划推出多尺寸混合推理模型 包括0.5B到32B的dense模型和激活13B的MoE模型 [2] - 将持续开源多模态基础模型及配套插件模型 包括图像 视频 3D等方向 [2] AI产业发展趋势 - 生成式AI已跨过"可用性"门槛 正从"可用"向"好用"转变 从"部分人用"向"人人能用"发展 [1] - 产业对大模型API调用量和算力需求快速增长 需在交互体验 执行能力 内容准确性 落地成本等方面持续升级 [1] - 优化模型可提升性能与交互体验 智能体赋予独立执行能力 知识库减少模型幻觉 基础设施优化降低训推成本 [1]
腾讯智能体开发平台发布,科创人工智能ETF华夏(589010)涨0.29%翻红
每日经济新闻· 2025-05-21 13:52
市场表现 - 科创人工智能ETF华夏(589010)上涨0 29% 持仓股中邮科技上涨17 89%领涨 凌云光上涨5 72% 复旦微电上涨5 3% 有方科技下跌2 79%领跌 麒麟信安 当虹科技等个股跌幅靠前 [1] 行业动态 - 腾讯云推出智能体开发平台 接入DeepSeek-R1 V3模型和联网搜索 计划推出世界模型混元3D场景模型 并开源企业级混合推理模型 端侧混合推理模型 多模态基础模型 近期已推出混元T1 Vision 混元Voice 混元图像2 0模型等大模型产品 [1] 配置价值分析 - A股处于库存周期弱企稳 产能周期持续出清阶段 基本面复苏动能偏弱 货币政策宽松下剩余流动性或维持高位 融资等交易型资金偏好科创方向 [2] - 中美达成阶段性关税协定 全球投资者风险偏好回暖 科技方向拥挤度回落 市场关注度有望提升 [2] - 中长期产业催化密集 AI(阿里 腾讯 DeepSeek等发布新一代大模型) 机器人 智能驾驶等领域有望逐步释放业绩 并购重组新政下可关注科创板块细分领域整合机会 [2] ETF产品特性 - 科创人工智能ETF华夏(589010)紧密跟踪科创人工智能指数 精选AI核心资产 凭借高研发强度与政策倾斜 叠加科创板制度优势 提供低门槛 高弹性的AI投资机会 [2]
腾讯计划开源多个模型!
第一财经· 2025-05-21 10:28
腾讯云智能体开发平台及大模型产品更新 - 腾讯云于5月21日推出智能体开发平台,该平台接入DeepSeek-R1和V3模型,并支持联网搜索功能 [1] - 公司计划近期推出世界模型混元3D场景模型,同时将开源企业级混合推理模型、端侧混合推理模型和多模态基础模型 [1] - 近期腾讯大模型产品批量更新,包括推出视觉深度推理模型混元T1 Vision、端到端语音通话模型混元Voice以及混元图像2.0模型等 [1]