Workflow
原生全模态
icon
搜索文档
2.4万亿参数原生全模态,文心5.0一手实测来了
量子位· 2025-11-13 17:25
西风 发自 凹非寺 量子位 | 公众号 QbitAI 刚刚, 文 心5. 0 正式发布了! 全新一代 主打原 生全模 态 ,最开始就把语言/图像/视频/音频放在同一套自回归统一架构里,做统一的理解与生成训练。 所以,最终模型能够做到支持全模态输入 (文字 /图片/音 频/视频) +全模态输出 (文字/图片/音频/视频) ,创意写作、指令遵循、智能体 规划方面也更强了。 在官方展示中,上传一个电影片段,它立马就能分析出最紧张的情节, 具体到第几秒到第几秒 的那种。 同时上传一段视频和一段音频 ,就能让它指出视频里是否有用到音频里的音乐,还能说出节点: 做音视频融合生成也行,简单操作即可爆改甄嬛传滴血认亲 (佟掌柜版) : 拿来生成3D交互式地球与卫星演示模型,用户可以通过鼠标拖拽旋转视 角,直观地观察地球与卫星的空间运动关系: 官方基准 测试结果显示,文心5.0 Preview在 语言、视觉理解、音频理解、视觉生成多维度表现突出 : 就在几天前, 文心5.0 Preview (ERNIE-5.0-Preview-1022) 还闪现大模型竞技场LMArena,在 文 本排行 榜 (Text Arena) 上得分 ...
同一天,百度、OpenAI双双发力高智能AI!先来实测一波原生全模态文心5.0
机器之心· 2025-11-13 16:26
机器之心报道 作者:杜伟 就在今天,大洋两岸两家顶尖的大模型厂商在「追求高智能 AI」这件事上不谋而合,引发了业界广泛关注。 百度创始人李彦宏 这种原生融合的设计使得文心 5.0 不同于业界多数采用后期融合的多模态模型,支持文本、图像、音频、视频等多种信息的联合输入与输出,实现了原生的全模态 统一理解与生成。 在原生全模态架构的加持下,文心 5.0 基础能力全面升级,在 多模态理解、指令遵循、创意写作、事实性、智能体规划与工具应用等方面表现突出 ,拥有了强大 的理解、逻辑、记忆和说服力。 文心 5.0 四大亮点能力 在总参数规模上,文心 5.0 达到了系列最高的 2.4 万亿 ,并位列业界已公开模型之首。 从跑分成绩来看,在 40 余项权威基准的综合评测中,文心 5.0 Preview 的语言与多模态理解能力与 Gemini-2.5-Pro、GPT-5-High 等模型持平,图像与视频生成能力 与垂直领域专精模型相当,达到全球领先水平。 OpenAI 凌晨更新了 GPT-5 系列大模型,上线了 GPT-5.1 Instant 和 GPT-5.1 Thinking。 而在上午以「效果涌现 |AI in Acti ...