文心5.0 Preview
搜索文档
2.4万亿参数原生全模态,文心5.0一手实测来了
量子位· 2025-11-13 17:25
西风 发自 凹非寺 量子位 | 公众号 QbitAI 刚刚, 文 心5. 0 正式发布了! 全新一代 主打原 生全模 态 ,最开始就把语言/图像/视频/音频放在同一套自回归统一架构里,做统一的理解与生成训练。 所以,最终模型能够做到支持全模态输入 (文字 /图片/音 频/视频) +全模态输出 (文字/图片/音频/视频) ,创意写作、指令遵循、智能体 规划方面也更强了。 在官方展示中,上传一个电影片段,它立马就能分析出最紧张的情节, 具体到第几秒到第几秒 的那种。 同时上传一段视频和一段音频 ,就能让它指出视频里是否有用到音频里的音乐,还能说出节点: 做音视频融合生成也行,简单操作即可爆改甄嬛传滴血认亲 (佟掌柜版) : 拿来生成3D交互式地球与卫星演示模型,用户可以通过鼠标拖拽旋转视 角,直观地观察地球与卫星的空间运动关系: 官方基准 测试结果显示,文心5.0 Preview在 语言、视觉理解、音频理解、视觉生成多维度表现突出 : 就在几天前, 文心5.0 Preview (ERNIE-5.0-Preview-1022) 还闪现大模型竞技场LMArena,在 文 本排行 榜 (Text Arena) 上得分 ...
全球第二、国内第一!最强文本的文心5.0 Preview一手实测来了
机器之心· 2025-11-09 19:48
文心5.0 Preview模型性能表现 - 百度文心最新模型ERNIE-5.0-Preview-1022在LMArena文本竞技场排名中取得1432分,位列全球并列第二、国内第一[2] - 该模型得分与OpenAI的gpt-4.5-preview-2025-02-27及Anthropic的claude-opus-4-1-0805、claude-sonnet-4-5-20250929三大国外顶级模型持平[2] - 在创意写作任务中排名第一,在复杂长问题理解任务中排名第二,在指令遵循任务中排名第三[5] 模型核心能力实测分析 - 在创意写作测试中,模型以“情绪价值”和“灵感合伙人”为切入点,其营销方案立意和措辞优于对比模型[13][14] - 在复杂长问题理解测试中,模型在客服场景下能提供准确信息并补充直观感受细节,展现超越简单检索的服务意识[23] - 在指令遵循测试中,模型能准确理解并执行多层、反直觉的复杂约束指令,包括回避特定词汇和使用自我审计元指令[33][34][37][39] 百度AI全栈技术布局 - 公司构建了“芯片-框架-模型-应用”四层全栈AI技术布局,形成从算力到算法的技术闭环[41] - 框架层飞桨深度学习平台已更新至v3.2版本,截至2025年9月生态开发者达2333万,服务企业76万家[41] - 芯片层自研昆仑芯三代万卡集群已于今年年初点亮,旨在为大模型训练与推理提供算力支持[42] - 应用层通过文心大模型构建产品矩阵,覆盖内容、搜索、办公、开发等多元场景[42] 行业竞争格局与影响 - LMArena平台通过真实用户对模型输出的偏好投票形成动态排名,其榜单结果更贴近实际使用场景[4][5] - 百度文心系列模型此次排名结果强化了其在全球通用智能模型竞争格局中第一梯队的地位[4] - 行业内观点认为这可能反映出中国AI技术体系正从“技术追赶”向“能力引领”阶段过渡[43]