Workflow
一手实测文心X1/4.5:又强又全面!歪果网友疯求英文版
量子位·2025-03-17 12:37

文章核心观点 百度在文心一言两周年时上新两款免费模型文心大模型4.5和文心大模型X1,引发关注;两款模型性能出色且价格优惠,背后有多项技术支撑;百度持续投入研发,后续还有开源和发布新版本等计划,有望推动大模型应用爆发 [1][2][48] 新模型发布情况 - 百度上新新一代原生多模态基础大模型文心大模型4.5和深度思考模型文心大模型X1,两款模型在文心一言官网免费开放,文心4.5 API可在百度智能云千帆大模型平台直接调用,文心X1即将上线 [1][2][4] - 文心4.5输入0.004元/千tokens,输出0.016元/千tokens;文心X1输入0.002元/千tokens,输出0.008元/千tokens [4] 新模型实测效果 文心大模型X1 - 逻辑推理能力强,成功解答经典和高难度逻辑题 [10][13] - 能灵活调用高级搜索、文档问答等诸多工具,生成多模态内容,如询问《红楼梦》人物关系时能绘制图表、生成配图 [14][16] - 能解析上传的图片或文档,如识别蔬菜并补充相关信息 [17] - 擅长复杂问题的规划分析,可生成旅游指南 [19] - 文本创作观点鲜明,创意写作有想象力,如用“红楼体”分析问题 [21] 文心大模型4.5 - 多模态方面更全能,支持文档、图片理解,能进行音频、视频分析,可听懂方言,理解梗图,能识别视频信息,支持单个最大20MB视频分析 [22][24][25] 新模型技术细节 文心大模型X1 - 采用递进式强化学习训练方法,提升综合应用能力 [29][30] - 基于思维链和行动链的端到端训练,提升训练效果 [31] - 有多元统一的奖励系统,为训练提供鲁棒反馈 [32][33] 文心大模型4.5 - 应用原生多模态技术,实现更深层次模态融合和更强交互理解能力 [34] - 应用FlashMask动态注意力掩码等多项技术,提升多方面能力并降低模型幻觉 [37] 通用技术 - 有百度RAG、iRAG技术加持,RAG生成准确率高、时效性好的答案,iRAG生成超真实图片 [35][36][38] 百度大模型发展历程及投入 - 2019 - 2025年文心大模型多次升级发布版本,用户规模和日均调用量不断增长,2024年日均调用量一年增长33倍达16.5亿 [41][43] - 近十年累计研发投入超1800亿元,多年研发投入超收入20% [44][45] - 实现芯片层、框架层、模型层和应用层全栈自研布局,模型API价格有优势,文心X1 API价格比DeepSeek R1便宜一半,文心4.5 API价格为GPT - 4.5的1% [46][47] 后续计划 - 6月30日正式开源文心大模型 [48] - 预计下半年发布文心大模型5.0 [48]