文心APP
搜索文档
百度“文心5.0”正式版发布,两名年轻技术骨干公开亮相
观察者网· 2026-01-23 11:07
文心5.0正式版发布与技术架构 - 百度于1月22日发布并上线原生全模态大模型文心5.0正式版,模型参数达2.4万亿,采用原生全模态统一建模技术,具备全模态理解与生成能力,支持文本、图像、音频、视频等多种信息的输入与输出 [1] - 该模型采用统一的自回归架构进行原生全模态建模,将多源数据在同一模型框架中联合训练,实现原生的全模态统一理解与生成,区别于业界的“后期融合”方案 [4] - 模型采用超大规模混合专家结构,具备超稀疏激活参数,激活参数比低于3%,在保持强大能力的同时有效提升推理效率 [8] - 模型基于大规模工具环境,合成长程任务轨迹数据,并采用基于思维链和行动链的端到端多轮强化学习训练,显著提升了智能体和工具调用能力 [8] 模型性能与市场表现 - 在40余项权威基准的综合评测中,文心5.0正式版的语言与多模态理解能力超越Gemini-2.5-Pro、GPT-5-High等模型,稳居国际第一梯队,图像与视频生成能力与垂直领域专精模型相当,整体处于全球领先水平 [3] - 百度文心助手月活已突破2亿 [3] - 个人用户可在文心APP、文心一言官网体验,企业与开发者可通过百度千帆平台进行调用 [3] 应用模型与专精技术 - 百度应用模型研发部负责人指出,应用模型的价值在于应用,目标是让模型在真实应用场景里“跑得稳、答得对、用得起” [9] - 基于文心基础大模型,百度构建了面向产品级应用的矩阵模型(包括文心Lite模型、视频大模型和语音大模型)和面向行业应用的专精模型(包括搜索闪电专精模型、电商蒸汽机模型、文心数字人大模型及行业大模型) [11] - 应用模型研发部分享了三项技术突破:基于声音Token的端到端合成大模型、5分钟超越真人的直播技术、实时交互数字人技术 [11] - 5分钟超越真人的直播技术通过对目标音色的少量采样,使合成语音具备直播带货所需的情绪、节奏与感染力 [12] - 实时交互数字人技术采用三态Token联动架构,实现文本、语音、视频的流式控制,具有低延迟、低成本和高表现力的特点,百度罗永浩数字人即基于此技术开发 [12] 平台支持与产业落地 - 百度千帆平台提供包括文心5.0及全场景150+SOAT模型服务,集成包括百度AI搜索在内的众多工具及MCP和Agent工具链,结合数据管理和企业级服务,为企业提供全周期、稳定支持多场景业务的运行环境,显著降低企业Agent创新门槛 [15] - 千帆平台上已累计开发超130万个Agents,以“百度AI搜索”为代表的工具日均调用量已突破千万次 [15] - 百度正形成以芯片为底座,智能云为平台框架,以模型支撑各类智能体应用的“芯云模体”全栈自研生态闭环 [15] 组织架构与战略方向 - 去年11月任命的基础模型研发部负责人吴甜和应用模型研发部负责人贾磊在发布会上亮相,两人直接向百度创始人李彦宏汇报,代表了公司技术侧的最新架构调整以及管理层年轻化的趋势 [1] - 基于强大的原生全模态统一建模技术与2.4万亿参数的海量算力,文心5.0已具备让AI应用走进真实行业与复杂场景,提供更高效解决方案的能力 [15] - 作为国内最早发布大模型的企业之一,百度正持续探索赋能行业的AI解决方案 [15]
这场AI市集,大模型拉满你的情绪价值
扬子晚报网· 2026-01-22 20:22
百度文心大模型5.0发布 - 百度于1月22日在上海发布并上线原生全模态大模型文心5.0正式版 [3] - 该模型参数规模达2.4万亿,采用原生全模态统一建模技术 [3] - 模型具备全模态理解与生成能力,支持文本、图像、音频、视频等多种信息的输入与输出 [3] 产品生态与市场表现 - 个人用户可通过文心APP、文心一言官网体验文心大模型 [3] - 企业与开发者可通过百度千帆平台进行模型调用 [3] - 此前,百度文心助手月活跃用户已突破2亿 [3] 开发者生态与应用场景 - 在文心Moment大会的AI市集中,展示了众多文心飞桨开发者基于文心大模型开发的小玩具、小应用 [3] - 展示的应用实例包括:手机互动应用、智能宠物玩具、AI写真互动应用以及镜头手势识别体感游戏等 [1] - 公司应用模型研发负责人表示,应用模型的价值在于实际应用,目标是让模型在真实场景中“跑得稳、答得对、用得起” [3]
AI漫画“拍立得”上线:1句话1张照片,生成剧情完整连载
量子位· 2025-11-03 12:30
产品核心功能 - 百度文心APP推出“魔法漫画”功能,用户通过一句话描述和一张参考照片,即可在两分钟内自动生成一套多图多页的连载漫画[1][4][23] - 该功能支持高度自定义,包括上传最多两张照片以自定义角色形象、自由设定角色名称,并可在吉卜力、二次元、国风水墨等九种风格中选择[24][26] - 生成内容包含6至7页连贯剧情,具备自动生成的文字解说,并在指令遵循、角色一致性和文字生成方面表现稳定[15][34][50][51] 产品交互与扩展性 - 提供“续写”功能,支持自动由AI随机生成后续剧情或手动由用户精准控制剧情走向,续写时系统会提供前情提示以确保剧情衔接[52][59][61] - 提供“改编”功能,允许用户在原有故事基础上重新调整角色、风格和剧情设定,从而快速创建新版本故事[72][73][75] - 生成的漫画可下载为图片或直接分享至微信及朋友圈,作品权限可设置为开放或私藏[57][82] 行业意义与技术定位 - 该功能代表了AI在内容生成领域从“能生成”到“能消费”的初步跨越,通过结合文字与图像生成技术,以低门槛方式让普通用户完成剧情连贯的创作[84][86][88] - 相较于仍需专业后期处理的AI视频生成,基于图片的生成链路更为成熟,该产品通过让AI变得人人可玩、可创作,推动了AI普惠从理念走向现实[88]