Workflow
百度蒸汽机(文心专精)
icon
搜索文档
对话百度蒸汽机团队:国内视频生成模型赛道非常“卷” Sora2发布后团队都没休假
中国经营报· 2025-10-21 22:35
行业竞争态势 - 视频生成大模型赛道竞争进入白热化阶段 [2] - OpenAI推出Sora2模型,凭借10秒有声一体化视频及社交化玩法引爆网络,加剧国内技术竞赛压力 [2] - 国内视频模型团队迅速响应,百度蒸汽机团队与快手AI团队在国庆中秋期间无休投入工作 [2] - 国内赛道竞争激烈程度远超国外,呈现百花齐放状态 [4] 百度蒸汽机技术进展 - 百度蒸汽机在10月15日完成升级,打破传统AI视频生成10秒左右时长限制,首次实现AI长视频实时交互生成 [4] - 用户可支持无限时长视频生成,并能在生成过程中实时交互,随时改写内容或扩写续集 [4] - 团队创新性地将自回归流式生成与扩散模型结合构建新型混合架构,使生成成本呈线性增长,适合长视频生成 [5][6] - 通过训推一致、关键参考帧注意力、历史帧扰动等技术缓解自回归带来的累计误差与一致性问题 [6] 产品特性与市场定位 - 百度蒸汽机实现实时交互能力,用户可在视频生成过程中随时暂停、修改段落或插入新情节,告别盲盒式生成 [6] - 产品致力于让创作过程符合创作者边写边改的思维习惯,目标是让用户想到可编辑、可打断的长视频时第一个想到蒸汽机 [6] - 在Sora2因定价高昂被开发者吐槽的背景下,百度蒸汽机升级后仍坚持原有定价策略,未来通过技术降本为用户释放红利而非陷入价格战 [6] 技术发展瓶颈与路径 - 视频生成技术面临瓶颈,DiT架构初期表现好但随需求深化,成本、生成时间、算力需求呈几何级数增长 [5] - 行业高门槛体现在生成技术复杂性及对及时满足的要求,用户无法接受延时等待 [5] - Sora2底层模型有提升,但在内容一致性、大动作呈现等方面基础模型升级幅度远不如从GPT到GPT-3.5显著 [5] - 多模态领域竞争焦灼,没有团队能拥有绝对长期技术优势,当前核心是比拼执行力,看谁能更快推进 [4]
TMT行业周报(10月第3周):海外AI景气度进一步提升-20251020
世纪证券· 2025-10-20 09:25
报告行业投资评级 - 报告未明确给出整体行业投资评级 [3][5] 报告核心观点 - 海外AI算力需求确定性进一步提升 OpenAI向博通采购10GW算力加速卡 目标于2026年下半年启动 至2029年底前完成部署 加上此前向英伟达和AMD的采购 OpenAI已提前锁定未来5年算力资源 [5] - 甲骨文与AMD扩大合作 计划从2026年第三季度起在数据中心部署5万块Instinct MI450芯片 预计其余海外头部模型厂商与云厂商将加速跟进算力布局 [5] - Anthropic发布轻量级低成本模型Claude Haiku 4 5 在SWE-bench Verified测试集上准确率达73 3% 接近前沿模型水平 API定价仅为Sonnet 4 4 5的三分之一 每百万输入 输出token分别为1美元和5美元 模型更易搭载于算力要求更低的场景 如端侧设备 企业小型服务器 看好AI应用渗透率提升 [5] - 海外大模型呈现"强性能 轻体量 降成本"演进趋势 强调成本效益 建议关注与海外算力产业链相关的光模块 PCB 服务器 液冷及电源等细分环节 以及端侧设备产业链相关的SoC与存储等细分环节 [5] 市场周度回顾 - TMT板块一级行业上周 10 13-10 17 涨跌幅均为负 计算机下跌5 61% 通信下跌5 92% 传媒下跌6 27% 电子下跌7 14% [5] - 板块内三级子行业中 教育出版跌幅最小为-1 20% 其次为被动元件-1 80% 大众出版-2 99% 半导体设备跌幅最大为-9 52% 其次为光学元件-9 33% 品牌消费电子-9 24% [5] - 电子行业个股周涨跌幅前五 雅创电子上涨24 47% 艾比森上涨23 35% 京泉华上涨18 81% 睿能科技上涨15 49% ST宇顺上涨12 12% 跌幅前五 思泉新材下跌-21 90% 华海诚科下跌-19 56% 先锋精科下跌-19 30% 统联精密下跌-18 90% 电连技术下跌-18 16% [14] - 计算机行业个股周涨跌幅前五 熙菱信息上涨40 87% 海峡创新上涨19 71% ST迪威迅上涨17 20% 卡莱特上涨15 57% 榕基软件上涨13 94% 跌幅前五 卓易信息下跌-18 92% 开普云下跌-17 95% 初灵信息下跌-17 49% 凯旺科技下跌-16 64% 井松智能下跌-16 59% [14] - 传媒行业个股周涨跌幅前五 ST返利上涨10 05% 粤传媒上涨9 51% 天威视讯上涨9 12% 名臣健康上涨4 63% 荣信文化上涨4 53% 跌幅前五 吉比特下跌-14 97% 紫天退下跌-13 16% 易点天下下跌-13 09% 昆仑万维下跌-12 49% ST大晟下跌-11 86% [15] - 通信行业个股周涨跌幅前五 东信和平上涨15 77% 万隆光电上涨11 80% 中嘉博创上涨7 54% 中光防雷上涨6 54% 三维通信上涨4 89% 跌幅前五 仕佳光子下跌-19 62% 世嘉科技下跌-17 88% 共进股份下跌-16 21% 联特科技下跌-15 16% 神宇股份下跌-14 42% [15] 行业重要事件 - AI模型侧 OpenAI新一代多模态视频生成模型Sora 2在Azure AI Foundry国际版上线 定价0 1美元 秒 李飞飞推出实时运行模型RTFM 单张H100 GPU即可运行 字节跳动火山引擎豆包大模型使用量从2024年5月1200亿tokens增长253倍至2025年9月超30万亿tokens Anthropic预计2026年年化收入可能高达260亿美元 2025年底年化收入达90亿美元 百度视频生成模型实现AI长视频实时交互生成 蚂蚁集团推出万亿参数思考模型Ring-1T并全面开源 腾讯优图实验室开源通用文本表示模型Youtu-Embedding [18][19] - AI应用侧 Salesforce与谷歌达成战略合作 将Gemini模型集成至Agentforce 360平台 Snowflake与Palantir合作集成AI数据云与AI平台 百度搜索AI短剧生成平台开启公测 小米集团雷军表示端侧AI模型是智能网联汽车未来趋势 百度搜索文心助手AIGC创作能力升级 支持8种模态 用户日均生成AIGC内容破千万 新凯来子公司启云方发布国产电子工程EDA设计软件 性能较行业标杆提升30% 硬件开发周期缩短40% 微软面临消费者集体诉讼 指控其与OpenAI协议非法抬高AI产品价格 [20][21] - AI算力侧 甲骨文举例一个六年总收入600亿美元的AI基础设施项目毛利率可达35% XAI筹划价值200亿美元的英伟达芯片租购交易 台积电将2025年营收增长预期上调至30%区间中段 预计第四季度销售额322亿美元至334亿美元 预计全年资本支出400亿美元至420亿美元 认为AI需求持续强劲 产能非常紧张 正努力提升Cowos产能 甲骨文推出大型云端AI超级计算机OCI Zettascale10 峰值性能达16 zettaFLOPS Meta投资15亿美元在得克萨斯州建设数据中心 支持AI运行 深圳市半导体与集成电路产业投资基金首期规模50亿元 重点投向算力 存储 芯片等领域 后摩智能首款存算一体端边大模型AI芯片处于可送测阶段 年底量产 算力160TOPS 功耗10W 工信部组织开展城域"毫秒用算"专项行动 构建低时延城域网络 OpenAI计划在阿根廷投资最高250亿美元建设数据中心枢纽 OpenAI制定五年商业计划以履行1万亿美元支出承诺 英特尔将GPU "Crescent Island"纳入产品组合 上海芯上微装展示新型化合物半导体光刻机等设备 云天励飞表示2026年大模型推理算力需求将超越训练需求 占比超70% 国产算力芯片使用比例不久将超过海外芯片 英国Nscale与微软达成价值高达140亿美元合作 签订约20万张NVIDIA GB300 GPU合同 ASML预计2026年来自中国客户需求将从高基数回落 但全年净销售不会低于2025年 EUV业务将增长 DUV业务可能下滑 商汤科技与中科寒武纪签署战略合作协议 联合优化软硬件 富士康与英伟达合作推动800伏直流电源架构落地AI数据中心 纳微半导体支持英伟达下一代AI工厂计算平台的800 VDC电源架构 OpenAI为博通AI芯片研发与Arm合作 谷歌未来5年在印度投入150亿美元建设AI数据中心 英伟达向SpaceX交付DGX Spark 博枫向Bloom Energy燃料电池技术投资至多50亿美元 合作设计交付AI工厂 北京大学团队研制出高精度可扩展模拟矩阵计算芯片 计算吞吐量与能效较顶级GPU提升百倍至千倍 甲骨文对OpenAI支付每年600亿美元云资源费用充满信心 [22][23][24][25] 公司公告 - 多家公司发布前三季度或第三季度业绩预告或报告 思特威净利同比预增140%-169% 腾景科技第三季度净利润同比增长20 11% 仕佳光子前三季度净利润同比增长728% 光库科技前三季度净利同比预增97 00%-117 00% 奥比中光预计前三季度实现归母净利润1 08亿元 同比扭亏为盈 海光信息第三季度净利润7 6亿元 同比增长13% 泰凌微前三季度净利同比预增118% 端侧AI芯片新品进入规模量产阶段 中科曙光前三季度净利润同比增长24% 光华科技前三季度净利润同比增长1234% 硕贝德第三季度净利润同比预增2837%-3204% 瑞芯微前三季度净利同比预增116%-127% 存储芯片DDR4向DDR5转型或致后续业绩继续快速增长 炬芯科技前三季度净利同比预增113% 端侧AI处理器芯片相关销售收入数倍增长 飞荣达前三季度净利同比预增111%-130% AI服务器散热相关业务营收增长 中石科技前三季度净利同比预增74%-104% 散热材料及组件出货量增长 芯动联科前三季度归母净利同比预增56 43%至91 19% 领益智造前三季度净利同比预增34%-50% [25][26][27][28] - 业务与合作方面 汉得信息是甲骨文公司的"白金级别合作伙伴" 华天科技拟购买华羿微电100%股份 芯联集成拟向控股子公司增资18亿元 保障三期12英寸芯片制造项目 拟申请不超过18亿元新型政策性金融工具 领益智造已为部分国际知名客户批量出货散热模组 拟对参股公司越南光弘增资1102 5万美元 与智元机器人合资成立公司聚焦工业具身机器人 公司持股80% 中兴通讯确保在6G首个3GPP标准版本冻结后第一时间推出6G产品 车规级芯片撼域M1已于2025年9月底发货 自研芯片满足互联网公司核心需求 德明利表示存储市场价格整体呈上涨态势 企业级存储是业务核心增长领域之一 东山精密拟发行H股在香港联交所主板上市 华大九天与摩尔线程相关技术与业务协作稳步推进 路维光电为新凯来供应掩膜版产品 协创数据Dreamworld AI眼镜相关产品预计明年一季度启动量产 江丰电子拟募资不超19 48亿元 成都华微发布两收两发零中频射频捷变收发芯片 广和通H股招股说明书刊发 价格区间19 88港元至21 50港元 北方华创多款设备应用于长江存储芯片生产线 胜宏科技在AI算力卡 AI Data Center UBB&交换机市场份额全球领先 持续推进10阶30层HDI研发认证 东芯股份询价转让初步定价82 5元 股 较收盘价折价16% 中际旭创将根据客户需求做好3 2T光模块定制开发和市场导入工作 泰凌微筹划在香港上市 东华软件医疗 金融等行业应用软件绝大部分已完成与摩尔线程算力芯片 服务器及平台的适配 万兴科技发行H股备案申请材料获证监会接收 [25][26][27][28] - 股东减持及股份变动 通富微电第一大股东华达集团计划减持不超过1%股份 灿芯股份股东拟合计减持不超过2 71%股份 德邦科技第一大股东国家大基金减持151 73万股 华大九天第四大股东国家大基金累计减持271 47万股 减持计划实施完毕 德明利第二大股东魏宏章拟减持不超过1 32%股份 绿联科技持股5%以上股东及其一致行动人拟减持不超过1 5%股份 中微公司持股5%以上股东巽鑫投资权益变动触及1%刻度 云天励飞股东东海云天及东海一期合计减持317 02万股 永鼎股份控股股东拟减持3%公司股份 上海合晶大股东兴港融创计划减持不超过1%股份 [25][26][27][28]
百度蒸汽机,盯上长视频生成实时交互
21世纪经济报道· 2025-10-17 19:00
多模态AI视频行业竞争格局 - 行业竞争焦灼 参与方在技术上均无绝对优势 长期优势难以维持[2] - 当前竞争焦点在于执行力与速度[2] - 近期Open AI发布Sora 2模型 国内AI视频公司亦频繁更新动态[3] 百度蒸汽机模型技术进展 - 百度蒸汽机模型于10月15日升级 重点提升交互体验[3] - 模型实现实时交互生成AI长视频 突破传统10秒时长限制[4] - 用户可通过上传图片和提示词启动生成 并可实时预览 随时暂停或修改提示词以控制视频剧情 画面和转场[4] 百度蒸汽机模型技术细节与迭代 - 为延长视频时长 行业普遍采用"首尾帧续写"技术 但易导致视频缺乏连贯性[4] - 百度团队升级基础架构 引入自回归扩散模型 并着手消除训推偏差及优化一致性以应对技术挑战[4] - 自7月发布以来 模型基本保持每月重大更新的迭代频率[4] - 百度蒸汽机的APP正在规划中[4]
百度搜索全面升级创作能力 生成式AI边界行至何处?
证券日报之声· 2025-10-16 19:12
百度AI技术进展与战略方向 - 公司高管感叹AI技术演变加速,搜索边界正走向模糊和消失,技术发展在重新定义产品形态[1] - 百度搜索宣布全面升级文心助手AIGC创作能力,并发布行业首个开放式实时互动的数字人智能体[1][2] - 百度搜索自7月完成十年来最大改版后,用户日均生成AIGC内容已突破千万[1] 文心助手功能升级 - 升级后的文心助手支持一键调用多工具,解决生活、健康、教育、工作等多场景问题[1] - 在内容创作领域,文心助手已支持AI图片、AI视频、AI音乐、AI播客等8种模态创作能力[1] - 公司提出"万能搭子"概念,从信息检索演进为需求理解与任务交付,并加入情感人格[2] 数字人智能体与情感交互 - 发布的数字人智能体具备高逼真度、低延时、开放式实时互动与情感识别能力[2] - 该功能支持用户与持证真人专家的数字分身进行1对1谈话,应用于法律、情感、旅游等场景[2] - AI被预期将向更人格化、个性化、长期陪伴的方向演进,变得有情绪、有性格、有温度[2] 视频生成模型技术突破 - 视频生成模型百度蒸汽机(文心专精)升级,行业首次实现AI长视频实时交互生成[3] - 依托流式视频技术实现"无限时长"生成,突破传统AI视频生成10秒左右的时长限制[3] - 生成过程支持用户随时暂停、在任意节点修改提示词,实现对视频内容的实时控制,从"单向生成"迈向"双向共创"[3] 市场竞争与商业化表现 - 全球AI技术公司在视频生成模型的竞争日趋激烈,Sora2的新突破引起行业关注[4] - 百度蒸汽机在音视一体、电影画质和复杂运境上取得新突破[4] - 该模型由客户及用户需求催生,目前在B端和C端均有收益,表现为C端用户提升、PV提升及商业化模式提升[3]
AI日报丨苹果推出搭载 M5 芯片的新款 MacBook Pro,AMD获汇丰银行看好
美股研究社· 2025-10-16 18:13
AI技术进展 - 百度蒸汽机视频生成模型升级,实现AI长视频实时交互生成,突破传统10秒左右时长限制,依托流式视频技术实现"无限时长"生成,用户可单张图片加提示词启动生成并实时预览、暂停及修改 [4] - 华为发布全面升级的AI WAN解决方案,以AI-Centric重新定义体验感知、算网极限、安全韧性和运维模式,旨在助力运营商突破增长瓶颈 [5] 巨头资本支出与战略布局 - Meta计划投入超过15亿美元在美国得州新建一座1GW容量数据中心,为AI项目高端计算芯片提供动力,公司今年资本支出将高达720亿美元,包含AI基础设施项目 [6][7] - 苹果AI研究主管Ke Yang离职并加入Meta,其此前负责开发AI驱动型网络搜索,旨在让Siri变得更像ChatGPT [8] 硬件产品与性能提升 - 苹果推出搭载M5芯片的新款MacBook Pro和iPad Pro,M5芯片配备下一代GPU、神经加速器及更强大CPU,在运行AI应用程序时比M4芯片快四倍多 [10] 半导体与AI GPU市场前景 - 汇丰银行将英伟达评级上调至持有买入,目标价从320美元上调至200美元,预计AI GPU总潜在市场将继续增长并超越超大规模企业,导致盈利持续增长,其对台积电2027财年CoWoS晶圆预测的激进估计将推动数据中心收入超越普遍预期 [11][12][13] - 汇丰银行维持对AMD的买入评级,并将目标价从310美元上调至185美元,认为其与OpenAI的交易意味着巨大AI收入上涨潜力且市场共识仍低估该点,该交易可增强对AMD到2030年AI GPU收入机会的可见性 [14] - AMD与OpenAI签署协议,OpenAI将在多年内部署6吉瓦的AMD GPU,首批450吉瓦AMD Instinct MI1 GPU部署将于2026年下半年开始 [15]
百度搜索,再升级
上海证券报· 2025-10-15 23:43
产品能力升级 - 百度搜索于10月15日全面升级文心助手AIGC创作能力,支持AI图片、AI视频、AI音乐、AI播客等8种模态创作 [1] - 升级后的文心助手支持一键调用多工具解决生活、健康、教育、工作等多场景问题 [3] - 文心助手提供长视频生成功能,输入一段话即可创作一部三分钟的故事大片,全流程AI自动完成 [4] - 文心助手集成“一句话写歌”、“MV制作”、“名场面模仿秀”等创作功能,以及超30种特效玩法模板 [4] 技术突破与创新 - 视频生成模型百度蒸汽机再次升级,在行业内首次实现AI长视频实时交互生成,突破传统AI视频生成10秒左右的时长限制 [1][7] - 该模型依托流式视频技术实现“无限时长”生成,生成速度超越国内主流视频生成模型 [7] - 用户上传单张图片与提示词即可启动视频生成,并可实时预览、暂停或修改提示词,实现对视频的实时控制,使AI视频从“单向生成”迈向“双向共创” [7] - 公司发布行业首个开放式实时互动的数字人智能体,具备高逼真度、低延时、开放式实时互动与情感识别能力 [1][6] 应用场景与用户数据 - 开放式实时互动数字人支持用户与持证真人专家的数字分身进行1v1对话,将在法律、情感、旅游等场景提供专业陪伴与咨询服务 [7] - 可交互数字人支持沉浸式双向互动,可应用于AI导购、教育、陪伴等场景 [9] - 开放世界动态构建功能允许用户在AI生成的游戏地图、旅游景点、宇宙空间等环境中自由探索 [9] - 截至目前,百度搜索用户日均生成AIGC内容已破千万,每天都有千万量级的AIGC内容由用户通过文心助手创作产生 [1][3] 产品发展现状与规划 - 百度搜索自今年7月完成十年来最大改版,从搜索框、搜索结果页到搜索生态全面革新,从多项核心指标来看改版已初见成效 [9] - 公司期望产品能够快速迭代,提升用户使用的便捷性,并促进用户间的分享 [9] - 当前产品面临用户对功能认知不足的现实问题,公司计划确保用户能第一时间体验产品并及时收集反馈,以进行针对性改进 [9] - 真实数据的收集对网络和模型的持续提升具有重要意义 [9]
百度搜索 再升级
上海证券报· 2025-10-15 23:25
产品升级概述 - 百度搜索于10月15日全面升级文心助手AIGC创作能力,支持AI图片、AI视频、AI音乐、AI播客等8种模态创作 [2] - 此次升级是继今年7月完成十年来最大改版后的又一重要动作 [2][6] - 升级后的文心助手支持一键调用多工具解决生活、健康、教育、工作等多场景问题 [2] AIGC内容生成能力 - 百度搜索用户日均生成AIGC内容已破千万 [2] - 文心助手提供长视频生成玩法,输入一段话即可创作一部三分钟的故事大片,全流程AI自动完成 [4] - 视频生成模型百度蒸汽机再次升级,突破传统AI视频生成10秒左右的时长限制,在行业内首次实现AI长视频实时交互生成 [2][5] - 用户上传单张图片与一段提示词即可启动视频生成,并可实时预览、暂停或修改提示词,实现对视频的全程干预 [5] 数字人智能体与互动功能 - 公司发布行业首个开放式实时互动的数字人智能体,具备高逼真度、低延时、开放式实时互动与情感识别能力 [2][5] - 该功能支持用户与持证真人专家的数字分身进行1v1对话,在法律、情感、旅游等场景提供专业服务 [5] - 同步推出可交互数字人与开放世界动态构建两大功能,数字人支持沉浸式双向互动,开放世界允许用户在AI生成环境中自由探索 [5] 创作功能与模板 - 文心助手集成"一句话写歌"、"MV制作"、"名场面模仿秀"等创作功能,以及超30种特效玩法模板 [4] - 后续计划上线音乐数字人分身功能,以覆盖从图片处理到视频制作的多元创作需求 [4] 改版成效与未来展望 - 自7月完成十年来最大改版后,从搜索框、搜索结果页到搜索生态全面革新,多项核心指标显示改版已初见成效 [6] - 公司表示产品面临的现实问题是用户对产品功能认知不足,需确保用户能第一时间体验产品并及时收集反馈以进行改进 [6] - 鉴于行业发展的复杂性和不确定性,公司难以准确预期产品在何时能达到何种程度 [7]
从工具到搭子,百度搜索变了
北京商报· 2025-10-15 21:19
百度搜索AI产品升级 - 公司于7月完成最大改版,主要瞄准基于AIGC的玩法和创意实现两个产品形态进行改造 [2] - 10月15日,百度搜索宣布全面升级文心助手AIGC创作能力,并强调其“万能搭子”的定位 [2] - 百度App应用插件百度AI的月活跃用户规模达3.29亿,环比增长3.4%,在AI搜索赛道排名第一 [5] 文心助手AIGC功能 - 输入一段话即可全流程AI自动生成3分钟故事大片,涵盖情节设计、角色塑造、场景搭建等 [3] - 集成“一句话写歌”、“MV制作”、“名场面模仿秀”等创作功能,以及超30种特效玩法模板 [3] - 后续将上线音乐数字人分身功能,覆盖从图片处理到视频制作的多元创作需求 [3] - 在旅行中可通过拍摄景点物体并发问,文心助手会详细介绍该物体的名称、寓意、历史等信息 [2] 数字人智能体 - 公司发布行业首个开放式实时互动的数字人智能体,具备高逼真度、低延时、情感识别能力 [3] - 支持用户与持证真人专家的数字分身进行1v1对话,应用于法律、情感、旅游等咨询场景 [3] - 该功能基于百度数字人技术、多模态模型、多智能体协作等技术 [3] 百度蒸汽机视频模型 - 升级版百度蒸汽机模型实现AI长视频实时交互生成,突破传统AI视频生成10秒左右的时长限制 [3] - 依托流式视频技术实现“无限时长”生成,用户可上传单张图片与提示词启动视频生成 [4] - 用户可随时暂停或在任意节点修改提示词,实现对视频剧情、画面、转场的实时控制 [4] - 具备随时打断、任意改写功能,并可实时预览模型推理全部内容 [4] 行业竞争格局 - 根据Omdia及QuestMobile数据,百度搜索在AI用户规模、综合技术能力等多个核心指标位列AI搜索行业第一 [2] - 在PC网页端应用维度,2025年8月月活跃用户规模前三名为DeepSeek、百度AI助手、豆包,其中DeepSeek和百度AI助手被归为AI搜索引擎赛道 [5] - 抖音App的AI搜和微信App的AI搜索分别位列AI搜索赛道第二、三名,环比增速分别为3.3%和1.9% [5]
百度搜索宣布文心助手AIGC创作能力升级:支持8种模态,一键调用多工具
环球网· 2025-10-15 17:29
文心助手AIGC能力升级 - 百度搜索宣布全面升级文心助手AIGC创作能力,支持AI图片、AI视频、AI音乐、AI播客等8种模态创作 [1] - 文心助手用户日均生成AIGC内容已突破千万量级 [1][2][3] - 升级后的文心助手支持一键调用多工具解决生活、健康、教育、工作等多场景问题 [2] - 文心助手提供行业领先的长视频生成玩法,输入一段话即可全流程AI自动创作一部3分钟的故事大片 [2] - 文心助手集成“一句话写歌”、MV制作、名场面模仿秀等创作功能及超30种特效玩法模板 [2] 视频生成模型技术突破 - 视频生成模型百度蒸汽机(文心专精)再次升级,行业首次实现AI长视频实时交互生成 [1][4][5] - 该模型突破传统AI视频生成10秒左右的时长限制,依托流式视频技术实现“无限时长”生成,生成速度超越国内主流视频生成模型 [1][5] - 用户上传单张图片与一段提示词即可启动视频生成,并可实时预览、暂停、修改提示词,实现对视频剧情、画面、转场的实时控制 [5] - 此次升级同步推出了支持沉浸式双向互动的可交互数字人及允许用户自由探索AI生成环境的开放世界动态构建功能 [5] 数字人智能体与新搜索形态 - 百度搜索发布行业首个开放式实时互动的数字人智能体,具备高逼真度、低延时、开放式实时互动与情感识别能力 [1][2] - 该功能基于百度数字人技术、多模态模型、多智能体协作等,支持用户与持证真人专家的数字分身进行1v1对话 [2] - 数字人智能体将在法律、情感、旅游等场景中为用户提供专业陪伴与咨询服务 [2] 市场地位与改版成效 - Omdia发布的《2025年中国AI搜索市场报告》显示,百度AI搜索在综合技术能力(技术创新、内容质量等)方面位列行业第一 [6] - QuestMobile报告显示,百度AI搜索月活跃用户规模高达3.65亿,稳居国内AI搜索行业第一 [8] - IDC报告显示,百度AI搜索在中国通用型AI搜索类产品中总分排名第一,其中用户数据、技术能力两个重要指标均排名第一 [8] - 自今年7月完成十年来最大改版以来,百度搜索从搜索框、搜索结果页到搜索生态全面革新,多项核心指标显示改版已初见成效 [5]
行业首次 百度蒸汽机实现AI长视频实时交互
证券时报网· 2025-10-15 16:58
文心助手AIGC能力升级 - 文心助手支持AI图片、AI视频、AI音乐、AI播客等8种模态创作 [1][2] - 用户通过文心助手日均生成AIGC内容已突破千万 [1][2] - 助手支持一键调用多工具解决生活、健康、教育、工作等多场景问题 [2] 数字人智能体发布 - 公司发布行业首个开放式实时互动的数字人智能体 [1][2] - 数字人具备高逼真度、低延时、开放式实时互动与情感识别能力 [1][2] - 支持用户与持证真人专家的数字分身进行1v1对话,应用于法律、情感、旅游等场景 [2] 视频生成模型突破 - 百度蒸汽机(文心专精)视频生成模型实现行业首次AI长视频实时交互生成 [1][2] - 模型突破传统AI视频生成10秒左右的时长限制,依托流式视频技术实现"无限时长"生成 [1][2] - 生成速度超越国内主流视频生成模型 [1][2] - 用户可上传单张图片与提示词启动生成,并能实时预览、暂停及修改提示词以实现全程干预 [3] 交互功能与市场地位 - 升级同步推出可交互数字人与开放世界动态构建两大功能,支持沉浸式双向互动与自由探索 [3] - 百度AI搜索月活跃用户规模高达3.65亿,稳居国内AI搜索行业第一 [3] - 公司在IDC报告的中国通用型AI搜索类产品中总分排名第一,用户数据与技术能力指标均排名第一 [3]