Workflow
百度蒸汽机(MuseSteamer)
icon
搜索文档
百度用50天将视频价格打到行业70%!内部负责人:成本优化还有空间
AI前线· 2025-08-28 15:31
产品升级与发布 - 百度蒸汽机音视频一体化模型完成重大升级 在行业内首次实现多人有声视频一体化生成 [2] - Turbo版、Lite版、Pro版及有声版全面开放 用户可通过百度搜索或登录绘想平台体验 企业用户可在千帆平台享受高性能视频生成服务 [2] - 生成视频时长为5秒 Turbo版、Lite版、Pro版支持5秒 有声版支持5秒或10秒 [3] 技术突破与创新 - 全球首个中文音视频一体化生成的I2V模型 支持环境音效和多角色语音一体化生成 [3] - 五大核心技术突破包括:行业首次实现多人有声音视频一体化生成 语音与唇形、表情、动作毫秒级精准对齐 复杂场景下稳定 [10] - 首创多模态潜在空间规划技术 自主协调多角色身份、情感与互动逻辑 保障电影级叙事连贯性 [10] - 中文场景深度适配 以超98%的还原度精准呈现中文语音细节与情感表达 [10] - 端到端电影级画质生成 通过精准主体动态刻画打造真实细腻的人物表现力 [10] - 大师级运镜控制 内置数十种专业镜头语言 精准响应文本指令 [10] - 采用端到端训练实现一体化生成 通过统一的潜在空间规划让模型自主决定人物对话逻辑与互动情绪 [5] - 研发核心难点在于实现形、声、音容一体化生成效果 尤其是在多角色场景中保持画面连续自然、声音真实可信、口型表情动作与语音节奏完全匹配 [4] 成本优势与定价策略 - 价格低至行业同类产品的70% 刊例价之外还面向B端和C端用户提供各类优惠定价 所有价格均控制在市场水平的七折或更低 [8] - 国际知名视效指导使用百度蒸汽机2.0制作科幻短片 共有40多个镜头 每个镜头生成3次 共用AI生成超120个片段素材 成本低至百元 [8] - 成本控制得益于团队多年来在GPU算力和工程优化上的积累 能够精准优化训练过程包括调整训练集、优化算子等多项工作显著提升效率 [9] - 依托策略工程架构与底层蒜粒相结合 以及百度智能云百舸平台与自研昆仑芯片的专业适配共同推动成本下降 [9] 商业模式与生态价值 - 不依赖调用次数的商业模式 收益源于生态价值的整体增强而非单次调用费用 [13] - 搜索流量中已有超过60%融入了AIGC生成的内容 视频质量显著提升分发量迅猛增长 [13] - 百家号日更达数百万条 其中AIGC应用占比不断扩大 甚至出现完全由AIGC生成的高热度视频 [13] - 这类收益相比于仅依靠调用量产生的收入大约高出两个数量级 [14] 未来发展方向 - 视频生成技术将朝着更长时长、实时生成与交互方向发展 [6] - 当前生成内容以短片段为主限制在5秒到10秒 实际应用需无限时长生成能力但受限于扩散模型架构导致成本呈平方级增长 [6] - 团队在结合扩散模型和自回归模型优点的基础上进行创新 目前已取得内部突破既保持生成一致性也提升流畅度和叙事合理性同时减少误差累积 [6] - 成本优化仍是未来的重点方向 团队将持续优化以降低用户创作门槛 [11]
从百万预算到几分钟成片:百度蒸汽机为品牌视频开了挂
搜狐财经· 2025-08-25 19:39
行业痛点分析 - 传统视频广告制作周期冗长 从创意到成片需数周至数月 常错过节日热点等营销节点 [4][5] - 制作成本高昂 一条TVC广告成本动辄数十万至上百万元 多版本适配进一步推高费用 [4][7] - 个性化内容生产难度大 传统制作模式难以实现千人千面定制 创意受现实条件制约 [8] 技术解决方案 - 百度蒸汽机实现多人有声音视频一体化生成 输入脚本后数分钟即可输出完整视频 [3] - 创新音画对齐技术确保口型与语音毫秒级同步 即使侧脸或被遮挡仍保持稳定 [11][12] - 潜在空间多模态规划技术保障多角色互动连贯性 使剧情发展合乎逻辑 [13] - 深度适配中文场景 语音合成达到98%以上真人还原度 情感表达细腻入微 [13] - 支持1080p高清输出 内置数十种专业运镜手法 可自动匹配镜头运动 [14][15] 商业应用案例 - 一汽-大众揽境SUV七夕营销案例 通过AI生成《揽境天阶·七夕重逢》短片 实现零成本奇幻场景呈现 [16][17] - 伊利倍畅奶粉制作《漂"羊"过海来看你》宣传片 将产品卖点转化为视觉语言 避免跨国取景成本 [17][18] - 模型推出两周内注册用户超30万 任务提交量达每小时1.8万次 累计生成200多万条内容 [21] 产业影响分析 - 大幅降低制作门槛 使单台电脑加文字图片即可产出专业级视频 引发创意生产平权革命 [22] - 制作成本锐减 使品牌可尝试更多创意版本 实现内容供给规模化 [23][28] - 推动视频素材资产化 虚拟IP形象可持续复用 形成品牌数字资产积累 [26] - 消费者对AIGC内容接受度提升 更关注内容质量而非制作方式 [24][25] 竞争格局 - OpenAI的Sora模型侧重画面生成 尚未整合语音对白功能 且仅限小范围测试 [20][21] - 百度蒸汽机聚焦中文商业场景 通过百度APP等渠道向百万级创作者开放 走务实应用路线 [20][21] - 中美AI视频发展路径分化 百度选择应用驱动模型研发 直接解决企业营销需求 [21]
DeepSeek再度涨价;Meta已暂停AI人才招聘;全球首份具身智能人形机器人“万台订单”签署
观察者网· 2025-08-22 09:06
DeepSeek产品升级与定价策略 - 推出DeepSeek-V3.1模型 支持混合推理架构与更高思考效率 同步更新官方App及网页端 [1] - 取消夜间优惠并执行新版API价格表 调整将于2025年9月6日生效 [1] 百度视频生成技术突破 - 蒸汽机2.0音视频模型实现多人有声视频一体化生成 开放Turbo/Lite/Pro全系版本 [1] - 企业用户可通过千帆平台获取高性能视频生成服务 [1] 可灵AI商业化进展 - 第二季度营收超2.5亿元 母公司快手总营收350亿元同比增长13.1% [2] - 快手GMV达3589亿元同比增长17.6% 经调整净利润56亿元同比增长20.1% [2] Meta人力资源战略调整 - 暂停新AI部门招聘并于上周生效 伴随部门重组以构建超级智能业务结构 [3] vivo硬件产品创新 - 发布首款MR头显vivo Vision探索版 重量398g并支持100-1000度磁吸镜片定制 [4] - 产品暂不零售 8月22日起开放线下体验 [4] 人形机器人行业里程碑 - 天太机器人与战略伙伴签署全球首份万台具身智能人形机器人订单 [5] B站财务与运营表现 - 第二季度净营业额73.4亿元同比增长20% 净利润2.183亿元同比扭亏 [6][7] - 广告收入24.5亿元同比增长20% 游戏收入16.1亿元同比增长60% [6] - 毛利率提升至36.5%创十二季度连续增长 日均活跃用户1.094亿同比增长7% [6][7]
百度蒸汽机视频生成大模型升级2.0版本,价格低至行业70%
新浪科技· 2025-08-21 15:33
产品升级与发布 - 百度蒸汽机音视频一体化模型完成升级 业内首次实现多人有声视频一体化生成 [2] - Turbo版 Lite版 Pro版及全系有声版全面开放 用户可通过百度搜索或绘想平台体验 企业用户可在千帆平台享受高性能视频生成服务 [2] 技术特性 - 作为全球首个中文音视频一体化生成的I2V模型 首创多模态潜在空间规划技术 能自主协调多角色身份 情感与互动逻辑 [2] - 深度中文场景适配 以超98%还原度精准呈现中文语音细节与情感表达 [2] - 实现电影级高清视频画面 逼真环境音效和自然人物语音的同步输出 [2] 商业应用与成本优势 - 该系列大模型已在百度搜索 营销等多个场景落地应用 [2] - 定价低至行业70% 带来创作成本大幅下降 [2] - 好莱坞级大片镜头不再需要百万预算 国际知名视效指导使用该模型制作科幻短片《归途》 [2]
东方甄选辟谣新东方CEO被立案调查丨科技风向标
21世纪经济报道· 2025-08-20 11:20
巨头动向 - 字节跳动否认将推出自有手机产品 仅探索AI能力开放给硬件厂商的合作方案 [2] - 东方甄选股价大幅波动 收盘跌20.89%至34.32港元 公司否认CEO被立案及佣金率超30%的传言并已报警 [3] - 西安市交通运输局要求全面暂停网约车"一口价"和"特惠单"等低价营销活动 正督促平台落实 [4] - 阿里巴巴推出"饱呗运力"校园即时配送业务 由菜鸟团队打造 整合校内资源提供配送服务 [4] - 百度辟谣海外出现大量关于视频生成模型MuseSteamer的虚假网站 同时宣布将推出2.0版本 [5] - 苹果iPhone 17已进入大规模量产阶段 富士康郑州厂区开展旺季招工 [6] 汽车与机器人技术 - 小鹏汽车Ultra版本车型将搭载三颗自研图灵AI芯片 算力达2250TOPS并部署端侧VLA+VLM大模型 [8] - 小鹏汽车支持L4的车型将在2026年量产并试点Robotaxi服务 人形机器人预计2026年下半年量产 [8] 半导体与芯片 - 英伟达为中国市场开发新型AI芯片B30A 基于Blackwell架构 性能约为旗舰B300的50% 计划9月提供样品 [9] - 台积电2纳米工艺晶圆每片定价3万美元 初始良率60%-65% 计划2026年实现月产能6万片 [10] - 高通发布第四代骁龙7s移动平台 采用4纳米制程 CPU和GPU性能均提升7% 支持设备端生成式AI [11] 企业财报 - 小米第二季度营收1160亿元同比增长30.5% 调整后净利润108亿元增长75.4% [12] - 小米智能电动汽车收入206亿元 总交付量81302辆 创新业务分部毛利率26.4% [12] - 泡泡玛特上半年营收138.8亿元同比增长204.4% 调整后净利润47.1亿元增长362.8% [13] - 泡泡玛特分区域收入:中国82.8亿元增135.2% 亚太28.5亿元增257.8% 美洲22.6亿元增1142.3% 欧洲4.8亿元增729.2% [13] 资本市场 - 爱奇艺聘请美国银行、中金和摩根大通安排香港二次上市 计划筹资2亿-3亿美元 目标2026年农历新年前完成 [14][15]
8点1氪:个人养老金新增三种领取情形;俞敏洪回应新东方CEO被调查;海口一单位招聘研究生月薪3000
36氪· 2025-08-20 08:05
个人养老金政策更新 - 人力资源社会保障部发布《关于领取个人养老金有关问题的通知》,新增3种个人养老金领取情形,包括与基本医保相关的医药费用支出累计超过本省上一年度居民人均可支配收入、领取失业保险金累计达到12个月、正在领取城乡最低生活保障金 [2][3] 小米汽车业务进展 - 小米明确不参与汽车价格战,核心任务是汽车交付,经营亏损大幅收窄,有望在下半年实现单季或单月盈利 [7] - 小米二季度智能电动汽车收入206亿元,交付新车81302辆,相关业务分部毛利率26.4% [17][18] 苹果公司动态 - 苹果首次将全部四款iPhone 17机型安排在印度制造,过去四个月印度iPhone出口额达75亿美元 [5] - 英国不再强制苹果提供"后门"访问加密数据,此前苹果提出法律申诉 [10] 特斯拉产品更新 - Model 3汽车现已标配转向灯拨杆,老车主加装需2499元 [6] 字节跳动业务澄清 - 字节跳动否认将推出自有手机产品,表示所有合作不涉及自有手机研发 [7] 亚钾国际高管变动 - 董事长郭柏春因涉嫌挪用公款罪、滥用职权罪被逮捕,公司称事项与公司无关联 [8] 潘多拉中国市场调整 - 丹麦珠宝商潘多拉计划在中国市场关闭100家门店,规模较原计划翻倍,并可能进行大规模裁员 [12] 柯达公司声明 - 柯达公司澄清没有停止运营、终止业务或申请破产保护的计划,预计明年初交易完成后资产负债表将显著增强 [12] 百度AI产品发布 - 百度蒸汽机(MuseSteamer)将于8月21日推出2.0版本,包括Turbo、Lite、Pro和有声版全系模型 [15] - 百度蒸汽机发布首日平均每分钟超百人申请,2周内注册用户超30万 [16] Meta业务重组 - Meta计划将人工智能部门拆分为四个小组,分别专注于研究、超级智能技术、产品和基础设施 [16] AI行业人才需求 - AI岗位数相较2024年1月暴涨29倍,相关岗位平均月薪4.7万至7.8万元,部分实习生日薪达4000元 [16] 芯片行业动态 - Arm聘请亚马逊AI芯片专家Rami Sinno开发自研芯片,挑战英伟达 [17] - 软银与英特尔就收购合同芯片制造业务展开谈判 [14] 泡泡玛特业绩 - 泡泡玛特上半年营收138.8亿元,同比增长204.4%,中国、亚太、美洲、欧洲及其他地区营收均实现三位数增长 [19] 小鹏汽车财报 - 小鹏汽车二季度营收182.7亿元,同比增加125.3%,汽车交付量103181辆,同比增加241.6% [20] 中通快递业绩 - 中通快递上半年收入227.233亿元,同比增加9.8%,净利润40亿元,同比减少1.4% [21] 华润啤酒业绩 - 华润啤酒上半年营收239.4亿元,同比增长0.8%,净利润57.9亿元,同比增长23% [22] 加密货币相关 - 泰国将简化外国游客将加密货币兑换为泰铢的流程,以刺激旅游业 [7] - 加密货币交易所初创公司Figure Technology Solutions拟纳斯特交易所上市,计划集资5亿至10亿美元 [23] 机器人技术 - 宇树科技发布新款人形机器人预告海报,将配备31个关节 [23]
8点1氪|个人养老金新增三种领取情形;俞敏洪回应新东方CEO被调查;海口一单位招聘研究生月薪3000
36氪· 2025-08-20 07:58
个人养老金政策 - 人力资源社会保障部等5部门发布通知 新增三种个人养老金领取情形 包括医药费用负担超过当地居民人均可支配收入 领取失业保险金累计12个月 以及正在领取城乡最低生活保障金 自9月1日起实施 [2] 公司动态与市场表现 - 东方甄选股价跳水跌20% 公司辟谣新东方CEO被立案调查传闻 并启动报警和司法流程 [2] - 海口市龙华区发改委招聘临时聘用人员 研究生月薪3000元 本科2700元 薪资含个人缴纳五险一金且基本固定 [2][3] - 老铺黄金招聘珠宝销售顾问要求身高160-166cm 形象气质端庄 招聘方回应称最基本条件是能否穿下统一工装 [3][4] - 亚钾国际董事长郭柏春涉嫌挪用公款罪和滥用职权罪被逮捕 公司公告称事项与公司无关联 生产经营正常 [4][7] - 辛巴名下广东辛选控股入股杭州黑睛网络技术有限公司 [8] - 日本迷你岛便利店曝食品保质期造假 全国1600多家门店停售多种自制食品 [10] - 柯达公司官方声明没有停止运营或申请破产保护的计划 有信心完成债务偿还及再融资 [10] - 脉脉数据显示AI岗位数暴涨29倍 相关在招岗位超7.2万个 平均月薪4.7万至7.8万元 部分实习生日薪达4000元 [13] 汽车与交通行业 - 小米明确不参与汽车价格战 核心任务是汽车交付 经营亏损大幅收窄 有望下半年实现单季或单月盈利 [4][6] - 特斯拉Model 3全系标配转向灯拨杆 老车主加装需2499元 [5][6] - 韩国7月汽车出口额同比增长8.8%至58.3亿美元 对欧洲出口增加抵消对美出口下滑 [12] - 小鹏汽车第二季度营收182.7亿元 同比增长125.3% 汽车交付量103181辆 同比增长241.6% [17] 科技与电子产品 - 苹果首次将全部四款iPhone 17机型安排在印度制造 过去四个月印度iPhone出口额达75亿美元 [5] - 字节跳动否认将推出自有手机产品 表示仅探索AI能力开放给硬件厂商 [6] - 百度辟谣蒸汽机视频生成模型海外仿冒网址 将于8月21日推出2.0版本 [12][13] - 扎克伯格计划改革Meta人工智能业务 将AI部门拆分为四个小组 [13] - ChatGPT能耗比最初版本或高20倍 AI幻觉问题引发关注 [14] - Arm聘请亚马逊AI芯片专家Rami Sinno开发自研芯片 [14][15] - 宇树科技发布新款人形机器人预告 配备31个关节 [20] 零售与消费品 - 丹麦珠宝商潘多拉计划在中国市场关闭100家门店 并开启大规模裁员 [4][10] - 星巴克为北美所有领薪员工统一上调2%薪资 推进转型计划并管控开支 [5] - 泡泡玛特上半年营收138.8亿元 同比增长204.4% 中国区营收82.8亿元 美洲区营收22.6亿元同比增长1142.3% [16] - 华润啤酒上半年净利润57.9亿元 同比增长23% 每股派息0.464元 [19] 能源与半导体 - 泰国简化加密货币兑换泰铢流程 刺激旅游业 进行18个月试点 [4][7] - 美国商务部推进收购英特尔10%股份 考虑将109亿美元联邦补贴转换为股权 [9] - 软银与英特尔就收购合同芯片制造业务展开谈判 [12] - 韩国和美国可能签署能源领域投资协议 重点关注核电厂和生物能源产业 涉及1000亿美元能源产品采购 [11] 政策与法规 - 英国不再强制苹果提供"后门"访问加密数据 [4][9] - 海南优化个人所得税优惠政策 将合理离岛天数纳入居住天数统计 实际居住不得少于90天 [11] 企业财报 - 小米第二季度营收1160亿元 同比增长30.5% 智能电动汽车收入206亿元 交付新车81302辆 [15] - 中通快递上半年净利润40亿元 同比减少1.4% 收入227.233亿元 [18] 资本市场 - 加密货币交易所Figure Technology Solutions拟纳斯达克上市 代码FIGR 计划集资5亿至10亿美元 [20] - Nexstar以35亿美元现金收购电视台运营商Tegna 覆盖美国家庭比例将提升至80% [12]
百度辟谣蒸汽机视频生成模型多个海外仿冒网址
新浪财经· 2025-08-19 19:37
公司动态 - 百度营销发布官方声明 提示用户注意甄别近期海外出现的大量关于视频生成模型百度蒸汽机(MuseSteamer)的虚假网站 [1] - 百度蒸汽机(MuseSteamer)将于8月21日举办升级发布会 全新推出2.0版本 包括Turbo、Lite、Pro和有声版全系模型 [1] - 百度蒸汽机(MuseSteamer)于7月2日正式发布 发布首日平均每分钟超百人申请 2周内注册用户超30万 [1] 产品表现 - 百度蒸汽机(MuseSteamer)自上线以来受到各方关注 [1]
被多家海外网站仿冒,百度蒸汽机视频生成模型最新声明
新浪科技· 2025-08-19 19:28
公司动态 - 百度营销发布官方声明提示用户注意甄别近期海外出现的大量关于视频生成模型百度蒸汽机(MuseSteamer)的虚假网站 [3] - 百度蒸汽机(MuseSteamer)将于8月21日举办升级发布会并全新推出2.0版本包括Turbo、Lite、Pro和有声版全系模型 [3] - 百度蒸汽机(MuseSteamer)于7月2日正式发布发布首日平均每分钟超百人申请2周内注册用户超30万 [3] 产品技术 - 百度蒸汽机2.0版本基于多模态时空规划、中文场景深度优化以及音视端到端建模等领先技术能力 [3] - 新产品能够实现多人音视频一体化生成、复杂运镜、电影级人物细腻表演、丰富镜头表现和流畅画质 [3]