百度蒸汽机
搜索文档
一档AI生成的综艺爆红
投资界· 2025-11-21 17:18
AI长视频内容的市场接受度与潜力 - 一部完全由AI制作的近7分钟综艺视频《把远古沧龙做成六道菜》在B站获得超过700万点击量,部分观众最初未察觉为AI制作[2][4] - 该作品成功转化了部分原本对AI内容持排斥态度的观众,此前约50%网友对AI内容存在排斥心理[3] - 视频弹幕中超过90%的评论对AI制作精良度表示惊叹,显示高质量AI内容能有效提升用户粘性[5] AI视频创作的技术流程与核心挑战 - 创作者采用人机协作模式,主要负责核心创意构思(如六位厨师人设、核心剧情),具体执行交由AI工具完成[7][8] - 制作过程中累计撰写约20万个提示词,复杂镜头提示词长度达一页Word文档,简单镜头则为三分之一页[6][8][9] - 为实现7分钟成片,实际生成视频片段超过1000个,远超理论所需的42个片段(按10秒/片段计算)[10] - 最大技术难点在于保持人物形象和菜品外观的一致性,解决方案包括通过括号强调关键元素以提升AI识别优先级[12] AI视频生成工具生态与使用策略 - 创作过程混合使用十余种AI工具,包括谷歌Veo 3(承担80%视频画面生成)、阿里Wan 2.2(动作生成优势)、快手可灵(擅长东方人物及中餐场景)[10] - 工具选择需注重风格统一性,例如Veo 3和Sora 2不建议混用以避免影片风格割裂[11] - 硬件投入约2万多元(含英伟达显卡、CPU、主板),制作成本约4000元(主要为付费模型会员及token费用)[12] 平台生态与内容创作趋势 - B站出现AI内容爆发趋势,除AI综艺外还有AI生成的NPC歌唱大赛等新形式,播放量从数万级跃升至数百万级[17][18] - 快手计划通过可灵模型重点赋能平台内创作者,百度则推出"魔法漫画"功能推动AI连载漫画发展[18] - 行业呈现从片段式AI应用(如早期"甄嬛吃汉堡")向完整长视频内容升级的明显趋势,AI长内容未来可能形成独立专区[16][19] 创作者能力要求与行业方向 - 成功创作需具备多项复合能力:多语言提示词撰写、工具特性掌握、创意策划等,AI驱动技能成为创作者新标配[17] - 核心在于平衡科技与内容规律,坚持创作者主体性而非被动跟随AI输出,优质内容创意仍是吸引观众的首要因素[16][19] - 未来竞争将聚焦于AI掌控力与人类创意力的深度融合,形成集团化作战模式[19]
第一档AI生成的下饭综艺,700万人入坑
创业邦· 2025-11-15 18:09
AI长视频内容市场潜力 - 一部纯AI制作的近7分钟综艺视频在B站获得700多万点击量,显示市场对高质量AI长视频内容接受度提升[7] - 该作品成功转化了部分原本对AI内容排斥的观众,此前有50%网友对AI内容持排斥态度[7][18] - B站上AI生成内容如NPC歌唱大赛也获得数百万播放量,平台用户接受度正在快速提高[51] AI视频制作技术发展 - UP主使用十几个AI工具混合制作,包括谷歌Veo 3(承担80%视频画面)、阿里Wan2.2(动作生成优势)、快手可灵(承担80%东方人物场景)[35] - 7分钟视频实际生成片段达1000多个,理论需42个片段(按10秒/片段计算)[34] - 制作成本约4000元(主要为大模型会员和token费),设备投入2万多元(含烧坏的英伟达显卡)[38][39] 创作者工作流程 - 创作者采用人机分工模式:负责核心创意(厨师人设、核心剧情),AI负责具体内容生成[26] - 每个分镜头需编写1-2套提示词,难点镜头提示词长达一页Word文档[29][32] - 通过分段叙述提示词(人物动作、穿着、外貌分开描述)减少AI幻觉,使用括号强调关键元素保持一致性[30][40] 行业竞争格局 - 国内外视频生成模型快速迭代,包括快手可灵、阿里Wan2.2、百度蒸汽机、Sora 2、Veo 3等[47] - 快手计划用可灵赋能平台创作者产出更多高质量AI长内容,百度文心APP上线"魔法漫画"功能生成AI连载漫画[51] - 创作者需要掌握多语言能力、提示词技巧和对各工具性能的深入理解[48] 内容创作趋势 - AI长视频成功关键在于发挥创作者主体性,内容创意仍排第一位[45][46] - AI视频工具从早期片段式生成发展到能制作有剧情、有审美的完整长视频内容[44] - 平台可能出现AI内容爆发趋势,未来AI长内容有望成为独立专区,成为创作者新战场[51]
第一档AI生成的下饭综艺,700万人入坑
36氪· 2025-11-10 12:11
AI长视频内容的市场接受度与影响力 - 一部近7分钟纯AI制作综艺《把远古沧龙做成六道菜》在B站获得超过700万点击量,部分观众未察觉其为AI制作[1] - 该内容成功转化了部分原本对AI生成内容持排斥态度的观众,此前有50%网友对AI内容表示排斥[1] - 弹幕中高达9成以上观众对AI制作的精良程度表示惊叹,刷新了他们对AI内容能力的认知[6] - 观众呈现多种派别:找Bug派、被诱拐派(误以为是真人秀续集)、惊叹派和转化派,体现了内容赛道看客的多样心态[6][7] AI综艺内容创作方法与技术细节 - UP主@黄浦江三文鱼采用人机合作模式,主要负责核心创意(六位厨师人设、核心剧情),其余交由AI完成[13] - 创作过程中编写了约20万个提示词,每个分镜头会写1-2套提示词进行精修,复杂镜头提示词长达一页word文档[15][16][18] - 采用分段叙述提示词方法,将人物动作、穿着、外貌等要素分开描述,以减少AI幻觉现象[16] - 使用了十几个AI工具混合制作,包括谷歌Veo 3(承担80%视频画面)、阿里Wan2.2(动作生成优势)、快手可灵(承担80%东方人物和中餐画面)[19] - 7分钟视频实际生成了1000多个片段,远超理论所需的42个片段(按10秒片段计算)[18] - 制作成本约4000元(会员费和token费),设备投入2万多元(含烧坏的一张英伟达40系列显卡)[22] AI视频创作行业发展趋势与平台动态 - AI长视频内容正从片段式鬼畜文化(如"甄嬛吃汉堡")向具有作者主体性的完整作品升级[1][25] - B站出现AI内容爆发趋势,除AI综艺外还有AI生成的NPC歌唱大赛等,播放量达到数百万级别[29] - 各大平台积极布局:快手用可灵赋能创作者并争夺海外市场,百度上线"魔法漫画"功能生成AI连载漫画,AI播客开始在播客平台蔓延[29] - 行业竞争推动AI视频工具快速发展,国内外模型混合使用成为创作者常态,对语言能力、提示词能力和工具掌握能力提出较高要求[27][29] - 未来AI长内容可能成为独立专区,竞争将是AI掌控力与人类创意力结合的集团作战[29]
对话刘林:百度AIGC的差异化破局
经济观察网· 2025-11-04 22:36
行业趋势与战略 - AIGC技术正深刻改变营销行业,百度营销凭借多模态大模型技术优势推出视频生成模型[1] - 行业各方需构建有机协同体以充分发挥技术价值,实现营销全链路价值提升[3] - 技术竞争激烈,单纯技术突破已不足以构建绝对优势,关键在于实现“技术+产品+玩法”的深度融合[6] 百度蒸汽机产品能力 - 百度蒸汽机视频生成模型仅需一张图片和提示词即可生成高质量广告创意[1] - 模型通过极致遵循能力支持复杂运镜生成,实现电影级超高画质[1] - 采用音视频一体化生成技术实现逼真环境音效和多人自然人物语音的同步输出[1] - 采用“流式生成”技术突破5秒、10秒的视频生成限制,实现长视频生成[1] - 具备实时生成可交互视频能力,实现人与模型的实时互动和人机共创[1] - 产品具备三大差异化能力:音视频一体化生成、长视频生成及交互式视频生成[5] - 用户可在生成过程中实时编辑、随时打断并修改结果,具备创新交互功能[6] 产品生态与市场应用 - 百度构建了面向B端的“擎舵”平台和面向C端的“绘想”平台产品矩阵[2] - 平台通过“多智能体WorkFlow”助力企业和创作者实现个性化创意内容生产[2] - 产品旨在服务百度移动生态,丰富视频内容,吸引更多创作者[4] - 目标是通过新奇体验引发用户自发传播和社交裂变,形成差异化竞争力[5][6] - AI工具的核心价值在于解放创意人员,使其从重复执行中解放,更专注于策略洞察[3]
互联网行业周报:豆包发布升级多款大模型,多平台正式开启双十一大促-20251020
招商证券· 2025-10-20 21:40
报告行业投资评级 - 互联网行业投资评级为“推荐”(维持)[2] 报告核心观点 - 三季报临近,各类大模型加速迭代,持续坚定推荐业绩表现稳中向好、AI应用领域领先布局的互联网龙头公司,如腾讯控股、泡泡玛特、快手、网易、哔哩哔哩、美图公司等 [1] 互联网上市公司重要公告及新闻一周回顾 - 快手-W于2025年10月17日向若干合资格参与者授出合共6,567,269份受限制股份单位 [2][8] - 腾讯生命科学实验室联合研发的DeepGEM病理大模型在肺癌基因突变预测中完成大规模验证,精准度达78%~99%,仅需常规病理切片图像即可在1分钟内完成预测 [8] - 哔哩哔哩于10月14日正式开启双11大促,平台日活跃用户1.09亿,人均使用时长105分钟,此前6·18期间带来的平均进店新客率近60% [8] - 百度于10月15日宣布其视频生成模型“百度蒸汽机”完成升级,突破AI生成视频普遍在10秒左右的时长限制,首次实现长视频的实时交互生成 [5][8] - 火山引擎于10月16日发布和升级四款豆包大模型,并正式发布“智能模型路由”,截至2025年9月底,豆包大模型日均tokens调用量已突破30万亿,相比今年5月底增长超80% [5][8][10] - 阿里于10月16日凌晨正式上线AI编程工具Qoder CLI,并于同日通义千问推出Qwen3-VL的4B和8B两个版本 [5][8][10] - 百度搜索于10月16日宣布旗下AI短剧生成平台开启公测,可辅助创作者完成80%以上的内容创作 [10] - 百度智能云于10月16日对千帆平台进行品牌战略升级 [5][10] - 美团于10月17日正式开源其自主研发的专用语音编解码方案LongCat-Audio-Codec [5][10] 上周市场表现回顾 - 行业整体表现:报告期内(10月13日至10月19日),上证指数下跌1.47%,恒生互联网科技业指数下跌6.27%,产业互联网综合服务指数下跌7.66%,深证成指下跌4.99%,沪深300下跌2.22% [11] - 公司一周涨跌幅:A股方面,同花顺下跌7.11%,大智慧下跌13.33%,东方财富下跌4.71%;港股公司方面,腾讯控股下跌6.68%,哔哩哔哩-W下跌10.26%,快手-W下跌13.05% [16] - 重点公司市值及周涨跌幅:腾讯控股当前市值50,822.98亿元,周跌6.68%;快手-W当前市值2,880.70亿元,周跌13.05%;网易-S当前市值6,474.42亿元,周跌5.73%;哔哩哔哩-W当前市值786.28亿元,周跌10.26%;美图公司当前市值343.17亿元,周跌9.56% [17][18][19][20][21][22][23] 核心组合及推荐理由 - 腾讯控股:25Q2网络游戏业务收入592亿元,同比+22%,其中国内收入404亿元,同比+17%,国际市场游戏收入188亿元,同比+35%;社交网络业务收入322亿元,同比+6%;营销服务业务收入358亿元,同比+20%;金融科技及企业服务业务收入555亿元,同比+10%;25Q2毛利润1050亿元,同比+22%,毛利率57% [19][20] - 快手-W:25Q2 DAU和MAU分别为4.09亿和7.15亿,分别同比增长3.4%和3.3%,单DAU使用时长126.8分钟;25Q2直播收入100亿元,线上营销服务收入198亿元,其他业务收入52亿元,GMV为3589亿元,同比增长17.6%;25Q2调整后净利润56亿元,同比增长20.1%,经调整净利率16% [20][21] - 网易-S:游戏板块25Q2收入228亿元,同比+13.7%;有道25Q2收入14亿元,同比+7.69%;云音乐25Q2营业收入20亿元;25Q2营业成本98亿元,营业费用90亿元 [21] - 哔哩哔哩-W:25Q2收入73.4亿元,同比+20%,经调整净利润5.6亿元,同比扭亏为盈,经调整净利润率7.6%;增值服务业务收入28.4亿元,广告业务收入24.5亿元,移动游戏业务收入16.1亿元;Q2 DAU达1.094亿,MAU达3.63亿,月均付费用户3100万 [21][22] - 美图公司:2025年上半年收入18.21亿元,同比+12.3%,经调整归母净利润4.67亿元,同比+71.3%;上半年毛利13.4亿元,毛利率73.6%;截至中报,产品MAU达2.8亿,付费用户数达1540万,同比增长42% [22][23]
“百度不做”,仅仅一年,李彦宏反悔了
搜狐财经· 2025-10-20 16:59
行业战略转变 - 百度创始人李彦宏在2024年10月内部讲话中表示AI视频大模型投入周期过长可能10年或20年都无法获得业务收益因此百度不会去做此类模型 [1] - 2025年9月30日Sora 2发布后仅14天百度便高调推广其AI视频模型“百度蒸汽机”与谷歌Veo 3.1形成竞争态势显示公司战略从回避转向积极参与 [2] - 中国AI视频应用从2024年初Sora发布时的沉寂转变为2025年的火热各大厂商包括阿里、腾讯、字节、百度均推出产品市场竞争加剧 [4][12] 技术差距与演进 - 2024年2月Sora通过“建构现实”能力超越其他仅“模拟现实”的应用例如能再现咬苹果留下齿痕的物理规则细节提升视频真实感 [5] - 2024年中国大厂因基础大模型与Open AI、谷歌存在巨大差距优先聚焦追赶GPT-4而非开发文生视频模型导致初期回避Sora竞争 [10][12] - 2025年初深度求索推出“物美价廉”的DeepSeek模型减轻行业焦虑基础大模型竞争迭代加速成本下降推动多模态能力发展 [12] - 当前AI视频模型沿两大方向演进:视频质量提升如画面更真实、提示词更准确以及用户编辑能力强化如局部修改和对象增删 [15] - 音频即时生成功能填补了AI视频仅能制作“默片”的短板而测试显示Sora 2注重娱乐性谷歌Veo 3.1强调物理规则差异化竞争明显 [16][17] 商业化前景 - Sora 2通过成本降低和可用性增强用户可直接生成复杂电影片段减少修改需求AI演员如蒂利·诺伍德出现可能替代真人颠覆传统影视行业 [19][20] - Sora 2推出免费用户“一键创作视频”功能推动从网页端向APP移动端战略下沉通过个性化设计如插入用户形象加速社交传播 [22] - Open AI计划为创作者提供变现机制目标是让90%以上免费用户找到盈利途径构建类似TikTok的用户生产与消费闭环平台 [22][24] - 全球生成式AI视频竞争加剧但平台化机会有限同一类型“平台”数量不会太多导致厂商间血腥厮杀以争夺主导地位 [24]
百度文心助手都成这样了
量子位· 2025-10-17 19:30
百度AI模型与产品升级 - 文心助手新增8种多模态创作能力,包括生成分钟级长视频和行业首个实时互动数字人智能体[3] - 视频生成模型"蒸汽机"升级至10.15版本,突破传统5-10秒时长限制,实现AI长视频实时交互生成[3][27] - 文心助手支持30多种爆款视频特效,内置超200种配音音色,并整合文生/图生图功能实现视频封面AI一站式输出[21][22] 百度AI技术性能优势 - 文心助手移动端和PC端上线极速大模型,生成速度比行业第一梯队快5倍,成本仅为70%[11] - 蒸汽机模型采用流式生成技术,支持"一张图+一个Prompt"实时修改视频内容,用户可随时中断或调整生成过程[27][29] - 多Agent蜂群工作流技术实现编剧、导演、演员、后期各环节协同,一句指令即可完成"脚本-角色-分镜-成片"全流程[21] 百度AI应用场景拓展 - 文心助手具备超长记忆和深度研究能力,可快速生成市场分析报告,搭载数十亿学习题库支持作业辅导[14][15] - 提供24小时AI在线问诊服务,与专业医生资源合作覆盖医疗咨询场景,魔镜功能支持实时识别物体并获取知识[12][13] - 支持Rap歌曲创作、图片生成MV、数字人歌手转换等娱乐功能,预计10月底上线AI播客功能[23][24] 百度AI市场地位与生态策略 - 百度搜索在AI用户规模、综合技术能力等核心指标位列全行业第一,用户日均AIGC生成量突破千万级[4] - 公司采用"加量不加价"定价策略保持产品低门槛,通过快速迭代(如版本1.0至1.1短期升级)强化市场执行力[34][39] - 生态建设同时面向内部B端(百家号、百度文库)和外部C端需求,通过合作圈层整合数据资源与用户真实需求[35][36] 百度AI产品定位转型 - 百度搜索口号从"百度一下,你就知道"升级为"百度一下,解锁AI万能搭子",从工具属性转向AI伙伴定位[7][8] - 文心助手引入16型MBTI和12星座人设系统,基于数据记忆理解用户习惯,支持个性化互动与情感连接[15][24] - 所有AI功能免费开放给用户,旨在将AI创作转化为日常低门槛活动,实现"边做边改、快速迭代"的产品理念[25][26][34]
创历史!百度“蒸汽机”让AI视频可“边改边看”!科创人工智能ETF华夏(589010) 盘初弱势震荡,芯片算力方向成盘中亮点!
每日经济新闻· 2025-10-17 05:52
科创人工智能ETF(589010)市场表现 - 截至9点48分早盘小幅回调0.07% 开盘后短暂冲高至1.452元后震荡回落 整体在1.44元附近维持整理 暂未脱离前一交易日区间 [1] - 成分股方面30只中上涨7只 下跌23只 个股分化明显 寒武纪 道通科技 芯原股份领涨超2% 海天瑞声 奥比中光 恒玄科技领跌 显示AI算力与智能硬件板块内部轮动 [1] - 流动性方面成交额达3136万元 成交量2170万份 交投平稳 [1] 人工智能技术进展 - 百度宣布视频生成模型百度蒸汽机再次升级 突破传统AI视频生成10秒左右时长限制 行业首次实现AI长视频实时交互生成 生成速度超越国内主流视频生成模型 [1] - 用户只需上传单张图片与一段提示词即可启动视频生成流程 并能实时预览模型推理全部内容 在生成过程中可随时暂停或在任意节点修改提示词 实现对视频剧情 画面 转场的实时控制 [1] 中美人工智能发展路径 - 中国优先部署成本低 易跨行业扩展的应用人工智能 强调通过"AI+"推动人工智能融入科研与产业 目标在2030年实现全面赋能增长 [2] - 美国专注于将原始能力推向极限的通用人工智能(AGI) 两种愿景代表不同发展路径的正面交锋 [2] - 美国在GPT-5受挫后其通用人工智能发展路径已遇瓶颈 而中国的AI应用路线正显现成功迹象 [2] 科创人工智能ETF(589010)产品特征 - 紧密跟踪上证科创板人工智能指数 覆盖全产业链优质企业 兼具高研发投入与政策红利支持 [2] - 20%涨跌幅与中小盘弹性助力捕捉AI产业"奇点时刻" [2]
闪电快讯|Sora 2亮相后,百度谷歌同日发布视频模型新品
新浪财经· 2025-10-16 22:04
行业动态与竞争格局 - OpenAI于10月1日发布最新视频生成应用Sora 2,为全球视频生成赛道打响新的发令枪 [1] - 百度于10月15日官宣视频生成模型百度蒸汽机升级,谷歌于同一天夜间推出最新视频生成模型Veo 3.1版 [2][5] - 视频生成赛道竞争焦灼,各公司在技术上没有绝对长期优势,竞争焦点在于执行力和速度 [7] 百度蒸汽机模型技术特点 - 升级后的蒸汽机模型行业首次实现AI长视频实时交互生成功能,突破传统AI视频生成10秒左右的时长限制,理论支持无限时长生成 [2][5] - 模型支持图生视频和视频生视频双模式生成,用户可实时查看推理内容、随时暂停、修改提示词,实现对视频剧情、画面、转场的实时控制 [5] - 同步推出可交互数字人与开放世界动态构建两大功能,数字人支持沉浸式双向互动,开放世界允许用户在AI生成环境中自由探索 [5] 产品定价策略 - 百度蒸汽机Turbo有声版价格2.5元/秒,首发双周优惠为1.4元/5秒,C端用户在“绘想”平台会员充值定价41元/月起 [2] - Sora 2 API定价为0.1美元/秒起,C端用户需拥有ChatGPT Plus(20美元/月)或Pro(200美元/月)会员 [3] - 百度蒸汽机定价为行业同类产品的70%,本次升级沿用了之前的价格策略 [2] 产品化与生态构建 - Sora 2推出了独立的iOS App应用,首页以信息流呈现优质生成作品,支持用户浏览、分享、共创,被讨论有意入局社交内容产品 [8] - 百度蒸汽机目前主要接入百度App满足内部业务需求,独立App是未来规划方向 [8] - 百度搜索于10月15日全面升级文心助手AIGC创作能力,支持AI图片、视频、音乐、播客等8种模态创作,每天有千万量级AIGC内容由用户通过文心助手创作产生 [8] 应用场景与功能 - 百度文心助手提供“长视频生成玩法”,用户可通过输入描述要求AI自动完成一部3分钟故事片的全流程制作,包括情节设计、角色塑造、场景搭建等 [10] - 文心助手集成“一句话写歌”、“MV制作”、“名场面模仿秀”等创作功能,以及超30种特效玩法模板,后续将上线音乐数字人分身功能 [10] - 百度搜索发布行业首个开放式实时互动的数字人智能体,支持用户与持证真人专家的数字分身进行1v1对话,应用于法律、情感、旅游等专业咨询场景 [10] 谷歌Veo模型更新 - 谷歌Veo 3.1版在音频输出、精细化编辑控制以及图像转视频效果方面均有提升 [5] - Veo 3.1特别推出视频扩展、首尾帧补过渡、图片引导风格控制三大升级功能 [6]
从工具到搭子 百度搜索求变
北京商报· 2025-10-15 23:54
公司产品升级与功能 - 百度搜索于今年7月完成最大改版,主要瞄准基于AIGC的玩法和创意实现两个产品形态进行改造 [1] - 公司于10月15日全面升级文心助手AIGC创作能力,并发布行业首个开放式实时互动的数字人智能体 [1] - 文心助手提供行业长视频生成玩法,输入一段话即可全流程AI自动创作3分钟故事大片,集成超30种特效玩法模板 [2] - 开放式实时互动的数字人智能体基于百度数字人技术、多模态模型等,具备高逼真度、低延时等特点,支持用户与持证真人专家的数字分身进行1v1对话 [2] - 升级版百度蒸汽机模型实现AI长视频实时交互生成,依托流式视频技术突破传统AI视频生成10秒左右的时长限制,实现无限时长生成 [2] - 百度蒸汽机支持用户上传单张图片与提示词启动视频生成,并可随时暂停或修改提示词,实现对视频剧情、画面的实时控制和全程干预 [3] 行业市场地位与数据 - 根据Omdia及QuestMobile最新数据,百度搜索在AI用户规模、综合技术能力等多个核心指标位列AI搜索行业第一 [1] - QuestMobile报告显示,百度App中的应用插件百度AI月活跃用户规模达3.29亿,环比增长3.4%,在AI搜索赛道排名第一 [4] - 在AI搜索赛道,抖音App的AI搜索和微信App的AI搜索分别位列第二和第三,环比增速分别为3.3%和1.9% [4] - PC网页端应用维度,QuestMobile统计的今年8月月活跃用户规模排名前三依次是DeepSeek、百度AI助手、豆包,其中DeepSeek和百度AI助手被归为AI搜索引擎赛道 [4]