Workflow
Xverse
icon
搜索文档
百度文心大模型4.5系列开源,字节发布图像生成新模型Xverse
国盛证券· 2025-07-07 08:31
报告行业投资评级 - 增持(维持) [6] 报告的核心观点 - 本周(6.30 - 7.4)中信一级传媒板块上涨 2.39%,在游戏板块带动下继续上涨,临近中报期重视中报预期较好公司的投资机会 [1] - 2025 年下半年传媒继续看好游戏等基本面驱动板块,同时弹性方向看好 AI 应用及 IP 变现;AI 应用聚焦新应用的映射投资及部分较成熟应用的数据跟踪,重点关注 AI 陪伴、AI 教育及 AI 玩具方向;IP 变现聚焦有 IP 优势及全产业链潜力的公司,潮流玩具、影视内容等方向有机会 [1] 根据相关目录分别进行总结 投资聚焦 行情概览 - 本周中信一级传媒板块上涨 2.39%,涨跌幅前三的板块分别是钢铁(5.27%)、银行(3.78%)、建材(3.63%);涨跌幅后三的板块分别是综合( - 0.72%)、计算机( - 0.86%)、综合金融( - 4.45%) [1][10] - 传媒板块本周涨幅前五:吉比特(21.6%)、巨人网络(17.4%)、三七互娱(13.1%)、世纪华通(12.8%)、三人行(12.2%);跌幅前五:慈文传媒( - 9.8%)、盛讯达( - 9.1%)、元隆雅图( - 6.2%)、上海电影( - 5.5%)、引力传媒( - 4.8%) [13] - 教育&人服板块本周涨幅前五:粉笔(12.4%)、豆神教育(8.7%)、开元教育(5.7%)、人瑞人才(5.2%)、博瑞传播(4.6%);跌幅前五:天立国际控股( - 20.0%)、同道猎聘( - 9.8%)、好未来( - 6.1%)、BOSS 直聘 - W( - 4.8%)、中国东方教育( - 4.5%) [13] - 重点港股&中概股上市公司一周走势:泡泡玛特( - 1.9%)、快手( - 1.4%)、猫眼娱乐( - 1.9%)、爱奇艺(0.6%)、腾讯控股( - 3.2%)、心动公司(3.9%)、网易 - S(1.1%)、哔哩哔哩( - 2.5%)、阅文集团(0.0%)、腾讯音乐(1.9%) [13] 本周子板块观点 - 游戏:重点关注 ST 华通、吉比特、恺英网络、巨人网络、神州泰岳、心动公司等,关注完美世界、冰川网络、华立科技等 [2][17] - AI:豆神教育、盛天网络、上海电影、荣信文化、盛天网络、中文在线、易点天下、视觉中国、盛通股份、焦点科技、世纪天鸿、佳发教育等 [2][17] - 资源整合预期:中视传媒、国新文化、广西广电、华智数媒、吉视传媒、游族网络等 [2][17] - 国企:慈文传媒、皖新传媒、中文传媒、南方传媒、凯文教育、大晟文化等 [2][17] - 教育:学大教育、粉笔等 [2][17] - 港股:关注【阿里巴巴】【腾讯控股】【泡泡玛特】【中旭未来】,产业爆发在即的【阜博集团】,K12 教培龙头【新东方】及业绩弹性较大的区域龙头【思考乐教育】【卓越教育】 [2][17] 重点事件回顾 - 百度文心大模型 4.5 系列于 6 月 30 日正式发布,并同步开放 API 服务;发布包括 10 款开源模型,涵盖从 47B 参数的混合专家(MoE)模型到轻量级 0.3B 稠密模型,适用于文本、多模态等多种任务;在多个文本和多模态基准测试中达到 SOTA 水平,尤其在指令遵循、世界知识记忆、视觉理解和多模态推理任务上效果突出;遵循 Apache 2.0 协议,提供开箱即用的工具和全流程支持 [3][20] - 字节跳动于 7 月 2 日发布多主体控制生成模型 XVerse,基于 Diffusion Transformer 架构,能精确控制生成图像中每个主体,同时保持图像质量;包括四个关键组成部分,确保生成图像的逼真度和一致性;提出了 XVerseBench 基准测试,共计 300 个测试提示,在多主体生成一致性方面显著优于其他多主体驱动生成技术 [4][20] - 天立国际集团于 6 月 30 日召开“天立启鸣 AI 学伴”大模型应用成果发布会;该模型已在全国 107 所学校 25 万师生中应用,通过人工智能与教育的深度融合,成为教育数字化转型的核心驱动力;计划在三年内联合全国千所学校共建教育数字共同体 [5][20] 子板块数据跟踪 游戏 - 近期热门的重点游戏包括《现代战舰》《问鼎三国 - 策略国战手游》《地下城堡 4:骑士与破碎编年史》《仙境传说:破晓》《进击的堡垒 - 末日废土放置手游》《月影之塔 - LUNA the Shadow Dust》等 [21] 院线 - 内地电影市场周总票房(6.28 - 7.4)约 6.19 亿元(不含服务费);票房排名前三的电影:《名侦探柯南:独眼的残像》(1.64 亿元),《侏罗纪世界:重生》(1.44 亿元),《F1:狂飙飞车》(0.83 亿元) [22] 影视视频 - 2025 年 6 月 28 日至 2025 年 7 月 4 日全平台剧集收视播放量,《书梦一卷》排名第一,全网热度 81.5;《以法之名》排名第二,全网热度 83.4;《桃花映江山》排名第三,全网热度 80.4;前五热度剧集腾讯独播 1 部,优酷独播 1 部,爱奇艺独播 2 部,腾讯、芒果 TV 联合播出 1 部 [25] - 2025 年 6 月 28 日至 2025 年 7 月 4 日全平台综艺收视播放量《这是我的西游》排名第一,全网热度 72.9;《哈哈哈哈哈第五季》排名第二,全网热度 80.3;《麻花特开心第二季》排名第三,全网热度 75.3;前五热度综艺优酷独播 3 部,爱奇艺、腾讯联合播出 1 部,优酷、爱奇艺、腾讯联合播出 1 部 [25]
视频模型赛道“热闹”起来,变现仍是大难题
环球网· 2025-07-06 10:16
视频模型技术进展 - 生数科技更新视频模型Vidu至可一键生成32秒视频,支持音视频合成与4D生成 [1] - MiniMax推出海螺Hailuo-02,实现最高1080P、最长10秒超清视频端到端生成 [1] - 百度发布首个图生视频大模型MuseSteamer,瞄准广告商等专业视频内容创作者 [1] - 据AGI-Eval评测,部分模型如PixVerse-V3等已超越Sora [1] 行业竞争格局 - 视频模型领域由大型互联网/科技企业主导,辅以爱诗科技、生数科技、MiniMax等明星创业公司 [1] - 瑞银研报指出视频模型竞争强度预计不及大语言模型,主要受限于视频语料内容限制 [1] - 2024年初至今,行业已涌现爱诗科技PixVerse、生数科技Vidu、智谱清影、字节跳动PixelDance等多款新品 [1] 商业化模式探索 - To C端采用付费订阅模式,价格从每月数元到数百元不等,如快手可灵、字节即梦 [4] - To B端通过API接口和解决方案服务收费,月费从数十元至数万元不等,服务影视、广告等领域 [4] - 快手可灵AI披露突破一亿美元ARR,月度付费金额连续突破一亿元人民币 [4] - MiniMax海螺自去年8月发布至今,已帮助创作者生成超过3.7亿个视频 [4] 市场前景与挑战 - 全球AI视频生成器市场规模预计从2024年的6.148亿美元增长至2032年的25.629亿美元,年均复合增长率达20.0% [4] - 视频处理复杂度高,数据量庞大,对基础设施要求极高,且开源视频内容稀缺 [2] - 投资人早期看重团队质量,中后期更关注技术与商业化能力 [2] - 生数科技创始人朱军预计视频模型商业化将在2024年加速,行业格局将呈现多元化 [4]
视频模型赛道“热闹”起来了,但变现仍不容易
第一财经· 2025-07-05 16:19
视频大模型行业竞争格局 - 视频大模型行业暂时不会出现一家独大的局面,多款新品近期发布但竞争不如大语言模型激烈[1] - 主要参与者包括大厂与明星创业公司,如生数科技、MiniMax、百度等,正在加快产品更新与商业化落地[1] - 视频模型热度不及AI应用层,主要由大型互联网/科技企业主导,明星创业公司补充[3] 近期产品与技术进展 - 生数科技Vidu更新至可生成32秒视频,支持音视频合成与4D生成[1] - MiniMax发布海螺Hailuo-02,支持1080P、10秒超清视频生成[1] - 百度发布首个图生视频大模型MuseSteamer,面向专业视频内容创作者[1] - 2024年12月PixVerse-V3、可灵1.5、Video-01评测得分超越Sora[3] 商业化与变现模式 - 主要收费模式包括API、订阅、广告、定制化,B端变现更清晰,C端国内市场多免费[7] - 快手可灵AI年化收入突破1亿美元,月付费连续两月超1亿元人民币[7] - MiniMax已帮助创作者生成超过3.7亿个视频,采用B端API和C端会员积分制[8] - 全球AI视频生成器市场规模2024年6.148亿美元,预计2032年达25.629亿美元,年均复合增长率20%[8] 技术挑战与投资趋势 - 视频处理复杂度远高于文本,存储差距达几千倍,视频开源内容较少[4] - 早期投资看团队质量,中后期看技术与商业化能力[4] - 大部分资金可能流向模型公司,但应用程序开发公司数量将更多[5] 行业前景与特点 - 视频大模型商业化将加快,市场需求广阔[9] - 头部平台各有特色与商业化路径,尚未出现高度同质化竞争[9] - 视频赛道与文字赛道差异明显,技术成熟度和成本仍是主要限制因素[3][4]
可灵悄悄赚了1个亿
36氪· 2025-07-04 07:59
视频生成技术商业化进展 - 视频生成技术在营销推广端已实现收入与投入打平 [1] - 头部视频生成产品年化收入(ARR)预计2024年达1亿美元,2025年可能增长至5-10亿美元 [19] - 快手可灵在推出后10个月实现ARR超1亿美元,速度快于Cursor的12个月 [17] 行业技术突破与产品迭代 - 谷歌Veo3实现音画同步,成为改变创作者生产模式的杀手级产品 [5] - 可灵2.1版本支持的首部AI单元故事集《新世界加载中》被评价为AI版《爱死机》,模型能力显著提升 [5] - 可灵系列视频生成大模型全球使用份额超30%,超越Runway(23.6%)和Veo-2(16.6%) [14] 用户行为与市场反馈 - AI生成ASMR和AI动物运动会等内容在短视频平台爆火,单条视频播放量达数百万 [2][11] - 用户生成100张图的下载率一年内提升3倍至60%,30天留存率从10%+提升至40% [15] - 创作者倾向选择价格最低的工具,缺乏品牌忠诚度,可灵10秒视频成本约20元,即梦AI约6.3元 [20][22] 技术挑战与行业共识 - 当前模型存在短板,需平衡语义遵从、运动表现、人脸清晰度等多维度能力 [20] - 行业普遍认为"多模态的ChatGPT时刻"尚未到来 [26] - 商业化虽取得进展,但部分公司认为模式尚未完全跑通,仍处早期阶段 [25]
2025全球数字经济创新大赛AIGC创作大赛在京启动
证券日报网· 2025-07-02 21:14
大赛概况 - 2025全球数字经济创新大赛AIGC创作大赛于7月2日在北京国家会议中心启动 [1] - 大赛由全球数字经济大会组委会主办,联合北京市多个政府部门及9所高校共同承办 [1] - 旨在推动AIGC技术与创作深度融合,搭建国际化创意展示平台 [1] - 吸引政府、高校、企业等300余位代表参会 [1] 赛道设置 - 设置短视频短剧、服饰设计、数字IP、声音创作、代码生成六大特色赛道 [1] - 采用"场景化命题+自由命题"双轨并行模式 [1] - 赛道命题由牵头企业深度参与制定,确保作品具备商业化基因 [2] 产业生态建设 - 通过赛事评选最具市场价值的AIGC创作工具,树立技术标杆 [1] - 重点发掘创新潜力强的创作团队和成长型企业 [1] - 启动"未来创作者"培养计划,构建产学研协同的人才生态体系 [1] 赛事创新亮点 - 设立全球创作赛道,促进中外数字创意交流与国际人才对话 [2] - 开放技术理念,不限定创作工具选择,支持主流AIGC工具及PixVerse等专业工具 [2] - 优秀作品可直接对接产业资源实现快速转化 [2]
2025全球数字经济创新大赛AIGC创作大赛启动
新京报· 2025-07-02 18:00
行业动态 - 2025全球数字经济创新大赛AIGC创作大赛启动 旨在推动AIGC技术与艺术创作深度融合 优秀成果可直接对接产业资源实现快速转化 [1] - 北京市人工智能核心产业营收超3500亿元 同比增长超12% 人工智能核心企业超2400家 [1] - 北京模型备案量达132款 占全国超三成 稳居全国首位 [1] 赛事创新 - 大赛设置短视频短剧、服饰设计、数字IP、声音创作、代码生成等特色赛道 采用"场景化命题+自由命题"双轨并行模式 [1] - 设立"产业需求导向"赛事机制 各赛道命题由牵头企业深度参与制定 确保作品具备商业化基因 [1] - 特别设立全球创作赛道 搭建中外数字创意交流平台 [1] 技术支持 - 参赛者可自由选用主流AIGC工具 组委会提供PixVerse等专业工具的专项支持 [1] - 北京信息化协会与多家行业领军企业签署战略合作协议 企业将担任赛道牵头单位 提供技术支持和商业化落地指导 [2]
字节图像生成新模型:主打多主体一致性,新基准数据集同时亮相
量子位· 2025-07-02 17:33
字节发布多主体控制生成模型XVerse - 字节最新发布多主体控制生成模型XVerse 实现对设定好的每个主体进行精确控制 同时不破坏图像生成质量 [2] - XVerse可处理多主体 多光源 多风格等复杂场景 [4] - 模型核心通过学习DiT中文本流调制机制的偏移量 实现对多个主体身份和语义属性的一致控制 [6] XVerse技术架构 - T-Mod适配器采用perceiver重采样器作为文本流调制核心 将CLIP编码图像特征与文本提示特征结合生成交叉偏移量 实现多主体精准控制 [8] - 文本流调制机制将参考图像转换为偏移量并注入模型token嵌入 调整原始缩放和移位参数实现生成过程精确控制 [9] - VAE编码图像特征模块集成到FLUX模块中 增强细节保留能力 减少伪影和失真 [10] - 引入两种关键正则化技术进一步提升生成质量和一致性 [11] XVerseBench基准测试 - 测试数据集包含20种人类身份 74种物品 45种动物物种 共300个独特测试提示 [11] - 采用多维评估指标包括区域保留损失 文本图像注意力损失 DPG评分 Face ID相似度 DINOv2相似度 美学评分 [12][13] - 在单主体任务中XVerse取得DPG 93.69 ID-Sim 79.48 IP-Sim 76.86 AES 56.84 AVG 76.72 多主体任务中DPG 88.26 ID-Sim 66.59 IP-Sim 71.48 AES 53.97 AVG 70.08 综合表现优于对比模型 [15] 字节AIGC技术发展历程 - 2023年底上线DreamTuner实现高保真身份保留 [18] - 2024年推出DiffPortrait3D将一致性从2D拓展到3D空间 [19] - 2025年发布OmniHuman-1在音频驱动下实现人物动作与表情自然一致 [19] - 2025年4月推出DreamO基于DiT框架支持身份控制 虚拟换装 风格迁移等复杂任务 [20] - 上述技术积累为XVerse的提出奠定基础 [21] 未来研究方向 - 团队将持续提升AI创作智能化和趣味性 使其更贴合日常需求和审美体验 [22]
国产视频生成模型持续发力推动行业发展
华金证券· 2025-06-29 21:47
报告行业投资评级 - 领先大市(维持) [2] 报告的核心观点 - 国产视频生成模型持续发力推动行业发展,视频生成领域应用持续迭代,行业头部公司持续布局,有望提升应用渗透率 [1][5] 根据相关目录分别进行总结 事件 - 近日,全球首部 AI 单元故事集《新世界加载中》在北京举行首映礼,其 7 个单元 AI 微电影全部借助快手自研视频生成大模型可灵 AI 创作而成,涵盖多种题材 [5] 视频生成模型情况 - 可灵 AI 自 2024 年 6 月发布后在全球视觉 AI 领域保持领先,过去一年累计完成超 20 次迭代,全球用户规模突破 2200 万,今年 5 月推出 2.1 系列模型形成产品矩阵,今年一季度收入规模达 1.5 亿元,收入增速仍在提升,P 端付费订阅会员贡献近 70%营业收入 [5] - 国产图生视频模型竞相发展并取得部分成绩,图生视频模型 Top5 国产模型共占三席,分别是字节 Seedance1.0、Minimax Hailuo02、快手 Kling2.0;爱诗科技旗下 PixVerse 积累 6000 万全球用户,月活达 1600 万,海外占据视频生成应用榜首,已上线国内版本“拍我 AI” [5] AI 生成模型应用情况 - 中文在线通过自研工具链将传统动漫短剧制作环节压缩,实现生产周期缩短 70%、成本降低 50%;掌阅科技上线首部 AI 技术与实拍画面深度融合微短剧《遮天》,全网累计话题量破亿,AI 全面介入创作过程;超 50%广告主在生成创意内容时使用 AIGC,且 AI 营销内容占比超 10% [5] 投资建议 - 建议关注中文在线、阅文集团等多家公司 [5] 行业表现 |升幅%|1M|3M|12M| | --- | --- | --- | --- | |相对收益|3.34|3.19|34.3| |绝对收益|5.57|3.36|47.59| [4]
爱诗科技联合举办 CVPR 2025第二届高效端侧生成技术研讨会(EDGE)
财富在线· 2025-06-17 16:15
行业动态 - CVPR 2025第二届高效端侧生成技术研讨会(EDGE)在美国田纳西州纳什维尔市成功举办 [2] - 研讨会期间《AdaVid:Adaptive Video-Language Pretraining》和《Scaling On-Device GPU Inference for Large Generative Models》两篇论文获得最高荣誉 [2] 技术突破 - 《AdaVid》论文提出面向多场景迁移的自适应视频-语言预训练框架 [2] - 《Scaling On-Device GPU Inference for Large Generative Models》论文探讨生成式大模型端侧GPU推理的规模化加速方案 [2] 公司参与 - 爱诗科技旗下AI视频生成平台PixVerse作为联合举办方参与本次研讨会 [4] - 公司与全球顶尖学者专家进行学术共创和行业赋能合作 [4]
拍我AI国内首秀VALSE大会,PixVerse国内版引发现象级关注
搜狐财经· 2025-06-10 14:32
公司动态 - 爱诗科技旗下AI视频生成平台"拍我AI"(PixVerse国内版)首次在国内亮相 完成全球化布局关键一步 [1] - 平台为全球首个用户规模突破6000万的AI视频生成平台 [1] - 2025年5月PixVerse移动端跻身美区iOS总榜第四位 超越WhatsApp TikTok等头部应用 [3] - 截至2025年4月 月活跃用户突破1600万 [3] 产品与技术 - PixVerse凭借"变身特效""拥抱特效"等创新视频模板在全球市场取得现象级成功 [3] - 相关模板在TikTok平台引发病毒式传播 成为海内外网络达人的"涨粉神器" [3] - 依托6000万用户增长经验 构建完整商业化生态 [5] - API开放平台为电商 数字营销 短剧制作等领域提供定制化解决方案 [5] 行业影响 - 展示领先技术实力 传递AI视频技术普惠化新趋势 [1] - 与多家行业头部企业达成深度合作 显著降低视频内容生产门槛和制作成本 [5] - 推动生成式AI在视频内容生产领域的规模化应用 [5]