多模态AI

搜索文档
传媒行业周报:关注火山引擎原动力大会,聚焦AI应用及IP商业化行业周报
开源证券· 2025-06-09 09:13
报告行业投资评级 - 看好(维持) [2] 报告的核心观点 - 全球科技巨头在多模态模型、Agent及端侧AI方面竞争延续,视频生成模型商业化加快,推动多模态AI应用市场空间打开,拉动算力需求,建议继续布局AI [5] - 多款新游延续良好表现,临近暑期旺季,建议关注IP内容及潮玩新品推出给相关公司带来的业绩弹性 [6] 根据相关目录分别进行总结 行业数据综述 - 《龙魂旅人》获内地iOS免费榜第一,《王者荣耀》获内地iOS畅销榜第一;《无畏契约:源能行动》为安卓和iOS预约榜第一;电影《碟中谍8:最终清算》获得周票房冠军 [10][13] 行业新闻综述 AIGC - OceanBase发布AI生态进展,接入60余家AI生态伙伴支持MCP协议,提升数据库在AI时代基础设施作用 [33] - 阿里通义发布VRAG-RL框架,提升多模态智能体视觉信息处理能力,代码与模型已开源 [34] - 智源研究院发布“悟界”系列大模型,推动物理AGI发展,大会展示AI多领域进展 [35] - Flux新模型上线,AI内容创作领域涌现爆款,AI图片辨别难度提升 [35] - 谷歌升级Gemini 2.5 Pro大模型,性能提升但遭遇“越狱攻击” [36][37] - 快手旗下可灵AI上线一周年,年化收入运行率突破1亿美元,全球用户规模超2200万 [5] 游戏 - 光子工作室《最终幻想14:水晶世界》定档6月19日上线 [38] - 《三角洲行动》5月全球收入大涨,超2200万美元分成后收入 [38] - 2025年5月全球移动端游戏TOP50收入约163亿元,环比增长3.69%,《王者荣耀》位列榜首 [39] 影视/IP - 第22届电影频道传媒关注单元启幕,15部入围佳作角逐多个奖项 [40] 公告总结 - 蓝色光标拟变更经营范围及注册资本,修订公司章程,增设独立董事 [40] - *ST紫天发布股票停牌进展及可能被终止上市风险提示 [41] - 人民网拟使用不超过16亿元闲置自有资金进行委托理财 [42] - 光线传媒实施年度权益分派,向全体股东每10股派发2元现金股利 [43][44] 板块行情综述 - A股传媒板块2025年第23周上涨2.59%,强于上证综指等指数,体育板块表现最好,营销板块最差 [45] - A股传媒个股中歌华有线周涨幅最大,元隆雅图周跌幅最大;美股中陌陌周涨幅最大,微美全息周跌幅最大;港股中天鸽互动周涨幅最大,数字国王周跌幅最大 [45]
一度飙涨超180%!可控核聚变概念,大爆发
证券时报网· 2025-05-26 17:20
市场表现 - A股主要股指涨跌互现 北证50涨近2% 创业板指险守2000点 上证50跌破2700点创2周新低 [1] - 上涨个股多于下跌个股 成交额萎缩至1万亿元以下创1个多月新低 [1] - 上证指数微跌0.05%至3346.84点 深证成指跌0.41%至10091.16点 创业板指跌0.80%至2005.26点 [2] - 沪深300跌0.57%至3860.11点 科创50涨0.17%至982.26点 中证1000涨0.65%至6028.79点 [2] 行业资金流向 - 电子行业获主力资金净流入62亿元 机械设备/计算机均获超40亿元净流入 传媒获超30亿元净流入 [3] - 电力设备/通信/基础化工均获超20亿元净流入 轻工制造连续12日净流入 [3] - 医药生物净流出31亿元 汽车净流出29亿元 银行净流出17亿元 [3] 板块涨跌 - 可控核聚变/游戏/人工智能/谷子经济涨幅居前 乘用车/化学制药/能源金属/酿酒跌幅居前 [2] - 核能概念全线大涨 可控核聚变板块指数盘中飙升逾6%创历史新高 哈焊华通等10余股涨停或涨超10% [3][4] - 发电设备/核电核能/超导概念/核污染防治板块跟随走强 瑞奇智造30%涨停 逾20股涨停或涨超10% [4] 机构观点 - 中邮证券认为A股指数或陷入震荡 需新契机提振市场信心 [3] - 招商证券建议关注汽车/有色金属/国防军工/化学制药等行业 [3] - 浙商证券指出特朗普新政将强化全球核电发展 天然铀长牛可期 [5] - 中信证券认为全球资金更青睐中国科技资产 AI商业化落地有望加速 [6] 人工智能动态 - AI概念午后单边上扬 Sora/AIGC/多模态AI等细分板块均收于最高点 多股20%涨停 [5] - 国际通用人工智能大会发布《通用人工智能标准》 填补国际评测空白 [5] - 深圳国际人工智能展达成近1000个项目采购需求 意向金额30亿元 [5] 核电产业 - 港股核电股集体上涨 中核国际一度飙涨180%创近10年新高 [7] - 特朗普签署行政命令推动美国核能改革 计划2030年前启动10座核电站建设 [8]
短期调整趋势或将延续
英大证券· 2025-05-26 10:30
市场现状 - 上周五沪深三大指数集体调整,沪指跌0.94%,深证成指跌0.85%,创业板指跌1.18%,科创50指跌1.02%,两市成交额11556亿元[5] - 上周市场窄幅震荡,沪指周跌幅0.57%,深证成指周跌幅0.46%,创业板周跌幅0.88%,科创50指数周跌幅1.47%[6] 影响因素 - 外部美国财政困局逼近推升美债利率上行预期,全球金融系统不确定性增加;内部4月制造业数据重回荣枯线下方,人民币贷款不及预期,经济修复不强[2][4][15][17] 板块表现 - 可控核聚变、医药、消费、新能源、并购重组、多模态AI等概念股一度活跃,航运港口板块冲高回落,贵金属、银行板块有表现[7][8][9][10][11][12][14] 后市研判 - 短期调整趋势或将延续,若阶段调整延续,是中期低吸及布局好时机;中期政策托底与流动性宽松为主基调,市场底部支撑强,整体向好趋势明显[2][4][15][17] 操作建议 - 避免盲目追涨杀跌,高抛低吸;减持前期涨幅大个股,关注业绩稳定、前景好、估值合理优质标的;中长期关注科技成长与消费复苏主线及并购重组主题[3][16][17]
目标出货一亿台,Altman和Ive的新公司「io」到底要做什么硬件?
Founder Park· 2025-05-23 19:01
核心观点 - OpenAI以65亿美元全股票交易收购Jony Ive的AI硬件创企「io」,计划打造继手机和笔记本电脑之后的"第三核心"设备,目标出货1亿台[1][4][5] - 新设备将无屏幕、可便携或置于办公桌,定位为AI交互核心载体,强调环境感知与低调设计[1][5][10] - Altman预测该收购将为OpenAI创造1万亿美元额外价值,并计划2025年底前推出产品[4][8] 行业动态 - 谷歌在I/O 2025推出Project Moohan头显和Project Aura智能眼镜,苹果计划2026年推出AI智能眼镜[2] - 科技巨头对AI硬件形态存在分歧:Ive和Altman认为显示屏非必需,而其他公司押注可穿戴设备[2][5] - 实现多模态AI需满足环境感知、实时LLM访问和长续航等条件,推动可穿戴设备研发热潮[2] 产品规划 - 设备定位为"设备家族"成员,设计理念受Apple软硬件整合启发,旨在减少用户对屏幕依赖[5][10] - 强调保密性以防竞争对手模仿,Ive团队已接触量产供应商[6][8] - 目标超越传统硬件发布速度,计划比任何公司更快达到1亿台出货量[8] 战略背景 - OpenAI预计2029年前亏损440亿美元,需通过自有设备建立直接用户触达渠道[9] - Altman认为现有设备无法满足AI交互需求,合并「io」是为实现"AI直接赋能用户"的愿景[10] - 硬件战略与数据中心建设、企业技术、机器人等业务形成协同[8] 合作细节 - 合作始于18个月前OpenAI产品副总裁与Ive团队的接触,去年秋季确定硬件开发方向[10] - 最初设想独立开发,后调整为合并模式以确保设备作为OpenAI核心交互载体的定位[10] - Ive提及与Steve Jobs的合作经历,强调与Altman的默契具有特殊意义[4]
数据复盘丨银行、保险等行业走强 29股获主力资金净流入超亿元
证券时报网· 2025-05-22 17:57
涨停股中,从连续涨停天数来看,大于或等于2天的个股有19只,其中,宜宾纸业、棕榈股份、浪莎股份、三生国健、 滨海能源、ST岭南、*ST苏吴、*ST岩石、*ST节能、*ST双成、*ST赛隆均4连板,连续涨停板数量最多;其次是慧博云 通、莱绅通灵均3连板;永安药业、廊坊发展、重庆港、宝光股份、汇得科技、通达电气均2连板。 沪深两市主力资金净流出252.63亿元 6个行业主力资金呈现净流入 5月22日,上证指数全天窄幅震荡;深证成指、创业板指全天震荡走低;科创50指数早盘探底回升,随后震荡回落,临 近午盘有所回升,午后回落走低。截至收盘,上证指数报3380.19点,跌0.22%,成交额4383.35亿元;深证成指报 10219.62点,跌0.72%,成交额6643.55亿元;创业板指报2045.57点,跌0.96%,成交额2940.63亿元;科创50指数报 990.71点,跌0.48%,成交额164.4亿元。沪深两市合计成交11026.9亿元,成交额较上一交易日减少707.88亿元。 银行、保险等行业走强宜宾纸业、棕榈股份等股4连板 从盘面上来看,行业板块、概念跌多涨少。其中,银行、保险、传媒等行业涨幅靠前;重组蛋 ...
对话阶跃星辰段楠:“我们可能正触及 Diffusion 能力上限”
AI科技大本营· 2025-05-20 09:02
视频生成技术现状与挑战 - 当前视频生成技术(如Diffusion模型)已能产出惊艳视觉片段,但可能触及能力天花板,真正具备深度理解能力的多模态基础模型尚在孕育中[1][5] - 阶跃星辰开源两个30B参数视频生成模型:Step-Video-T2V(文生视频)和Step-Video-TI2V(图生视频),在运动性和风格化生成方面表现突出[12][33] - 当前Diffusion视频模型Scaling Law表现不显著,30B参数模型泛化能力提升有限,15B参数可能在效率与性能间取得更好平衡[5][26] 下一代技术发展方向 - 未来1-2年内可能出现视觉领域的"GPT-3时刻",带来革命性突破[4][36] - 技术突破方向包括:自回归(AR)与Diffusion模型融合架构、从映射学习转向因果预测学习范式、增强少样本学习能力[5][21][45] - 视觉基础模型需具备深度理解能力而非仅像素生成,需借鉴NLP领域成功经验,通过生成方式获得更强理解能力[19][32] 行业实践关键因素 - 高质量自然数据是核心瓶颈,需大规模多样化真实数据而非合成数据,数据处理复杂度极高[14][16][32] - 系统支持与多团队协作至关重要,阶跃星辰项目成功得益于强大系统团队支持[17][18] - 模型需平衡上限探索与易用性,30B参数模型因体积过大影响实际应用,未来需大小模型并行发展[28][29] 多模态与AI应用前景 - 视频理解能力进步将推动具身智能、机器人等需要物理交互的AI应用发展[14][37] - 多模态模型将向物理世界感知发展,增强动作理解等能力,2025年可能出现图像与文字理解生成的重要突破[56][49] - AIGC趋势包括视频长度延长、编辑能力提升、基于参考的生成技术发展,未来将降低内容创作门槛[38][44] 技术里程碑与行业参考 - 近五年AI重大创新包括BERT、GPT-3、ChatGPT、Sora等,确立不同领域技术范式[15] - 视觉领域可能处于NLP中BERT之后、GPT-3之前的阶段,需经历类似发展过程[32] - DeepSeek系列模型因性能优异且实用性强,成为国内行业重要参考[15]
百度居然悄悄拿了个榜单第一,关键是……他们自己好像还不知道?
36氪· 2025-05-19 19:57
百度Steamer-I2V模型技术突破 - 百度视频生成模型Steamer-I2V以89.38%总分位列VBench图生视频评测榜单首位 超过OpenAI Sora及谷歌Imagen Video等竞争对手 [1] - 模型采用Transformer扩散架构 支持生成1080P高清视频 通过多阶段SFT训练和时间步采样优化实现画面流畅过渡与物理运动逼真效果 [8] - 具备像素级画面控制能力 支持多模态条件输入(中文文本/参考图像/引导信号)精准控制运动轨迹与镜头语言 [7] 图生视频赛道商业化优势 - 相较于文生视频技术 图生视频模式提供更高可控性与稳定性 生成成本可降至传统视频制作的1/20以下 [4] - 技术特别适合品牌营销场景 企业可基于产品图片生成专业级宣传视频 避免文生视频的不可控风险 [4] - 在影视创作领域 结合AI图片工具实现角色一致性分镜后 图生视频成为自然工作流程延伸 [4] 中文语义理解技术壁垒 - 模型基于亿级规模中文多模态数据库训练 通过三级数据优化体系确保文本指令与视觉元素语义对齐 [9] - 具备专业级中文概念解析能力 可精准捕捉文化特定元素与复杂语义关联 消除英文翻译偏差 [9] - 技术优势使中国创作者能以自然中文表达创意意图 提升视觉转化准确率 [9] 百度AI生态战略布局 - 技术突破与年初推出的"百看"多模态搜索形成协同 支持语音/图像等多种输入方式获取结构化答案 [10] - 商业系统升级为"百度伴飞" 在智能问答/短剧/小说/游戏等新场域释放商业空间 未来2年预计产生10倍增长 [10] - 公司构建覆盖搜索/文档/视频的全方位AI内容生态系统 实现创作者与商业应用的无缝集成 [10][11] 行业竞争态势 - 百度在未进行大规模宣传的情况下取得技术突破 与行业动辄"放卫星"的推广风格形成鲜明对比 [12] - 图生视频赛道正成为大厂发力重点 源于其更高的商业化可行性与市场需求匹配度 [2][3] - 视频生成领域竞争白热化 技术指标(如VBench评分)成为衡量模型性能的关键基准 [1]
行业周报:多模态AI继续迭代,IP产业资本化或加快-20250518
开源证券· 2025-05-18 23:40
报告行业投资评级 - 看好(维持)[2] 报告的核心观点 - 多模态模型及 Agent 持续更新迭代,互联网大厂对 AI 持续投入,推动 AI 应用在内容创作、商业活动等垂直领域加快渗透,拉动推理算力需求,AI 对业绩的赋能将进一步显现,建议继续布局 AI [4] - 继续关注综艺、游戏、IP 潮玩新品表现,随更多公司切入 IP 潮玩赛道,IP 产业的资本化或加快,助力 IP 新消费延续高景气 [5] 根据相关目录分别进行总结 行业数据综述 - 游戏方面,截至 2025 年 5 月 17 日 22:00,《三角洲行动》获内地 iOS 免费榜第一,《和平精英》获内地 iOS 畅销榜第一;《失控进化》为安卓预约榜和 iOS 预约榜第一;《异环》为 TapTap 新游安卓预约榜第一,《无畏契约:源能行动》为 TapTap 新游 iOS 预约榜第一 [12][22][23] - 电影方面,《水饺皇后》获得 2025 年 5 月 11 日 - 5 月 17 日周票房冠军,本周票房 0.42 亿,累计票房 3.28 亿 [26] - 网播剧方面,《淮水竹亭》表现良好,播映指数 84.3 [27] - 网播综艺方面,《哈哈哈哈哈第五季》周播映指数第一,为 78.2 [28] - 台播剧方面,《刑警的日子》周市占率第一,为 17.6% [29] - 台播综艺方面,芒果超媒《乘风 2025》周市占率登顶第一,为 16.40% [29] - 抖音卡牌爆款榜前 10 名中,喝酒之奕金铲铲卡牌本周销量领先,为 39.5 万 [32] 行业新闻综述 AIGC:技术革新,创造多场景应用 - 2025 年 5 月 15 日,新榜发布第 38 期 AI 产品周榜,Chat GPT 以 10.78 亿周访问量稳居总榜第一,开放注册的 Manus 跻身国内榜第 7 名 [33] - 2025 年 5 月 15 日,阿里巴巴集团发布 2025 财年第四季度及全年业绩,阿里本地生活集团该季度收入 161.34 亿元,同比增长 10%,全年收入 670.76 亿元、同比增长 12%,亏损持续收窄 [33][34] - 2025 年 5 月 16 日,智元机器人联合创始人稚晖君发布智元灵犀 X2 机器人最新研发进展,该机器人将于近期开启首轮预售 [34] - 5 月 13 日,火山引擎发布豆包·视频生成模型 Seedance 1.0 lite、豆包 1.5·视觉深度思考模型,升级豆包·音乐模型 [35] - MiniMax 全新一代 TTS 语音大模型「Speech - 02」在国际权威语音评测榜单 Artificial Analysis 上强势登顶 [35] 游戏:多款新品公测定档 - 2025 年 5 月 17 日,腾讯《王者荣耀世界》正式启动保密测试招募 [36] - 2025 年 5 月 16 日,网易《遗忘之海》正式曝光首支预告片,并同步开启首测招募 [37] - 2025 年 5 月 15 日,网易发布 2025 年一季度财报,网易 CEO 丁磊称《燕云十六声》未来 5 - 10 年还会是长青项目 [37] - 《胜利女神:新的希望》全平台预约人数已突破 800 万,将于 5 月 22 日全平台多端同步上线 [38] 影视/IP:蜜雪冰城与巴西签署采购大单 - 5 月 14 日,动画导演郝姗入职阿里大文娱,并成立超然其乐导演工作室,有 1 - 2 部原创 IP 已进入孵化流程 [38] - 5 月 15 日,湖南卫视、芒果 TV 与阿维塔、宁德时代签约 [39] 公告总结 - 腾讯控股 2025Q1 权益持有人应占盈利 478.21 亿元,同比增长 14.16%;集团收入 1800.22 亿元,同比增长 12.87% [40] - 网易 - S2025Q1 净收入为 288 亿元,同比增加 7.4%;游戏及相关增值服务净收入为 240 亿元,同比增加 12.1% [41] - 阿里巴巴 - W 2025 财年营收为 9963.47 亿元,同比增长 6%;归属于普通股股东的净利润为 1294.70 亿元 [42] - 2025 年第一季度,腾讯音乐娱乐集团季度总收入为 73.6 亿元,同比增长 8.7%,调整后净利润为 22.3 亿元,同比增长 22.8% [43] 板块行情综述 - A 股传媒板块 2025 年第 20 周(5 月 12 日 - 5 月 16 日)下跌 0.77%,表现弱于上证综指、沪深 300、深证成指、创业板指 [44] - 传媒七大子板块中,互联网板块表现最好(+2.18%),影视板块表现最差(-1.11%) [44][45] - 相对传媒指数/沪深 300,互联网板块获得最高超额收益,分别为 +2.95%/+1.06% [45] - A 股传媒互联网相关个股中,ST 惠程周涨幅最大(+14.34%),完美世界周跌幅最大(-6.28%) [45][46] - 美股传媒互联网相关个股中,SoundHoundAl 周涨幅最大(+24.61%),宝尊电商周跌幅最大(-12.70%) [45][51] - 港股传媒互联网相关个股中,网易 - S 周涨幅最大(+16.07%),创梦天地周跌幅最大(-7.23%) [45][54]
【私募调研记录】龙赢富泽调研海天瑞声
证券之星· 2025-05-16 08:13
海天瑞声业务发展 - 2025年第一季度收入增长驱动因素包括多模态大模型迭代、高质量图像/视频数据采购、场景类文本数据需求增加及东南亚数据交付体系运营[1] - 公司探索公共数据资源开发、数据标注人才培养及地方数据标注基地建设[1] - 与运营商合作已成为重要数据服务供应商,未来数据需求将持续增长[1] 营收增长策略 - 2025年营收增长点在于多模态AI技术演进、垂直行业深度应用及东南亚数据交付体系运营[1] - 产品数据集为一次性投入、重复授权销售,定制服务为定向需求、实网数据加工[1] - 标准数据集基于市场需求趋势判断和共性需求提炼,先于客户需求开发[1] 境外业务与毛利率 - 境外业务毛利率高因标准化数据集销售占比高及客户认同综合能力[1] 数据来源与客户需求 - 训练特定垂向领域大模型数据来源包括公开数据、客户自有数据及垂直场景定向采集数据[1] - DeepSeek仍需大量高质量数据,尤其在复杂问题和垂向领域[1] 核心竞争力与竞争对手 - 核心竞争力体现在服务产品双模式、技术平台能力、供应链资源管理能力及数据安全及合规能力[1] - 主要竞争对手为国内数据堂、标贝等,国外Appen,未来Scale AI等技术属性更强的公司[1] 龙赢富泽机构背景 - 初创于2006年,注册资本人民币1000万元,拥有优秀的投资研究、风险管理和客户服务团队[2] - 核心成员来自国内权威专业媒体资讯机构、最大资产管理机构和有影响力的研究机构[2] - 坚持追求绝对回报,通过规范化风险管理体系和系统投资研究框架实现超额收益最大化[2]
【机构调研记录】金信基金调研海天瑞声、万润新能
证券之星· 2025-05-16 08:10
海天瑞声调研要点 - 2025年第一季度收入增长驱动因素包括多模态大模型迭代、高质量图像/视频数据采购、场景类文本数据需求增加及东南亚数据交付体系运营[1] - 公司正探索公共数据资源开发、数据标注人才培养及地方数据标注基地建设[1] - 与运营商合作已成为重要数据服务供应商,未来数据需求将持续增长[1] - 2025年营收增长点在于多模态AI技术演进、垂直行业深度应用及东南亚数据交付体系运营[1] - 产品数据集为一次性投入、重复授权销售,定制服务为定向需求、实网数据加工[1] - 标准数据集基于市场需求趋势判断和共性需求提炼,先于客户需求开发[1] - 境外业务毛利率高因标准化数据集销售占比高及客户认同综合能力[1] - 训练特定垂向领域大模型数据来源包括公开数据、客户自有数据及垂直场景定向采集数据[1] - DeepSeek仍需大量高质量数据,尤其在复杂问题和垂向领域[1] - 核心竞争力体现在服务产品双模式、技术平台能力、供应链资源管理能力及数据安全及合规能力[1] - 主要竞争对手为国内数据堂、标贝等,国外Appen,未来Scale AI等技术属性更强的公司[1] 万润新能调研要点 - 一季度实现出货7.4万吨,同比增长138%,行业需求旺盛,预计二季度出货量将环比提升[2] - 一季度部分原材料如MP、硫酸亚铁价格上涨,但通过拓展采购渠道、错峰采购、加强供应链和库存管理等措施,成本上涨压力相对可控[2] - 将进一步深化与战略客户合作,扩大市场占有率,统筹国内外市场,提升全球化竞争力[2] - 2024年钠电材料出货逾两百吨,应用于小型电动车、低速四轮车等领域,看好钠电市场发展[2] - 美国项目土地和厂房已完成交割,正推进设计、报批报建等工作[2] 金信基金概况 - 资产管理规模(全部公募基金)132.99亿元,排名133/210[2] - 资产管理规模(非货币公募基金)107.82亿元,排名120/210[2] - 管理公募基金数44只,排名108/210[2] - 旗下公募基金经理9人,排名116/210[2] - 旗下最近一年表现最佳的公募基金产品为金信多策略精选混合A,最新单位净值为1.56,近一年增长51.42%[2]