Workflow
多模态
icon
搜索文档
视声智能(920976):北交所信息更新:研发创新聚焦技术迭代与场景拓展,2025Q1-3归母净利润同比增长23%
开源证券· 2025-10-30 15:15
投资评级与核心观点 - 报告对研究的具体公司维持“增持”投资评级 [3][5] - 报告核心观点为看好公司业绩增长能力 研发投入持续加大以及产品出海创收 [5] - 研究的具体公司2025年三季报显示 2025Q1-Q3营业收入为1 99亿元 同比增长12 56% 归母净利润4 427 46万元 同比增长22 79% [5] - 维持2025-2027年盈利预测 预计归母净利润分别为65 83 105百万元 对应EPS分别为0 92 1 17 1 47元 股 [5] 公司技术与市场拓展 - 公司在KNX领域深耕多年 每年研发投入超10% KNX相关产品认证数量等指标均位于国内领先水平 [6] - 公司研发与创新聚焦技术迭代与场景拓展 加强KNX通讯协议与其他协议的对接 并预研AI 多模态 大数据 云计算等新兴技术应用 [6] - 公司在全球各大洲已建立经销商网络 形成覆盖广泛的销售布局 中东 非洲地区增长比重较大 欧洲地区增长绝对值高 [6] 行业市场前景 - 2024年全球智能家居市场规模达2229亿美元 约合1 6万亿人民币 中国贡献率超35% [7] - 预计到2028年中国智能家居活跃用户数将达1 91亿户 家庭渗透率接近39 2% [7] - 预计到2031年 KNX全球市场规模将达179 2亿美元 2025-2031年期间复合年增长率为10 3% [7] - 在KNX产品结构中 远程控制类产品占主导地位 约14%份额 住宅建筑是最主要应用领域 占比达53 4% [7] 财务数据与估值 - 研究的具体公司当前股价为26 57元 总市值18 85亿元 流通市值11 72亿元 近3个月换手率为215 57% [3] - 根据盈利预测 研究的具体公司2025-2027年对应当前股价的PE分别为29 0 22 8 18 0倍 [5] - 财务预测显示 研究的具体公司营业收入将从2024A的249百万元增长至2027E的441百万元 归母净利润将从2024A的48百万元增长至2027E的105百万元 [8] - 盈利能力持续改善 毛利率预计从2024A的51 5%提升至2027E的55 6% 净利率从2024A的19 2%提升至2027E的23 7% ROE从2024A的17 7%提升至2027E的24 6% [8]
深度|开源新王M2与全模态布局,AI竞赛的另一种可能
Z Potentials· 2025-10-30 10:32
技术实力与行业地位 - 新一代自研开源文本大模型M2在权威Artificial Analysis榜单上登顶全球开源模型第一,综合能力在智能体和代码等关键维度上逼近GPT-5等顶尖闭源模型 [2] - M2总分冲入全球前五,在所有开源模型中位列第一,综合表现超越Google的Gemini 2.5 Pro和Anthropic的Claude 4.1,直逼Claude 4.5 Sonnet [8] - 原创算法CISPO被AI巨头Meta在其最新论文中公开致敬,Meta研究指出该算法在提升多轮对话逻辑性方面展现了良好效率和结果 [2][6] 市场表现与开发者认可 - M2上线3天便在知名AI聚合平台OpenRouter快速攀升到全球调用量第7名与编程场景第3名 [3] - 在OpenRouter平台,M2免费版本调用量达到21B tokens,增长26%,超过Anthropic Claude Sonnet 4.5的112B tokens(增长16%)和Google Gemini 2.5 Pro的30.7B tokens(增长14%) [6] 产品性能与成本优势 - M2展现了强大的端到端开发能力,在Terminal-Bench和SWE-Bench等高难度基准测试中名列前茅,具备深入开发者工作流的实用价值 [12] - M2单位成本不到同级竞品Claude 4.5的8%,并面向全球限时免费,旨在瓦解"算力税"、推动AI普惠 [12] 多模态战略与商业化进展 - 公司多模态模型协同出击,新发布Hailuo 2.3视频模型Fast版本为B端工业级应用降本50%,解决AI视频"叫好不叫座"的商业软肋 [13] - Speech 2.6语音模型以250ms首包延迟的极致性能解决语音交互卡顿感,凭借自动文本规整、高鲁棒性复刻等特性赢得LiveKit、Pipecat、Vapi等海内外顶级客户订单 [13] 发展路径与行业趋势 - 公司展示"飞轮生态"式发展路径,在文本、视频、语音等各条战线深耕技术,并将模型能力注入自研应用,用商业闭环反哺模型迭代 [14] - 多模态融合成为大模型发展全球趋势,公司通过三线并进的体系化作战能力,展示在AI竞赛中场战事中的务实路径 [13][14]
这个秋冬,吃饱了,才有热量改变世界!|「锦秋小饭桌」Vol.36-38上新
锦秋集· 2025-10-29 16:50
活动概览 - 锦秋小饭桌是为创业者打造的常态化闭门社交活动,每周五晚在北京、深圳、上海、杭州等地举办[4] - 活动形式为非正式会谈,聚集优秀创业者、技术大牛和产品创新者进行实打实的干货分享和真诚交流[5] - 2025年已举办35场活动,过去一个月举办了4场围绕AI Agent、具身智能、机器人硬件等主题的讨论[1] AI Agent领域讨论 - 深圳举办的AI Agent Builder之夜聚集了30多位投资人、创业者和大厂技术专家[7] - 探讨AI作为合作者时AI Agent产品价值的重新定义,参与者包括刚获融资的创业者和活跃用户过千万的产品负责人[8] 具身智能技术发展 - 具身智能技术中VLA和世界模型被视为关键突破方向,能融合多模态数据增强系统泛化能力[13] - 触觉传感器是机器人感知关键,工业场景中非接触式保护对精度与安全至关重要但抗干扰性仍是挑战[13] - 具身智能在机器人任务中成功率有限,工业场景注重稳定而生活场景更依赖灵活[16][17] 机器人商业化应用 - 工业场景技术落地难点在于理解产线需求和应对不确定性,非算法先进性[18] - 企业需通过深入沟通与真实案例帮助客户理解技术价值,避免Demo认知偏差影响决策[14] - 半导体行业在具身智能浪潮中迎来新增长点,客户资金充裕但非标场景仍不适合大规模应用[15] 硬件创业策略 - 硬件创业需平衡性能、成本、稳定性的不可能三角,面向场景做恰到好处的取舍[33] - 建议采用数据驱动迭代,让用户先使用并基于真实数据优化,比闭门造车更有效[34] - 供应链需本土化,采用国产MCU/驱动/AI模组建立备份方案防范地缘风险[36] 产品定义与用户需求 - 产品胜负关键不在于技术最强而在于谁先创造净价值,用户需要最合适而非最先进的产品[28] - 情感型产品可围绕人类被倾听、被理解的社交需求展开,结合游戏化机制提升留存[28] - 专业用户需要可控的工业级制作工具,普通用户需要低门槛一键处理工具,产品定位需明确[43] 多模态内容创作 - 多模态工具竞争点不在模型能力,而在于解决运动、关系、真实性问题[43] - 影视内容生产正走向资产复用,常用镜头、机位模板等资产可被调用和交易决定规模化效率[43] - VEO3目前综合素质最高,但动作细节训练数据稀缺且非人形骨骼绑定仍是能力差异点[43] 硬件出海策略 - 众筹是消费电子出海高杠杆入口,需在三个月内聚合投放、内容、社群集中放大品牌势能[40] - 要通过KOL与核心爱好者深度共创内容,让真实使用场景反哺营销形成内容飞轮[40] - 众筹后应通过全球社群活动将初期热度转化为长期品牌资产,实现持续销售[41] 量产管理方法 - 量产需从需求出发明确核心痛点与可量化收益,用最小可卖版本验证场景与付费意愿[38] - 建议阶梯式投资,越临近尾声决策代价越大,每个阶段保留否决权避免大钱补错误[39] - 需前置暴露致命风险,将合规、关键器件等提前验证并设立严格放行条件[39]
剪映前AI产品负责人创业多模态Agent,做懂上下文的007乙方,成立半月融资数百万美元
搜狐财经· 2025-10-29 14:27
公司概况与融资 - 公司名称为极致上下文(Apex Context),由前生数科技产品副总裁廖谦于2024年8月底创立 [1] - 公司成立仅半个月即获得硅谷美元基金HT Investment与BV百度风投数百万美元投资 [1] 创始人背景 - 创始人廖谦拥有计算机视觉技术背景,职业经历覆盖算法、产品、商业化完整路径 [3][11] - 曾任职于腾讯天美工作室、腾讯云、字节跳动火山引擎及剪映、生数科技等公司,具备大厂与0到1创业经验 [3][11][13] - 在字节跳动期间孵化海外AI内容生产与分发平台Pippit,月活已超百万 [13] 产品战略与定位 - 首要目标是打造面向营销场景的多模态AI Agent,提供从创意策划、脚本生成到视频成片的端到端自动化服务 [3][5][6] - 选择营销场景因其需求明确、效果可量化、付费意愿强,最能体现AI真实价值 [3] - 商业模式采用“预期思维”或“结果导向”,为用户提供明确价格与质量标准 [5] - 中长期规划是构建AI时代的信息表达系统,让任何人能实现个性化自我表达 [6] 技术理念与行业判断 - 公司命名源于对AI下一阶段发展的理解:AI应能深度理解并呼应用户上下文,使生成内容更精准 [1] - 判断下一阶段核心竞争力在于帮助人、品牌及组织更好地表达自己 [6] - 当前技术周期进入拐点,语义理解、镜头语言、画面真实度全面提升,技术已达“可用”临界点 [8][9] - 在模型层面,“一致性”是绝对可预见的重点提升方向 [18] 竞争格局与市场机会 - 认为当前时代没有传统意义上的护城河,巨头互殴为创业公司创造了进攻窗口期 [14][15] - Sora 2等模型的发布迫使抖音、TikTok等巨头防守核心业务,从而减缓其他方向创新 [14][15] - 公司优势在于对用户和场景的理解以及团队的热爱 [16]
前字节剪映AI产品负责人创业,获硅谷基金及BV百度风投投资,要做营销多模态Agent
36氪· 2025-10-29 13:08
公司核心业务与产品定位 - 公司“极致上下文”致力于打造一个新时代的“AI表达系统”,其首款产品是一个营销Agent,而非视频生成工具 [6][7][53] - 产品定位为端到端的解决方案,前端通过多模态交互理解企业品牌调性和需求,后端整合各种AI模型能力,直接交付成品视频 [6][26] - 目标是将传统营销视频制作成本降低十倍,交付速度提升百倍,使交付质量达到行业标准 [6][29][30] - 公司选择从“生产力信息”场景切入,优先服务营销人员、品牌方等有明确工作产出目标的用户,因其ROI可量化 [28][29] - 产品开发初期将首先面向海外市场推出,后续计划拓展至教育、办公等更多垂直领域 [7][57] 创始人背景与创业契机 - 创始人廖谦拥有丰富的AIGC产品经验,曾在腾讯云打造DAU千万的换脸产品,在字节跳动从0到1推出火山引擎Top1流量产品“智能创作云”,并主导剪映出海项目Pippit达到月活百万 [1][2][10][13] - 2024年初加入多模态初创公司生数科技,带领Vidu团队实现从0到1的冷启动,达到数千万全球用户和数千万美金收入 [2][15] - 创业想法源于在生数科技期间处理上千单企业级AIGC定制需求时发现的明确痛点:企业用户不需要复杂AI工具,而是需要能直接交付成片的解决方案 [5][16][18] - 公司于2024年8月成立,并在半个月内迅速敲定了由HT investment和BV百度风投投资的数百万美金首轮融资 [2] 行业趋势与技术拐点判断 - 多模态领域的ChatGPT时刻即将来临,底层模型技术处在迅猛变化中,但落地鸿沟依然存在 [2][6] - 2024年被认为是技术拐点,关键因素包括多模态模型效果与成本达到可商业化水平,生成视频成本相比传统制作可降低到十分之一 [19][20] - 模型推理能力的突破(如ChatGPT o1发布)使得大模型落地千行百业成为一个优化程度问题,而非行与不行的问题 [20] - 多模态模型的一致性得到显著提升,为商业化应用扫除了主要瓶颈 [20][21] - 中国在AI视频领域具有独特优势,短视频生态领先全球1-2年,对视频生态的落地探索和理解更深 [7][52] 竞争格局与战略选择 - 公司战略定位为“造船的人”,即应用层开发者,其能力会随着底层模型能力的上升而增强,Sora等基础模型的进步对公司是利好 [4][35][36][37] - 明确选择不做通用Agent,而是聚焦垂直场景,认为移动互联网早期的发展规律(垂直应用胜出)同样适用于AI Agent领域 [7][27][57] - 面对Sora等强大基础模型的发布,公司的策略是建立快速反应机制,产品需每周迭代一次,以应对基础模型每两三个月一次的快速迭代 [64] - 在创业心态上强调要更冒险、更激进,去做尚未被验证过的可能性,而非追求确定性 [5][65][68] 产品交互与交付模式 - 产品交互设计为多模态,不仅限于文字输入,会通过生成参考图等方式更精准地理解用户偏好 [32] - 交付模式是保证交付一个达到行业特定质量标准的、内容本身合格的交付物,但不保证其发布后带来的市场“效果”[59][60] - 对于中小客户,其业务流程可以接受AI完全接管;但对于大客户,仍需要真人参与对接 [33] - 未来信息表达将进入“生成时代”,AI能主动理解、抓取、聚合信息,并为用户动态生成全新的、个性化的内容(如图文报告、播客)[56][62]
剪映前AI产品负责人创业多模态Agent,做懂上下文的007乙方,成立半月融资数百万美元
量子位· 2025-10-29 10:39
公司概况与融资 - 创始人廖谦于2024年8月底成立新公司“极致上下文”,公司成立仅半个月即获得硅谷美元基金HT Investment与BV百度风投的数百万美元投资 [1][2][4][10] - 公司名称源于对AI发展的理解,即AI应能深度理解并呼应用户上下文,目标是构建“更多的Context,更少的Control”的公司文化 [5][6] 创始人背景 - 创始人廖谦拥有计算机视觉技术背景,职业经历涵盖算法、产品、商业化完整路径,以及国内与海外市场、大厂与0到1创业经验 [8][9][27] - 曾任职于腾讯天美游戏工作室、腾讯云、字节跳动火山引擎,并作为发起人孵化剪映海项目Pippit(月活超百万),后加入生数科技担任产品副总裁,主导Vidu产品并带领超百人团队 [28][29][30][31][32][33] 产品战略与目标 - 公司首要目标是打造面向营销场景的多模态Agent,提供从创意、脚本到视频生成、编辑的端到端能力,因营销场景需求明确、效果可量化、付费意愿强 [3][11][12][13][18] - 中长期规划是构建AI时代的信息表达系统,让任何人(品牌或个体)实现个性化自我表达,未来能力可拓展至教育、生活方式、娱乐等领域 [19][20][21][22] 商业模式与用户定位 - 采用“预期思维”或“结果导向”的Agent模式,用户无需学习技能,Agent像专业Agency一样理解用户诉求,全流程自动完成内容生成 [14][15] - 目标用户是“大概知道自己要什么,但不需要懂怎么做的人”,产品核心价值在于持续降低用户的使用成本、理解成本与价格成本 [16] 行业机遇与技术判断 - 当前技术周期进入拐点,语义理解、镜头语言、画面真实度全面提升,Google Veo3和Sora 2等技术已达“可用”临界点,重点是将能力转化为真实产品价值 [23][24][25] - 巨头互殴(如Sora 2侵蚀抖音、TikTok核心业务)为初创公司提供进攻窗口期,可定义新内容形态、协作方式及信息分发逻辑 [36][37][38][39] - AI视频领域,“一致性”是绝对可预见的提升方向,包括画面角色一致性、音色一致性及画面美学(构图、光影等)待解决 [44]
豆包凶猛,深度解析字节AI战略
36氪· 2025-10-28 20:27
公司AI战略与市场地位 - 字节跳动在AI战略上采取“一盘棋”式协同打法,这在当前国内大型互联网公司中较为少见 [1][7] - 公司AI体系被视为“几乎没有短板”的选手,具备自研大模型底层能力、抖音超级流量入口及快速孵化App的产品体系 [1] - 豆包大模型与DeepSeek、阿里Qwen同处国内第一阵营,但在视频、图像、语音多模态产品化与矩阵完整度上具有优势 [4][5][6] 豆包App用户与产品策略 - 截至2025年8月,豆包App月活用户超过1.57亿,成为国内移动端用户量最大的AI聊天助手,其主要竞争对手DeepSeek月活约为1.43亿 [2] - DeepSeek流失用户中有近四成转向豆包App [2] - 豆包App产品风格主打“亲近”、“易用”,支持语音、视频、方言聊天,区别于西方AI聊天助手的强工具属性 [2] - 2025年9月,字节老将赵祺接手豆包产品,工作重心或将转向加速用户规模与商业变现 [3] 豆包大模型技术进展与表现 - 豆包大模型在2025年6月发布1.6版,作为国内首个原生多模态模型,在长上下文和性价比上表现突出,实现市场处境逆转 [4][5] - 截至2025年9月底,豆包大模型日均tokens调用量已突破30万亿,相比2025年5月底增长超过80% [5] - 在开发者评测中,豆包大模型在中文理解、多模态理解、视频生成中表现优异,但在代码生成、复杂API调用等任务上弱于部分竞品 [5] - 2025年初,Seed部门核心领导层变动,前Google DeepMind副总裁吴永辉博士加入,担任模型基础研究负责人 [6] 商业化与生态协同路径 - 豆包App未来可能的变现路径包括:围绕特定场景推出按次计费服务、针对企业或高频需求设置超额使用收费、在抖音生态中嵌入功能通过广告分成或佣金获取收益 [3] - 豆包大模型通过“一盘棋”打法实现品牌、产品互动、引流和商业化的协同,例如豆包App的消费端体验直接推动了企业级市场对豆包大模型的选择 [8][10] - 抖音(含极速版)月活于2025年3月达10.01亿,成为AI原生应用引流的万能入口,并在产品层与豆包形成双向互动闭环 [10] - 豆包大模型已应用于抖音、飞书、番茄小说等字节内部超过50个业务场景,火山引擎上的产品均先在内部跑通验证后再对外服务 [10][11] - 在电商大促期间,飞书多维表格集成文案、图片和视频生成工具,能批量帮助商家生成内容并一键发布至抖音,形成内部闭环 [11]
量子位「MEET2026智能未来大会」已启动!年度AI榜单 & 趋势报告正在征集中
量子位· 2025-10-28 16:04
大会核心主题与背景 - 当前正迈入人工智能重塑一切的新时代,智能技术已从工具发展为能深度理解人类需求的智能伙伴 [1][2] - 智能技术跨越产业、学科和场景边界,数字世界与物理世界的界限正逐步模糊并融合,催生出全新生态和机遇 [3][4] - 人工智能正成为基础设施的一部分,企业、技术与社会之间的连接与共生是推动发展的核心动力 [5][7] - 大会以“共生无界,智启未来”为主题,探讨AI作为驱动社会演进的核心动能,其本质是连接、共生、重塑和跃迁 [7][14] MEET2026智能未来大会概况 - 今年是MEET智能未来大会的第七年,是年度影响力科技商业峰会 [9] - 过往大会曾吸引李开复、张亚勤等产业领袖,倪光南、谭建荣等多位院士,以及百度、阿里、腾讯、华为、京东等科技行业领军者参与 [9] - 大会每年吸引上千名科技从业者现场参与,百万观众线上围观,并获得近百家合作媒体联合曝光,已成为智能科技行业的年度风向标 [12] - 本届大会将聚焦智能科技产业,邀请技术、产业、投资领域代表,探讨人工智能+、AI Infra、智能终端、智能驾驶、低空经济、能源电力等前沿话题 [13] - 大会地点设在中国北京,参会报名通道即将开启 [28] 2025人工智能年度榜单 - 量子位发起的“人工智能年度榜单”是AI行业最具影响力榜单之一,旨在发现引领变革的探索者 [16] - 榜单从公司、产品、人物三大维度评选五类奖项,包括年度领航企业、潜力创业公司、杰出产品、杰出解决方案和焦点人物 [17][18][19] - 评选报名从即日起至2025年11月17日截止 [20] 2025年度AI十大趋势报告 - 依照惯例,量子位智库将在MEET2026大会上发布《2025年度AI十大趋势报告》 [23] - 报告将结合技术成熟度、落地现状和潜在价值,提名释放巨大潜力的十大AI趋势,并进行深入分析,提名代表机构和最佳案例 [24]
晚报 | 10月27日主题前瞻
选股宝· 2025-10-26 22:49
算力 - 全球首款类脑智算体"智者一号"发布,将超算能力浓缩至迷你冰箱大小的设备中,实现超算能力高度集成化[1] - 类脑智算通过适配原创性的直觉神经网络类脑算法,为传统超算中心与智能算力集群的能效提升提供全新路径[1] - 类脑芯片与存算一体架构将突破传统冯·诺依曼瓶颈,实现算力密度与能效的指数级提升[1] 仓储物流 - 中国物流与采购联合会发起倡议,要求仓储经营者遵循《价格法》,以成本与市场供求为定价依据,自觉维护市场价格稳定,抵制低质低价恶性竞争[2] - 仓储经营者须以数字化转型为核心战略方向,通过技术升级、流程优化提升运营效率与核心竞争力[2] - 行业正从传统"货品保管"向"智能供应链枢纽"转型,预计到2030年市场规模将达3.5万亿元[3] 空气电池 - 工信部装备工业发展中心提出建议,系统布局金属空气电池等新一代电池研发工作,加速新技术产业化进程[3] - 金属空气电池是利用锌、镁、铝等常见金属与氧气、海水制成的新型电池,是一种半储能半燃料的电池[4] - 相比锂离子电池,金属空气电池在能量密度、充电时长、续航里程、环保、安全等方面有诸多优势[4] 光刻胶 - 北京大学团队通过冷冻电子断层扫描技术,首次原位解析光刻胶分子在液相环境中的微观三维结构,指导开发出可显著减少光刻缺陷的产业化方案[4] - 研究成果解决了长期困扰先进芯片制造的光刻缺陷问题,提高了芯片良率[4] - 为在原子/分子尺度上原位研究液体环境中的化学反应提供了通用工具,有助于推动光刻、蚀刻、清洗等多个制造环节的缺陷控制[4] 大飞机 - 文莱民航局发布新条例,文莱航空公司获准运营中国制造的客机,为中国喷气式客机进入文莱市场奠定法律基础[5] - 中国商飞预测,到2042年全球客机总规模将达到48455架(约为2022年的2.2倍),中国客机将达到9969架,成为全球最大单一航空市场[5] - 预计未来20年(2023-2042年)中国将接收超9000架新机,对应价值1.4万亿美元,C919批产交付有望打破空客、波音的垄断格局[5] 无人驾驶 - 英伟达宣布与优步就自动驾驶汽车开发展开合作,优步股价当日上涨3.5%[6] - 合作重点在于利用优步收集的大量真实驾驶数据来训练英伟达的Cosmos World基础模型[6] - 英伟达将借助其DGX Cloud基础设施加快开发进程,相关英伟达智能驾驶产业链公司有望受益[6] 多模态 - 蚂蚁集团即将发布全新AGI多模态应用"灵光",已上线应用商店并开启邀约内测,最大特点为"AGI相机"功能[6] - "灵光"上线意味着蚂蚁在AGI多模态赛道正式布局,依托十亿级实名账户与万亿支付数据,具备天然场景与合规壁垒[7] - 乐观测算"灵光"三年内可为蚂蚁带来百亿元增量收入,估值重估空间或超1500亿元[7] 宏观与行业 - 中美双方在吉隆坡举行经贸磋商,就多项重要经贸议题形成初步共识,下一步将履行各自国内批准程序[8] - 截至9月底,全国累计发电装机容量37.2亿千瓦,同比增长17.5%[8] - 中国人民银行开展9000亿元MLF操作,期限为1年期[8] - 截至10月17日,股票私募仓位指数升至79.68%,较前一周上涨0.55个百分点,创年内新高[9] - 沐曦股份科创板IPO获上市委会议审议通过[10] 市场主题复盘 - DRAM板块受三星、海力士四季度涨价30%及美股存储芯片龙头集体大涨影响,相关公司包括大为股份、普冉股份等[14] - 航天板块受四中全会公报提出建设航天强国影响,相关公司包括航天科技、中国卫星等[14] - 国产芯片板块受四中全会公报提出加快高水平科技自立自强影响,相关公司包括大豪科技、汇顶科技等[15] - 机器人板块受十五五规划提出推动脑机接口、具身智能等成为新经济增长点影响,相关公司包括新泉股份、春秋电子等[15] - 大消费板块受四中全会公报发布要大力提振消费影响,相关公司包括祖名股份、联翔股份等[15] - 量子计算板块受谷歌量子芯片实现新突破影响,相关公司包括格尔软件、达华智能[16]
多模态技术、产品、商业化均边际向上,看好多模态投资机会
东方证券· 2025-10-19 10:25
行业投资评级 - 传媒行业投资评级为“看好”(维持)[5] 报告核心观点 - 多模态行业在技术、产品、商业化层面均呈现边际向上趋势,投资机会显著[2] - 行业技术迭代势头迅猛,底模能力上下限同步提升,推动产品与商业化落地加速[2] - 产品路径出现分化,例如谷歌Veo系列和快手可灵系列更专注专业内容创作者,而Sora更偏重C端用户,不同路线均加速商业应用[2] - B端应用向高难度内容领域(如电影)渗透,C端产品商业模式逐步落地,共同驱动行业规模扩容提速[2] 技术层面总结 - 10月海外厂商模型相继迭代,行业技术下限与上限同步提升[7] - OpenAI的Sora2相较前代进步显著,物理运动规律和画面真实感大幅提升,分镜能力和叙事性达到SOTA,支持多语种内容生成,Pro用户可生成25秒视频(对比其他模型5~10秒)[7] - Google Veo3.1为小版本迭代,音频生成效果、画面质感提升,并具备一定分镜能力[7] - 国内厂商中,快手可灵2.5turbo版本在文生视频和提示词响应上突破,海螺02版本、ViduQ2模型、万相2.5等在物理规律、视觉美学、一致性方面提升下限能力[7] 产品层面总结 - 边际变化在于OpenAI对C端的触达加速用户拓圈,视频模型产品路径出现分化[7] - OpenAI上线Sora APP(AI原生短视频内容社区),10日内用户突破300万,自10月4日起霸榜美国地区iOS总榜第一[7] - 产品路径分化为两类:一是以OpenAI为代表,侧重C端用户简单Prompt生成完整成片,满足创意轻量化产出和社交传播;二是以Veo系列和可灵系列为代表,围绕专业内容创作者需求,注重稳定性、可控性、一致性[7] 商业化与应用前景总结 - B端内容制作向电影等高难度领域加速渗透,例如全球首部AIGC空战电影《带我去飞》(全片39分钟)上线后取得腾讯视频战争电影榜Top1[7] - AI视频技术商业化运营提速,看好其在视频广告素材、短剧、动漫、电影电视剧等内容制作领域的提效作用[7] - Sora的应用落地有望加速C端商业变现路径,包括广告、IP分成等模式,进一步抬升多模态行业的规模天花板[7] 投资建议与标的 - 建议重视垂类多模态AI应用机会,看好技术突破与成本优化带动用户增长、付费渗透和商业化发展[3] - 尤其关注有多模态AI应用出海布局的公司,其起量速率可能更快[3] - 相关标的包括:快手-W(买入)、美图公司(买入)、万兴科技(未评级)[3] - 年底至明年建议重视Meta逻辑的演绎(基于模型能力带来的CTR提升使收入提升),收入提升同时带来估值重塑,建议跟进大厂实际落地测试情况[3] - 建议关注:阿里巴巴-W(买入)、腾讯控股(买入)、快手-W(买入)[3]