多模态模型
搜索文档
中信证券4月投资策略:算力涨价扩散,关注一季报超预期三条线索
搜狐财经· 2026-04-05 09:08
文章核心观点 - 3月科技板块显示算力整体仍处紧缺状态且涨价扩散至云服务、CPU等环节,但板块估值受宏观扰动与地缘冲击影响 [1] - 展望4月,市场因进入业绩期往往风险偏好收缩,且地缘扰动持续时长难判,建议聚焦2026年一季报业绩向好、估值合理的稳健品种 [1] - 配置上建议关注三个方向:国产半导体设备、持续景气的光模块等环节、国产算力紧缺相关公司,并提示5-6月多模态模型迭代机会 [1] 行业现状与景气度分析 - 3月科技板块算力整体处于紧缺状态,涨价现象不断扩散至云服务、CPU等环节 [1] - 中信三级行业中,AI算力基建相关板块整体处于高景气状态 [1] - 盈利同比增长超过50%较多的板块包括:网络接配及塔设、PCB、线缆、半导体设备、集成电路 [1] - 摩托车板块、游戏和显示零组也处于较高的景气度状态 [1] 投资配置建议 - 建议关注受益于两存持续扩产的国产半导体设备 [1] - 建议关注持续景气的光模块、光纤光缆、PCB及上游、存储,以及存在补涨逻辑的被动元件环节 [1] - 首推业绩确定性高、估值水平相对合理的光模块龙头 [1] - 建议关注国产算力持续紧缺背景下的字节链与昇腾链公司、受益于超节点爆发的交换芯片、服务器代工等环节 [1] - 提示5-6月份多模态模型迭代会带来的机会 [1]
中信证券:算力涨价扩散,关注一季报超预期三条线索
新浪财经· 2026-04-03 08:38
3月科技板块表现与市场环境 - 3月科技板块显示算力整体仍处于紧缺状态且涨价不断扩散至云服务、CPU等环节 [1][2] - 受宏观扰动与地缘冲击影响,科技板块估值受到较大冲击 [1][2] - 历史来看4月进入业绩期后市场往往处于风险偏好收缩期 [1][2] 2025年业绩预告与行业景气度 - 梳理已披露2025年业绩预告的A股科技板块公司发现,中信三级行业中AI算力基建相关板块整体处于高景气状态 [1][2] - 盈利同比增长超过50%较多的板块包括网络接配及塔设、PCB、线缆、半导体设备、集成电路 [1][2] - 摩托车板块、游戏和显示零组也处于较高的景气度状态 [1][2] 4月投资配置建议 - 建议聚焦2026年一季报业绩向好、估值合理的稳健品种 [1][2] - 配置上建议关注三个方向:受益于两存持续扩产的国产半导体设备 [1][2] - 配置上建议关注三个方向:持续景气的光模块、光纤光缆、PCB及上游、存储,存在补涨逻辑的被动元件环节,首推业绩确定性高、估值水平相对合理的光模块龙头 [1][2] - 配置上建议关注三个方向:国产算力仍持续紧缺,关注字节链与昇腾链公司、受益于超节点爆发的交换芯片、服务器代工等环节 [1][2] 未来潜在机会提示 - 提示5—6月份多模态模型迭代会带来的机会 [1][2]
老板电器发布全球首款AI烹饪眼镜 智能体开始走进厨房日常
第一财经· 2026-03-19 17:16
文章核心观点 - AI正从虚拟工具转向介入具体生活场景,其应用形态成为比技术本身更重要的问题 [1][2][3][4] - 老板电器在AWE 2026上推出的全球首款AI烹饪眼镜,为“AI如何进入生活”提供了一种具体答案,即让AI成为持续感知、理解并参与具体活动进程的智能体 [4][9][23] AI硬件的形态演进与智能眼镜的兴起 - AI能力形态经历了从设备附属功能、到移动端软件、再到持续存在的智能体的演变 [7][8][9] - 可穿戴设备,尤其是智能眼镜,被视为AI智能体的重要载体,因其与视觉系统重合、提供第一视角信息且具备日常佩戴属性 [10][11] - 2025年上半年全球智能眼镜出货量同比增长约110%,其中AI智能眼镜已占市场出货量的78%,成为增长最快的可穿戴设备之一 [12] - Meta、Xiaomi、TCL RayNeo等企业纷纷进入该赛道,AI智能眼镜正从概念产品走向消费级设备,并有望成为下一代个人计算终端 [12][13] 厨房作为AI落地的关键场景 - 厨房是一个复杂程度极高的动态空间,烹饪关键判断依赖经验,且现场状态因高温、油烟、多设备运转而持续变化 [15][18] - 中国家庭厨房正经历设备升级周期,从单一设备走向成套系统,厨房逐渐成为智能家居体系中技术含量最高的空间之一 [19] - 厨房设备角色在变化,从完成烹饪的工具转变为能够参与烹饪过程的全链路解决方案 [21] - 超过60%的用户认为家庭烹饪难度主要来自经验不足 [33] - 公司认为AI在厨房中的角色不是取代人,而是作为观察和提醒的助手,帮助人成就人,使厨房成为技术与生活交织的场景 [22][23][35] AI烹饪眼镜的技术闭环 - 公司构建了包含感知、决策与执行三个环节的完整AI烹饪技术闭环 [25] - **感知层**:AI眼镜通过第一视角摄像头实时识别食材类型与烹饪状态 [26] - **决策层**:系统调用公司自研的行业首个烹饪大模型“食神”,该模型专为烹饪场景训练,能理解菜谱、处理方式,并可结合用户身体状况与饮食偏好动态调整菜谱,提供个性化膳食建议 [27] - **执行层**:通过AI数字厨电系统,将AI判断后的控制指令传递给厨房设备,协同完成后续烹饪操作 [27] - 该闭环使厨房设备从彼此独立工具转变为协同运作的整体,让AI真正参与烹饪过程 [28][29][30] AI进入家庭厨房的用户体验与产业意义 - AI眼镜通过第一视角实时识别锅中状态,可在食材颜色变化、火候临界点等关键时刻提供提示,解决用户经验不足的问题 [33][34] - 用户体验更接近于一个站在旁边的AI烹饪伙伴,人仍掌握烹饪节奏,AI提供判断与提示 [34] - 公司选择将AI技术嵌入厨房这一具体生活场景,而非追逐通用大模型叙事,通过烹饪大模型、AI眼镜与AI数字厨电的联动,让技术真正参与一顿饭的诞生 [36][37] - 技术变革以感知日常细节(如食材变色、火候临界点)的形式被消费者感知,技术成为生活体验的一部分 [39] - AI进入厨房等日常空间,不仅打开新的产品形态,更开启了一种技术真正参与生活方式形成的新产业想象 [39]
腾讯纯文本LLM训视觉encoder,拿捏图表长视频,达到开源小模型SOTA!
量子位· 2026-03-19 09:02
文章核心观点 - 腾讯开源的多模态大模型Penguin-VL,其核心创新在于打破了主流“视觉编码器+语言模型”的拼接范式,提出了一种从纯文本大语言模型初始化视觉编码器的新路径[1][2] - 该方法旨在解决传统基于对比学习的视觉编码器在处理文档、图表、长视频等需要保留局部结构、空间关系和时序细节的复杂任务时的潜在不足[8][9][10] - 在2B和8B的紧凑参数规模下,该模型在多项复杂视觉理解任务上展现出强大竞争力,证明了此技术路线的有效性,并可能引领多模态模型向更原生、统一的方向发展[3][36][45][49] 技术路径创新 - **主流范式批判**:当前多数视觉语言模型采用固定模式,即使用CLIP、SigLIP等通过对比学习预训练的视觉模型作为编码器,再接上大语言模型进行训练[5][6] - **新路径提出**:Penguin-VL团队质疑上述范式是否为复杂视觉理解的最合适起点,并创新性地提出直接从纯文本大语言模型初始化视觉编码器[8][15] - **核心优势**:从大语言模型出发的视觉编码器,与下游语言模型的表示空间更近,复用了其成熟的序列建模、因果逻辑等能力,为视觉理解提供了更强起点[18][19] 模型架构与训练 - **关键改造**:对初始化的纯文本大语言模型进行两处关键改造,将因果注意力改为双向注意力,并引入2D-RoPE以更好地处理图像和视频的二维位置信息[21][22] - **三阶训练**: - Stage 1:训练Penguin-Encoder本身,采用从低分辨率预训练到高分辨率微调的路线,并引入重建损失和关系损失以保留结构化视觉信息[28][29] - Stage 2:进行视觉语言模型预训练,让编码器、投影层和语言模型共同学习多模态知识[30] - Stage 3:进行监督微调,将模型能力对齐到具体用户任务[31] - **视频处理**:引入时序冗余感知令牌压缩策略,优先将计算预算分配给关键帧,以高效保留重要的时序信息[32][33][34] 性能表现 - **整体竞争力**:在2B和8B的紧凑参数规模下,Penguin-VL在文档理解、图表理解、视觉知识和长视频理解等复杂任务上均表现出极强竞争力[3][36] - **2B模型表现**:在InfoVQA、ChartQA、DocVQA、V-star、LongVideoBench、NextQA、Perception Test等任务上表现亮眼[37] - **8B模型表现**:在更完整的配置下延续优势,在InfoVQA、ChartQA、DocVQA、AI2D、RealWorldQA、V-star、LongVideoBench、NextQA、CharadesSTA、Perception Test等任务上保持强劲表现[39][40][41] - **基准测试数据**:以8B模型为例,在InfoVQA上得分86.8,ChartQA上得分90.5,DocVQA上得分96.2,LongVideoBench上得分67.0,均优于或接近部分同规模竞品[43] - **编码器有效性验证**:消融实验表明,使用大语言模型初始化的Penguin-Encoder平均分达34.6,优于随机初始化的31.3分;在模型集成比较中,Penguin-Encoder以约2.4亿Stage 1训练样本,取得了49.3的平均分,超过了依赖更大规模对比学习预训练的视觉编码方案[44] 行业意义与趋势 - **范式探索**:该研究证明,未来的视觉编码器不一定必须源自传统视觉模型,也可以从更通用的语言模型出发,为多模态模型设计提供了新思路[45][47] - **行业趋势**:这与DeepSeek-OCR2等工作呈现的趋势相通,表明行业正逐步跳出传统的多模态拼接路线,开始探索更原生、统一的建模方式[48][49] - **开源与可及性**:腾讯已开放该项目的相关代码、模型权重,并提供交互式体验,降低了行业研究和应用的门槛[50][51]
当所有机器人都在卷四肢和大脑,他十年只做一件事:脸|「锦供参考」Vol.04
锦秋集· 2026-03-03 20:43
公司核心战略与差异化定位 - 公司选择了一条与主流具身智能公司(如波士顿动力、Figure、特斯拉Optimus)专注于“四肢”或“大脑”完全不同的非共识路线,专注于研发机器人的“脸” [1][2][3][6] - 核心观点认为,人与机器人之间建立信任与情感连接的最关键接口是“脸”,而非语言或行动,因为人类大脑对脸部高度敏感,能快速识别情绪并产生情感投射 [5] - 该选择基于创始人十年的持续经历,并非营销噱头,旨在通过“脸”这一最古老的交互界面,建立人机信任与情感连接 [6][7][37] 技术路径与研发逻辑 - 技术研发避开需要复杂物理交互(如抓取、碰撞)的领域,专注于通过拉动面部肌肉表达感情,从而规避了硬件磨损、触觉传感器可靠性等难题 [12] - 选择“人脸”作为切口,是因为其环境变量单纯,便于集中精力研究能让模型实现“自我迭代”的算法路径 [11][13] - 对当前主流机器人算法路径(如VLA、VRM、World Model)持怀疑态度,认为机器人应学习“学习的能力”,实现任务的快速迁移,而非对单一任务的完全收敛 [16] - 公司相关论文登上《Science》封面,展示了通过声音生成自然嘴部动作的机器人,开创了以“人的界面”为主、融合多模态信息的新人机交互方向 [28] 市场前景与商业化落地 - 终极愿景是面向消费者(To C)市场,创造能提供情感陪伴与疗愈、让用户产生感情依赖的新品类机器人 [32][33] - 短期(2-3年内)更可行的落地场景是替代销售、前台、服务人员等“情绪消耗型”岗位的重复劳动力 [35][36] - 已与国内最大的沉浸式乐园合资成立公司,探索在乐园中部署机器人作为NPC,提供沉浸式交互体验,这是当前较好落地的场景 [43] - 相较于毛绒AI玩具等产品,“人脸机器人”的核心优势在于其极高的情绪表现力和零学习成本,人类能天然理解面部表情的含义 [45] 产品定义与设计哲学 - 产品的“脸”是否好看、符合审美至关重要,这直接关系到第一眼的亲和力与情感投射强度 [38] - 产品设计需兼顾三层需求:首先是像人以获得最大情感投射;其次是符合大众审美以获取市场空间;最难的是满足小众圈子的个性化需求 [38] - 公司已推出灵动的桌面级陪伴产品,短期内已可实现陪伴功能 [36] - 未来可能衍生出机器人“后事处理”等新的产业生态,以应对用户与机器人建立情感后产生的换代或处置需求 [40][41] 创始人背景与公司文化 - 创始人展现出极强的韧性,体现在其克服高考失利、为出国考9次托福等个人经历,以及创业中坚持“十年只做一件事”的笃定 [8][9][82] - 公司管理倡导“Context not Control”理念,强调透明、公平与提供上下文,而非控制,并避免酒桌文化等不必要的社交压力 [49][53][54] - 在招聘上,创始人特别看重拥有丰富且充满挫折经历(如参加Robomaster等艰苦比赛)、具备极强动手和问题解决能力的“韧性”人才 [86][87] - 公司认为,在早期吸引人才,利益(金钱、资源、成功率)是重要底线;随着公司发展,清晰的愿景(Vision)才成为留住顶尖人才的关键 [62][64][65] 行业洞察与竞争格局 - 当前行业众多公司聚焦于机器人的“四肢”或“大脑”,致力于在工厂等场景创造生产价值,而该公司选择强化人机之间的情绪连接与信任感 [1][16][80] - 行业面临数据获取成本高的挑战,例如Figure完成一个抓取任务需要1000小时的人类数据,这对于普通小团队而言非常昂贵 [18] - 随着社会自动化程度提高,尤其是在老龄化不可逆的背景下,人们对精神层面和情感陪伴的需求会越来越高,而让机器人获得人类信任是突破的关键 [19][80] - 创始人认为,机器人表演具有巨大潜力,不应局限于工具属性,可以融合动作与语言,参与舞蹈、小品等多种艺术形式,创造美学价值 [90]
对谈Fish Audio:千万ARR、12个月13倍增长,我们正进入AI Voice 2.0的技术爆发期
Founder Park· 2026-02-26 22:35
公司概况与市场地位 - Fish Audio是一家全球领先的AI语音生成平台,专注于多语言文本转语音和高精度声音克隆,其核心产品S1模型是世界首个支持通过自然语言描述控制情感的TTS模型[5][7] - 公司是全球第二大AI语音平台,仅次于ElevenLabs,拥有350万用户,月活用户超过100万,平台上拥有110万个由用户生成的公开声音模型,构成了全球最大的UGC声音模型市场[5][6][32] - 在过去12个月内,公司实现了13倍的增长,年度经常性收入达到1000万美元[5][6] 商业模式与客户构成 - 收入来源分为两大类:专业创作者直接使用平台进行内容创作,以及企业API用户,后者在过去三个月内收入占比已快速提升至40%[8][9] - 企业API客户主要包括四大类:AI陪伴类社交应用、游戏公司与B2B企业、AI内容创作平台以及实时语音智能体应用[9] - 公司采用产品驱动增长模式,结合开源社区运营和创作者平台的口碑传播,约60%的收入来自C端或专业创作者,这与其他AI基础设施公司显著不同[29][30][31] 技术战略与核心优势 - 技术路线上,公司采用端到端建模语义和声学信息的架构,与行业主流趋势一致,旨在实现更强的表现力和更低的延迟[10][11][23][24] - 公司的核心数据壁垒源于对“脏数据”的利用,如吵架、争论等包含重叠人声和丰富情感的音频,传统数据清洗会丢弃这些数据,而公司将其视为宝藏[2][19] - 公司构建了自研的数据管线,包括世界领先的情绪标注自动语音识别模型,并投入百万美元级别进行高质量、多语种、多任务类型的数据采集与标注[16][17][21] 产品矩阵与研发路线 - 公司采用模型矩阵策略匹配不同商业场景,而非追求单一模型,旗舰S1模型适用于娱乐和AI原生应用,即将推出的S2 Flash企业模型专注于低延迟客服场景,而S2 Pro则面向对声音质量和情感表达要求更高的内容生成场景[28] - 研发路线图明确:计划在未来半年内完成多模态感知模型的研发,在未来6-12个月内完成全双工模型的研发,并计划在今年年底推出端到端的“语音输入-语音输出”模型,目标是将延迟降至100毫秒以内[26][44] - 公司正从AI语音生成平台向多模态内容创作平台扩展,计划为创作者提供包括多轨编辑、唇形同步、视频化身等在内的端到端创作工具[39][44][46] 竞争格局与市场定位 - 公司认为独立的、专注于复杂情感控制的语音模型仍有持久生存空间,不易被多模态大模型直接吸收,因为互联网上缺乏高质量、带复杂标注的语音-文本配对数据[11] - 与主要竞争对手ElevenLabs的差异化在于:ElevenLabs主打传统企业配音和有聲書市场,而公司专注于为娱乐、游戏和AI原生应用提供更具情感和趣味性的声音,瞄准高增长潜力市场[29][43] - 公司计划采取“先占领AI原生应用市场,再切入传统世界500强企业市场”的竞争策略[43] 增长动力与护城河 - 公司拥有多个难以复制的闭环效应构成的护城河:1) 庞大的UGC声音模型生态;2) 基于实时人类反馈的强化学习管线,使用越多模型表现越好;3) 高效的模型架构带来成本优势;4) 开源社区带来的低获客成本和高信任度[37] - UGC生态通过激励机制(创作者可获得其模型所消耗付费代币的30%作为平台积分)和实时RLHF反馈循环得以强化,特定语种的使用量爆发能直接提升该语种模型的性能[33][34] - 开源策略是有效的分发和获客渠道,开源仓库累计获得超过10万GitHub星标,但商业化主要通过闭源模型实现,企业客户往往从使用开源模型开始,在起量后转向付费的闭源API[6][41][42] 行业趋势与未来展望 - 行业正进入“AI语音2.0”的技术爆发期,其特征是从广播式、正式的配音工具,转向更具交互性、情感化和智能体化的语音,延迟降低使得与AI的对话更像真人交互[48][49] - 全球有约4000万专业内容创作者正在逐步采用AI进行内容创作,这为AI语音市场带来了巨大的增长机遇[49] - 公司未来12-18个月的目标是实现更激进的增长,优化收入,目标ARR达到5000万至1亿美元,并扩展为多模态内容创作平台[44]
全线飘红!积极因素提振A股开市信心 机构看好这两大主线
广州日报· 2026-02-24 10:49
市场行情表现 - 2月24日A股马年首个交易日三大指数全线上涨 上证指数高开1.15%报4129.13点 深证成指高开1.52%报14313.86点 创业板指高开1.7%报3331.79点 [1] - 主要宽基指数普遍上涨 沪深300指数上涨1.44% 中证500指数上涨1.25% 中证1000指数上涨1.40% 万得全A指数上涨1.30% [2] - 市场情绪积极 万得全A指数成分股中上涨家数达4969家 下跌家数仅306家 成交额达305亿 [2] 驱动市场上涨的因素 - 春节假期海外市场行情积极 欧洲、东亚、南美多国股指先后创出历史新高 国际贵金属与原油价格携手走强 [2] - 全球流动性维持非常充裕的状态 资金不断流向各个预期有边际变化的经济体和股票市场 [2] - 节前A股跟随海外资产调整后已释放一定风险 节后A股即将进入一段高胜率窗口 [3] 机构对后市的观点 - 广发证券策略首席分析师刘晨明认为 随着一系列条件的满足和不确定性因素的落地 建议重整旗鼓备战马年的第一波上涨周期 [3] - 中国银河证券策略首席分析师杨超表示 春节假期后在政策预期、流动性支持与产业趋势催化下市场震荡上行概率较大 [3] - 兴业证券经济与金融研究院策略研究首席分析师张启尧继续看好A股节后迎来新一轮上行 [3] 机构看好的配置主线:科技 - 开源证券计算机行业分析师刘逍遥分析 2026年是AI走向价值落地和商业化的关键之年 多模态模型有望迎来“DeepSeek时刻” 在能力提升的同时实现成本端大幅下降 从而推动影视、游戏、广告等内容创意领域的繁荣 [4] - 兴业证券张启尧建议继续聚焦“泛AI资产” 围绕算力基础设施与商业化应用布局 [4] - 算力基础设施方向看好光模块、储能、电网、存储龙头、上游设备封测环节、半导体产业链等 [4] - 商业化应用方向看好人形机器人、智能驾驶、有望受到苹果公司年度股东大会催化的消费电子以及受益于多模态能力提升的游戏、营销、影视等 [4] 机构看好的配置主线:资源品 - 假期期间国际贵金属与原油价格走强 提升了其配置价值 [5] - 全球宏观叙事继续提升资源品战略性配置价值 国内新一轮价格周期的上行也在进一步丰富涨价线索 [5] - 春节后进入开工旺季 3—4月是全年工业、基建、地产等领域的活跃阶段 涨价线索易扩散 [5] - 值得关注的领域包括化工、钢铁、建材、高端制造等中游材料和制造行业 [5] - 同时可重视出口链的修复机会 如轻工家电、消费电子、电池、汽车零部件及医疗器械等细分方向 [5]
全年维度看好AI的价值落地与商业化
中国能源网· 2026-02-24 09:56
核心观点 - 2026年是AI走向价值落地和商业化的关键年,商业化成为大模型公司的核心命题 [1][3] - 2026年多模态模型有望迎来“DS时刻”,在能力提升的同时实现成本大幅下降,推动相关应用领域繁荣 [4][5] 市场回顾 - 报告期内(2026.2.9-2026.2.13),沪深300指数上涨0.36%,计算机指数上涨4.35% [2] AI价值落地与商业化 - Anthropic被视为商业化速度最快的大模型企业之一,其G轮融资300亿美元,估值达3800亿美元 [1][3] - Anthropic的年度经常性收入(ARR)增长迅速,从2023年底的1亿美元,提升至2024年底的10亿美元,截至2026年2月已达140亿美元 [3] - Claude Code是其最大增长引擎,ARR已突破25亿美元,2026年初以来企业订阅量激增4倍,企业客户贡献营收占比已超过一半 [3] - Claude的应用正从编程向金融分析、数据建模、销售、网络安全、科研发现等关键领域拓展 [3] - OpenAI近期解散其内部“使命对齐”团队,并将算力支出目标下调至6000亿美元,预计到2030年总营收将超过2800亿美元,消费者与企业业务贡献大致相当,显示出从AGI理想转向商业优先的迹象 [3] 多模态模型发展 - OpenAI在2024年2月推出初代Sora模型,被视为视频领域的“GPT 1时刻”;2025年9月底推出Sora2,迎来“GPT3.5式突破” [4] - 谷歌于2025年10月16日在Gemini API中发布Veo3.1和Veo3.1Fast付费预览版,在音频支持、叙事控制及质感还原方面进行重大升级 [4] - 2026年2月5日,可灵AI全球上线3.0系列模型;2月7日,Seedance2.0正式上线,能生成1080p广播级标准视频 [4] - 借鉴DeepSeek开源与成本优势驱动文本大模型普及的经验,多模态模型有望在2026年迎来类似时刻,能力提升伴随成本端大幅下降,从而推动影视、游戏、广告等内容创意领域繁荣 [4][5] 投资建议 - 报告维持两个关键判断:2026年是AI价值落地和商业化关键年;多模态模型有望迎来“DS时刻” [5] - AI应用推荐公司包括:金山办公、合合信息、鼎捷数智、迈富时、致远互联、金蝶国际、博彦科技、用友网络、同花顺、恒生电子、拓尔思、科大讯飞、焦点科技、中科创达、税友股份、上海钢联等 [5] - AI应用受益标的包括:泛微网络、福昕软件、汉得信息、万兴科技、第四范式、多点数智、北森控股、新开普、新致软件、欧玛软件、汉邦高科、石基信息、汉王科技、汉仪股份、三六零、彩讯股份、金桥信息、佳讯飞鸿等 [5] - 多模态领域受益标的包括:万兴科技、海天瑞声、虹软科技、当虹科技、快手-W、美图公司、阜博集团等 [5]
国泰海通|传媒:巨头红包大战争夺AI入口,大模型密集更新
国泰海通证券研究· 2026-02-23 22:31
春节AI营销与竞争格局 - 互联网巨头在2026年春节围绕“AI超级入口”展开红包大战,总投入金额超80亿元,主要参与者包括字节、阿里、腾讯、百度,其核心AI应用(豆包、千问、元宝、文心)成为红包派发主阵地 [1] - 红包活动拉新效果显著:2月6日(活动首日),千问App DAU实现727.7%的增长,达到5848万,较前一日增长超5100万,与豆包的DAU差距缩小至2275万;元宝在2月1日活动首日DAU达2399万,较前一日增长2.1倍 [1] - 字节跳动深度绑定央视春晚,其火山引擎成为独家AI云合作伙伴并参与内容制作,除夕当天豆包AI总互动达19亿,并于2月17日登顶AppStore免费榜 [1] AI入口竞争的核心要素 - 春节营销是短期用户增长的窗口,但AI入口竞争的最终胜负手在于用户留存,而留存取决于基座模型能力以及背后的大厂基建与生态支撑 [2] - 互联网厂商在补贴拉新之外,更注重引导用户形成AI使用路径:阿里千问以消费场景切入,通过“免单”功能训练用户调用Agent完成任务的习惯,以加深信任并形成复购;字节则凭借视频领域积累,发力多模态模型并应用于春晚内容制作,同时激励用户使用模型进行图片视频生产以深化用户心智 [2] 大模型技术进展与能力提升 - 春节前后大模型密集更新,多模态和智能体(Agent)能力显著增强,且Agent工程化能力成为基座模型标配 [3] - 具体模型更新包括:智谱GLM-5和MiniMax M2.5强调编程与智能体能力,性能对标Claude Opus 4.6等顶尖模型;DeepSeek灰度更新版本将上下文窗口提升至1M(100万token),并强调长上下文和代码生成能力;字节上线Seedance2.0视频生成模型并集成至即梦AI、豆包等平台,在文生视频、图生视频及多模态参考生成任务上达到行业领先水平;阿里发布Qwen3.5,在多模态理解、推理、编程及Agent能力上领先同级开源模型 [3] 投资主线建议 - 建议围绕三条主线进行布局:关注基座模型及生态领先的互联网大厂;关注上市模型厂商;关注内容及IP方,其将受益于基座模型的突破,可优先关注在商业层面率先取得进展的AI营销、AI短剧及AI电商板块 [3]
周观点:全年维度看好AI的价值落地与商业化
开源证券· 2026-02-23 18:45
行业投资评级 - 投资评级:看好(维持)[1] 核心观点 - 2026年是AI走向价值落地和商业化的关键年,商业化将是大模型公司的关键命题[4][10] - 2026年,多模态模型有望迎来“DS时刻”,在能力提升的同时实现成本端大幅下降,从而推动影视、游戏、广告等内容创意领域的繁荣[5][11] 市场回顾与行业走势 - 2026年2月9日至2月13日期间,沪深300指数上涨0.36%,计算机指数上涨4.35%[3][13] - 截至2026年2月,计算机行业指数表现优于沪深300指数[2] AI商业化进展与关键判断 - Anthropic被认为是商业化速度最快的大模型企业之一,其G轮融资300亿美元,估值达3800亿美元[4][10] - Anthropic的年度经常性收入(ARR)从2023年底的1亿美元,提升至2024年底的10亿美元,截至2026年2月已达140亿美元[4][10] - Claude Code成为其最大增长引擎,ARR突破25亿美元,2026年初以来企业订阅量激增4倍,企业客户贡献的营收占比已超过一半[4][10] - OpenAI已解散其内部“使命对齐”团队,并将算力支出目标从1.4万亿美元下调至6000亿美元,预计到2030年总营收将超过2800亿美元,消费者业务与企业业务贡献大致相当,显示出从AGI理想转向商业优先的趋势[4][10][31] 多模态模型发展动态 - OpenAI于2024年2月推出初代Sora模型,2025年9月底推出Sora 2,被视为视频领域的突破[5][11] - 谷歌在2025年10月16日发布了Veo 3.1和Veo 3.1 Fast付费预览版,在音频支持、叙事控制及质感还原方面进行了重大升级[5][11] - 2026年2月5日,可灵AI正式全球上线3.0系列模型[5][11] - 2026年2月7日,Seedance 2.0正式上线,能生成真正的1080p分辨率广播级视频,具备音视频同步、多镜头叙事等能力[5][11] - 谷歌曝光Gemini 3.1 Pro最新模型,在ARC-AGI-2推理基准测试中得分为77.1%,远高于Gemini 3 Pro的31.1%,但保持与Gemini 3 Pro相同的定价[33] 投资建议与受益标的 - AI应用领域推荐标的包括:金山办公、合合信息、鼎捷数智、迈富时、致远互联、金蝶国际、博彦科技、用友网络、同花顺、恒生电子、拓尔思、科大讯飞、焦点科技、中科创达、税友股份、上海钢联等[6][12] - AI应用领域其他受益标的包括:泛微网络、福昕软件、汉得信息、万兴科技、第四范式、多点数智、北森控股、新开普、新致软件、欧玛软件、汉邦高科、石基信息、汉王科技、汉仪股份、三六零、彩讯股份、金桥信息、佳讯飞鸿等[6][12] - 多模态领域受益标的包括:万兴科技、海天瑞声、虹软科技、当虹科技、快手-W、美图公司、阜博集团等[6][12] 公司动态:业绩快报 - 光云科技:2025年度预计实现营业收入56,538.06万元,同比增长18.33%;预计归母净利润为-2,638.02万元,同比减亏67.85%[14] - 国网信通:2025年度预计实现营业总收入1,062,782.05万元,同比增长1.99%;预计归母净利润67,820.02万元,同比下降16.91%[14] - 中控技术:2025年度预计实现营业总收入805,062.53万元,同比减少11.90%;预计归母净利润45,009.58万元,同比减少59.70%[15] - 莱斯信息:2025年度预计实现营业总收入127,353.29万元,同比下降20.89%;预计归母净利润5,523.29万元,同比下降57.20%[15] - 金橙子:2025年度预计实现营业收入25,339.82万元,同比增长19.46%;预计归母净利润3,726.47万元,同比增长22.20%[15] 公司动态:投资与并购 - 盛视科技拟投资设立全资子公司深圳盛信投资有限公司,注册资本为人民币20,000万元[16] - 恒为科技拟出资3,500万元参与设立南通正海恒浦创业投资合伙企业(有限合伙),认缴出资占比20.00%[16] - 银信科技拟出资510万元(占51%股权)与华章智教等共同投资设立合资公司,合资公司注册资本为1,000万元[16] - 拓尔思以自有资金2,120万元认购深圳星连荣基创业投资合伙企业(有限合伙)份额,该基金规模为21,201万元[17] 公司动态:股权激励与员工持股 - ST迪威迅发布2026年股票期权激励计划(草案),拟授予第一类限制性股票2,725.49万股,占公司总股本的7.00%,授予价格为每股2.55元[18] - 智莱科技发布第一期员工持股计划(草案),筹集资金总额不超过3,860万元,业绩考核目标为以2024年营收为基数,2026/2027年的营收增长率分别不低于45%/65%[19] 公司动态:其他公告(股东减持) - 焦点科技:财务总监顾军、董事兼董事会秘书迟梦洁、高级副总裁成俊杰计划合计减持不超过约143,760股[20] - 捷顺科技:实际控制人刘翠英计划减持不超过17,910,000股,占公司总股本不超过2.80%[21] - 千方科技:大股东杭州灏月计划合计减持不超过23,650,697股,占公司总股本(剔除回购股份)1.50%[21] - 岩山科技:董事及高级管理人员陈于冰、黄国敏计划合计减持不超过约16,903,100股[22][23] 行业动态:国内要闻 - 腾讯元宝在春节活动期间日活跃用户突破5000万,月活跃用户达到1.14亿[24] - 月之暗面Kimi新一轮超7亿美元融资即将完成交割,由阿里、五源等老股东联合领投,腾讯参与投资[25] - 宇树科技创始人预计2026年公司人形机器人目标出货量在1-2万台左右[26] - 豆包通过春晚送出超10万份科技好礼和现金红包,AI总互动达19亿次,其视频生成模型Seedance 2.0参与了多个春晚节目的视觉创作[27] - 阿里正式发布全新一代大模型千问Qwen3.5-Plus,实现了从纯文本到原生多模态的升级[28][29] - 豆包大模型2.0正式发布,包含Pro、Lite、Mini三款通用Agent模型和Code模型[30] 行业动态:海外要闻 - OpenAI计划到2030年投入约6000亿美元用于算力建设,较此前宣称的1.4万亿美元目标大幅下调[31] - 英伟达正接近与OpenAI达成一项约300亿美元的股权投资协议,这意味着双方将放弃此前宣布的1000亿美元多年投资合作计划[34]