Workflow
Sora App
icon
搜索文档
年末 AI 回顾:从模型到应用,从技术到商战,拽住洪流中的意义之线(上)
新浪财经· 2026-02-12 20:12
模型 - 2025年是Agentic Model能力提升的关键一年,大模型的推理、编程和多模态能力持续进步,为复杂智能体应用奠定了能力基础,2025年普遍被认为是Agent应用元年 [27][64] - 推理模型在2025年崛起,标志性事件是DeepSeek-R1于2025年1月20日发布,其影响力远超同日发布的Kimi K1.5和更早的OpenAI o1,成为全球首个在大参数规模上复现o1的推理模型 [7][59] - DeepSeek-R1的成功得益于三个关键因素:完全开源最强旗舰版本、技术报告极其详细、以及高亮了仅557万美元的最后一次训练成本,极低的成本引发了美国政商界广泛关注 [7][59] - 推理模型的效果提升主要体现为多步推理能力,背后的新技术范式是“测试时计算”的扩展,即将更多算力放在模型推理阶段 [9][61] - 编程能力成为支撑通用智能体的关键,Anthropic在2025年2月发布的Claude Code本质上是一个通用智能体,领先于3月初发布的“世界首个通用Agent”Manus,OpenAI、x.ai和Google等巨头也在2025年相继发布了各自的编程应用 [10][62] - 多模态模型已演进为原生多模态,即用单一模型处理文字、图片、语音等信息,代表模型包括2024年的OpenAI 4o、Gemini 1.5以及2025年的Gemini 3和Kimi 2.5,同时中国公司在视频生成模型领域表现突出 [11][63] - 模型竞争的底层是研发组织方式的竞争,“协同设计”成为巨头关键战略,即从芯片、基础设施、算法到应用的垂直整合与优化,Google、阿里和腾讯均在推进此类整合 [13][14][65][66] - DeepSeek展示了极致的工程优化能力,其开源周披露的推理成本引发行业争议,数据显示在24小时内用1800多张GPU卡支持了6000多亿输入Token和近1700亿输出Token,据此计算的毛利率高达84.5% [15][16][67][68] - 算力发展的趋势从比拼单颗芯片性能转向优化多芯片互联系统,华为的384 Matrix超节点和英伟达的NVL72均体现了这一思路 [22][74] - AI研究界已开始深度思考下一代学习范式,认为当前基于海量数据预训练和后训练的方法将触达瓶颈,新的研究方向包括持续学习、在线学习和世界模型等,旨在实现更接近人类的高效、节能学习方式 [23][24][75][76] 应用 - 2025年是智能体应用大规模爆发的元年,主要分为两条主线:以编程能力为核心的通用智能体,以及深入特定行业的垂直智能体 [29][81] - 通用智能体的核心转变是编程从目的变为手段,代表产品包括Anthropic的Claude Code、Claude Cowork、近期风靡的OpenClaw,以及字节跳动的Trae Solo模式、蚂蚁灵光、马卡龙等,它们旨在满足个人工作与生活的自动化需求 [30][31][82][83] - 智能体生态催生了工具链的繁荣,基础设施层出现细分机会,涵盖语音与多模态交互、记忆管理、评估测评等方向,美国硅谷的软件水平分工为此提供了成熟土壤 [40][41][42][43][92][93][94][95][96] - 智能体数量激增后,分发与交易成为新需求,Youware和MuleRun等公司尝试构建社区化平台或交易市场,但目前正从平台模式转向强化工具属性以降低使用门槛 [34][86] - 通用智能体正向移动端渗透,引发手机厂商、超级App与AI公司之间的三方博弈,例如字节豆包手机预览版的自动回微信、比价点外卖功能曾遭微信、美团等超级App封禁 [35][87] - 不同场景的App受智能体影响程度不同,点外卖、订机票等提效需求强的场景受影响更大,但超级App出于广告收入和数据安全考虑对开放接口持谨慎态度,而抖音、小红书等娱乐内容平台受影响较小 [36][88] - 垂直领域智能体正改变商业模式,从“卖服务”转向“为结果收费”,例如法律领域的艾语智能直接承接金融机构案件并按最终收回款项收费,教育领域的爱为舞则将AI老师嵌入在线大班课商业模式 [38][39][90][91] - Sora App代表了AI在非提效类消费端场景的新尝试,其核心功能Cameo允许用户生成数字角色进行创作或合拍,发布初期热度高但留存挑战大,30天留存率低于8%,远低于TikTok的42%和Instagram的38% [44][45][97][98] - 特定创作者群体正在Sora App上沉淀,例如日本创作者Matsumaru利用该工具探索二次元与视觉特效,粉丝量已突破10万 [46][99] - 传统消费端场景也在被AI重塑,例如聊天应用Intent利用大模型实现“默认全局翻译”,语音输入应用Typeless凭借更精准的识别和语境理解脱颖而出 [48][101] - AI for Science领域存在多种探索路径:一是利用机器学习加速第一性原理计算,如深势科技的DeePMD;二是利用生成式AI解决特定科学问题,如AlphaFold;三是发展能够覆盖完整科研流程的科研智能体,迈向“AI发明家”时代 [49][50][51][102][103][104]
年末 AI 回顾:从模型到应用,从技术到商战,拽住洪流中的意义之线
晚点LatePost· 2026-02-12 15:15
模型 - 本轮AI热潮仍处于早期,技术变化是核心驱动力,也是推演产品与商业格局的基点[6] - **Agentic Model成为关键趋势**:指能支持Agent能力的模型,需要具备推理、编程、多模态理解、工具使用和记忆等能力[7] - **推理模型崛起**:以DeepSeek-R1的爆火为标志,其于2025年1月20日与Kimi K1.5同日发布,成为全球首个在大参数规模上复现OpenAI o1的推理模型[8] - DeepSeek-R1影响力巨大,原因包括:完全开源最强旗舰模型、技术报告详尽、高亮仅557万美元的最后一次训练成本[8] - 推理模型的效果提升表现为多步推理能力,推动了ChatBot产品的“深度研究”功能,其背后的新技术范式是“测试时计算”的Scaling[9] - **Coding能力重要性凸显**:编程是数字世界中执行任务的基础,是支撑复杂Agent应用的重要能力[11] - 2025年全球顶尖模型厂商加大Coding投入并下场做应用,如OpenAI的Codex、x.ai的Grok Code Fast、Google的Antigravity[12] - **多模态能力成为标配**:最领先的大模型已演进为原生多模态模型,如OpenAI 4o、Gemini 1.5/3、Kimi 2.5[13] - 同时存在专门的多模态生成模型,如中国的视频生成模型可灵、海螺、SeedDance,以及Google的Veo 3和Nano Banana[13] - **协同设计成为研发组织关键**:大模型训练是系统工程,需要硬件、软件系统和算法的垂直整合与协同优化[15] - Google凭借全面掌握TPU芯片、软件库、Infra到云平台和应用,形成了协同优化的Superpower[15] - 阿里提出“通云哥”(通义-阿里云-平头哥)战略,腾讯和阿里千问团队也都在内部推动Infra与算法的更紧密整合[15][16] - DeepSeek从零开始自然形成协同优化,其Infra团队参与算法设计,展现了超强的工程能力[17] - DeepSeek在2025年2月的“开源周”展示了其Infra成果,并测算其推理系统在24小时内用1800多张卡支持了超6000亿输入Token和近1700亿输出Token,毛利率达84.5%[17][18] - **注意力机制持续改进**:围绕稀疏注意力和线性注意力进行优化,以突破上下文长度瓶颈,如Flash Attention、DeltaNet等[21][22] - **算力趋势转向多芯片互联**:从比拼单颗芯片性能转向优化多芯片互联系统,如华为384 Matrix超节点、英伟达NVL72[23] - **行业开始探索下一个学习范式**:认为当前基于海量数据预训练和微调的方法可能触达瓶颈,未来需向更接近人类的学习机制演进[24] - 研究方向包括持续学习、在线学习、世界模型等,许多研究者从动物与人类智能中获取灵感[25] - 人类大脑功耗仅约20瓦,而当前大模型训练极其耗能,寻求更节能、可解释的新学习范式成为重要议题[26] 应用 - 2025年被普遍认为是Agent应用大规模爆发的元年[27][30] - **通用Agent以Coding为核心手段**:Coding从目的变为手段,使Agent能在数字世界执行各类任务[27][28] - 代表产品包括Claude Code、Claude Cowork、近期风靡的OpenClaw,以及字节的Trae Solo、蚂蚁灵光、马卡龙、Youware等[31] - Anthropic推出的MCP协议和Skills开放标准,降低了构建Agent的门槛,使其变得模块化[32] - **出现Agent Scaling与群体智能趋势**:如Moltbook探索大量智能体聚集后的系统变化,PingCAP CTO黄东旭开发了多角色Agent协作的Minibook[33] - **垂类Agent深度结合行业**:从“卖服务”转向“为结果收费”,例如法律领域的艾语智能直接承接案件并按收回款项收费,AI教育公司爱为舞用AI替代助教[38] - **手机Agent面临存量博弈**:字节豆包手机预览版曾实现自动回微信、比价等功能,但遭超级App封禁;OpenClaw因能部署到手机而流行[35] - 手机Agent的发展涉及手机厂商、超级App与AI公司之间的三方博弈,功能性场景需求强但超级App对开放接口有顾虑[36] - **Agent工具链生态繁荣**:在基础模型与完整Agent产品间的中间地带,涵盖RAG、提示工程、上下文工程、测评等环节,成为关键机会[40] - 工具链的核心机会包括:语音与多模态交互、记忆管理、评估体系等[40][41][42] - **Sora App代表非提效类To C方向**:集中于陪伴、社交、游戏与娱乐领域,其核心功能Cameo允许用户生成数字角色进行创作或合拍[43] - Sora App发布初期热度高但留存挑战大,Sensor Tower数据显示其30天留存率低于8%,远低于TikTok的42%和Instagram的38%[43] - 特定创作者群体在沉淀,如日本创作者Matsumaru粉丝量突破10万,接近Sam Altman的14万[44] - **AI for Science应用深化**:包括利用AI加速第一性原理计算(如深势科技的DeePMD),以及利用生成式AI解决特定科学问题(如AlphaFold)[46] - **AI发明家方向兴起**:探索用AI覆盖完整科研流程,甚至让AI承担人类研究员工作,实现技术的自我繁殖[47] 巨头的AI之战:字节、阿里、腾讯 - **人才和组织是竞争底层**:三家公司采取不同策略构建AI团队[50] - **字节以创业方式做AI**:成立相对独立的Flow、Seed、Stone部门,初期由老将负责,后在2025年2月引入Google DeepMind前研究副总裁吴永辉作为Seed研发一号位,吸纳大量AI原生年轻骨干[51][52] - 内部存在多团队赛马机制,部分人才有流失[52] - **阿里团队相对稳定**:AI一号位为入职十年的周靖人,其下通义实验室包含千问、通义万相、多模态交互三个核心团队[55] - 团队从内部自下而上生长,通过开源形成强社区影响力[55] - **腾讯引入年轻“鲶鱼”**:1998年出生的前OpenAI研究员姚顺雨于2025年秋加入,出任总裁办首席AI科学家,直接向总裁汇报,并带来高频招新、重塑目标、组织调整(强调协同设计)等变化[56] - **中美人才吸引力差异**:在美国,OpenAI等初创公司对人才吸引力最大;在中国,巨头仍是顶尖人才首选[57] - **To C应用大战激烈**:字节豆包、腾讯元宝、阿里通义/夸克展开竞争[61] - **字节模型与产品协作最紧密**:Seed模型团队与Flow产品团队协作频次高,共同为产品服务[59] - 字节定下三大AI目标:探索智能上限、探索新UI交互形式、加强规模效应,其规模效应逻辑基于“数据飞轮”[59] - **腾讯与阿里经历产品团队重组**:腾讯将元宝等应用整合至CSIG,但混元模型团队仍在TEG,考验跨部门协作;微信的参与程度存疑[60] - 阿里将通义To C产品团队从阿里云划归至智能信息事业群,产品与模型团队分离[60] - **阿里应用布局经历轮换**:从通义千问App到主打夸克,再到2025年底通义App更名“千问 App”卷土重来,接通生活服务生态[61] - 千问App近期单日投放峰值达1500万元,但产品力与留存面临挑战[62] - **字节形成“一超多强”布局**:豆包成为中国首个日活过亿的AI产品,并推出海外版Dola;同时有Trae、Coze、豆包爱学等产品[63] - 豆包塑造亲切、生活化的人设,并开始尝试商业化[63] - **腾讯元宝因接入DeepSeek获益**:日活在2025年2月底快速增长了10倍,最新尝试是“元宝派”引入社交关系[63] - **春节之战白热化**:豆包拿下春晚合作;元宝推出10亿元红包;千问宣布发放30亿元红包[63] - DeepSeek-V4的发布成为最大变数,若节前发布可能利好绑定紧密的腾讯元宝[64] 创业公司们 - **大模型公司迎来IPO潮**:2026年1月,智谱AI与MiniMax前后脚上市,揭开财务底牌[67] - 智谱市值约114亿美元,MiniMax约185亿美元;但收入规模远小于美国同行:智谱2025年上半年收入约2700万美元,MiniMax前三季度约5300万美元;对比OpenAI 2025年营收超130亿美元,Anthropic达45亿美元[67] - 基础模型公司普遍巨额亏损,OpenAI仅在2025年第三季度亏损可能高达120亿美元[68] - 中国大模型公司提前上市是为获取续命资金,IPO是“下一轮竞赛的鼓点”和安全网[68] - 中国坚持做基础模型的未上市头部公司已寥寥无几,DeepSeek靠幻方自有资金,Kimi与阶跃星辰近期完成大额融资[68] - **AI应用公司出现高收入代表**:全球ARR超过或等于5000万美元的AI原生企业约有40-70家,集中在AI Coding、内容创作、法律、教育等场景[70] - 中国背景公司中,Manus以超20亿美元被Meta收购;Genspark ARR达5000万美元;OpenArt ARR达7000万美元;PixVerse 2025年总收入超4000万美元;Lovart在2025年10月宣布ARR突破3000万美元[70] - AI应用团队活法多样,可追求极致效率、寻求收购或在巨头缝隙立足[71] - **全球化面临复杂地缘因素**:HeyGen早期注销中国主体;Manus将总部迁至新加坡后被Meta收购,面临中国商务部审查;MiroMind中国团队因法律合规等地缘因素,研发负责人离职,团队寻求独立发展[72] - AI竞争已成为大国博弈核心一环,创业者需在技术主导权、场景匹配度和发展策略上做出抉择[73] 具身智能 - **投资与融资火热**:根据中国信通院报告,截至2025年底,中国具身智能和机器人领域年度融资总额高达735亿元,远超头部大模型公司同期的182亿元融资总额[75] - **中国具身智能公司估值高企**:银河通用2025年底估值达30亿美元;宇树科技IPO市值预期达500亿乃至千亿元人民币;而在美国,最贵的Figure估值390亿美元,仅为OpenAI的1/20[75] - **中国具身智能火热的三大原因**:政策与制造业红利(可落地产线)、供应链成本优势、更明确的二级市场退出路径[77] - **行业关注三大核心要素**:数据、模型和硬件本体,其中数据是当前最重要课题[76] - **数据获取方式多样**:包括真机遥操作、仿真迁移、视频学习、可穿戴设备采集、Self-play等[78] - **主流技术路线**:包括VLA模型、端到端模型,以及生成式的世界模型(如Sora、Genie 3被视为雏形)[82] - **硬件本体是复杂系统工程**:面临灵巧手寿命、关节稳定性、减重、续航等多重挑战,特斯拉Optimus多次延期[80] - **落地应用方向多元**:1) 研发(售予训练场、实验室);2) 表演与展示(如中国移动1.24亿元采购单);3) 商业与家庭服务(挑战大);4) 工业生产(有机会但面临传统竞争);5) 陪伴与娱乐(更接近消费电子,如宇树机器狗Go1累计销量数万台)[80][81][83] - 许多从业者预言2026年将是具身智能规模化应用落地元年[83] AI硬件 - **存在两种发展思路**:一是寻找下一个大规模的硬件入口;二是硬件形态可能分散和多样化[84] - **AI眼镜被视为潜在入口级硬件**:因其具备hands-off(离手操作)和always-on(全天佩戴)的交互特性,能作为接近人感官的传感器平台[85][86] - 做AI眼镜的公司众多,包括Google、Meta、阿里巴巴、小米、理想汽车等[85] - AI眼镜仍处早期,产品形态未收敛,功能选择(如是否带拍摄、显示)对应不同开发路径[87] - **多样化硬件形态并存**:包括手机、汽车,以及利用大模型特性的单功能新硬件[88] - **Plaud是多样化硬件的典型**:一款贴在iPhone背板的录音设备,加入AI总结能力,累计销量已超过100万台[88] - **Looki代表另一种传感器平台思路**:可贴在胸前的便携相机,抓拍生活片段并自动总结,旨在获取物理空间数据[86]
字节“上新”AI视频应用,正面迎战OpenAI、阿里
36氪· 2026-01-09 19:25
字节跳动2025年业务表现与2026年AI视频新布局 - 2025年是字节跳动应用工厂的收获年,旗下多款应用数据亮眼:豆包日活跃用户过亿,红果短剧月活跃用户迈过2亿门槛,汽水音乐月活数据开始逼近网易云音乐,多闪重回社交应用榜榜首 [1] - 然而,公司后方大本营抖音面临潜在挑战,OpenAI基于Sora 2视频模型推出的短视频应用Sora App,上线五天下载量突破百万,被视为“AI版TikTok”的潜在竞争者 [1] - 在国内市场,豆包在AI应用赛道保持断层领先,但阿里的千问通过天量投放强势曝光,并以AI视频玩法作为差异化竞争手段;字节旗下可灵AI成熟的创作者社区被视为孕育“国产版Sora App”的土壤 [1] 字节跳动推出AI视频社区新应用“随变” - 字节跳动于2026年初推出新应用“随变”,出品方为北京抖音科技,定位为“抖音旗下潮流玩法社区”,旨在聚合潮流玩法并通过AI能力降低创作门槛 [3][4] - “随变”的核心功能包括AI形象生成和AI合拍,其“合拍”功能与Sora App的Cameo客串功能类似,允许用户将AI形象置入AI生成的场景中 [6] - 该应用被视为“年轻版抖音”和抖音的“玩法试验田”,旨在吸纳前沿创作者、维持年轻“酷”感,并先行试点创新玩法以降低主站迭代风险 [6] - 应用上线初期尚未大规模推广,AI功能尚不完善,但公司可能瞄准春节社交裂变契机,通过AI拜年、合拍全家福等玩法推动普及 [7] - “随变”的发展路径预计将与抖音深度绑定,从抖音持续引流,类似汽水音乐和多闪的模式 [18] AI视频平台面临的共同挑战与竞争格局 - OpenAI的Sora App上线初期火爆,四天登顶美国区App Store免费榜,但面临严重的用户留存问题:90%的用户一天即走,98%的用户未坚持过一周,两个月后首批用户几乎全部离开 [11] - 纯AI视频平台的共同困境在于,用户容易对相似的AI玩法产生审美疲劳,且在新平台上难以获得足够的社交反馈,更倾向于将内容分发至TikTok等成熟平台 [11] - 决定AI视频平台成败的关键,在技术均等化后,更依赖于内容运营能力和为用户搭建获得反馈的舞台 [13] - 阿里于2025年11月公测千问App,并于次月上线视频生成模型万相2.6,在App内推出“AI小剧场”,引入“角色合拍”玩法,试图以此形成与豆包的差异化竞争 [13][15] - 千问将AI视频功能置于首页醒目位置并购买关键词广告,但其社区生态同样面临“尝鲜即弃”的问题,内容多停留在鬼畜玩梗阶段,未成为用户情感载体,且因缺乏社交关系网而难以破圈 [15][17][18] 行业趋势:大厂加速布局AI视频与AI社交 - 从2025年开始,抖音、快手等头部平台积极布局下一代AI视频与AI社交平台,以应对潜在颠覆者并提前抢占赛道 [19] - AI能力正与娱乐、社交场景深度融合,用户的AI分身可用于熟人互动或创意展现,推动平台AI视频与AI社交双线布局 [19] - 在AI社交方面,抖音多闪凭借“AI聊天小火人”功能,其日活跃用户已超过一亿,并持续占据App Store社交应用榜首位;快手的“火崽崽”已有近6000万用户,超七成为年轻用户,AI虚拟伙伴成为增强平台社交黏性的工具 [19][21] - 在AI视频创作工具方面,字节的猫箱(豆包团队)与快手的可灵AI目前采用会员制模式,以分担算力成本 [21] - 随着视频模型能力增强和算力成本下降,2026年这类应用可能走向免费以扩大用户规模;特别是全球用户突破4500万的可灵AI,若降低使用门槛,可能在工具基础上孵化出“AI版快手”,与抖音在AI视频领域正面对决 [23] - 2026年行业可能见证下一代AI娱乐入口的激烈争夺战 [24]
出海、上市,中国第一批大模型熬出头了
36氪· 2026-01-03 10:21
行业与公司动态概览 - 中国AI大模型创业公司智谱AI与MiniMax于2025年末相继通过港交所上市聆讯,标志着行业头部玩家开始“上岸”[1] - 两家公司展示了中国AI公司出海的两条不同路径:一条通向技术底座,一条通往消费应用[1] OpenAI的商业模式与市场地位 - OpenAI在2025年上半年实现营收约43亿美元,保守预估全年收入将达到127亿美元[3] - 其收入超60%来自企业客户,服务对象包括摩根大通、Booking.com、Garb、Mercado Libre等全球知名企业[3] - 在C端,其Sora App于2025年10月上线四天后即登顶美国苹果应用商店免费榜第一[3] - 得益于B端和C端并重的发展策略,OpenAI在2025年中旬估值飙升至5000亿美元,成为全球估值最高的独角兽[4] 智谱AI的业务模式与财务表现 - 公司成立于2019年,源自清华大学技术成果转化,走全栈自主研发路线,已发布GLM-4等模型[6] - 其商业模式以MaaS(模型即服务,即API调用)为主,2025年上半年该业务贡献了84.8%的营收[6] - 2024年,公司在中国独立通用大模型开发商中收入排名第一,在所有通用大模型开发商中位列第二,市场份额为6.6%[6] - 截至2025年上半年,累计为超过8000家机构客户提供服务,累计营收6.85亿元人民币[6] - 客户包括金山办公、蒙牛乳业、智联招聘、捏TA等国内知名企业[7] 智谱AI的客户结构与潜在风险 - 2024年,公司最大客户贡献了19%的收入,前五大客户合计贡献了45.5%的收入[10] - 前五大客户名单每年几乎没有重合,反映出一次性交付模式导致的收费不可持续性问题[10] - 海外业务处于初期,截至2025年上半年海外收入占比为11.6%,其中东南亚地区收入占比11.1%,对应金额约1792.7万元人民币[10] MiniMax的业务模式与财务表现 - 公司成立于2022年初,采用“技术即产品”策略,同步推进模型开发和应用[11] - 收入主要来自两大板块:AI原生产品(2024年占总营收71.4%)和开放平台及企业服务(2024年占比28.6%)[11] - 2023年、2024年及2025年前三季度分别实现营收346万美元、3052.3万美元和5343.7万美元,合计8742万美元(约6.12亿元人民币)[11] - 海外收入占比增长迅速,从2023年的约19.2%提升至2025年前三季度的73.1%,已成为公司主要收入支柱[11] MiniMax的用户数据与市场地位 - 公司AI原生产品的平均月活跃用户从2023年的约315万增长至2024年的1911万,增长超六倍[12] - 截至2025年9月30日,拥有2.12亿名个人用户,月活用户达2760万[12] - 旗下产品星野(含海外版Talkie)已成为全球第二大AI原生交互平台,用户日均使用时长超过70分钟,接近同期TikTok水平[13] MiniMax面临的挑战 - 公司面临来自迪士尼、环球影业、华纳兄弟探索频道等多家影视巨头的版权诉讼,原告主张的最高损害赔偿金额约7500万美元[14] - 公司董事认为该诉讼缺乏足够证据支持,并辩称其AI工具仅根据用户提示生成内容,不构成直接侵权[14] 市场前景与公司战略定位 - 2024年中国大语言模型市场规模约53亿元人民币,其中机构客户贡献47亿元,个人客户仅6亿元[15] - 预计到2030年,中国企业级大模型市场规模将达到904亿元人民币,2024至2030年复合年增长率为63.7%[15] - 全球大模型市场(基于模型的收入口径)预计将从2024年的107亿美元增长至2029年的2065亿美元,复合年增长率达80.7%[16] - 智谱AI选择B端市场,顺应了中国市场企业客户为“安全、可控、私有化”付费的支付能力结构[15] - MiniMax选择C端路径,避开与OpenAI、Google在基础模型层的直接竞争,通过产品体验和文化洞察打造应用[18] - 剔除尚未商业化的星野产品,MiniMax的C端业务毛利率接近50%[18] 中国AI“六小龙”竞争格局分化 - 第一梯队(已递表):智谱AI(押注企业私有化+API)、MiniMax(主打编码/语音模型的公有云调用)[20] - 第二梯队(资金充裕):月之暗面(背靠阿里)、阶跃星辰(背靠腾讯+国资),商业化刚起步,预计2025下半年-2026年启动上市[20] - 第三梯队(被迫转型):面壁智能、零一万物转向行业Agent或场景应用,后续独立IPO难度大,更可能被并购[20] - 2025年被认为是“六小龙”最后的上市窗口期[20] 长期战略与融合趋势 - 智谱AI计划扩大AI在消费电子中的作用,已与三星达成合作,其AI功能将集成于Galaxy S25系列手机[21] - MiniMax计划继续大力投资研发,推进大模型架构突破(如动态多模态融合)和现实世界应用[21] - 长远看,两家公司可能向“两手抓、两手强”的模式发展,即技术底座提供商向下游延伸,消费应用公司向B端拓展[21] AI企业出海面临的挑战 - 东南亚市场:中小企业数字化预算有限,80%的企业IT支出月均不到500美元;网络基础设施碎片化严重,印尼岛屿间网络延迟可达200ms以上[22] - 欧洲市场:面临欧盟《人工智能法案》的合规门槛,高风险系统需通过第三方认证;72%的德国企业要求核心数据存储在本国境内[22]
全球大模型密集升级强化AI主线,关注恒生科技ETF易方达(513010)等产品投资价值
每日经济新闻· 2025-12-08 15:15
海外大模型技术演进 - 海外大模型迎来新一轮升级,技术演进方向明确 [1] - Gemini 3 Pro Preview引入深度推理模式,大幅提升复杂任务处理能力 [1] - Sora App开放与Anthropic Claude Opus 4.5在智能体领域取得突破,AI正加速向消费级应用与高执行力形态渗透 [1] 国内大模型技术进展 - DeepSeek发布V3.2正式版与V3.2-Speciale,推理能力在行业中处于领先位置 [1] - 模型在“思考模式+工具调用”融合上实现提升,复杂任务执行与推理效率进一步增强 [1] 行业发展趋势主线 - 本轮大模型更新潮呈现“推理深化、智能体增强、多模态普及”三条主线 [1] - 行业正向更高可靠性、更强执行力与更广应用形态迈进 [1] 港股科技龙头投资前景 - 对于港股科技龙头,大模型商业化路径清晰、生态扩张空间大 [1] - 有助于提升盈利端的可见度与估值修复斜率 [1] - 在估值仍具吸引力、产业趋势逐步强化背景下,港股科技龙头的中长期配置价值继续凸显 [1] 相关指数与ETF产品 - 恒生科技指数由港股中与科技主题高度相关的、市值最大的30只股票组成,聚焦AI产业链、互联网等高成长赛道,实现“软硬协同”布局 [2] - 中证港股通互联网指数由港股通范围内30家涉及互联网相关业务的股票组成,覆盖多家AI应用领域核心龙头企业 [2] - 跟踪以上指数的恒生科技ETF易方达(513010)和港股通互联网ETF(513040)近期频繁获资金加仓 [2] - 恒生科技ETF易方达(513010)最新规模达257亿元,创历史新高 [2] - 港股通互联网ETF(513040)最新规模达73亿元,创历史新高 [2] - 看好大模型等AI应用领域的投资者可通过以上产品一键打包相关龙头企业 [2]
晚点独家丨视频生成产品 Pollo AI 获 1400 万美元融资,一个没有大厂与海外背景的 “草根” 创始人
晚点LatePost· 2025-12-05 12:00
公司融资与业务现状 - AI视频生成产品Pollo AI完成1400万美元首轮融资,由高成资本领投,真格基金跟投[4] - 公司定位为视频内容创作平台,创始人朱陈彪(阿彪)拥有软件出海及SEO背景[4] - 公司注册用户数超过2000万,月活跃用户超过600万,日活跃用户超过20万,年化收入超过2000万美元,并于今年5月实现盈亏平衡[4] 产品发展历程与策略 - 产品最初仅提供可灵视频生成模型的内测API接口,后演变为集合几乎所有公开模型的POE平台,提供生成图片、视频与虚拟形象服务[6] - 作为没有自研模型的聚合平台,上线仅七个月月活跃用户就超过400万[6] - 创始人认为专业创作流程和独特用户心智比“AI版TikTok”的社交模式更重要,并指出SEO带来的增长效果已放缓,需寻找新增长曲线[6] - 公司早期快速增长得益于产品、营销及好的时机,SEO是原因之一,但SEO有天花板,算法规则变化可能导致流量减半或跌至谷底[7] - SEO方法论的重要迭代是将SEO融入产品,实现营销与产品的有机结合[7] - SEO策略围绕目标人群而非单一功能进行优化,为目标用户群体所需的所有信息和内容制作对应落地页[8] - 公司借鉴了万兴科技的海外营销方法论,将其视为一个包含内容、外链、红人推广、网站URL结构的完整闭环[9] 行业洞察与产品方向选择 - 创始人基于20多款出海产品经验,认为择时和选品极为重要,当新技术变革对旧商业格局撕开一道口子时,便出现新机会[11][12] - 好的选品案例包括:GPT-4o出现后做模特图/商品图,Stable Diffusion出现后做图片站/社区,AI视频API或开源模型出现后做视频应用[12][14] - 糟糕的选品案例包括:在ChatGPT出现一年后做Chatbot套壳,在Stable Diffusion出现一年后做图片站,以及一年前去做缺乏差异化的商品图、去背景、海报等工具[14][15] - 公司抓住的时间窗口是去年九月到十二月之间,当时开源视频模型及API接口刚出现,公司在可灵API内测阶段就接入了API并发布产品[16] - 决定将Pollo AI定位为POE平台是误打误撞,最初是想探索AIGC中的“C”(内容),后受Canva收购Leonardo.AI启发,形成多模型加工具加社区的形态[17] - 公司暂时没有自研模型的计划,认为无法在资金和技术上卷过字节、Google、OpenAI等大厂,能力项一直在应用层[18] 产品演进与未来规划 - 公司正处于从工具属性占主导向一站式创作流程转变的阶段,目标是解决用户在不同模型和工具间切换的割裂体验[19] - 产品化升级方向包括:从表单交互转向更主流的对话交互,引入Agent模块以使用户跳过选择模型步骤直接得到视频,以及从生成短视频片段转向生成更长的短片(如30秒)[21] - 公司希望Pollo AI最终能成为AI时代的剪映或视频版的Canva,这需要未来三到六个月的产品化并找到独特的用户心智[22] - 创始人认为独特的产品心智非常重要,并以剪映(剪辑)、Lovart(设计)为例[23] 对竞争格局与市场趋势的看法 - 针对OpenAI推出的Sora App,创始人认为其作为“AI版TikTok”的商业模式具有不可持续性,据《福布斯》报道,其在免费情况下每天token成本消耗约1500万美元,且用户留存不会很好[24] - 观察到网页端更偏创作,移动端更偏娱乐,对于视频创作,更好的交互在网页端[25] - 认为通过特效引流拉新不可持续,需要一茬茬寻找新用户,公司策略是将特效融入工作流,用特效拉新,再通过专业创作流程留住用户[25]
中国银河证券:传媒互联网子行业10月表现分化 AI应用生态构建进行时
智通财经网· 2025-11-19 10:23
文章核心观点 - 10月影视与游戏市场受高基数影响,收入同比有所回落,广告大盘则稳中向好,邮电通讯等行业增投显著,AI领域进展迅速,大模型正从技术竞争转向生态构建与场景渗透 [1] 影视行业 - 2025年10月全国电影票房26.12亿元(含服务费),同比下降27.94%,环比下降1.88% [2] - 影片《志愿军:浴血和平》单月票房达5.25亿,月票房占比达22.4%,为当月票房冠军 [2] 游戏行业 - 2025年9月国内游戏市场实际销售收入296.79亿元,同比下降2.13%,自研游戏海外市场收入16.21亿美元,同比下降4.82% [3] - 移动游戏收入214.88亿元,同比下降2.31%,客户端游戏收入70.09亿元,同比增长25.49% [3] - 腾讯《王者荣耀》《三角洲行动》《和平精英》《金铲铲之战》包揽中国iOS收入榜前四,共32家中国厂商进入全球发行商收入百强,合计收入19.5亿美元,占全球TOP100发行商收入的36.1% [3] 营销广告行业 - 2025年1-9月广告市场整体花费同比上涨3.5%,9月单月广告花费同比上涨12.7%,环比上涨0.7% [4] - 邮电通讯、个人用品、娱乐及休闲、IT产品及办公自助化服务行业刊例花费同比分别上涨78.9%、42.1%、38.9%和22.2% [4] - 药品、酒精类饮品及化妆品/浴室用品刊例花费同比分别下滑17.4%、12.7%和4.8% [4] AI领域 - OpenAI于10月发布Sora2、Sora App及浏览器智能体ChatGPT Atlas,谷歌推出Veo3.1并集成至Gemini生态 [5] - 国内DeepSeek推出DeepSeek-OCR仓库,聚焦视觉-文本压缩 [5] - AI产业正从模型能力竞争转向生态构建与场景渗透,视频生成、代码辅助、浏览器智能体等方向持续迭代 [5] 投资关注标的 - AI应用领域建议关注腾讯控股、阿里巴巴、快手-W、值得买、昆仑万维等 [6] - 游戏市场建议关注哔哩哔哩-W、巨人网络、吉比特、完美世界、三七互娱等 [6]
中金2026年展望 | 电信软件教育:AI惊喜不断,电信分红可期(要点版)
中金点睛· 2025-11-07 08:09
文章核心观点 - 2026年AI领域是软件行业最重要的增长点,AI基础设施(AI Infra)将保持高景气增长,头部大模型厂商的Token消耗预计各季度环比增长50%~70%以上 [2] - AI应用层出不穷,将不断刷新投资者认知并牵引对AI领域投入的预期上修,重点关注AI搜索、多模态、创新硬件、下一代交互等领域 [2] - 电信运营商步入5G后周期,资本开支下降支撑分红能力;数据中心步入业绩兑现期,受益于下游资本开支提升 [12][13][14] - “AI+教育”应用百花齐放,K12教培市场集中度提升,职业考试培训及技能教育板块的行业格局有望重塑 [15][16] AI基础设施(AI Infra) - AI Infra产业需求将持续超出市场预期,内部分工和层次将更加明显,算力管理层、模型管理层及应用层推理定向优化等领域可能出现新锐独立技术厂商 [2] - 为支持原生AI场景,支持Agent的云端沙盒环境E2B、边缘计算平台等机会有望涌现 [2] AI应用前景 - **AI搜索**:根据Gartner预测,到2026年25%的传统搜索流量将转向AI工具,新兴流量生态为GEO、流量代理、声誉管理等领域的新兴服务商留出发展空间 [4] - **多模态**:工业界多家模型厂商已实现小时级视频的理解和推理,为AutoEdit、AutoVlog等功能落地奠定基础;视频生成模型的可控性和一致性增强将打开数倍于当前的市场空间 [5] - **创新硬件**:AI原生硬件加速涌现,软硬耦合加速技术落地和商业转化,例如Plaud预计2025年年化收入达2.5亿美元,订阅收入占比超50%,海外用户订阅率超60% [6][7] - **下一代交互**:基于大模型的新一代语音交互扩展和普惠势不可挡,输入法这一工具型产品有望迎来洗牌 [8] - **智能座舱与驾驶**:2026年7B、4B乃至30B体量的端侧模型将进入舱内,支持舱内Agent等功能;外挂算力芯片的AI Box方案因有较好降本效果受到关注 [9] - **具身智能**:产业竞争更多转向“大脑”领域,加速向端到端机器人大模型探索,产业链从垂直整合走向分工协作 [10] - **B端AI落地**:国内B端AI应用企业2025年相关订单体量多在5亿元以内,收入贡献尚不彰显;海外SaaS厂商AI商业化进入加速阶段,2026年收入体现有望更清晰 [11] 电信服务 - 电信运营商收入端增速放缓,5G套餐渗透率超80%,但AI应用、物联网等对流量与ARPU的拉动或逐渐显现;资本开支进入下行周期,有望支撑公司分红能力 [13] - 数据中心厂商2025年加速交付,为2026年业绩兑现提供支撑;云厂商和互联网厂商对AI基础设施的投入持续,资本开支规划有望相较2025年持续加码 [14] 教育行业 - K12教培市场集中度持续向全国及区域龙头集中,尽管受新业务探索影响部分头部机构短期利润释放节奏放缓 [16] - 职业考试培训及技能教育板块,头部机构凭借教研、技术优势及数据积累逆境求变,通过AI产品拓展用户覆盖,行业格局有望重塑 [16] - 高等教育板块,政策端民办高校分类登记、营非选择推进进展偏慢,行业营利性转设出现积极信号 [16]
独家|LiblibAI融资1.3亿美金,红杉CMC领投
36氪· 2025-10-31 01:09
融资信息 - LiblibAI完成1.3亿美元B轮融资,由红杉中国、CMC资本及一家大厂战投联合领投,是今年截至目前中国AI应用领域公开的最大一笔融资[1] - 公司早期以1500万美元估值完成来自金沙江、高榕、源码的350万美元天使轮融资[2] - 公司在2024年经历困难后,于短短几个月内连续完成由明势资本、渶策资本、顺为资本领投的三轮总额超2000万美元融资[3] 业务发展与战略 - LiblibAI发布2.0版本,从模型社区进化为一站式AI创作Studio[1] - 公司整体业务尚未实现完全盈利[1] - 公司为赢得市场领先地位,在前期投入了300多万美元进行补贴大战[2] - 公司拒绝多个收购意向,其理念是“不是为了创业而创业,是为了赢而创业”[3] - 公司当前战略是“准备再囤个大几千万美金,为未来两三年做准备”[3] 行业竞争格局 - 在AI应用战局中,资本正以史无前例的速度聚拢,一个赛道只会留下一种声音[1][4] - 高昂的算力成本和投流成本意味着,一旦没有钱,就很难做出大批量服务[3] - 在Agent这一VC投资红海中,“钱是更大的壁垒”[1] - OpenAI发布的Sora让选择再次融资的LiblibAI更确信,如果不能更快变大,就没有机会[1] 公司历史与挑战 - 公司上线仅四个月后,于2023年9月因未完成大模型备案而被下架[2] - 到2024年3月,公司账上仅剩4000元人民币,当时估值3000万美元却无机构愿意投资[2] - 最后一家互联网战投提供了救命钱[3] - 濒临倒闭的经历一定程度改变了公司对融资的看法[3]
AI+系列报告十:从Sora看AI视频的昨天、今天和明天
招商证券· 2025-10-30 14:01
行业投资评级 - 行业评级:推荐(维持)[3] 核心观点 - Sora2的发布标志着AI视频行业迎来二次革命,其技术突破与社交功能的深度融合加速了C端应用的商业化进程[1][2] - AI视频技术催生了如"AI漫剧"等创新内容形态,这些形态具备"短平快"和低成本的特点,正引发行业供需爆发,为产业链带来新的受益机会[2][16][25] - 未来AI视频的发展将围绕三个核心方向:与社交互动深度融合、向集成化平台化演进、以及与AI Agent结合实现一站式创作,从而在影视、游戏、IP等领域进一步凸显赋能作用[7][17] 技术突破与行业变革 - Sora2在2025年9月发布,相比前代实现了三大技术突破:物理世界拟真度提升、支持多模态融合同步生成音频、以及具备初步的导演叙事与镜头调度能力[2][18] - Sora App的推出是颠覆性突破,支持用户二次创作和虚拟形象植入,具备"客串"和"混剪"功能,上线七天获得62.7万次iOS下载量,登顶美国App Store榜首[19][20][72] - 国内AI视频应用如快手的可灵、字节的即梦等产品迭代迅速,可灵AI已迭代至2.5 Turbo版本,累计生成超2亿个视频和4亿张图片,服务超过2万家企业客户[61][127] 创新内容形态与应用场景 - "AI漫剧"作为AI技术与动漫短剧融合的产物,以漫画、小说IP为基础,全流程由AI制作,集均时长8-10分钟,具备"短平快"特征[2][25][27] - 腾讯动漫上线的AI漫剧《传武》和《我的治愈系游戏》由7人核心团队借助即梦AI制作,20多集耗时一个月,上线4天播放量破千万[16][25][88] - AI短剧同样表现亮眼,如68集真人短剧《奶团太后宫心计》累计播放突破2亿,首部付费AI短剧《兴安岭诡事》上线21小时播放量破千万,抖音端收益超30万[25] - 2025年上半年漫剧供给量以83%的复合增长率扩张,近半年上线漫剧3000部,环比增长603%,播放量实现92%的复合增长[27] 未来发展趋势 - AI视频将与社交互动深度融合,加速消费级应用落地,Sora App的快速普及印证了产品化对C端商业化的重要性[7][72] - ChatGPT正向生态系统演进,宣布向第三方应用全面开放,AI视频工具有望接入实现集成化和平台化,从简单工具转向"生成-分发-变现"全链路平台[7][75][76] - AI视频与AI Agent结合趋势凸显,可一站式解决脚本生成、文生图、图生视频等全流程需求,如美图公司的RoboNeo上线首月MAU破百万[7][80] 行业赋能与投资机会 - 在影视行业,AI视频技术显著降本提效,如AI动画《一品布衣》单集制作周期从传统30天压缩至3天,效率提升超90%,人力成本节省96%,单分钟成本从5万元降至3000元[93] - 在游戏领域,AI技术革新创作流程,Unity报告显示2024年有96%的游戏工作室在工作流程中使用AI,较2023年的62%大幅提升,AI赋能从美术资源生成到玩法创新[107][108] - 在IP领域,AI视频加速IP可视化,将改编周期从数月缩短至数天,并打破官方生产模式,让粉丝成为共同创作者,如Vidu发起的动画西游改编大赛掀起全民二次创作浪潮[112][116] - 谷子经济市场规模持续增长,2024年达1798.8亿元,预计2027年突破3000亿元,AI技术可快速生成角色3D模型,助力IP衍生品开发效率提升[112][119][120] 相关标的公司 - 腾讯控股:混元大模型实现多模态能力全覆盖,HunyuanImage 3.0成为最强大开源图像生成模型,全面赋能游戏、广告等核心业务[126][127] - 快手:可灵AI迭代至2.5 Turbo版本,2025年Q2单季营收达2.5亿元,与《逆水寒》合作生成角色特效,提升玩家创作体验[61][127] - 哔哩哔哩:自研AniSora V3等开源视频生成模型,赋能动漫等多场景,推出AI原声翻译功能提升内容可及性[8][51] - 美图公司:自研视觉大模型MiracleVision4.0,上线AI Agent RoboNeo,支持自然语言指令完成全场景任务[8][80] - 阅文集团:拥有海量网文IP储备,推出AIGC工具"漫剧助手"提升IP改编效率,开放十万部精品IP供AI漫剧创作[8][27]