Workflow
多模态
icon
搜索文档
为什么是这10个词,定义了2025年AI叙事
钛媒体APP· 2025-12-31 08:05
文章核心观点 - 2025年是AI技术从理论走向深度应用与产业爆发的关键一年,AI从聊天工具演变为具备深度推理能力的智能体,并驱动了从大模型竞争到算力军备竞赛的全面变革 [2] - 行业竞争格局被打破,以DeepSeek为代表的国产力量崛起,改变了OpenAI旗下ChatGPT独步全球的局面,将竞争焦点引向应用推理效率与算力估值 [2] - 每一个年度热词都标志着人类向通用人工智能(AGI)迈进的坚实步伐 [2] AI技术演进与能力突破 - **多模态能力爆发**:AI拥有了视听感官,从演示阶段走向成熟应用,例如Sora 2.0、Veo 3等模型生成的视频画质可媲美电影,并应用于视频游戏交互场景 [4] - **端侧多模态受青睐**:苹果与高通发布AI芯片,使AI能在手机端离线运行;植入AI眼镜的摄像头可借助多模态实时分析环境并提供语音服务 [4] - **推理能力质变**:“推理”指大模型通过强化学习和思维链获得慢思考与自我纠错能力,例如DeepSeek-R1、OpenAI o3/o4-mini模型在AIME等逻辑测试中逼近满分 [7] - **智能体(Agent)成为核心**:2025年被视为“智能体元年”,以Agent为核心的系统化AI被公认是释放生产力的关键,AI初创公司Manus凭借通用任务处理能力迅速实现1亿美元年度经常性收入 [12] 关键参与者与市场格局 - **OpenAI保持技术灯塔地位**:尽管面临竞争,其估值增长迅猛,3月完成软银领投的400亿美元融资后估值达3000亿美元,9月在迪士尼10亿美元股权投资后估值冲上5000亿美元,成为全球估值最高独角兽 [8] - **ChatGPT维持领先地位**:完成从聊天工具到全能交互中心的跨越,依旧是全球用户规模最大的AI应用,周活跃用户数突破8亿,付费用户数突破2000万 [5] - **DeepSeek成为最大黑马**:凭借DeepSeek-R1模型以不足30万美元的训练成本实现比肩国际顶尖模型的能力,其独特的MLA架构与FP8混合精度训练大幅拉低了大模型推理成本 [9] - **英伟达巩固算力霸主地位**:作为AI经济的核心与地缘政治杠杆,其Blackwell架构芯片(如GB200/GB300)大规模量产,占据高端GPU出货量的80%以上,并于10月成为全球首家市值突破5万亿美元的公司 [2][6] 算力基础设施与供应链 - **GPU成为硬指标**:几乎所有AI重大突破都建立在GPU供给之上,围绕GPU供应链安全、自研AI芯片和国产替代的讨论成为高频话题 [2] - **算力竞争白热化**:英伟达Blackwell执掌霸权,AMD凭借MI325X和MI350系列强化在推理市场的贡献 [10] - **国产算力崛起**:迎来上市元年,摩尔线程和沐曦股份已登陆科创板,壁仞科技即将冲击港股,标志着国产算力迈向商业化量产拐点 [10] 前沿应用与产业融合 - **机器人站上风口**:因“具身智能”而兴起,从年初宇树科技等人形机器人亮相春晚完成复杂歌舞,到年底英伟达发布开源VLA模型Alpamayo-R1,机器人已成为集成物理AI、具备多模态感知与自主决策能力的实体 [11] - **Agent验证商业前景**:Meta收购Manus,验证了Agent技术的巨大商业潜力,为年度AI热点画上句号 [12]
跨年行情还看AI?创业板人工智能ETF(159363)创收盘新高!标的指数年内猛涨超107%大幅领跑
新浪财经· 2025-12-30 20:16
市场行情表现 - 2025年12月30日,创业板人工智能指数反弹1%,成份股大面积上涨 [1][7] - AI应用板块涨幅居前,蓝色光标领涨7%,易点天下、汉得信息涨超3% [1][7] - 算力板块中,协创数据涨超5%,光模块CPO龙头中际旭创涨超2%,润泽科技、北京君正、锐捷网络等多股涨超1% [1][7] - 热门ETF创业板人工智能ETF(159363)场内收涨1.12%,收盘价0.993元创历史新高,全天成交超5亿元,资金单日净申购3600万份 [1][7] 指数年度复盘与比较 - 截至2025年12月30日,创业板人工智能指数年内涨幅高达107.21%,实现翻倍增长 [3][9] - 该指数年内表现大幅领跑其他同类AI主题指数,人工智能指数涨80.64%,CS人工智指数涨69.09%,科创AI指数涨50.75% [3][10] - 创业板人工智能指数2020至2024年的年度涨跌幅分别为20.1%、17.57%、-34.52%、47.83%、38.44% [3][10] AI应用领域动态与观点 - AI应用板块可能受Meta以数十亿美元收购开发AI应用Manus的公司“蝴蝶效应”所催化,此为Meta成立以来第三大收购 [4][11] - 在Meta收购前,Manus正以20亿美元估值进行新一轮融资 [4][11] - 长江证券指出,2026年大模型景气度确定性较高,to C侧流量入口争夺是明年AI应用核心看点,同时多模态有望迎来爆发,继续看好国产AI产业链 [4][11] - 华龙证券认为,在政策支持下AI产业有望持续良性发展并赋能千行百业,资本市场加持有望加速国产AI创新周期 [4][11] - 华福证券也表示看好国产AI应用领域的爆发 [4][11] 算力领域动态与观点 - 国盛证券建议随着年末临近回归业绩主线 [4][11] - 在算力产业链高景气周期下,光模块头部厂商正在大陆和泰国加速扩产 [4][11] - 国盛证券预计光模块行业将在2026年一季度迎来产能集中释放,驱动业绩进入新一轮爬坡期,并继续看好算力板块,坚定推荐算力产业链相关企业如光模块行业龙头 [4][11] 相关投资产品概况 - 创业板人工智能ETF(159363)是全市场首只跟踪创业板人工智能指数的ETF,其场外联接基金为A类023407、C类023408 [5][12] - 该ETF标的指数重点布局光模块龙头“易中天”,光模块含量最新超56% [5][12] - 从赛道分布看,该ETF逾七成仓位布局算力,超两成仓位布局AI应用 [5][12]
从大厂设计师到超级一人公司:6000字回顾我和AI的2025
歸藏的AI工具箱· 2025-12-30 18:34
作者个人转型与业务模式 - 作者身份从大厂设计师转变为自由职业者,专注于将“歸藏”打造成一个可持续输出、有收入并能帮助行业朋友的“超级一人公司”[4] - 作者强调在AI加持下,个人能力边际得到提升,使得一人运营多个平台成为可能[19][20] AI自媒体运营与成果 - 在即刻平台拥有近25,000名粉丝,被视为相当高的粉丝量[6] - 在Twitter平台粉丝量达到11万,作者认为该平台是获取AI行业前沿信息的关键渠道[10][12] - 微信公众号粉丝量从年初的1万多增长至约7.8万,目标是达到10万以上[16] - 开始制作视频内容,在抖音、小红书、视频号等平台取得良好数据表现,包括数十万至上百万的播放量[17] - 作者认为AI洗稿能力提升导致图文内容商业价值下降,视频内容成为重要方向[17] AI社群运营与活动 - 运营付费AIGC周刊社群,会员数量(含续费)达到约2000个,被认为是中国规模较大的AI社群之一[28] - 探索新的社群推广模式,在销售社群会员的同时,联合推广国产AI产品,帮助创业者提升销售额[24][30] - 在11月初的大型活动中,与超过30个AI产品的负责人进行沟通协作,并独立负责营销方案制定和抽奖等环节[29] AI创作内容与趋势 - 在图像与视频生成领域产出大量内容,是作者涨粉最多的领域[34] - 推动“Vibe Coding”(通过自然语言生成网页)概念的普及,相关提示词被广泛引用[34] - 关注并产出关于AI Agent、MCP(模型上下文协议)等周边服务的内容[35][36] - 强化学习在工具使用及编程领域的应用,是推动2025年AI进入新阶段的关键技术之一,极大地促进了Vibe Coding和Agent工具的爆发[53] - 多模态能力的爆发是另一关键技术突破,体现在图像、视频、音频的理解与生成质量飞速提高,例如Sora 2、Veo 3.1、Nano Banana Pro、Seedream 4.0等模型[55][56] 关注的AI产品与公司 - **Medeo**:一款支持多模型、可通过自然语言进行视频编辑的AI Agent[44] - **Youware**:一个Vibe Coding工具及社区,允许用户通过自然语言创建并分享网页[46] - **Listenhub**:一个从AI音频平台进化为全面的AI创作平台,支持声音克隆、AI播客、PPT和视频生成[47] - **Chatwise**:一个整合各平台模型优势并支持工具调用的产品,让用户能简单构建Agent[58][62] - **Manus**:被认为是第一个展示通用Agent形态的产品,在Agent交互和构建方法上给行业带来启发[60] - **Claude Code**:在推动AI编程落地和人机融合工作方法上被认为具有天才设计[60] - **AI Studio的Build模式**:谷歌整合其AI模型能力的产品,几乎完全用AI模型替代后端,尤其在Gemini 1.5 Pro更新后优势凸显[61][63] 对2026年AI行业的展望 - 强化学习应用将继续进化,例如Gemini 3 Pro和Flash模型的进展[67] - 大型算力中心(如OpenAI的Stargate)建设完成,将催生更强大的模型[67] - 期待视频生成领域出现“Nano Banana Pro时刻”,即实现全面的理解、编排及编辑能力[67] - Vibe Coding将在2026年迎来其“DeepSeek时刻”,实现极大的破圈[67] - Agent产品的发展将更侧重于垂直领域,而非通用Agent[67] - 随着工具调用和上下文管理技术的突破,2026年Agent领域可能还有一次突破[68]
a16z 年终复盘:消费 AI 赢家通吃,2026 机会在这 3 个口子
36氪· 2025-12-30 08:42
消费级AI市场格局与赢家通吃现象 - 2025年消费级AI市场热闹程度前所未有,各大公司频繁发布新产品[1] - OpenAI将ChatGPT打造成集对话、图像、群聊、Sora视频于一体的超级入口[1] - Google、Anthropic、Grok等公司也在积极争夺入口,产品如Nano Banana、Veo轮番刷屏[1] - 尽管产品发布很多,但真正改变用户习惯的并不多[2] - ChatGPT周活跃用户达到8-9亿,而Gemini的活跃用户仅为ChatGPT的三到四成[2] - 访问过多个AI平台的用户不到10%,愿意同时为多个AI服务付费的用户只有9%[2] - 大多数人只使用一个AI工具,市场呈现出赢家通吃的格局[2] AI创业的潜在机会与战略方向 - 2026年AI创业仍有机会,关键不在于模型能力,而在于三个突破口[3] - 第一个突破口是做对产品,包括打造爆款样式和打通多模态路径[4] - 第二个突破口是抓住用户,专注于服务专业用户的深水区需求[4] - 第三个突破口是避开大厂,利用其算力负担和组织盲区[4] - 成功的关键不依赖模型能力取胜,而是依靠产品更懂用户[5] 突破口一:用爆款样式降低创作门槛 - 用户沉迷于AI的核心是创作,而非聊天[6] - 2025年最疯传的AI产品是那些能立即产出成果的、风格鲜明的图像或视频,如OpenAI的Ghibli风格图像和Google的Nano Banana[6] - 这类产品的核心是“用模板降门槛”,通过提供设计起点(如节日卡片、素描头像示例)让用户无需思考从何开始[6] - 初创公司如Krea,通过让用户保留并复用角色、风格素材来提升体验[6] - 产品的难点在于美学、构图和文化感,风格样式比技术更有记忆点[6] - 爆款模板样式正变得更智能,例如Nano Banana Pro能根据视频自动生成信息图、市场地图及搭配图标配色[7] - Claude的artifacts功能允许用户编辑生成内容的风格与结构[7] - 图像/视频模型的下一步发展方向是让用户能随意切换风格样式,重新定义创作起点[8] 突破口二:用多模态打通创作路径 - 多模态AI能力有潜力重构整个创作流程,并成为新的产品入口[9] - 社交媒体上约一半内容已是AI生成视频,如Veo和Sora,它们能理解故事结构、保持人物一致性并模仿节奏风格[9] - 多模态AI能处理混合输入并生成多样化输出,例如根据YouTube视频生成讲解图,或根据品牌网站链接生成完整广告提案[10] - AI工具正从问答助手转变为搭建产品的创作工具,能够处理旧照片、网页、语音笔记等输入,生成图像、短视频、幻灯片等可直接发布的内容[10] - Google内部实验产品Pamelli能自动拉取网站内容,识别品牌定位,并生成三组完整的营销素材[10] - 这种能力直接交付成品,是模型与用户之间最短的距离,能自然成为工作流的起点[11] - 多模态能力正在打破内容创作边界,Claude支持图像文本混合输入,Sora和Veo支持视频加语音提示编辑[12] - 2026年的爆点可能不是新模型,而是新的能力组合,关键在于让用户少操心、少切换、直接拿到结果[12][13] 突破口三:抓住专业用户的深水区 - 消费级AI产品中,用户越用越舍得花钱,存在持续付费的群体[14][15] - 付费主力是真正将AI作为日常工具的专业消费者,如运营、编辑、自由职业者和创作者,他们是过去一年增长最快的群体[16] - 专业用户使用的不是基础版ChatGPT,而是更专业的工具,例如:Perplexity的Comet浏览器(自动整理资料)、11 Labs Reader(文章转语音)、Granola(自动记录整理会议)、Cursor(代码编辑器内调用AI)、Gamma(文档生成幻灯片)[17][18] - 这些工具的共通点是“有记忆”,能基于用户历史行为继续工作,例如ChatGPT的连接器功能可读取日历、邮箱并自动总结建议[18] - 关键特征是每天都要用,例如有用户平均每周使用ChatGPT约24次(即每天三到四次),远高于普通工具用户的每周1-2次[19] - 争夺高频、深度、持续付费的专业用户是下一阶段消费AI的关键战场[19] - 专业用户一旦依赖某个工具,切换成本极高[20] 初创公司与大厂的竞争态势 - 大厂产品更新飞快,例如OpenAI推出了Sora、群聊、Pulse、图像工具、浏览器Atlas和应用商店;Google推出了大量Gemini相关试验功能;Anthropic上线了Claude的artifacts、skills和Claude Code[21][22] - 但大公司在消费端尝试了几十个方向,真正留下来的产品不多[23] - 一些AI初创公司虽然功能简单,但用户认可度高,例如Comet浏览器的日活和留存高于ChatGPT的Atlas,Lovable在生成特定类型应用上做得特别好上手[24] - 初创公司的共同特征是聚焦一个场景,做得够深、够具体[25] - 大厂需要服务亿级用户、保障合规、兼顾平台,而初创公司可以专注于抢占一个高频小场景并将其做透[25] - 大公司有算力分配的隐形负担,火爆的应用可能消耗大量推理资源,拖慢下一代大模型的训练计划[26] - 初创公司没有此问题,可以灵活选用Claude、GPT、Gemini或本地模型,专注于即时满足用户需求[27] - 在应用层,初创公司无需与大厂正面对抗,只要做出真正好用的产品就能留住用户[27] - 新一代创业机会在于,在模型能力已足够的前提下,做出能落地、可复用、有用户粘性的前端产品[27] - 比起做下一个ChatGPT,不如先做好一个ChatGPT做不好的产品[27] 2026年消费级AI的发展总结与展望 - ChatGPT已占据入口,模型能力足够,接下来的机会在于做出用户离不开的产品[28] - 产品方向总结为三点:样式要现成以降低用户启动门槛;路径要打通以实现从想法到成品的无缝衔接;深度要够以吸引专业用户每日使用并持续付费[28] - 大厂在抢入口,初创公司可以抢方向,聚焦并做深一个具体场景[28] - 模型能力属于大厂,但用户归属尚未定论,产品不必大,只要准,现在是创业者该出手的时候[28]
字节原动力大会点评:产业落地高速增长,Agent能力开放有望带动云持续高增
东方证券· 2025-12-24 18:42
报告行业投资评级 - 行业评级为“看好”(维持)[5] 报告的核心观点 - 报告认为,火山引擎Force原动力大会显示AI产业落地正日益深化,模型能力持续升级,特别是多模态理解与Agent能力的提升,有望通过供给升级进一步带动需求,并看好通用Agent平台对下游云服务上量的带动作用[2][8] - 报告持续看好多模态乃至全模态的技术路径迭代[8] 根据相关目录分别进行总结 投资建议与投资标的 - 看好具备硬件-研究-模型-应用场景全栈AI路径的科技大厂,相关标的包括阿里巴巴-W(09988,买入)、谷歌-A(GOOGL.O,未评级)[3] - 看好多模态相关产品,因其兼容B/C端用户且商业化场景明确、增长确定性高,建议关注快手-W(01024,买入)、美图公司(01357,买入)[3] - 重视其他具备模型能力的厂商及相关产业链,以及受益于底模能力迭代、下游应用场景体验改善的标的,包括腾讯控股(00700,买入)、同道猎聘(06100,未评级)、北森控股(09669,未评级)[3] 行业动态与数据表现 - 截至12月,豆包大模型日均Tokens使用量已突破50万亿,较9月的30万亿增长67%,居中国第一、全球第三[8] - 目前已有超过100家企业在火山引擎上累计Tokens使用量超过一万亿[8] - 从中国公有云大模型调用量份额看,火山引擎以49.2%位居第一,较2024年的46.4%提升2.8个百分点[8] - Tokens使用的增长意味着下游场景应用持续上量,AI产业落地正日益深化[8] 模型能力升级 - 发布豆包大模型1.8,其多模态理解能力大幅提升,可以低帧率理解超长视频,广泛应用于在线教育、安全巡检、产品质检等场景[8] - 豆包大模型1.8具备更强的Agent能力,提升了模型对复杂任务的规划和执行能力[8] - 豆包大模型1.8拥有更灵活的上下文管理,在通用智能体测评集BrowserComp中取得全球领先成绩[8] - 发布Seedance 1.5 pro,具备音画同步、多人多语言对白配音功能[8] - Seedance 1.5 pro的Draft样本功能可通过低分辨率输出预览加最终高分辨率成片,帮助创作者减少60%的无效创作成本[8] - 模型能力作为供给侧核心,是持续带动需求扩容的关键[8] 云服务与平台发展 - 火山引擎提供AI云原生全栈服务,在MaaS(模型即服务)上推出企业自有模型的推理代工服务、强化学习平台,以帮助企业实现成本端稳定可控[8] - 面向Agent开发和运营,火山引擎发布了企业级AI Agent平台AgentKit和HiAgent “1+N+X”智能体工作站[8] - 火山引擎通过系列通用智能体,将大量共性的业务能力和经验以开箱即用的方式开放给企业,有望进一步带动下游云服务上量[8]
Omdia发布《2025全球企业级MaaS市场分析》,火山引擎名列全球第三
21世纪经济报道· 2025-12-24 15:24
全球MaaS市场竞争格局 - 截至2025年10月,OpenAI和Google Cloud分别以近70万亿和43万亿的日均Tokens调用量,排名全球MaaS服务市场前两位 [1] - 中国云厂商火山引擎日均Tokens调用量超30万亿,名列全球第三,市场份额达到15% [1] - 三家厂商合计占据全球MaaS市场65%的份额 [1] 市场增长与财务表现 - MaaS服务已成为增长最快、毛利最高的AI云计算产品 [4] - 截至今年12月,火山引擎豆包大模型日均调用量已突破50万亿Tokens,比10月数据增长66.7%,相比去年同期增长超十倍 [4] - 通过技术创新,大模型在提供高性价比服务的同时也有着较好的毛利,其毛利水平远远优于IaaS等传统云产品 [4] 技术演进与应用场景拓展 - 头部模型厂商重点发力多模态和Agent能力,最新旗舰模型GPT-5.2、Gemini 3.0和豆包1.8均为多模态大模型,原生支持图像等视觉理解 [4] - 模型通过强化工具调用和多轮指令遵循等能力,拓展了在具身智能、智能硬件、产品质检、软件服务等应用场景 [4] - 在客服场景中,AI客服已能从拟人对话升级为可推荐购物链接、自主完成工单客诉等一系列Agent任务,带动模型Tokens调用量成倍增长 [4] 细分市场亮点与未来展望 - 图像和视频创作模型(如Nano Banano和豆包Seedream4.0)达到生产级应用水平,大幅降低了短剧、漫剧、PPT制作、海报制作的门槛 [5] - 模型厂商和云厂商正在加速模型迭代并完善AI云基础设施,预计2026年全球MaaS市场增速还将进一步扩大 [5]
QuestMobile2025下半年AI应用交互革新与生态落地报告:头部梯队玩家快速变化,垂直赛道新秀迭出,三层渗透实现集团化复用
36氪· 2025-12-23 10:28
AI应用行业活跃用户格局 - 截至2025年12月08日至12月14日统计周期,AI原生APP周活跃用户前三名为豆包(1.55亿)、DeepSeek(8156万)、元宝(2084万)[1] - 蚂蚁阿福、千问、豆包爱学位居第二梯队,周活跃用户量分别为1025万、872万、722万[1] 2025下半年AI产业投融资趋势 - 2025年7月至11月,AIGC产业共完成186起投融资事件,总金额达336.7亿元,较上半年增长20.8%[1][4][7] - 投资逻辑由“投模型”转向“投应用”,下游应用层投融资事件占比接近50%[4][7][9] 大模型技术发展路径与模态竞争 - 截至2025年11月,8个主流厂商合计推出409个大模型,其中单模态、多模态和全模态占比分别为61.4%、36.7%、1.9%[1][4][14] - 多模态交互已成为主流,在多模态大模型中,“多模态输入”到“单模态输出”的组合占比高达73.3%[1][4][18] - 全模态大模型强调“原生统一架构”,是AI走向通用智能的关键路径,百川智能、阿里巴巴、百度集团已进入全模态布局阶段[12][16][22] AI应用落地形态与热门赛道 - 2025年7月至11月,新上线AI应用超过200款,其中应用插件、PC网页端、AI原生APP的形态占比分别为81.5%、10.7%、7.8%[2][4][29] - 应用方向上,AI图像处理(24.9%)、AI专业顾问(18.5%)、AI效率办公(6.8%)、AI社交互动(5.9%)、AI文案写作(5.9%)是主要垂直赛道[2][31] 头部互联网公司AI应用表现与战略 - 腾讯将元宝嵌入微信、QQ等全场景应用矩阵,基本完成腾讯系全场景应用内嵌[2][51] - 蚂蚁集团旗下蚂蚁阿福App上线五个月,周活跃用户达1025.4万,位列AI原生APP榜单第四及下半年新上线原生App第一[2][5][38] - 蚂蚁集团新应用“灵光”自11月18日上线至12月14日,日活跃用户规模实现7倍增长,周活跃用户达295.2万[2][5][42] - 互联网企业采用“通用AI应用先行先试”策略,验证后将AI能力反向嵌入生态产品,实现集团级规模化复用,代表公司有腾讯、百度、阿里[5][46][48] 手机厂商的GUI智能体发展方向 - 国内手机厂商以“看屏+点屏”的GUI智能体为主流方向,旨在系统性解决App长尾操作痛点[5][52] - GUI智能体负责“落地执行”,与手机AI助手、工具类AI应用协同,实现从“用户说需求”到“手机自动完成任务”的完整链路[5][53] - GUI智能体的发展水平将决定AI手机能否实现“跨App无感串联”的稳定日常体验[5][56]
QuestMobile2025下半年AI应用交互革新与生态落地报告:头部梯队玩家快速变化,垂直赛道新秀迭出,三层渗透实现集团化复用
QuestMobile· 2025-12-23 10:02
2025下半年AI应用行业核心观点 - 行业处于高景气度,资本逻辑从“投模型”转向“投应用”,下半年投融资活动显著升温,应用层成为资本关注焦点 [4][8][10] - 技术发展路径从单模态走向多模态,并探索全模态,多模态交互已成为主流范式,是驱动应用创新和体验升级的关键前提 [4][8][17][31] - 市场竞争呈现体系化与生态化特征,头部互联网公司凭借技术、用户和生态优势,通过“通用应用先行、反向生态赋能”策略实现规模化复用 [5][8][9][53] - 应用落地呈现百花齐放格局,插件是主要形态,垂直场景应用成为重要突破口,新上线原生应用在细分领域展现出强劲增长活力 [5][8][34][45] 行业投融资趋势 - **投融资规模与活跃度**:2025年7月至11月,AIGC产业共完成186起投融资事件,总金额达336.7亿元,较上半年增长20.8% [4][8][10] - **投资偏好转移**:资本偏好从产业链中游(大模型开发)向上游基础设施及下游行业解决方案转移,应用层融资事件占比接近每月总量的50% [8][13] - **驱动因素**:下半年商业模式与技术落地路径逐步清晰,市场信心走强,应用层更契合资本对投资回报的诉求 [10][13] 技术发展:从单模态到全模态 - **模型格局**:截至2025年11月,8个主流厂商共推出409个大模型,其中单模态、多模态、全模态占比分别为61.4%、36.7%、1.9% [4][8][19] - **多模态交互主流化**:在多模态模型中,“多模态输入>单模态输出”的组合占比最高,达73.3%,表明技术更擅长从复杂信息中提炼单一结果 [4][8][23] - **全模态探索**:全模态大模型强调原生统一架构,旨在实现“感知-理解-推理-生成”一体化,是AI走向通用智能的关键路径,百川智能、阿里巴巴、百度等已开始布局 [17][19][21][27] - **厂商技术侧重**:部分厂商在多模态领域占比突出,如抖音集团、智谱、月之暗面旗下多模态大模型占比分别达68.4%、47.1%和45.5% [21] 应用落地与市场格局 - **应用上线情况**:2025下半年共上新205个AI应用,其中插件形态占比81.5%,PC网页端占10.7%,原生APP占7.8% [5][8][34] - **热门应用方向**:新上应用中,AI图像处理、AI专业顾问、AI效率办公、AI社交互动、AI文案写作是主要方向,占比分别为24.9%、18.5%、6.8%、5.9%、5.9% [5] - **头部应用表现**: - 截至统计周期(12.08-12.14),AI原生APP周活跃用户前三名为:豆包(1.55亿)、DeepSeek(8156万)、元宝(2084万)[3] - 蚂蚁阿福、千问、豆包爱学位居第二梯队,周活跃用户分别为1025万、872万、722万 [3] - 下半年新上线原生APP中,蚂蚁阿福(周活1025.4万)和灵光(周活295.2万)表现最为突出,分别位列榜单第一、第二 [8][46] - **垂直应用增长**:垂直场景应用增长迅速,例如蚂蚁的灵光APP自11月18日上线至12月14日,日活跃用户实现7倍增长 [5][49] 抖音旗下的小荷AI医生在医疗垂直领域也有不错表现 [46][51] 互联网公司生态化竞争策略 - **通用应用先行先试**:腾讯、百度、阿里等集团采用通用AI应用先行策略,在验证场景和积累用户后,将其反向嵌入自有生态产品中,实现集团级规模化复用 [8][9][53] - **产品命名与认知统一**:通过标准化命名(如百度“文心助手”、阿里“千问”)统一用户认知,强化产品心智,并内嵌于多个核心APP中 [55] - **生态整合案例**:腾讯“元宝”已基本完成在微信、QQ等全场景应用矩阵的内嵌 [5][57] 阿里“千问”内嵌于夸克、高德地图等应用 [55] 终端厂商:GUI智能体与交互变革 - **交互方向**:国内手机厂商以“看屏+点屏”的GUI(图形用户界面)智能体为主要发展方向,旨在系统性解决APP长尾操作痛点 [9][60] - **角色定位**:GUI智能体负责“落地执行”,与手机AI助手、工具类AI应用协同,完成从“用户说需求”到“手机自动完成任务”的完整链路 [11][62] - **发展目标**:推动交互从“App主导”转向“Agent主导”,最终实现“跨App无感串联”的智能体验 [59][67] 市场赛道与竞争态势 - **头部赛道特征**:AI搜索与AI综合助手已形成近7亿用户规模的流量池,但新玩家仍在突破入局,表明赛道兼具规模壁垒与增量空间 [36] - **垂直赛道机会**:垂直应用通过聚焦细分场景的专业价值与多模态交互重构体验,找到了差异化发展路径,例如AI专业顾问(特别是医疗)、AI图像处理等 [36][47] - **竞争焦点演进**:行业竞争正从技术赋能向体验升级和生态整合演进,未来将更聚焦于功能创新与用户体验的精细化博弈 [36][38][39]
争夺“大模型第一股”,智谱向左、MiniMax向右
钛媒体APP· 2025-12-23 09:50
公司概况与上市背景 - 智谱AI与MiniMax(上海稀宇科技)同属“大模型六小龙”,在几天内先后通过港交所上市聆讯并披露招股书,首次公开了国内头部大模型公司的商业与财务细节 [1] - MiniMax成立于2021年,创始人闫俊杰为中科院博士,曾任商汤科技副总裁,公司累计融资超15.5亿美元,投资方包括红杉中国、高瓴、腾讯、IDG等一线机构 [2][3] 战略路径与商业模式 - MiniMax选择了“多模态+重产品”的激进战略,同时布局文本、语音、图像、视频等多个模态的研发,并重点开发面向全球用户的C端应用 [2][3] - 智谱AI则更偏向“技术驱动”,专注于底层大模型能力与开发者生态,商业模式以服务B端客户为核心 [18] - 这种差异导致两家公司收入结构不同:MiniMax收入主要来自AI原生产品(C端),而智谱AI收入主要来自面向企业的本地化部署和MaaS平台服务 [7][18][19] 财务表现:收入与增长 - MiniMax近三年零九个月累计营收8742万美元(约合6.2亿元人民币)[1] - 公司收入增长迅猛:2023年总收入346万美元,2024年增至3052.3万美元,同比增长782.1%;2025年前九个月收入达5343.7万美元,同比增长174.8%,已超2024年全年 [9] - 收入结构发生显著切换:2023年C端应用收入仅占21.9%,企业服务占78.1%;到2024年,C端应用收入占比增至71.4%,成为增长主力 [11] - 具体产品中,Talkie/星野在2024年创造1945.8万美元营收;海螺AI在2025年前九个月收入1746.4万美元,营收占比达32.6% [11][12] 财务表现:亏损与成本 - MiniMax近三年零九个月累计净亏损达13.2亿美元(约合92.9亿元人民币),超过智谱AI同期累计亏损的62亿元人民币 [1] - 净亏损持续扩大:从2022年的7372.8万美元激增266%至2023年的2.7亿美元,2024年增至4.7亿美元,2025年前九个月已达5.1亿美元,超过2024年全年 [14] - 巨额亏损主要源于大模型和AI基础设施的前期高投入(算力、人才、数据)以及金融负债公允价值变动带来的账面亏损 [14] - 研发是核心成本:公司员工约385人,其中研发团队近300人,占比近八成;近四年研发总投入近4.5亿美元,2025年前九个月研发投入为1.8亿美元 [15] 用户与客户数据 - C端用户规模快速扩张:AI原生产品的平均月活用户(MAU)从2023年的310万增长至2024年的1910万,2025年前九个月进一步增至2760万,累计用户已超2.12亿 [12] - C端付费用户数从2023年的12万增长至2024年的65万,2025年前九个月达到177万 [12] - 企业服务付费客户数从2023年的约100家增长至2024年的约700家,2025年前九个月已达约2500家 [11] 盈利能力与毛利率 - MiniMax整体毛利率从负值快速提升:2024年为12.2%,2025年前九个月增长至23.3% [20] - 但分业务看毛利率差异巨大:AI原生产品业务在2024年毛利率为-8.1%,2025年前九个月才勉强转正至4.7%;而开发者和企业服务收入的毛利率一直稳定在60%-76%之间 [21] - 作为对比,智谱AI的毛利率从2023年的64.6%下降至2025年上半年的50%左右,主要因云端MaaS平台收入占比提升 [19] 市场布局与竞争 - MiniMax高度依赖海外市场,2025年前九个月来自海外市场的收入占比已超过70% [17] - 公司在多模态各细分领域面临专业型竞争对手,如文本领域的ChatGPT、文生图领域的Midjourney等 [8] - 第三方排名显示差异:智谱AI在2024年中国大语言模型开发平台市场收入排名第二;MiniMax在2024年全球基于模型的收入排名第十,在pureplay大模型独立公司中排名第四 [23] 发展挑战与潜在风险 - “多线作战”导致成本压力巨大,每条技术路线都需长期算力、数据与人才投入,管理难度更高 [8] - 真正的跨模态理解与生成仍是全球技术难题,尚未形成统一稳定的技术路径 [8] - 2025年9月,MiniMax因视频生成产品“海螺AI”被迪士尼等公司起诉,指控其生成受版权保护内容,原告索赔最高7500万美元,这可能对其海外业务构成潜在影响 [16][17]
活动报名:25 年一二级市场年终复盘和 26 年展望|42章经
42章经· 2025-12-21 21:32
活动背景与形式 - 该讨论会由深耕国内一级市场的资深人士与熟悉硅谷二级市场的资深从业者共同主持[3] - 自2023年底起保持每隔几个月复盘一次AI市场的节奏 通过跨视角对照碰撞出超前且准确的结论[5] - 过去一年已录制三期相关播客 主题涵盖二级市场热潮、硅谷AI转向及AI泡沫探讨[5] - 自2024年秋季起 将季度复盘延伸为更小范围、更高密度的线上讨论会形式[5] - 每期活动由多位长期研究产业与投资的朋友共同主持 围绕近期重点主题进行小范围交流[5] 活动核心议题与展望 - 2025年末场活动旨在对当年一、二级市场进行复盘 并对2026年进行展望[6] - 计划共同探讨今明两年的AI关键词 包括Agent、多模态、AI硬件、具身智能、自动驾驶、大模型泡沫、OAI下一个观测点以及港股模型上市[6] - 活动时间定于北京时间2025年12月27日上午11:00[7]