Workflow
多模态
icon
搜索文档
从大厂设计师到超级一人公司:6000字回顾我和AI的2025
歸藏的AI工具箱· 2025-12-30 18:34
作者个人转型与业务模式 - 作者身份从大厂设计师转变为自由职业者,专注于将“歸藏”打造成一个可持续输出、有收入并能帮助行业朋友的“超级一人公司”[4] - 作者强调在AI加持下,个人能力边际得到提升,使得一人运营多个平台成为可能[19][20] AI自媒体运营与成果 - 在即刻平台拥有近25,000名粉丝,被视为相当高的粉丝量[6] - 在Twitter平台粉丝量达到11万,作者认为该平台是获取AI行业前沿信息的关键渠道[10][12] - 微信公众号粉丝量从年初的1万多增长至约7.8万,目标是达到10万以上[16] - 开始制作视频内容,在抖音、小红书、视频号等平台取得良好数据表现,包括数十万至上百万的播放量[17] - 作者认为AI洗稿能力提升导致图文内容商业价值下降,视频内容成为重要方向[17] AI社群运营与活动 - 运营付费AIGC周刊社群,会员数量(含续费)达到约2000个,被认为是中国规模较大的AI社群之一[28] - 探索新的社群推广模式,在销售社群会员的同时,联合推广国产AI产品,帮助创业者提升销售额[24][30] - 在11月初的大型活动中,与超过30个AI产品的负责人进行沟通协作,并独立负责营销方案制定和抽奖等环节[29] AI创作内容与趋势 - 在图像与视频生成领域产出大量内容,是作者涨粉最多的领域[34] - 推动“Vibe Coding”(通过自然语言生成网页)概念的普及,相关提示词被广泛引用[34] - 关注并产出关于AI Agent、MCP(模型上下文协议)等周边服务的内容[35][36] - 强化学习在工具使用及编程领域的应用,是推动2025年AI进入新阶段的关键技术之一,极大地促进了Vibe Coding和Agent工具的爆发[53] - 多模态能力的爆发是另一关键技术突破,体现在图像、视频、音频的理解与生成质量飞速提高,例如Sora 2、Veo 3.1、Nano Banana Pro、Seedream 4.0等模型[55][56] 关注的AI产品与公司 - **Medeo**:一款支持多模型、可通过自然语言进行视频编辑的AI Agent[44] - **Youware**:一个Vibe Coding工具及社区,允许用户通过自然语言创建并分享网页[46] - **Listenhub**:一个从AI音频平台进化为全面的AI创作平台,支持声音克隆、AI播客、PPT和视频生成[47] - **Chatwise**:一个整合各平台模型优势并支持工具调用的产品,让用户能简单构建Agent[58][62] - **Manus**:被认为是第一个展示通用Agent形态的产品,在Agent交互和构建方法上给行业带来启发[60] - **Claude Code**:在推动AI编程落地和人机融合工作方法上被认为具有天才设计[60] - **AI Studio的Build模式**:谷歌整合其AI模型能力的产品,几乎完全用AI模型替代后端,尤其在Gemini 1.5 Pro更新后优势凸显[61][63] 对2026年AI行业的展望 - 强化学习应用将继续进化,例如Gemini 3 Pro和Flash模型的进展[67] - 大型算力中心(如OpenAI的Stargate)建设完成,将催生更强大的模型[67] - 期待视频生成领域出现“Nano Banana Pro时刻”,即实现全面的理解、编排及编辑能力[67] - Vibe Coding将在2026年迎来其“DeepSeek时刻”,实现极大的破圈[67] - Agent产品的发展将更侧重于垂直领域,而非通用Agent[67] - 随着工具调用和上下文管理技术的突破,2026年Agent领域可能还有一次突破[68]
a16z 年终复盘:消费 AI 赢家通吃,2026 机会在这 3 个口子
36氪· 2025-12-30 08:42
消费级AI市场格局与赢家通吃现象 - 2025年消费级AI市场热闹程度前所未有,各大公司频繁发布新产品[1] - OpenAI将ChatGPT打造成集对话、图像、群聊、Sora视频于一体的超级入口[1] - Google、Anthropic、Grok等公司也在积极争夺入口,产品如Nano Banana、Veo轮番刷屏[1] - 尽管产品发布很多,但真正改变用户习惯的并不多[2] - ChatGPT周活跃用户达到8-9亿,而Gemini的活跃用户仅为ChatGPT的三到四成[2] - 访问过多个AI平台的用户不到10%,愿意同时为多个AI服务付费的用户只有9%[2] - 大多数人只使用一个AI工具,市场呈现出赢家通吃的格局[2] AI创业的潜在机会与战略方向 - 2026年AI创业仍有机会,关键不在于模型能力,而在于三个突破口[3] - 第一个突破口是做对产品,包括打造爆款样式和打通多模态路径[4] - 第二个突破口是抓住用户,专注于服务专业用户的深水区需求[4] - 第三个突破口是避开大厂,利用其算力负担和组织盲区[4] - 成功的关键不依赖模型能力取胜,而是依靠产品更懂用户[5] 突破口一:用爆款样式降低创作门槛 - 用户沉迷于AI的核心是创作,而非聊天[6] - 2025年最疯传的AI产品是那些能立即产出成果的、风格鲜明的图像或视频,如OpenAI的Ghibli风格图像和Google的Nano Banana[6] - 这类产品的核心是“用模板降门槛”,通过提供设计起点(如节日卡片、素描头像示例)让用户无需思考从何开始[6] - 初创公司如Krea,通过让用户保留并复用角色、风格素材来提升体验[6] - 产品的难点在于美学、构图和文化感,风格样式比技术更有记忆点[6] - 爆款模板样式正变得更智能,例如Nano Banana Pro能根据视频自动生成信息图、市场地图及搭配图标配色[7] - Claude的artifacts功能允许用户编辑生成内容的风格与结构[7] - 图像/视频模型的下一步发展方向是让用户能随意切换风格样式,重新定义创作起点[8] 突破口二:用多模态打通创作路径 - 多模态AI能力有潜力重构整个创作流程,并成为新的产品入口[9] - 社交媒体上约一半内容已是AI生成视频,如Veo和Sora,它们能理解故事结构、保持人物一致性并模仿节奏风格[9] - 多模态AI能处理混合输入并生成多样化输出,例如根据YouTube视频生成讲解图,或根据品牌网站链接生成完整广告提案[10] - AI工具正从问答助手转变为搭建产品的创作工具,能够处理旧照片、网页、语音笔记等输入,生成图像、短视频、幻灯片等可直接发布的内容[10] - Google内部实验产品Pamelli能自动拉取网站内容,识别品牌定位,并生成三组完整的营销素材[10] - 这种能力直接交付成品,是模型与用户之间最短的距离,能自然成为工作流的起点[11] - 多模态能力正在打破内容创作边界,Claude支持图像文本混合输入,Sora和Veo支持视频加语音提示编辑[12] - 2026年的爆点可能不是新模型,而是新的能力组合,关键在于让用户少操心、少切换、直接拿到结果[12][13] 突破口三:抓住专业用户的深水区 - 消费级AI产品中,用户越用越舍得花钱,存在持续付费的群体[14][15] - 付费主力是真正将AI作为日常工具的专业消费者,如运营、编辑、自由职业者和创作者,他们是过去一年增长最快的群体[16] - 专业用户使用的不是基础版ChatGPT,而是更专业的工具,例如:Perplexity的Comet浏览器(自动整理资料)、11 Labs Reader(文章转语音)、Granola(自动记录整理会议)、Cursor(代码编辑器内调用AI)、Gamma(文档生成幻灯片)[17][18] - 这些工具的共通点是“有记忆”,能基于用户历史行为继续工作,例如ChatGPT的连接器功能可读取日历、邮箱并自动总结建议[18] - 关键特征是每天都要用,例如有用户平均每周使用ChatGPT约24次(即每天三到四次),远高于普通工具用户的每周1-2次[19] - 争夺高频、深度、持续付费的专业用户是下一阶段消费AI的关键战场[19] - 专业用户一旦依赖某个工具,切换成本极高[20] 初创公司与大厂的竞争态势 - 大厂产品更新飞快,例如OpenAI推出了Sora、群聊、Pulse、图像工具、浏览器Atlas和应用商店;Google推出了大量Gemini相关试验功能;Anthropic上线了Claude的artifacts、skills和Claude Code[21][22] - 但大公司在消费端尝试了几十个方向,真正留下来的产品不多[23] - 一些AI初创公司虽然功能简单,但用户认可度高,例如Comet浏览器的日活和留存高于ChatGPT的Atlas,Lovable在生成特定类型应用上做得特别好上手[24] - 初创公司的共同特征是聚焦一个场景,做得够深、够具体[25] - 大厂需要服务亿级用户、保障合规、兼顾平台,而初创公司可以专注于抢占一个高频小场景并将其做透[25] - 大公司有算力分配的隐形负担,火爆的应用可能消耗大量推理资源,拖慢下一代大模型的训练计划[26] - 初创公司没有此问题,可以灵活选用Claude、GPT、Gemini或本地模型,专注于即时满足用户需求[27] - 在应用层,初创公司无需与大厂正面对抗,只要做出真正好用的产品就能留住用户[27] - 新一代创业机会在于,在模型能力已足够的前提下,做出能落地、可复用、有用户粘性的前端产品[27] - 比起做下一个ChatGPT,不如先做好一个ChatGPT做不好的产品[27] 2026年消费级AI的发展总结与展望 - ChatGPT已占据入口,模型能力足够,接下来的机会在于做出用户离不开的产品[28] - 产品方向总结为三点:样式要现成以降低用户启动门槛;路径要打通以实现从想法到成品的无缝衔接;深度要够以吸引专业用户每日使用并持续付费[28] - 大厂在抢入口,初创公司可以抢方向,聚焦并做深一个具体场景[28] - 模型能力属于大厂,但用户归属尚未定论,产品不必大,只要准,现在是创业者该出手的时候[28]
字节原动力大会点评:产业落地高速增长,Agent能力开放有望带动云持续高增
东方证券· 2025-12-24 18:42
报告行业投资评级 - 行业评级为“看好”(维持)[5] 报告的核心观点 - 报告认为,火山引擎Force原动力大会显示AI产业落地正日益深化,模型能力持续升级,特别是多模态理解与Agent能力的提升,有望通过供给升级进一步带动需求,并看好通用Agent平台对下游云服务上量的带动作用[2][8] - 报告持续看好多模态乃至全模态的技术路径迭代[8] 根据相关目录分别进行总结 投资建议与投资标的 - 看好具备硬件-研究-模型-应用场景全栈AI路径的科技大厂,相关标的包括阿里巴巴-W(09988,买入)、谷歌-A(GOOGL.O,未评级)[3] - 看好多模态相关产品,因其兼容B/C端用户且商业化场景明确、增长确定性高,建议关注快手-W(01024,买入)、美图公司(01357,买入)[3] - 重视其他具备模型能力的厂商及相关产业链,以及受益于底模能力迭代、下游应用场景体验改善的标的,包括腾讯控股(00700,买入)、同道猎聘(06100,未评级)、北森控股(09669,未评级)[3] 行业动态与数据表现 - 截至12月,豆包大模型日均Tokens使用量已突破50万亿,较9月的30万亿增长67%,居中国第一、全球第三[8] - 目前已有超过100家企业在火山引擎上累计Tokens使用量超过一万亿[8] - 从中国公有云大模型调用量份额看,火山引擎以49.2%位居第一,较2024年的46.4%提升2.8个百分点[8] - Tokens使用的增长意味着下游场景应用持续上量,AI产业落地正日益深化[8] 模型能力升级 - 发布豆包大模型1.8,其多模态理解能力大幅提升,可以低帧率理解超长视频,广泛应用于在线教育、安全巡检、产品质检等场景[8] - 豆包大模型1.8具备更强的Agent能力,提升了模型对复杂任务的规划和执行能力[8] - 豆包大模型1.8拥有更灵活的上下文管理,在通用智能体测评集BrowserComp中取得全球领先成绩[8] - 发布Seedance 1.5 pro,具备音画同步、多人多语言对白配音功能[8] - Seedance 1.5 pro的Draft样本功能可通过低分辨率输出预览加最终高分辨率成片,帮助创作者减少60%的无效创作成本[8] - 模型能力作为供给侧核心,是持续带动需求扩容的关键[8] 云服务与平台发展 - 火山引擎提供AI云原生全栈服务,在MaaS(模型即服务)上推出企业自有模型的推理代工服务、强化学习平台,以帮助企业实现成本端稳定可控[8] - 面向Agent开发和运营,火山引擎发布了企业级AI Agent平台AgentKit和HiAgent “1+N+X”智能体工作站[8] - 火山引擎通过系列通用智能体,将大量共性的业务能力和经验以开箱即用的方式开放给企业,有望进一步带动下游云服务上量[8]
Omdia发布《2025全球企业级MaaS市场分析》,火山引擎名列全球第三
21世纪经济报道· 2025-12-24 15:24
全球MaaS市场竞争格局 - 截至2025年10月,OpenAI和Google Cloud分别以近70万亿和43万亿的日均Tokens调用量,排名全球MaaS服务市场前两位 [1] - 中国云厂商火山引擎日均Tokens调用量超30万亿,名列全球第三,市场份额达到15% [1] - 三家厂商合计占据全球MaaS市场65%的份额 [1] 市场增长与财务表现 - MaaS服务已成为增长最快、毛利最高的AI云计算产品 [4] - 截至今年12月,火山引擎豆包大模型日均调用量已突破50万亿Tokens,比10月数据增长66.7%,相比去年同期增长超十倍 [4] - 通过技术创新,大模型在提供高性价比服务的同时也有着较好的毛利,其毛利水平远远优于IaaS等传统云产品 [4] 技术演进与应用场景拓展 - 头部模型厂商重点发力多模态和Agent能力,最新旗舰模型GPT-5.2、Gemini 3.0和豆包1.8均为多模态大模型,原生支持图像等视觉理解 [4] - 模型通过强化工具调用和多轮指令遵循等能力,拓展了在具身智能、智能硬件、产品质检、软件服务等应用场景 [4] - 在客服场景中,AI客服已能从拟人对话升级为可推荐购物链接、自主完成工单客诉等一系列Agent任务,带动模型Tokens调用量成倍增长 [4] 细分市场亮点与未来展望 - 图像和视频创作模型(如Nano Banano和豆包Seedream4.0)达到生产级应用水平,大幅降低了短剧、漫剧、PPT制作、海报制作的门槛 [5] - 模型厂商和云厂商正在加速模型迭代并完善AI云基础设施,预计2026年全球MaaS市场增速还将进一步扩大 [5]
QuestMobile2025下半年AI应用交互革新与生态落地报告:头部梯队玩家快速变化,垂直赛道新秀迭出,三层渗透实现集团化复用
36氪· 2025-12-23 10:28
AI应用行业活跃用户格局 - 截至2025年12月08日至12月14日统计周期,AI原生APP周活跃用户前三名为豆包(1.55亿)、DeepSeek(8156万)、元宝(2084万)[1] - 蚂蚁阿福、千问、豆包爱学位居第二梯队,周活跃用户量分别为1025万、872万、722万[1] 2025下半年AI产业投融资趋势 - 2025年7月至11月,AIGC产业共完成186起投融资事件,总金额达336.7亿元,较上半年增长20.8%[1][4][7] - 投资逻辑由“投模型”转向“投应用”,下游应用层投融资事件占比接近50%[4][7][9] 大模型技术发展路径与模态竞争 - 截至2025年11月,8个主流厂商合计推出409个大模型,其中单模态、多模态和全模态占比分别为61.4%、36.7%、1.9%[1][4][14] - 多模态交互已成为主流,在多模态大模型中,“多模态输入”到“单模态输出”的组合占比高达73.3%[1][4][18] - 全模态大模型强调“原生统一架构”,是AI走向通用智能的关键路径,百川智能、阿里巴巴、百度集团已进入全模态布局阶段[12][16][22] AI应用落地形态与热门赛道 - 2025年7月至11月,新上线AI应用超过200款,其中应用插件、PC网页端、AI原生APP的形态占比分别为81.5%、10.7%、7.8%[2][4][29] - 应用方向上,AI图像处理(24.9%)、AI专业顾问(18.5%)、AI效率办公(6.8%)、AI社交互动(5.9%)、AI文案写作(5.9%)是主要垂直赛道[2][31] 头部互联网公司AI应用表现与战略 - 腾讯将元宝嵌入微信、QQ等全场景应用矩阵,基本完成腾讯系全场景应用内嵌[2][51] - 蚂蚁集团旗下蚂蚁阿福App上线五个月,周活跃用户达1025.4万,位列AI原生APP榜单第四及下半年新上线原生App第一[2][5][38] - 蚂蚁集团新应用“灵光”自11月18日上线至12月14日,日活跃用户规模实现7倍增长,周活跃用户达295.2万[2][5][42] - 互联网企业采用“通用AI应用先行先试”策略,验证后将AI能力反向嵌入生态产品,实现集团级规模化复用,代表公司有腾讯、百度、阿里[5][46][48] 手机厂商的GUI智能体发展方向 - 国内手机厂商以“看屏+点屏”的GUI智能体为主流方向,旨在系统性解决App长尾操作痛点[5][52] - GUI智能体负责“落地执行”,与手机AI助手、工具类AI应用协同,实现从“用户说需求”到“手机自动完成任务”的完整链路[5][53] - GUI智能体的发展水平将决定AI手机能否实现“跨App无感串联”的稳定日常体验[5][56]
QuestMobile2025下半年AI应用交互革新与生态落地报告:头部梯队玩家快速变化,垂直赛道新秀迭出,三层渗透实现集团化复用
QuestMobile· 2025-12-23 10:02
2025下半年AI应用行业核心观点 - 行业处于高景气度,资本逻辑从“投模型”转向“投应用”,下半年投融资活动显著升温,应用层成为资本关注焦点 [4][8][10] - 技术发展路径从单模态走向多模态,并探索全模态,多模态交互已成为主流范式,是驱动应用创新和体验升级的关键前提 [4][8][17][31] - 市场竞争呈现体系化与生态化特征,头部互联网公司凭借技术、用户和生态优势,通过“通用应用先行、反向生态赋能”策略实现规模化复用 [5][8][9][53] - 应用落地呈现百花齐放格局,插件是主要形态,垂直场景应用成为重要突破口,新上线原生应用在细分领域展现出强劲增长活力 [5][8][34][45] 行业投融资趋势 - **投融资规模与活跃度**:2025年7月至11月,AIGC产业共完成186起投融资事件,总金额达336.7亿元,较上半年增长20.8% [4][8][10] - **投资偏好转移**:资本偏好从产业链中游(大模型开发)向上游基础设施及下游行业解决方案转移,应用层融资事件占比接近每月总量的50% [8][13] - **驱动因素**:下半年商业模式与技术落地路径逐步清晰,市场信心走强,应用层更契合资本对投资回报的诉求 [10][13] 技术发展:从单模态到全模态 - **模型格局**:截至2025年11月,8个主流厂商共推出409个大模型,其中单模态、多模态、全模态占比分别为61.4%、36.7%、1.9% [4][8][19] - **多模态交互主流化**:在多模态模型中,“多模态输入>单模态输出”的组合占比最高,达73.3%,表明技术更擅长从复杂信息中提炼单一结果 [4][8][23] - **全模态探索**:全模态大模型强调原生统一架构,旨在实现“感知-理解-推理-生成”一体化,是AI走向通用智能的关键路径,百川智能、阿里巴巴、百度等已开始布局 [17][19][21][27] - **厂商技术侧重**:部分厂商在多模态领域占比突出,如抖音集团、智谱、月之暗面旗下多模态大模型占比分别达68.4%、47.1%和45.5% [21] 应用落地与市场格局 - **应用上线情况**:2025下半年共上新205个AI应用,其中插件形态占比81.5%,PC网页端占10.7%,原生APP占7.8% [5][8][34] - **热门应用方向**:新上应用中,AI图像处理、AI专业顾问、AI效率办公、AI社交互动、AI文案写作是主要方向,占比分别为24.9%、18.5%、6.8%、5.9%、5.9% [5] - **头部应用表现**: - 截至统计周期(12.08-12.14),AI原生APP周活跃用户前三名为:豆包(1.55亿)、DeepSeek(8156万)、元宝(2084万)[3] - 蚂蚁阿福、千问、豆包爱学位居第二梯队,周活跃用户分别为1025万、872万、722万 [3] - 下半年新上线原生APP中,蚂蚁阿福(周活1025.4万)和灵光(周活295.2万)表现最为突出,分别位列榜单第一、第二 [8][46] - **垂直应用增长**:垂直场景应用增长迅速,例如蚂蚁的灵光APP自11月18日上线至12月14日,日活跃用户实现7倍增长 [5][49] 抖音旗下的小荷AI医生在医疗垂直领域也有不错表现 [46][51] 互联网公司生态化竞争策略 - **通用应用先行先试**:腾讯、百度、阿里等集团采用通用AI应用先行策略,在验证场景和积累用户后,将其反向嵌入自有生态产品中,实现集团级规模化复用 [8][9][53] - **产品命名与认知统一**:通过标准化命名(如百度“文心助手”、阿里“千问”)统一用户认知,强化产品心智,并内嵌于多个核心APP中 [55] - **生态整合案例**:腾讯“元宝”已基本完成在微信、QQ等全场景应用矩阵的内嵌 [5][57] 阿里“千问”内嵌于夸克、高德地图等应用 [55] 终端厂商:GUI智能体与交互变革 - **交互方向**:国内手机厂商以“看屏+点屏”的GUI(图形用户界面)智能体为主要发展方向,旨在系统性解决APP长尾操作痛点 [9][60] - **角色定位**:GUI智能体负责“落地执行”,与手机AI助手、工具类AI应用协同,完成从“用户说需求”到“手机自动完成任务”的完整链路 [11][62] - **发展目标**:推动交互从“App主导”转向“Agent主导”,最终实现“跨App无感串联”的智能体验 [59][67] 市场赛道与竞争态势 - **头部赛道特征**:AI搜索与AI综合助手已形成近7亿用户规模的流量池,但新玩家仍在突破入局,表明赛道兼具规模壁垒与增量空间 [36] - **垂直赛道机会**:垂直应用通过聚焦细分场景的专业价值与多模态交互重构体验,找到了差异化发展路径,例如AI专业顾问(特别是医疗)、AI图像处理等 [36][47] - **竞争焦点演进**:行业竞争正从技术赋能向体验升级和生态整合演进,未来将更聚焦于功能创新与用户体验的精细化博弈 [36][38][39]
争夺“大模型第一股”,智谱向左、MiniMax向右
钛媒体APP· 2025-12-23 09:50
公司概况与上市背景 - 智谱AI与MiniMax(上海稀宇科技)同属“大模型六小龙”,在几天内先后通过港交所上市聆讯并披露招股书,首次公开了国内头部大模型公司的商业与财务细节 [1] - MiniMax成立于2021年,创始人闫俊杰为中科院博士,曾任商汤科技副总裁,公司累计融资超15.5亿美元,投资方包括红杉中国、高瓴、腾讯、IDG等一线机构 [2][3] 战略路径与商业模式 - MiniMax选择了“多模态+重产品”的激进战略,同时布局文本、语音、图像、视频等多个模态的研发,并重点开发面向全球用户的C端应用 [2][3] - 智谱AI则更偏向“技术驱动”,专注于底层大模型能力与开发者生态,商业模式以服务B端客户为核心 [18] - 这种差异导致两家公司收入结构不同:MiniMax收入主要来自AI原生产品(C端),而智谱AI收入主要来自面向企业的本地化部署和MaaS平台服务 [7][18][19] 财务表现:收入与增长 - MiniMax近三年零九个月累计营收8742万美元(约合6.2亿元人民币)[1] - 公司收入增长迅猛:2023年总收入346万美元,2024年增至3052.3万美元,同比增长782.1%;2025年前九个月收入达5343.7万美元,同比增长174.8%,已超2024年全年 [9] - 收入结构发生显著切换:2023年C端应用收入仅占21.9%,企业服务占78.1%;到2024年,C端应用收入占比增至71.4%,成为增长主力 [11] - 具体产品中,Talkie/星野在2024年创造1945.8万美元营收;海螺AI在2025年前九个月收入1746.4万美元,营收占比达32.6% [11][12] 财务表现:亏损与成本 - MiniMax近三年零九个月累计净亏损达13.2亿美元(约合92.9亿元人民币),超过智谱AI同期累计亏损的62亿元人民币 [1] - 净亏损持续扩大:从2022年的7372.8万美元激增266%至2023年的2.7亿美元,2024年增至4.7亿美元,2025年前九个月已达5.1亿美元,超过2024年全年 [14] - 巨额亏损主要源于大模型和AI基础设施的前期高投入(算力、人才、数据)以及金融负债公允价值变动带来的账面亏损 [14] - 研发是核心成本:公司员工约385人,其中研发团队近300人,占比近八成;近四年研发总投入近4.5亿美元,2025年前九个月研发投入为1.8亿美元 [15] 用户与客户数据 - C端用户规模快速扩张:AI原生产品的平均月活用户(MAU)从2023年的310万增长至2024年的1910万,2025年前九个月进一步增至2760万,累计用户已超2.12亿 [12] - C端付费用户数从2023年的12万增长至2024年的65万,2025年前九个月达到177万 [12] - 企业服务付费客户数从2023年的约100家增长至2024年的约700家,2025年前九个月已达约2500家 [11] 盈利能力与毛利率 - MiniMax整体毛利率从负值快速提升:2024年为12.2%,2025年前九个月增长至23.3% [20] - 但分业务看毛利率差异巨大:AI原生产品业务在2024年毛利率为-8.1%,2025年前九个月才勉强转正至4.7%;而开发者和企业服务收入的毛利率一直稳定在60%-76%之间 [21] - 作为对比,智谱AI的毛利率从2023年的64.6%下降至2025年上半年的50%左右,主要因云端MaaS平台收入占比提升 [19] 市场布局与竞争 - MiniMax高度依赖海外市场,2025年前九个月来自海外市场的收入占比已超过70% [17] - 公司在多模态各细分领域面临专业型竞争对手,如文本领域的ChatGPT、文生图领域的Midjourney等 [8] - 第三方排名显示差异:智谱AI在2024年中国大语言模型开发平台市场收入排名第二;MiniMax在2024年全球基于模型的收入排名第十,在pureplay大模型独立公司中排名第四 [23] 发展挑战与潜在风险 - “多线作战”导致成本压力巨大,每条技术路线都需长期算力、数据与人才投入,管理难度更高 [8] - 真正的跨模态理解与生成仍是全球技术难题,尚未形成统一稳定的技术路径 [8] - 2025年9月,MiniMax因视频生成产品“海螺AI”被迪士尼等公司起诉,指控其生成受版权保护内容,原告索赔最高7500万美元,这可能对其海外业务构成潜在影响 [16][17]
活动报名:25 年一二级市场年终复盘和 26 年展望|42章经
42章经· 2025-12-21 21:32
活动背景与形式 - 该讨论会由深耕国内一级市场的资深人士与熟悉硅谷二级市场的资深从业者共同主持[3] - 自2023年底起保持每隔几个月复盘一次AI市场的节奏 通过跨视角对照碰撞出超前且准确的结论[5] - 过去一年已录制三期相关播客 主题涵盖二级市场热潮、硅谷AI转向及AI泡沫探讨[5] - 自2024年秋季起 将季度复盘延伸为更小范围、更高密度的线上讨论会形式[5] - 每期活动由多位长期研究产业与投资的朋友共同主持 围绕近期重点主题进行小范围交流[5] 活动核心议题与展望 - 2025年末场活动旨在对当年一、二级市场进行复盘 并对2026年进行展望[6] - 计划共同探讨今明两年的AI关键词 包括Agent、多模态、AI硬件、具身智能、自动驾驶、大模型泡沫、OAI下一个观测点以及港股模型上市[6] - 活动时间定于北京时间2025年12月27日上午11:00[7]
日耗50万亿Token,火山引擎的AI消费品战事
36氪· 2025-12-19 18:55
火山引擎AI业务增长与市场地位 - 截至2025年12月,豆包大模型日均token使用量突破50万亿,较去年同期增长超过10倍[1] - 在MaaS(模型即服务)市场,火山引擎已成为国内市场份额第一,全球排名第三[2] - 公司营收规模快速增长,2024年营收超过110亿元,增速远超60%;2025年营收已超过200亿元[6] 2025年AI市场核心趋势 - 多模态和Agent是2025年AI市场的关键趋势[3] - 视频生成模型的竞争焦点已从参数、时长转向能否直接产出“可发布的完整作品”,声画同步成为重要竞争因素[7][11] - 行业迭代速度极快,模型正从技术工具演变为具备社交平台潜力的创作工具[9][22] 火山引擎Force大会核心产品发布 - 模型侧发布豆包旗舰模型1.8和视频生成模型Seedance 1.5 pro[3] - 围绕Agent生态发布企业推理代工服务、强化学习平台、企业级AI Agent平台AgentKit以及HiAgent“1+N+X”智能体工作站[3] - 豆包大模型1.8采用集成策略,将LLM、VLM、Thinking等能力整合进单一模型接口,简化客户选择与集成流程[26][27] Seedance 1.5 pro视频模型的技术与商业突破 - 核心主打声画同步功能,可实现开箱即用,生成视频的嘴型匹配、情绪捕捉与画面配合度达到高可用水平[8][13] - 在中文适配、电影级运镜、动态张力及环境沉浸感方面表现突出,优于部分海外模型[13][14][15] - 通过多阶段蒸馏、量化等工程优化,模型端到端推理速度提升超过10倍,极大降低了生成成本[17][31] - 模型支持多种方言和强表演场景,适合生成可供二次创作的社交内容,与豆包、即梦等C端产品联动潜力大[21][22] 火山引擎的AI发展战略与系统工程 - 公司定位为AI Native,其基础设施、产品架构及商业模式均围绕AI云原生设计,视AI为弯道超车的关键[34] - 竞争已从模型能力比拼转向系统工程较量,重点解决企业“用不起来”的问题,涉及数据接入、任务编排、效果评估等[35] - 同步建设模型的“脑”(豆包大模型)与“手”(AgentKit),旨在降低开发门槛,提供从开发到运营的闭环解决方案[37] - 演示中企业级电商客服Agent从搭建到上线用时不足半小时,展现了效率的飞跃[38] 商业模式与成本优化创新 - 推出“AI节省计划”,通过阶梯式折扣帮助企业最高节省47%的成本[32] - 探索按“智能”交付物价值或按思考长度分段付费等新型计费模式,超越单纯的Token计费[33] - 通过工程优化不断提升MaaS服务“密度”,即在同等成本下提供更多价值[30][31] 市场渗透现状与未来展望 - 国内大约10%-20%的头部企业消耗了超过90%的Token,大模型服务渗透率不高,头部效应明显[24][25] - 预计到2030年,豆包大模型的Token调用量将比2025年末增长约100倍[24] - 公司目标是构建完整的AI基础设施和服务体系,让每个企业都能低门槛、低成本地使用先进AI能力[38]
AI 产业速递:从字节原动力大会看国内 AI 应用落地趋势
长江证券· 2025-12-19 17:27
报告行业投资评级 - 投资评级:看好,维持 [6] 报告的核心观点 - 从火山引擎原动力大会观察到明确的下游需求爆发趋势和模型能力的持续迭代,供需共振下看好明年行业token用量再上台阶 [2][9] - 重点关注多模态(如生图、生视频)、端侧(如AI玩具、眼镜等)、Agent等赛道的应用机会 [2][9] 事件描述与数据表现 - 2025年12月18日,火山引擎举办冬季Force原动力大会,正式发布豆包大模型1.8及音视频创作模型Seedance 1.5 pro,同时发布多款新产品 [2][4] - 截至2025年12月,豆包大模型日均token使用量突破50万亿,自发布以来增长471倍,较去年同期增长超过10倍 [9] - 已有超过100家企业客户累计token使用量超过一万亿 [9] 模型能力迭代升级 - **豆包大模型1.8**:拥有更强多模态Agent能力 [9] - 升级多模态理解,单视频理解帧数从640提升至1280 [9] - 更强Agent能力,加强工具调用、长文和多轮指令遵循,同时支持OS Agent落地 [9] - 更灵活的上下文管理:支持256K,具备原生API上下文管理 [9] - **豆包视频生成模型Seedance 1.5 pro**:主要进步在于音画高精同步、支持多人多语言对白及具备影视级叙事张力 [9] 新产品与架构发布 - 全面升级AI云原生架构 [9] - 推出企业级AI Agent平台AgentKit,帮助企业打造多样的Agent,解决权限、集成等工作 [9] - 推出智能体工作站HiAgent,帮助企业管理和调度未来的数字员工 [9] - 发布多款封装完成的通用Agent,如“内容审核Agent”、“内容洞察Agent”、“客服Agent”,以降低企业特定任务的部署难度 [9] 商业模式与定价策略 - 火山引擎推出模型“节省计划”,提供阶梯折扣最高节省47% [2][9] - 模型定价思路从最初的技术调优实现单token降价,演进为根据Context区间定价,再到针对客户使用多款模型解决不同任务的习惯推出整体节省计划 [9] - 定价策略旨在使客户在token用量增大的情况下享受更优惠价格,降低创新成本 [9]