Workflow
AGI
icon
搜索文档
大厂入场斗法,“AI六小龙”变“四小强”
新京报· 2025-12-31 16:54
文章核心观点 2025年是中国AI大模型行业深度分化与价值重塑的关键年份,行业格局发生剧变,“AI六小龙”的创业光环褪色,战略路径出现显著分化,而科技巨头与现象级开源模型DeepSeek的强势入场,共同推动了行业的第一次大规模“收敛”,竞争焦点从通用基座模型转向实际应用价值与商业化能力[1][2][18] 行业格局剧变:“AI六小龙”光环褪色与战略分化 - “AI六小龙”(智谱、MiniMax、月之暗面、阶跃星辰、百川智能、零一万物)集体退至舞台侧翼,名号被“基模五强”、“AI四小强”等取代,市场关注度与估值逻辑发生根本变化[1][2][3] - 六家初创公司战略路径出现显著分化:智谱与MiniMax在2025年12月双双递交港交所招股书,寻求上市“上岸”;月之暗面与阶跃星辰最新基础模型发布停留在2025年9月和7月,并分别转向深度思考与端侧模型;零一万物与百川智能已放弃预训练通用模型,转向AI应用与垂直领域[2][6] - 投资人观点认为,基础模型终归是巨头的战场,创业公司若转向应用层,其估值想象力将完全不同[3] 基础模型研发:高昂成本与行业门槛 - 研发基础模型成本极其高昂,训练千亿级参数模型需要数千甚至上万张顶级GPU集群,单张英伟达H100 GPU采购价超过20万元[4] - 对标ChatGPT需要万亿级别大模型,是一场“烧钱竞赛”,零一万物创始人透露一次预训练的投产运行训练成本达三四百万美元[4][5] - 行业门槛持续提升,模型参数规模正迈向万亿级别,当前四五千亿参数已成为基准量级,训练成本越来越高导致行业自然收敛[11] 关键催化事件:DeepSeek的冲击与行业“收敛” - 2025年春节期间,开源模型DeepSeek爆火,其免费开源特性促使许多AI初创公司重新评估自研基础模型的必要性,成为行业第一次大规模“收敛”的催化剂[6][8] - 零一万物创始人李开复在2025年3月公开表示,公司要做“行业第一个全面拥抱DeepSeek模型的‘六小虎(龙)’”,并在7月指出业务核心应是“行业+AI”而非“AI+行业”[8] - 百川智能创始人王小川在全员信中坦承过去战线过长,宣布将围绕百小应、AI儿科等四个方向专注聚焦[8] - DeepSeek的横空出世刺激了整个行业进入高强度迭代节奏,有技术员工表示工作体量和思考量比年初翻了两倍多[2][9] 企业战略调整:聚焦与差异化竞争 - 月之暗面(Kimi)在2025年初与DeepSeek发布“撞车”后转变战略,收缩重心于基础研发,集中资源研发下一代模型,并于7月推出受市场好评的K2模型[9] - 多家公司战略呈现趋同性:在坚持研发基础模型的同时,将工具调用能力与场景落地价值置于核心,例如智谱、MiniMax、Kimi均强调其编程模型的差异化竞争力[10] - 智谱核心战略是坚持做好基础模型并对齐世界领先水平;MiniMax判断应用层机会最终属于模型公司,并强调其全模态技术能力,声称有能力做出Gemini 3级别产品[12] - 月之暗面接下来的主要任务是提升模型能力,并重点发展Agent和API产品[12] 巨头入场与C端竞争格局 - 科技巨头在C端建立起巨大优势:2025年11月,字节跳动豆包App月活用户达3.09亿,断层式领先;DeepSeek月活1.66亿排名第二;月之暗面月活3062.2万排名第六[14] - 2025年11月月活TOP 20 AI应用中,字节跳动、百度、阿里巴巴均有4款上榜,Kimi是唯一上榜的“六小龙”公司[14][15] - 2025年11月,阿里系向C端全面进攻,“千问”App公测一周下载量破千万,“灵光”上线4天破百万下载[16] - 腾讯引入OpenAI前研究员作为首席AI科学家,加剧赛道竞争[17] - 在字节、阿里、腾讯“三巨头”斗法格局下,即便“小龙”手握百亿融资、估值近千亿,也难以在资源密集型竞赛中找到有效插手空间[17] 行业未来展望:收敛与巨头游戏 - 行业专家指出,若一个基础模型无法稳居市场前三,便失去了持续投入海量算力与数据的战略意义,这倒逼大多数企业转向to C应用或to B垂类服务[17] - 当前坚守通用基模型赛道的头部玩家仅剩四家:DeepSeek、通义千问、豆包、元宝,行业本质上已成为“巨头的开源游戏”[18] - DeepSeek被视为例外,其背后有幻方持续输血,按照当前迭代速度,有可能在2026年于基模型性能上反超美国谷歌Gemini和OpenAI GPT系列[18] - 智谱与MiniMax预计于2026年1月8日和9日上市,智谱将成“全球大模型第一股”,MiniMax获得14家基石投资者约27.23亿港元认购[12] - 市场给坚持训练基础模型的“小龙”们新的称号——“AI四小强”[13]
回望2025|大厂入场斗法,“AI六小龙”变“四小强”
贝壳财经· 2025-12-31 16:48
2025年中国AI大模型行业格局重塑 - 行业核心叙事从追逐风口转向深度分化与价值重塑,进入关键节点[2] - 行业竞争逻辑发生深刻变迁,市场与资本趋于理性,企业生存姿态更趋务实[3][7] “AI六小龙”光环褪色与战略分化 - 曾以“AI六小龙”(智谱、MiniMax、月之暗面、阶跃星辰、百川智能、零一万物)闻名的创业军团在2025年退至舞台侧翼[6] - 六家公司战略路径出现显著分化:智谱与MiniMax递交港交所招股书准备上市;月之暗面与阶跃星辰收缩重心于基础研发;零一万物与百川智能转向AI应用与垂直领域[6] - 自2025年中以来,相关企业在宣传上已不再与“AI六小龙”名号绑定,该称谓因估值逻辑和故事改变而不再“性感”[9] 基础模型研发的高昂成本与行业门槛 - 研发基础模型是“烧钱竞赛”,训练千亿级参数模型需数千至上万张顶级GPU集群,单张英伟达H100 GPU采购价超过20万元[11] - 对标ChatGPT需万亿级别大模型,零一万物创始人透露一次预训练的投产运行训练成本达三四百万美元[11][12] - 行业门槛提升,模型参数规模迈向万亿级别,四五千亿参数成为基准量级,导致行业自然收敛[19] DeepSeek的冲击与“鲶鱼效应” - 2025年春节期间DeepSeek爆火,其免费开源策略对“AI六小龙”造成巨大冲击[13] - DeepSeek刺激整个行业进入高强度、高浓度迭代节奏,被视为国产大模型崛起并快速追赶全球前沿的关键年份[8] - 部分“小龙”企业(如月之暗面)认为DeepSeek的出现是好事,促使其回归技术本源,以长期主义视角发展[18] 企业最新战略布局与产品更新 - 智谱与MiniMax在2025年12月23日仍有通用基座模型更新(GLM-4.7, M2.1),月之暗面与阶跃星辰最新版本发布于2025年9月和7月,而百川智能与零一万物更新停留在2024年[15] - 多家企业战略趋同:在研发基础模型的同时,强调工具调用与场景落地价值,例如突出编程模型的差异化竞争力[19] - 月之暗面转变发展战略,在2025年7月推出受市场好评的K2模型,并计划重点提升模型能力,发展Agent和API产品[18][21] - MiniMax相关人士判断,模型体验的下一个亮点是模态融合,并声称有能力做出Gemini 3级别的产品[21] 巨头入场与C端竞争格局 - 字节跳动旗下豆包App在C端建立巨大优势,2025年11月月活用户达3.09亿,断层式领先[24] - 2025年11月,阿里系产品(千问、灵光、蚂蚁阿福)向C端全面进攻,下载量迅猛增长[27] - 在字节、阿里、腾讯构成的“三巨头”格局下,创业公司难以在资源密集型竞赛中找到有效插手空间[28] - 2025年11月月活TOP20 AI应用中,字节、百度、阿里各有4款上榜,月之暗面是唯一上榜的“六小龙”公司[25] 行业收敛与“AI四小强”崛起 - 行业收敛至少数拥有自研能力的厂商专注基础模型,其他公司专注于分发和行业应用[19] - 市场为坚持训练基础模型的“小龙”们赋予新称号“AI四小强”[22] - 快思慢想研究院院长分析,若基础模型无法稳居前三,则失去持续投入的战略意义,这倒逼多数企业转向to C或to B服务[29] - 当前坚守通用基模型赛道的头部玩家主要为DeepSeek、通义千问、豆包、元宝,这被视为“巨头的开源游戏”[30] 上市进程与资本动向 - 智谱与MiniMax预计分别于2026年1月8日和1月9日在港上市,智谱将成“全球大模型第一股”[21] - MiniMax获得包括Aspex、Eastspring在内的14家基石投资者约27.23亿港元认购,获得长线资本背书[21] - 两家公司营收逐年稳步增长,但亏损同样逐年增大[21] 技术展望与行业信心 - 有观点认为,按照当前迭代速度,DeepSeek有可能在2026年于基模型性能上反超美国谷歌Gemini和OpenAI GPT系列[30] - 尽管竞争激烈,但行业技术迭代速度加快,人才得以留存,构成了中国大模型行业最坚实的基础[23] - 行业内高管认为,未来可能只剩下一个梯队,当前能生存下来的公司都非常优秀且选择了不同路径[31]
月之暗面完成 5 亿美元新融资,杨植麟表态“不急于IPO”
新浪财经· 2025-12-31 16:41
融资与资金状况 - 公司近期已完成5亿美元C轮融资 [1] - 公司目前拥有超过100亿元人民币现金储备 [1] - 基于充足的现金储备,公司不急于进行IPO [1] 员工激励计划 - 2025年,公司基于SOTA结果产出,通过调薪、期权奖励、现金奖励等措施累计激励324人次 [1][2] - 2026年春节前,公司将确定K2 Thiking及后续模型和产品发布的奖励方案并发放 [1][2] - 2026年公司的平均激励预计将达到2025年的200% [1][2] - 公司计划在2026年大幅上调期权回购额度 [1][2] 公司战略目标 - 公司最重要的目标是超越Anthropic等前沿公司,成为世界领先的AGI公司 [1][2]
晚点独家丨Kimi 完成 5 亿美元新融资,杨植麟:账上有超百亿元人民币
晚点LatePost· 2025-12-31 16:04
融资与估值 - 近期完成5亿美元C轮融资,投后估值达43亿美元 [2] - 本轮融资由IDG领投1.5亿美元,阿里巴巴、腾讯及王慧文等老股东超额认购 [2] - 王慧文已累计向公司投资7000万美元 [2] - 公司当前现金储备超过100亿元人民币 [2][9] 财务与商业化 - 公司启动会员制收费,国内分三档:每月49元、99元、199元;海外对应为19美元、39美元和199美元 [4] - 全球付费用户数月增速达170% [4][9] - 自11月以来,受K2 Thinking大模型带动,海外大模型API收入增长4倍 [4][9] - 公司预期其Agent等功能上线一年内能在全球获得1亿美元收入 [4] - 公司现金储备规模已不输于已进行IPO的同行:智谱AI截至2025年6月有25.5亿元现金,MiniMax截至2025年9月有73.5亿元现金 [3][6] 产品与技术进展 - 2025年9月推出Agent功能“OK Computer”,可调用虚拟电脑工具进行网站开发、数据分析、生成图片音频或制作PPT等 [4] - 公司专注于大模型层、逻辑层、Agent层,以及深入研究、PPT、数据分析、网站开发等偏生产力、复杂任务的链路,刻意控制业务边界,不做生活娱乐方向及多模态生成业务 [5] - 2025年发布了K2和K2 Thinking模型,是中国首个万亿参数基座模型及第一个开源的agentic model,在核心基准测试上超越OpenAI取得领先成绩 [8] - K2系列模型在全球技术圈产生重大影响力,获得诸多知名技术领袖的高度评价 [8] 战略与未来规划 - C轮融资资金将用于更激进地扩增显卡,加速K3模型的训练和研发 [5][10] - 2026年战略目标包括:K3模型在预训练水平上追平世界前沿模型,并通过技术改进使等效FLOPs提升至少一个数量级 [7][10] - 目标让K3成为更“不同”的模型,垂直整合训练技术和产品品味,提供其他模型不具备的用户体验 [7][10] - 产品和商业化将聚焦Agent,不以绝对用户数量为目标,而是追求智能上限,创造更大的生产力价值,实现营收规模数量级增长 [7][10] - 公司短期不急于IPO,认为可以从一级市场募集更大量资金,其B/C轮融资金额已超过绝大部分IPO募资及上市公司定向增发 [9] 公司运营与团队 - 公司当前团队规模为300人 [5] - 2025年基于技术成果产出,累计有324人次获得调薪、期权奖励、现金奖励等激励 [10] - 计划将部分新资金用于提高2026年激励计划,预计平均激励是2025年的200%(即两倍),并大幅上调期权回购额度 [5][10] - 公司最重要的长期目标是超越Anthropic等前沿公司,成为世界领先的AGI公司 [10]
MiniMax作价461亿港元募资46亿,1月9日敲钟代码00100
量子位· 2025-12-31 13:28
公司上市进程 - MiniMax于2025年12月31日启动招股,预计2026年1月9日在港交所挂牌上市,股票代号00100 [2][7] - 本次IPO拟募资超过6亿美元,发行估值将超过461亿港元,发行规模为2538.9万股,定价区间为151-165港元/股 [7][13] - 共有14家基石投资者参与认购,总额约27.23亿港元,包括阿里巴巴、阿布扎比投资局、IDG资本、Perseverance Asset Management及韩国未来资产等 [7][8] - 若成功上市,MiniMax将成为从2022年成立到完成IPO用时最短的公司 [51] 行业背景与竞争格局 - 2025年底AI行业迎来上市窗口期,智谱与MiniMax几乎同时启动招股,共同冲击“全球大模型第一股” [3][6][9] - 2025年12月是自2019年以来香港IPO最繁忙的一个月,共有25家公司完成上市 [9] - 智谱与MiniMax的同时招股点燃了市场情绪,但流量也被一分为二 [10] - 与主营B端业务的智谱(毛利率长期维持在50%以上)相比,MiniMax的商业模式呈现出K型分叉,凸显了AI在B端与C端商业化落地的差异 [39] 公司业务与市场地位 - MiniMax定位为全球化的通用人工智能(AGI)科技公司,服务覆盖全球200多个国家和地区,国际化业务收入占比达70% [12] - 公司采用多模态技术路线,在文本、语音、音乐、视频及智能体等多个领域均有布局 [15][16] - **文本模型**:2024年发布的M2模型在Artificial Analysis榜单上刷新国产文本模型最高成绩,位列全球前五、开源第一,推理速度是Claude 4.5 Sonnet的两倍,API价格仅为后者的8% [20][21] - **语音模型**:Speech模型已迭代至2.6版本,支持40多种语言,累计生成超2.2亿小时(约2.5万年)语音,并为ChatGPT的LiveKit提供底层技术引擎 [24] - **音乐模型**:Music 2.0支持生成长达5分钟、结构完整的专业级歌曲 [25] - **视频模型**:海螺AI(Hailuo)在VBench和Video Arena等国际榜单中位列第一梯队,已帮助全球用户创作超5.9亿个视频 [26][28] - **智能体与平台**:推出国内首款全栈通用智能体MiniMax Agent及交互平台星野(Talkie) [30] B端业务通过MiniMax开放平台销售API,日均处理超万亿Token请求,已为超100个国家及地区的客户提供服务 [31][32] 财务表现 - **营收高速增长**:2023年营收346万美元,2024年飙升至3052万美元,同比暴涨782.2% [35] 2025年前9个月营收达5344万美元,同比增长175%,已超2024年全年 [36] - **收入结构**:截至2025年9月30日,C端收入同比增长181%,B端收入同比增长160% [37] - **毛利率显著改善**:毛利率从2023年的-24.7%转正至2024年的12.2%,并在2025年前9个月提升至23.3% [38] 其中,C端业务毛利率为4.7%,B端业务毛利率高达69.4% [40] 若剔除C端产品星野的影响,整体毛利率将接近50% [41] - **高昂的研发投入**:训练相关的云计算服务开支持续攀升,2022年至2025年前9个月分别为415万美元、4723万美元、1.4亿美元和1.42亿美元 [43] 训练成本占收入的比例从2023年的超1365%降至2025年前9个月的266.5% [43] - **仍处亏损状态**:2022年至2024年经调整净亏损分别为1215万美元、8907万美元和2.44亿美元,2025年前9个月经调整净亏损为1.86亿美元 [45] - **充裕的现金储备**:截至2025年9月30日,公司现金储备合计11.02亿美元,足以支持正常运营53个月以上 [46][47] 公司团队与投资人 - 创始人兼CEO闫俊杰曾任商汤科技副总裁,早期核心团队周彧聪、贠烨祎等均来自商汤,具备成熟的工程化落地能力和算法研究体系 [53][55][56] - 公司全员385人,平均年龄29岁,其中研发人员占比高达73.8% [57][58] - 成立近4年累计融资超15亿美元(约106亿元人民币),投资方包括米哈游、阿里巴巴、腾讯、高瓴、IDG、红杉、经纬等战略投资人与知名机构 [50]
智谱(02513):IPO点评
国投证券(香港)· 2025-12-30 15:58
投资评级与核心观点 - 报告给予智谱IPO专用评分6.1分,建议融资申购 [10] - 报告核心观点:看好大模型需求爆发式增长及公司的商业化前景,考虑行业前景、公司技术及商业化潜力、市场情绪,建议申购 [10] 公司概览与市场地位 - 智谱成立于2019年,是致力于实现AGI的领先通用大模型公司 [1] - 截至2025年6月30日,公司已开源超50个大模型,累计下载量超4,500万次,大模型适配超40款主流芯片 [1] - 2025年12月23日发布的GLM-4.7在Code Arena上位列开源第一 [1][10] - 公司商业化收入来自MaaS平台,提供语言模型、多模态模型、智能体模型、代码模型等 [1] - 截至2025年6月30日,智谱AI大模型机构客户超8,000家 [1] - 按2024年收入计,智谱在中国大语言模型市场的份额为6.6%,位列第二 [3] 财务表现 - 2025年上半年总收入1.9亿元,同比增长325% [2] - 2025年上半年本地化部署收入1.6亿元,同比增长504%,占总收入的85% [2] - 2025年上半年云端部署收入2900万元,同比增长61%,占总收入的15% [2] - 2025年上半年研发支出16亿元,同比增长86%,约为总收入的8.4倍,其中72%为算力服务支出 [2] - 2025年上半年经调整净亏损18亿元,对比去年同期亏损10亿元 [2] - 2022年至2024年,收入从5700万元增长至3.12亿元 [11] - 2025年上半年毛利率为50% [11] - 2025年上半年经营亏损率为-995%,净亏损率为-1235% [11] 行业状况与前景 - 预计2025年中国人工智能市场规模为2,189亿元,同比增长36%,预计到2030年增至9930亿元,对应2025E-2030E复合年增长率为35% [3] - 预计2025年中国大语言模型市场规模96亿元,同比增长81%,预计到2030年增至1,011亿元,对应2025E-2030E复合年增长率为60% [3] - 预计到2030年,企业级大语言模型市场规模将增至904亿元,消费者级增至107亿元 [3] - 预计到2030年,企业级大语言模型市场规模中,约76%(691亿元)为本地化部署,24%(213亿元)为云端部署 [3] 优势与机遇 - 企业级场景是大语言模型在中国重要商业化应用核心场景,行业前景广阔 [4] - 公司拥有全面的模型矩阵,同时一站式MaaS平台推动模型商业化 [4] - 模型技术能力在行业前列,研发实力较强,研发团队有657名成员,包括中科院院士张钹博士等多位AI领域领军人物 [4] 募集资金与估值 - 招股价为116.2港元,若不考虑超额配售,预计发行后公司市值为512亿港元 [10] - 发行市值较2025年5月融资估值(244亿元)提升约为90% [10] - 基石投资人合计认购2,568万股(约30亿港元),占全球发售股份的69% [7] - 不考虑超额配售(15%),预计募资净额为41.73亿港元 [7] - 募集资金未来3年用途规划:70%用于AI大模型研发,10%用于MaaS平台优化,10%用于发展业务合作伙伴和战略投资,10%补充运营资金 [9]
电子行业2026年度投资策略:从云端到端云共振
长江证券· 2025-12-30 09:58
核心观点 - 报告核心观点是展望2026年,电子行业投资应聚焦于由AGI发展驱动的“端云共振”逻辑,即在云端和智能终端侧同时寻找最强景气赛道[5][8][11] - 回顾历史,电子板块涨幅靠前的环节多为出现“成本通胀”的领域,包括因创新带来的规格提升和因供需错配带来的价格上涨[5][8][23] - 报告判断,当前AGI正从“推理”阶段迈向“代理”阶段,将驱动AI眼镜、AI手机、桌面机器人等智能终端场景爆发,从而形成端云共振的投资主线[5][8][26] - 云端侧,最看好成本通胀剧烈的PCB和存储产业链,包括正交背板、存储颗粒原厂及后周期设备材料[5][11][28] - 端侧侧,最看好有望重现2019年TWS耳机(AirPods)爆发式增长的AI眼镜,以及AI手机、折叠屏、机器人等新品创新带来的供应链机会[5][11][34] 行业景气与投资逻辑 - 回顾2025年,科技板块涨幅靠前的行业多来自景气扩张,可概括为“AI+有色”,而除AI外的大部分行业处于景气收缩,预计此状态至少持续至2026年上半年[8][21] - 从2016年至今,电子板块年度涨幅前十的个股多属于出现成本通胀的环节,例如特定年份的iPhone零部件、TWS耳机组装、半导体IC设计、AI相关的PCB与设备等[23][24] - AGI发展被分为五个阶段,乐观预计2026年AI在智能手机、眼镜、穿戴等端侧的放量将确认进入第三阶段(代理者),从而推动产业链需求高速扩张[8][26] 云端投资主线:PCB - AI服务器PCB规格持续升级,从H系列的OAM、UBB到B系列的Compute Tray、Switch Tray,再到未来的CPX、正交背板,其价值量以每代翻倍左右的速率通胀[9][28][29] - 2026年AI PCB需求增长动力包括:1)谷歌TPU出货量大幅提升及V8渗透率提升带动均价增长;2)1.6T交换机进入大批量出货,交换机PCB进入量价齐升;3)基于Scale-up需求的新方案正交背板正式出货;4)亚马逊和英伟达持续贡献需求[9] - AI PCB整体毛利率稳定在35%以上,显著高于传统PCB约20%的平均毛利率,且2-3年内价格不会大幅波动,相关企业价值量和利润率有望大幅提升[39] - PCB技术向高密度化(HDI、类载板SLP)、高性能化发展,线宽线距持续收窄,采用mSAP(半加成法)等核心工艺是PCB接近IC载板制程的关键[46][50][51] - 英伟达预计在2027年下半年推出的Rubin Ultra NVL576产品采用Kyber机架架构,将机架旋转90度以提升计算密度,其CPX新架构将为PCB带来Midplane(预计40层+高多层)和CPX PCB(预计HDI方案)等新增价值量[50][55][58] 云端投资主线:存储 - AI训练和推理对数据存储需求拉动巨大,从长文本到图片、视频的数据产生量大爆发,驱动存储行业逻辑从供给控产转换为AI需求驱动[10][32] - 在AI强相关领域,企业级产品需求增长明显,DRAM和NAND原厂产能逐步切换至企业级,导致消费级及利基型存储供给收紧,呈现持续供不应求[10] - 展望2026年,DRAM和NAND需求端增速预计分别为30%以上和30%[10] - 现货产品价格已先行启动,合约价格也将跟进,预计将带动原厂毛利率大幅上行,模组厂库存大幅增值[10][32] - 预计国内两大存储原厂(长鑫/长存)IPO上市后,将带动材料和设备等后周期环节景气度[10][32] - 存储是大模型关键基础设施,AI驱动数据中心存储需求高速增长,预计企业级存储总需求将从2024年的1357 EB增长至2028年的3043 EB,年复合增长率达22%[59][62][64][65] - HBM市场规模快速扩张,预计从2022年至2025E年复合增长率达156%[64][66] - 供给端,原厂近几年未大规模新建晶圆厂,资本开支增长主要用于扩产HBM,有效新增产能有限,在AI需求驱动下,行业稼动率已提升至高位,预计2026年存储价格将持续上扬[71] - 报告看好存储产业链的确定性机遇,包括模组与分销公司、利基存储设计公司、配套产业链以及长鑫/长存产业链的设备、材料及制造核心标的[83][84] 端侧投资主线:AI眼镜 - 历史上消费电子板块表现与重磅新品高度相关,如十周年iPhone、TWS耳机、折叠屏等均带来供应链公司巨大涨幅,AI眼镜有望重现2019年TWS耳机的“AirPods时刻”[11][34][35] - AI眼镜产品成熟度快速提升,在佩戴舒适度、潮流外观、续航、语音音效等环节不断打磨,提升用户粘性[11][37] - 从排产和芯片端看,2026年AI眼镜出货量有望大幅增长,供应链业绩将明显受益,类似2019年OEM环节基本面爆发,重点看好组装、SOC、光学等卡位公司[11][37] - Meta是AI眼镜领域的引领者,其产品矩阵包括不带显示的Ray-Ban Meta Gen2(售价379美元,续航8小时)、运动风格的Oakley Meta Vanguard(售价499美元)以及首款带显示的Meta Ray-Ban Display(与腕带合计799美元)[84][86] - 2025年第三季度,Meta AI眼镜销量达112万副,同比增长250%,环比增长56%[89] - 全球传统眼镜年销量约15亿副,替代空间巨大,Ray-Ban与Oakley的庞大用户基数为Meta AI眼镜提供了潜在意向人群[90][92] - 据预测,到2030年全球AI眼镜销量有望达到9000万副,未来5年将持续高速增长,成为现象级爆品[91][92] 端云共振总结 - 2026年电子板块投资将围绕“端云共振”展开,云端聚焦PCB和存储的通胀弹性,端侧聚焦AI眼镜、AI手机等新品放量[11][95][96] - 云端具体机会包括:PCB领域的正交背板、COWOP封装;存储领域的颗粒原厂、模组、材料设备[95][96] - 端侧具体机会包括:AI眼镜的组装、SOC、外观件、散热件;AI手机的相关供应链[95][96]
上海合合信息科技股份有限公司(H0255) - 申请版本(第一次呈交)
2025-12-29 00:00
业绩总结 - 公司收入从2022年的9.885亿元增至2023年的11.865亿元,2024年达14.381亿元,2025年前9个月为13.035亿元[57][190] - 2022 - 2024年及2025年前9个月净利润分别为2.837亿、3.232亿、4.005亿、3.065亿、3.511亿元[57] - 2022 - 2025年毛利率均超80%,2023 - 2025年收入增长率分别为20.0%、21.2%、24.2%[57][97] - 2025年公司总收入1303450千元,中国内地收入占比65.9%,其他国家和地区占比34.1%[64] 用户数据 - 2025年C端产品月活188.9百万,付费用户9.3百万,月活付费转换率4.9%[67] - 2025年C端产品单个付费用户平均收入178元,月费会员续购率79.2%[67] - 2025年B端产品客户4204个,单个客户平均收入58.6千元,净收入留存率85.5%[67] - 截至2025年11月,MAU增至1.878亿,过去12个月付费用户增至970万[112] 未来展望 - 公司需强化技术基础设施、加速研发保持竞争力,可能需大量资本支出[182] - 公司决定2025年以现金向股东派付股息每股2元,以资本储备转增股本[108] 新产品和新技术研发 - 天璇平台实现“文档结构理解+智能纠错+关键信息提取”技术进步[47] - 天玑AGI技术平台奉行多模态大模型与AI Agent技术研发两大战略[50] 市场扩张和并购 - 公司业务覆盖全球超200个国家和地区,三款C端产品有全球数亿用户群[34][78] 其他新策略 - 公司自2024年9月在上海证券交易所科创板上市,无重大违规[99]
昇思人工智能框架峰会于杭州召开,正式发布“超节点时代”AI框架新范式
环球网· 2025-12-28 15:13
昇思MindSpore技术架构发布 - 昇思MindSpore提出“超节点”概念,将多台深度互联的物理服务器视为一台“超级计算机”,以应对大模型向十万亿级参数等方向演进对算力、存储与调度效率的更高要求[2] - 昇思正式发布HyperParallel架构,包含三大核心技术:HyperOffload通过计算与状态分离突破HBM瓶颈,训练性能提升20%以上,推理序列长度提升70%;HyperMPMD实现异构并行,提升算力利用率15%以上;HyperShard引入声明式并行编程,使新算法并行改造时间缩短至1天内,并行调优效率从“天级”跃升至“小时级”[4] - HyperParallel架构正式版本及配套加速套件计划于2026年上半年发布[4] 昇思MindSpore社区发展与应用成果 - 自2020年3月开源以来,昇思MindSpore下载量超1300万,覆盖全球156个国家和地区,社区贡献者逾5.2万人,支撑3100余项行业应用,发表近2500篇学术论文,在全球AI框架中稳居中国第一、世界第二[4] - 在“AI for Science”领域,基于昇思框架开发的民机超临界翼型气动设计智能体“御风·智翼”,将传统需数周的气动设计流程压缩至实时交互级别[5] - 在金融领域,招商银行基于昇思构建金融专精大模型,通过多维混合并行策略实现百亿参数模型的稳定训练,已在安全合规、知识问答等上百个场景落地[7] 行业趋势与生态合作 - 行业观点认为大模型的能力密度正以每3.3个月翻倍的速度增长,未来AGI发展需通过高效架构、高质量数据等方法实现“小模型、大智能”[7] - 昇思已原生支持端边云全场景部署,并全面兼容Numpy、Scipy等科学计算接口,同时与vLLM、SGLang等推理引擎完成深度集成[8] - SGLang推理引擎已正式合入MindSpore后端,支持Qwen3、DeepSeek等模型,并完成W8A8量化等关键特性适配[8] - 在人才培养方面,昇思与高校共建的大模型创新人才培养体系已覆盖全国百余所高校、400余名教师[8] 公司战略与未来展望 - 公司表示将持续打造超节点亲和、全场景融合、架构开放、敏捷使能的AI框架,以助力千行万业智能化转型[9] - 随着AI进入“超节点时代”,昇思MindSpore正携手全球开发者与产业伙伴,共同定义下一代AI基础设施,加速通用人工智能时代的到来[10]
压缩之外,Visual Tokenizer 也要理解世界?
机器之心· 2025-12-28 09:30
视觉Tokenizer的演进与MiniMax VTP研究 - 传统视觉生成模型采用两阶段流程:先通过Tokenizer(如VAE)压缩图像为潜在表示,再于潜在空间训练生成模型[6] - 行业常见做法是固定VAE,专注于扩展后续生成模型(如扩散Transformer)的规模,但研究发现若第一阶段Tokenizer质量未提升,生成效果将很快达到饱和[7][8] - MiniMax与华中科技大学的研究提出新视角:提升生成模型性能不仅可依赖主模型扩展,也可通过扩展Tokenizer本身实现[8] - 研究发现,仅追求像素级重建精度、投入更多算力让自编码器重建更逼真,反而可能降低下游生成质量[8] - VTP工作揭示问题根源:传统以重建为目标的视觉Tokenizer,其潜在空间偏向低层次像素信息,缺乏对高层语义的简洁表示,导致“重建强、生成弱”[8] - 解决方案是在Tokenizer预训练中引入语义理解,使潜在表示对高级语义信息更敏感,而非过度记忆像素细节[8] - 研究发现了视觉Tokenizer的Scaling Law现象:传统自编码器在预训练算力达一定规模后性能停滞,而VTP性能持续提升[8] - 实验中,普通VAE使用不到原计算量十分之一即达生成性能瓶颈,而VTP即使将预训练计算量提高10倍,生成效果仍在持续变好[8] - VTP框架将图像-文本对比学习(CLIP)、自监督学习(DINOv2)和传统重建损失结合,统一优化视觉Tokenizer的潜在空间[9] - 具体引入两项语义导向任务:基于DINOv2的自监督损失增强局部结构与全局语义一致性;基于CLIP风格的图像-文本对比损失将语言先验注入视觉潜在空间[9][10] - 实验表明潜在空间的语义质量(以零样本分类准确率度量)与生成性能(FID指标)呈高度正相关[11] - VTP最大模型(约7亿参数)在ImageNet上达到78.2%的零样本分类准确率,压缩重建保真度rFID为0.36[11] - 将该Tokenizer替换进标准扩散模型后,在不改变模型结构和计算量的情况下,生成图像的FID相对基准降低65.8%,收敛速度提升约4倍[12] - 这意味着仅通过在Tokenizer预训练上投入更多算力,即可大幅提升下游生成质量,无需额外增加生成模型复杂度[13] 视觉生成模型的技术路径与行业影响 - 视觉Tokenizer的下一步进化关键在于理解世界,而不仅是压缩[1] - 采用1D序列形式的Tokenizer可能比2D网格序列更适合大规模训练[1] - 目前的离散Tokenizer可能只是阶段性的过渡方案[1] - 生成采样阶段的分布偏移导致了“重建强、生成弱”的普遍现象[1] - VTP工作为视觉Tokenizer研究提供了新视角,证明其Scaling Law可行后,视觉生成模型能力可能“再上一个台阶”[5][8] - VTP的研究思路并非孤立,此前已有其他工作提出不同解决方案[14] - 该研究存在一些争议,有分析指出其未系统探讨VTP如何与不同DiT架构交互,且实验采用特定配置,语义潜在空间对其他方法(如flow matching)的有效性尚不明确[8]