私有化部署
搜索文档
MiniMax PK 智谱:港交所的正面交锋
虎嗅APP· 2025-12-22 08:11
文章核心观点 - 两家领先的中国大模型公司MiniMax与智谱在48小时内相继向港交所递交招股书,争夺“全球大模型第一股”称号,标志着大模型公司开始进入公开、透明、可对照的资本市场评价体系 [4][36] - 两家公司代表了两种截然不同的大模型商业模式与发展路径:MiniMax更偏向依赖模型能力、通过C端AI原生产品实现快速规模放量;智谱则更偏向通过私有化部署服务B/G端客户,并计划向云端部署(MaaS)转型 [7][24][30] - 资本市场面临的核心问题不是判断哪条路径更优,而是如何为两种不同的不确定性定价:MiniMax的不确定性在于用户规模增长的可持续性;智谱的不确定性在于模型能力未来能否成功实现平台化释放 [36] 财务表现对比分析 - **营收规模与增长**:两家公司均呈现高速增长 - MiniMax:2023年营收346万美元(约2436万人民币),2024年营收3052万美元(约2.1亿人民币),同比增长782.08%;截至2025年9月30日营收5344万美元(约3.77亿人民币),同比增长174.76% [4] - 智谱:2023年和2024年营收同比增长率分别为116.93%和150.85%;截至2025年6月30日,营收同比增长进一步扩大至325.03% [11] - **净亏损状况**:两家公司均处于明显亏损,但亏损率呈收敛趋势 - MiniMax:2023年亏损2.69亿美元(约18.94亿人民币),为当年收入的78倍;2024年亏损4.65亿美元(约32.74亿人民币),为收入的15倍,净亏损同比下降80.41%;截至2025年9月30日亏损5.12亿美元(约36.05亿人民币),为收入的9倍,净亏损同比下降63.26%;同期经调整净亏损(Non-IFRS)为1.86亿美元 [16] - 智谱:2023年和2024年亏损分别为7.87亿人民币和29.58亿人民币,对应当年收入的6倍和9倍;截至2025年6月30日亏损23.58亿人民币,为收入的12倍,净亏损同比下降55.10% [16] - **毛利率差异**:反映商业模式的结构性不同 - MiniMax:毛利率持续改善,2023年为-24.7%,2024年转正为12.2%,截至2025年9月30日提升至23.3%;其B端开放平台及企业服务业务毛利率高达69.4% [18][20] - 智谱:报告期内毛利率始终维持在50%左右,相对稳定 [19] - **现金流与融资**:MiniMax自成立以来累计融资超过15亿美元,报告期末账上现金约11亿美元,累计消耗资金约5亿美元;智谱未详细披露现金流数据 [22][23] 商业模式与市场定位 - **收入结构对比**: - MiniMax:收入以海外为主,海外与国内营收占比约为7:3;截至2025年9月30日,AI原生产品(C端)收入占比71.1%,“开放平台及其他基于AI的企业服务”(B端API)占比28.9% [6][21] - 智谱:收入主要集中在国内市场;截至2025年6月30日,私有化部署收入占比约82% [6][21] - **发展路径差异**: - MiniMax:路径更接近模型产品驱动的规模假设,依托C端AI原生产品(如Talkie/星野、海螺AI)快速放量;2023年AI产品平均MAU约310万,2024年增长超六倍至1910万,截至2025年9月30日MAU达2760万 [13][32] - 智谱:路径更接近工程化与基础设施并行演进,当前以私有化部署为现金流“地基”,长期寄望于MaaS与API的规模化;有计划在未来几年将私有化部署与云端部署比例控制在50%-50% [34][35] - **组织效率**:MiniMax截至2025年9月30日有385名员工(研发占比73.8%),智谱员工规模约1000人(研发占比70%以上),显示MiniMax人效更高 [17] 关键运营指标与挑战 - **MiniMax的关键指标与动态**:强调C端产品月活用户数(MAU)和收入规模;截至2025年9月30日,开放平台用户数同比增长288%;2025年因海外政策调整,Talkie/星野收入和用户数下降,但其他AI应用(MiniMax、海螺AI等)实现大幅上涨,推动整体MAU稳步增长 [32][40] - **智谱的关键指标与动态**:强调token的调用量与消耗量,作为其商业模式的核心量化变量 [40] - **面临的行业挑战**: - 大模型价格战持续拉低token单位回报率,API定价面临下行压力 [38] - 云厂商全面下场推进MaaS,可能分流token调用量,加剧竞争 [39] - DeepSeek R2等高质量低成本开源模型的发布,可能冲击智谱的私有化部署业务,并加剧MiniMax在C端文本模型市场的竞争 [41] - MiniMax约70%收入来自海外,商业模型对外部环境(地缘政治、监管政策等)敏感度较高 [39] 公司背景与战略选择 - **创始团队基因**:智谱创始人唐杰为清华大学教授,团队偏向研究导向,坚持开源策略;MiniMax创始人闫俊杰出身商汤科技,更强调产品落地与商业化效率 [28] - **战略突破**:智谱在坚持开源研究的同时逐步建立商业化闭环;MiniMax则区别于商汤过往的B端路径,选择了依托模型能力的C端规模化路线 [29] - **不确定性来源**:MiniMax承担的是用户规模是否可持续扩张的不确定性;智谱承担的是模型能力能否在未来实现平台化释放的不确定性 [36]
小红书发布FireRedChat:首个可私有化部署的全双工大模型语音交互系统
搜狐财经· 2025-10-03 22:28
产品发布核心 - 小红书智创音频团队推出业内首个支持私有化部署的全双工大模型语音交互系统FireRedChat [2] - 该系统旨在解决延迟高、噪声敏感、可控性差、依赖外部API等行业痛点 [2] - 提供级联与半级联两套端到端服务部署方案,覆盖从稳定易部署到更有温度的不同需求 [2] 技术架构与核心能力 - 基于交互控制器+交互模块+对话管理器的完整架构,可将任意半双工链路一键升级为全双工 [2][11] - 集成自研流式个性化打断pVAD、语义判停EoT、FireRedTTS-1s、FireRedASR、FireRedTTS2等核心模型 [2][11] - 轮次转换控制器基于pVAD与EoT,实时判断对话秩序,显著降低噪声与多说话人场景下的误打断 [11] - 交互模块支持级联模式与半级联模式,后者通过AudioLLM直达语音语义与情感,生成更贴心回应 [7][11] - 对话管理器支持工具调用、RAG检索增强、插件扩展与工作流管理,并内置与Dify的集成样例 [11] 性能优势与实验数据 - 在打断准确率方面,pVAD将误打断率降至10.2%,显著优于LiveKit的33.4%和Ten的78.1% [15] - 语义端点检测准确率方面,EoT在中文和英文上的平均准确率分别达到96.0%和94.9% [16] - 端到端延迟方面,本地级联部署下的P50延迟为2.341秒,P95延迟为3.015秒,逼近工业级闭源系统 [17] 情感交互与用户体验 - 系统能细腻感知用户情绪变化,在用户失落时安慰鼓励,惊喜时共情分享,开心时陪伴欢笑 [4][8] - 通过AudioLLM与FireRedTTS2的联动,捕捉用户声学线索,在回应中自然体现关怀与共情 [8] - 让AI聊天助手不仅能回应文字,更能用富有温度的声音和表达方式,带来被理解、被陪伴的真实感受 [4] 开源与部署策略 - 核心模块TTS、ASR、pVAD、EoT全部开放,无需API费用与外部依赖,坚持彻底开源 [12] - 支持在企业私有环境一键部署,确保数据资产不出域,满足安全合规可审计要求 [12] - 基于LiveKit的清晰模块化设计与完善文档,使普通用户即开即用,开发者可快速二次开发 [12] 应用场景 - 智能语音助手场景可实现自然打断、即时回应,贴近真人对话节奏 [14] - 客服与外呼场景在商场、车站等复杂声场仍能稳定识别与响应 [14] - 教育与心理陪伴场景因情绪感知与表达丰富度而带来更强的同理心体验 [14]
大模型私有化部署浪潮下的AB面:警惕“信息孤岛”顽疾在AI时代复现|人工智能瞭望台
证券时报· 2025-03-14 08:04
私有化部署的现状与趋势 - DeepSeek开源大模型在政府、金融、医疗等领域广泛采用私有化部署模式,典型案例包括中国工商银行、上海市消防救援局、安徽省数据资源管理局等机构近期完成本地化部署[1][3] - 普华永道数据显示近60%企业选择在本地数据中心或私有云部署AI推理模型,凸显市场对私有化方案的偏好[3] 私有化部署的核心优势 - **数据安全**:政务和企业敏感数据(如个人隐私、商业秘密)通过内部处理存储避免泄露风险[4] - **自主可控**:减少对外部供应商依赖,提升系统稳定性与可靠性[4] - **定制化能力**:可结合具体业务场景调整模型,例如上海市消防救援局通过定制实现低延迟响应和网络安全性[5] - 金融、医疗等强监管行业更倾向私有化部署以满足合规要求[4] 私有化部署的潜在问题 - **市场碎片化**:各部门/企业独立建设导致技术标准不统一,重复投入增加开发维护成本(如政务领域"信息孤岛"延续)[8] - **资源浪费**:类比"自建锅炉"现象,智算中心利用率不足与硬件重复投资并存[9] - **抑制创新**:企业聚焦项目订单而非核心技术研发,参考日本软件市场因外包服务主导导致创新乏力[10] 行业破局路径 - **数据端**:政府与行业协会协同制定数据互通标准,鼓励行业巨头牵头构建共享模型[13] - **应用端**: - 推行"公共云优先"政策,通过财税优惠(如算力券、研发费用加计扣除)激励企业采用云服务[13] - 分阶段建设医疗/金融等领域的行业云,发展混合云技术平衡效率与安全需求[14] - 医疗行业需解决数据标准不统一、多技术整合等挑战以突破应用瓶颈[12]
通信行业周报:DeepSeek开源的杀伤力
德邦证券· 2025-03-02 13:23
报告行业投资评级 - 通信行业评级为“优于大市”,并维持该评级 [2] 报告的核心观点 - 报告的核心观点围绕DeepSeek的开源模式及其对通信与AI产业的深刻影响展开,认为其通过推动私有化部署、模型蒸馏技术及开放协作,正在重塑行业格局,并催生算力基础设施、行业应用及数据要素等领域的投资机会 [4][5][6][7][8][9] 根据相关目录分别进行总结 1. 投资策略 - **行业数据流通不足,离线部署推动私有数据利用**:由于数据隐私问题,传统企业对云端AI持谨慎态度,行业数据成为AI赋能瓶颈。DeepSeek的开源模式支持本地化部署,解决了数据泄露风险。例如,在中国的5669个Ollama服务器中,88.9%的活跃服务器可被随意调用。私有化部署具备安全性高、成本较低、灵活性较高等优势。多行业已实现DeepSeek本地部署,如中国铝业接入DeepSeek(671B“满血版”),据不完全统计,已有不少于20家银行、15家险企、16家券商“官宣”进行本地化部署 [5][14] - **基座模型开源+蒸馏技术,推动私有/行业模型发展**:DeepSeek的“模型蒸馏”技术可将大模型能力压缩至轻量级垂直模型,降低企业训练成本。其基座模型DeepSeek-R1在数学、代码等任务上性能比肩OpenAI o1正式版。通过蒸馏技术开源的32B和70B模型在多项能力上对标OpenAI o1-mini。行业应用方面,中国移动协同中国石油已完成DeepSeek V3/R1全栈国产化的训推适配和私有化部署 [5][15] - **DeepSeek持续推动开放协作,大模型闭源策略受压**:DeepSeek的彻底开源模式对OpenAI等闭源厂商产生冲击。除了模型开源,DeepSeek还开源了5个核心代码库,包括FlashMLA、DeepEP、DeepGEMM、优化并行策略(DualPipe和EPLB)以及3FS文件系统。全球多家算力芯片厂商(英伟达、华为、寒武纪等)已主动对DeepSeek做出适配。DeepSeek日活跃用户数在2月1日已突破3000万,成为史上最快达成此里程碑的应用;截至2月,OpenAI日均活跃用户约5700万人 [5][6][16][17] 2. 行业要闻 - **DeepSeek“开源周”收官,开源5项核心数据库**:DeepSeek在为期五天的“开源周”中开源了5个代码库,旨在提升AI训练和推理效率。例如,FlashMLA发布6小时内GitHub收藏量突破5000次;DeepGEMM在HopperGPU上最高可达到1350+ FP8 TFLOPS的计算性能;DualPipe算法将硬件资源利用率提升超30% [7][18] - **《全国数据资源统计调查制度》发布**:国家数据局等部门制定的该制度自2025年1月开始实施,有效期3年,旨在摸清全国数据资源底数和发展趋势。调查内容包括数据生产、存储、计算、流通、应用和安全等,调查对象涵盖行政机关、事业单位、企业等。报告认为,DeepSeek开源有望缓和算力瓶颈,加速数据语料消耗 [7][19][20] - **阿里巴巴投建云和AI硬件基础设施**:阿里巴巴集团CEO宣布,未来三年将投入超过3800亿元用于建设云和AI硬件基础设施,总额超过去十年总和。在2025财年第三季度,阿里云营收为317.42亿元,同比增长13%,AI相关收入连续六个季度三位数增长 [7][21] - **英伟达利润大增80%,Blackwell需求惊人**:英伟达2025财年第四财季营收达393.31亿美元,同比增长78%;净利润为220.91亿美元,同比增长80%。增长主要得益于市场对Blackwell芯片的强劲需求,第四财季交付了价值110亿美元的Blackwell芯片。大型云服务提供商贡献了数据中心业务约50%的收入 [7][22] 3. 本周回顾及重点关注组合 - **本周通信市场回顾**:本周通信(中信)指数下跌9.62%,同期上证指数下跌1.72%,沪深300下跌2.22%。细分板块中,IDC指数下跌5.81%,卫星导航指数下跌5.4%,物联网指数下跌5.15%,AI算力指数下跌5.06%。报告认为,板块深度回调后,重点看好DeepSeek带来的算力、AI行业应用、算力基建相关领域投资机会 [9][23][24][25] - **建议关注组合**: - **下周关注**:聚焦AI行业/端侧应用、算力基础设施、IDC等领域,涉及公司包括中国移动、中国联通、中国电信、中兴通讯、中际旭创、新易盛、天孚通信等 [9][27] - **长期关注**:覆盖运营商、通信基建、主设备、北斗、物联网、云/IDC、光模块、数据要素、卫星互联网等多个细分领域龙头公司,如中国铁塔、烽火通信、移远通信、光环新网、亨通光电等 [9][27] 4. 行业新闻(摘要) - **运营商板块**:工信部向首批13家外资企业发放增值电信业务经营试点批复;中国移动启动USIM卡及超级SIM卡集采,总规模达10.68亿张 [28][29] - **主设备与光通信板块**:爱立信利用LEO卫星验证5G NTN回传能力;杭州电信与中兴通讯完成5G-A“网随车动”首次商用验证,用户切换次数减少83%以上;Dell‘Oro报告显示2024年Q4光传输设备市场环比增长45%,华为市场份额占33% [31][32] - **物联网与智能终端**:华为发布星河通信系统;CounterPoint报告显示2024年全球翻新智能手机市场苹果份额达56%;Canalys报告称2024Q4全球AIPC出货量1540万台,苹果市场份额达54% [33][35][36][37] - **数据中心与工业互联网**:OpenAI正式发布GPT-4.5,API价格为GPT-4o的30倍;苹果计划未来四年在美投资超5000亿美元;华为油气矿山军团全球总部预计2025年10月运营 [37][39][40] - **卫星互联网与低空经济**:Verizon与AT&T实现手机直连卫星视频通话;中国电信天通手机直连卫星终端累计销量超1600万台;民用航空法修订草案提出划分空域应兼顾低空经济发展需要;亿航智能携手江淮汽车等在合肥布局eVTOL制造基地 [41][42][43][44] 5. 上市公司公告(摘要) - 部分公司披露2024年度业绩快报,表现分化:仕佳光子营业收入同比增长42.38%,净利润同比增长234.17%;映翰通营业收入同比增长24.01%,净利润同比增长35.89%;而三旺通信营业总收入同比下降18.79%,净利润同比下降69%;中信科移动营业总收入同比减少17.34%,但净利润同比减亏 [45][46][47][48][49][52]