Workflow
大模型
icon
搜索文档
DeepSeek V4迟迟不发,中国开源王者为何越来越慢?
DeepSeek V4发布延迟与行业动态 - 文章核心观点:DeepSeek V4发布多次延期,从2026年1月推迟至4月,引发社区对其迭代速度放缓的担忧,而同期OpenAI与Anthropic则进入“月更模式”,行业竞争加剧[5][6][8][14][15][18] - 2025年是DeepSeek的“高光之年”,V3系列、R1推理模型、V3.2等版本平均每1-2个月有一次大更新,在数学和代码基准上多次局部超越闭源模型,API价格极具竞争力,其App累计下载量突破1.1亿次,周活跃用户最高逼近9700万[8][9][10][11] - 然而自2025年12月V3.2发布后,DeepSeek的迭代明显放缓,仅进行了上下文扩展至1M、API微调等小修小补,无新权重或重大功能跃升,GitHub和API更新日志也停滞不前[8][12] DeepSeek迭代放缓的潜在原因 - 技术挑战从“模型发布”升级为“系统工程”,难度陡增:V4的目标是成为Agent时代的主力,需解决模型连续执行任务的能力,其训练重点已转向Tool-Use和Agent,引入了覆盖1800+真实环境、8.5万+复杂指令的Agent训练数据,研发进入更复杂、更重的阶段[21][22][23][25] - 作为全球开源社区的标杆,DeepSeek背负巨大预期,没有犯错空间:任何一次平庸的迭代都可能引发口碑反噬,公司必须确保每次发布都是“杀招”,维持“用1/10成本达到GPT同等性能”的市场效率预期至关重要,因此一个没有明显代际差异的V4不如不发[26][27][28][29][30][31][32] - 面临资源与组织天花板的挑战,并需进行硬件生态重构:大模型竞争已进入工业化比拼阶段,比拼算力供给、数据流水线、工程团队规模等闭环能力,而DeepSeek V4据传将深度适配国产芯片,有望成为首个完全跑在国产算力生态上的大模型,这种底层适配拉长了研发周期[33][34][36][37][38][39][40] 竞争对手的快速迭代与行业格局 - OpenAI与Anthropic进入“月更模式”,持续给市场带来新能力与确定感:2025年4月至2026年3月,OpenAI迭代了4次,Anthropic迭代了2次以上,而DeepSeek大版本更新为0次[15][18] - Anthropic打法高度聚焦,将资源密集砸向Coding、Agent和企业工作流等易形成壁垒的方向,更新节奏清晰[42][43] - OpenAI采用平台化推进节奏,模型、产品和API接口同步更新,小步快跑,使用户体感始终在更新[35][42] - 短期看DeepSeek与头部厂商的差距在拉大,但V3.2在数学/代码基准上仍具竞争力,且V4传闻方向(多模态、长期记忆、代码能力跃升、国产芯片适配)具有足够杀伤力,若兑现则长期仍可一战[42]
OpenClaw、Agent 企业级落地……2026 奇点智能技术大会硬核议题发布
AI科技大本营· 2026-03-17 16:27
行业现状与趋势 - 行业正经历从"技术试水"向"工程范式跃迁"的演进,大模型与智能体深度融入生产环境 [2] - 行业进入由智能体驱动、自动化程度极高的新周期,但与之匹配的工程规范、安全体系、组织形态等尚未准备好 [2] - 技术发展呈现"技术狂奔,治理滞后;效率飙升,风险暗涌;愿景宏大,现实骨感"的特点 [1] 大语言模型技术演进 - 大模型赛道已过"盲目拼参数"的蛮荒时代,技术决策者面临如何让模型在大规模业务中真正运行的现实拷问 [7] - 该专题旨在构建一套完整的大模型技术演进新坐标,汇集了来自奇点智能研究院、新浪微博、微软亚洲研究院等机构的顶尖学者与技术专家 [7] 智能体系统与工程 - 该专题旨在告别"盲盒式"开发,掌握构建可靠智能体的工程方法 [13] - 微信分享了在超高并发下构建可靠AI搜索智能体的实战经验 [16] - 美团与Macaron AI分享了如何通过低成本强化学习、十万级沙盒基建等手段,让智能体摆脱对人工编排上下文的依赖,实现自我进化 [16] - 专家将交付一套覆盖感知、推理、协作等六大维度的智能体顶层架构设计图纸 [16] OpenClaw行业实践 - 该专题聚焦从"全民养虾"到企业级"数字员工"的落地实践,提供从算力适配、记忆构建到产品级改造的完整指南 [17] - 腾讯云将分享打造全民AI工作台的经验,网易有道将复盘其智能体产品的养成与实践 [19] - 记忆张量MemTensor将揭秘如何让智能体学会持久化记忆管理,实现经验与上下文的高效复用 [20] - 沐曦股份将从底层GPU算力出发分享数字员工实践,MiniMax将展示国产大模型如何与开源框架深度绑定释放生产力 [20] AI基础设施与运维 - 该专题旨在用智能体思想重塑运维体系,提供面向多GPU集群的自动化运维破局方案 [21] - 无问芯穹将直击万卡集群痛点,分享基于智能体基础设施的AIOps智能体系统实践 [24] - 清程极智将提出以智能体为中心的智能软件栈,让基础设施具备自我感知与修复能力 [24] - 北京智源人工智能研究院将解析大模型框架多芯片统一高效插件体系,以跨越异构算力适配鸿沟 [24] - 昆仑芯将从国产高端AI芯片视角探讨推理框架的极致优化,清微智能将分享可重构计算超节点的探索与实践 [24] - 启元实验室将从国家级实验室视角,给出算力与数据智能融合的顶层解法 [24] AI原生应用创新与开发实践 - 该专题旨在将AI从"酷炫玩具"变成"商业摇钱树",拆解日活千万级和估值亿级AI应用的工程实践 [25] - 小红书将拆解下一代非线性视频剪辑的架构设计,构建可落地的智能剪辑智能体 [28] - 平安科技将分享在复杂医疗场景下破局大模型落地"不可能三角"的多智能体实战经验 [28] - 商汤科技将揭秘AI PPT在线编辑系统如何通过HTML结构化输出与自研渲染引擎实现稳定闭环 [28] - AWS将直击ROI痛点,分享Inference-Free稀疏搜索等降本增效的平衡术 [28] - Dify将分享如何用严谨的系统工程构建"可执行、可治理、可复用"的AI工作流体系 [28] AI+行业落地实践 - 该专题聚焦将大模型转化为实打实业务ROI的方法论,回应"能给公司赚多少钱、省多少人力"的灵魂拷问 [29] - 小红书将拆解如何用自适应强化学习驱动AI搜索智能体,在极高并发流量中准确理解用户意图以实现业务增长 [32] - 京东将分享如何利用大模型结合因果推断,让智能体掌握动态定价权,从传统预测迈向反事实建模 [32] - 蚂蚁集团将从金融风控视角剖析大模型在企业信用等高壁垒场景下的可信落地与价值重塑 [32] - 金山办公将复盘多模态模型在文档理解与图片翻译等智能办公体系的探索与实践 [32] - 百度将展示经典OCR技术如何与大模型结合持续进化,打通企业数字化转型的视觉通道 [32] AI原生软件研发与氛围编程 - 该专题旨在将AI从"代码补全器"升级为"软件研发的操作系统",提升团队整体交付效能与工程质量 [33] - 快手将分享研发范式如何从L1单点辅助向L3深度协同跨越,并复盘如何在万人规模研发团队中实现体系化的研发效率跃迁 [37] - 通义灵码将探讨大模型如何从"代码生成"进化为"意图执行",构建具备上下文感知、推理与自主修正能力的智能体架构 [37] - 百度Comate将深度复盘其在大规模工程实践中的设计智慧 [38] 多模态与世界模型 - 该专题旨在提供从模型训练、后训练对齐到云端规模化部署的全栈可落地工程路径 [39] - 昆仑万维将拆解从视频生成到世界模型的多模态生成技术演进与实践 [41] - 京东将分享在多模态理解与生成上的最新实践 [42] - 蚂蚁集团将分享百灵多模态大模型的后训练算法实战,以提升模型在金融等严苛场景下的意图对齐能力 [42] - Google Cloud将从云端工程化视角,指导如何将复杂多模态大模型高效部署到商业生产环境 [42] 开源模型与框架 - 该专题聚焦推理加速与架构解耦的极致优化,旨在将GPU利用率从30%提升至80%以上,并获取支撑万亿参数规模推理的分布式架构蓝图 [43] - 专题汇集了SGLang、vLLM、Mooncake等开源项目的核心开发者与贡献者 [46] - 月之暗面将基于Kimi大规模模型训练的真实生产线,深度拆解线性注意力等先进架构的硬件感知设计逻辑与工程权衡 [46] 具身智能与智能硬件 - 该专题提供从"视觉感知"到"底层控制"的全链路落地方法论,旨在突破物理壁垒 [47] - 北京大学专家将拆解如何利用电声磁射频等多物理场模态,为AI开启突破视觉盲区的感知能力 [51] - 网易伏羲将解析"世界模型+强化学习"如何驱动无人装载机完成高精度作业 [52] - 来自复旦大学、同济大学、优必选等机构的专家将共同探讨具身智能在多关节控制、人机协同与先进制造场景下的工程落地瓶颈 [52] 行业大会与生态 - 2026奇点智能技术大会旨在系统性理解AI变革,为穿越"十倍速变革"绘制兼具前瞻性与实战性的认知地图 [3][5] - 大会将深入探讨多模态、世界模型、AI原生研发、AI基础设施、大模型系统架构、智能体系统等12大前沿专题 [5] - 大会汇聚全球顶尖学术专家与一线技术实践领军者,旨在推动AI生态融合与行业协同创新 [53]
融资 1200亿后 Kimi 再扔王牌,新架构爆改 Transformer 老配件,比 DeepSeek 同款还省钱
AI前线· 2026-03-17 15:53
文章核心观点 - 文章聚焦于Kimi公司发布的一篇重磅新论文,该论文对Transformer架构中基础但长期未变的“残差连接”组件进行了根本性创新,提出了“注意力残差”方法[5] - 该方法通过引入注意力机制作为“智能筛选器”,解决了传统残差连接固有的信息稀释、无法选择性听取和早期信息丢失等问题,从而显著提升了模型在复杂推理任务上的性能[6][13][18] - 与另一家公司DeepSeek提出的改进方案相比,Kimi的“注意力残差”在保持高性能的同时,具备即插即用、成本效益高等工程化优势,可能代表了大模型在数据红利见顶后,通过优化“信息管理”来提升效能的新方向[37][38][39] 技术原理与问题分析 - **传统残差连接的作用与问题**:残差连接为深度学习网络提供了信息流动的“主干道”,使深层网络易于训练[12]。但其存在三个致命问题:1) “不能挑着听”:所有层只能接收前面所有层输出的混合结果,无法选择性关注[13];2) “丢了的内容找不回来”:早期关键信息容易被后续信息覆盖而永久丢失[18];3) “内容越堆越多”:越往后层需要输出越强的信号才能被感知,导致训练困难[18] - **Kimi的解决方案**:受注意力机制解决序列建模中长距离依赖问题的启发,Kimi认为“序列维度上的时间问题和深度维度上的层问题是同一件事”,从而提出“注意力残差”[14]。其核心是让每一层都能直接访问前面所有层的原始输出,并通过一个动态的、内容依赖的重要性分数(α)进行加权融合,实现“想找谁的就找谁的”[15][16][33] - **工程优化版本**:为平衡性能与成本,Kimi提出了“分块注意力残差”,将网络层分组,组内使用标准残差,组间使用注意力残差,大幅节省成本[19]。并通过“跨阶段缓存”和“两阶段计算策略”进一步优化训练和推理效率[23] 性能表现与实验结果 - **综合性能提升**:在多种基准测试中,注意力残差模型相比基线模型实现了全场景稳定提升,在研究生级专业考试、高等数学推理、代码生成等高难度任务上,性能直接提升3-7.5个百分点[7]。例如,在GPQA-Diamond任务上从36.9%提升至44.4%,在Math任务上从53.5%提升至57.1%,在HumanEval代码生成任务上从59.1%提升至62.2%[8] - **效率与成本优势**:在Kimi自家架构上验证,该方案可节约1.25倍算力,训练端到端额外开销不到4%,推理延迟增加不到2%[8]。分块注意力残差“花同样的钱,能达到传统残差连接1.25倍算力才能达到的效果”[24] - **缩放定律与消融实验**:该技术完全适配大模型缩放定律,模型规模越大,优势越明显[10]。消融实验证明,方案中“随内容变的打分”、使用softmax函数、将层分为8个左右的小组等设计均必不可少[27][31] 与DeepSeek方案的对比分析 - **问题诊断与解决路径不同**:DeepSeek认为问题是“信息主干道太挤”,因此推出多头混合连接,通过拓宽多条并行专线并在专线间混合信息来解决问题[32]。Kimi则认为问题是“信息主干道不能挑重点”,因此赋予网络筛选权[33] - **能力边界差异**:DeepSeek的mHC方案只能处理“混合后的二手内容”,而Kimi的AttnRes能直接访问“所有前面的原版原话”[33]。因此,mHC在基础语言理解和闲聊场景有稳定提升,但在需要多步推理、长上下文记忆的复杂任务上提升有限[35];AttnRes则能兼顾训练稳定性与复杂推理,在长上下文、逻辑题等任务上提升显著[36] - **工程落地成本差异**:DeepSeek的mHC需要对现有架构进行“伤筋动骨的大改造”,无法直接替换传统残差连接,适配成本极高[37]。Kimi的AttnRes是“即插即用的替换件”,只需替换原有模块,其他结构和参数无需改动,适配成本极低[37] - **性价比对比**:根据对比,Kimi完整版的Full AttnRes性能始终优于mHC,而Block AttnRes性能与之相当,但所需读写数据量只有DeepSeek mHC的1/6[38]。这表明在大规模工程部署中,Kimi的路线可能更具现实吸引力[39] 行业影响与评价 - 该研究获得了包括OpenAI的Andrej Karpathy在内的行业顶尖人物的关注与点赞,引发了关于Transformer中其他“长期沿用的配置”是否也可被改进的思考[28] - 有网友将Kimi称为“新的DeepSeek”[30] - 文章指出,当数据红利逐渐到顶,过去大模型比拼“堆算力”的模式可能正在转向下一代通过优化“管信息”来拉开差距的竞争[39]
融资规模破纪录-具身智能资本化进程加速
2026-03-17 10:07
行业与公司 * 涉及的行业为**具身智能机器人**行业,具体包括大模型、硬件本体、核心零部件等细分领域[1][2] * 涉及的**公司**包括: * 大模型领域:World Models公司、MIR Labs、吉佳世界[1][4] * 国内本体及硬件公司:宇树、智元、银河通用、千寻智能、帕西尼感知科技、自变量、智平方、主机动力、星海图、灵犀巧手、众擎、松岩动力、魔法原子等[1][4] * 创新中心与产业方:北京人形机器人创新中心、浙江人形机器人创新中心、百度、东土科技[1][5] 核心观点与论据 **1 融资规模与增长:行业融资呈现爆发式增长,2月环比增速显著** * 2026年1-2月全球具身智能行业累计融资超371亿元人民币[1] * 1月融资156亿元,同比增长524%,环比增长108%[2] * 2月融资超215亿元,同比增长约291%,环比增长约37.8%[2] **2 融资结构:大模型与硬件本体占据主导,2月本体领域融资扩张明显** * 1-2月大模型领域融资约227亿元,占主导地位[1][4] * 2月份,在28起融资事件中,本体企业达到15家,显示其融资扩张占据主导地位[2] **3 区域差异:国内外融资侧重不同,海外单笔金额大且集中于软件** * 国内:发生45起融资,累计约161亿元,资本偏向硬件本体公司[1][3] * 海外:发生5起融资,累计约30.5亿美元(约合210亿元),单笔金额大,资本更倾向投向大模型等软件领域,特别是世界模型方向[1][3] **4 大模型投资热度:资本高度集中,出现多笔十亿美元级融资** * 1-2月大模型企业完成16起融资,累计约227亿元[4] * 具体案例:World Models公司完成约10亿美元融资;MIR Labs完成10.3亿美元融资;吉佳世界完成约10亿美元Pre-B轮融资[1][4] **5 国内行业新动向:融资热度高、估值攀升、资本化进程加速** * 融资规模:2026年初至3月13日,国内融资规模超10亿元的企业已达12家,而2025年全年仅6家[4] * 企业估值:目前统计有9家企业估值超百亿(如宇树、智元等),实际数量可能更多[1][4] * 资本化进程:众擎、星海图、松岩动力已完成股改;魔法原子预计最快2026年披露二级市场上市进度[1][4] **6 资本参与方:地方政府背景资本深度参与市场化融资** * 北京人形机器人创新中心完成超7亿元市场化融资,引入百度等战略投资人[1][5] * 浙江人形机器人创新中心完成4.5亿元Pre-A轮融资[1][5] * 显示出政府与市场资本共同推动行业发展的态势[5] **7 投资机会:聚焦产业化关键环节** * 投资机会主要集中在**本体制造、总成及核心零部件**领域[1][6] * 核心零部件中,**传感器、电机、丝杠、灵巧手**等是加速产业化量产的关键环节,值得重点关注[1][6] * 资本的涌入将加速行业产业化进程,包括提升量产能力和成本控制能力[6] 其他重要内容 * 海外市场除融资外,还有一起6.12亿美元的收并购事件[3] * 1月份融资事件中,核心零部件企业占4家,大模型领域7家,本体企业约8家[2] * 2月份融资事件中,核心零部件企业3家,大模型企业3家[2]
20天收入超2025全年,龙虾爆火的受益者Kimi能否弯道超车?
创业邦· 2026-03-16 18:37
文章核心观点 - AI智能体OpenClaw(龙虾)的爆火,使以Kimi为代表的大模型厂商成为首批最大受益者,公司通过整合K2.5模型与推出云端产品Kimi Claw,成功抓住市场机遇,实现了用户、收入及估值的爆发式增长,并借此打开了全球化与商业化的第二增长曲线,有望在AI模型竞争中实现弯道超车 [2][13] Kimi的业绩与估值爆发 - 受K2.5模型及Kimi Claw产品带动,公司收入在2026年1月底起的20天内已超过2025年全年总和 [2][10] - Kimi个人订阅用户支付订单数在2026年1月环比增长8280%,2月环比再增123.8% [2][10] - 根据全球支付巨头Stripe数据,公司排名从2026年初的第22位升至2月的第9位,首次进入全球支付榜单前十 [2][13] - 公司估值在短短三个月内翻四倍,从2025年底的43亿美元升至2026年初的100亿美元,随后以180亿美元投前估值启动新一轮10亿美元融资 [2] Kimi K2.5模型成为OpenClaw的“最佳大脑” - Kimi的K2.5模型是一款开源多模态大模型,被OpenClaw创始人推荐为“最佳适配模型”之一,并于2月初被设为OpenClaw官方主力模型 [5][7] - 模型核心能力与OpenClaw需求高度匹配:支持长达数百步的复杂任务拆解,能自动将指令细化成执行步骤 [5] - 具备强大的多任务并行处理能力,其Agent集群模式可自主创建并协调多达100个智能体同时工作 [6] - 在成本上具有显著优势,多项评测显示其运行成本仅为GPT-5的不到5%,用约1%的资源实现了顶尖模型性能;PinchBench测试完成费用仅0.20美元,低于谷歌Gemini 3 Flash的0.72美元 [7] 产品创新:推出云端服务Kimi Claw - 针对OpenClaw部署门槛过高的问题,公司推出云端服务Kimi Claw,预装OpenClaw和K2.5模型,提供40GB云存储,实现“零代码、零硬件,一键部署” [8][9] - 根据2026年2月AI产品榜数据,Kimi Claw以55.67万(556.7K)的网站访问量,在“Claw Agent”分类中排名第二,仅次于OpenClaw官网(访问量2700万/27M) [9][10] - 与阿里云、腾讯云等仍需用户自行配置的部署方案相比,Kimi Claw的“开箱即用”模式更贴近普通用户需求 [11] - Kimi Claw正在优化OpenClaw的记忆机制,以提升其准确性和稳定性 [11] 全球化与商业化突破 - 公司成功借助OpenClaw实现出海,中国访问占比从77%降至60%+,成为全球主流模型,且海外收入首次反超国内 [13] - 公司此前存在“有技术缺场景”的劣势,OpenClaw提供了能大规模、高持续消耗Token的场景,解决了商业化关键问题 [13] - 公司估值增长速度刷新国内初创企业纪录,仅用不到两年时间从3亿美元突破至100亿美元,成为国内最快跻身“十角兽”的公司 [14] 公司战略与未来展望 - 公司创始人明确2026年目标:让下一代K3模型的等效算力提升至少一个数量级,在预训练水平上追平世界前沿 [15] - 战略聚焦于智能体本身的产品化与商业化,不以绝对用户数量为目标,而是追求智能上限,创造生产力价值,以实现营收规模数量级增长 [15] - 公司选择All in Agent(智能体),计划在编程、研究、办公自动化等生产力场景建立差异化优势,以在巨头竞争中走出一条独特路径 [15] - 公司账上现金储备超过150亿元人民币,充足的资金使其能按自身节奏训练K3模型,不受二级市场业绩考核束缚 [15] - 公司募资能力强大,从未上市的一级市场募资金额已是大模型同行IPO的两倍有余 [14]
海外行业周报:国内大厂抢占市场,“龙虾热”引爆国产模型增量红利
开源证券· 2026-03-16 08:25
报告行业投资评级 - 投资评级:看好(维持) [2] 报告的核心观点 - 国内大厂正积极抢占AI应用市场,由“OpenClaw”(报告中比喻为“龙虾”)引发的热潮正引爆国产大模型的增量红利 [1][6] - 国际科技巨头通过收购等方式将AI模型推向商业化轨道,但欧美市场热度主要局限于技术群体 [8][21] - 报告对互联网、计算机、汽车及自动驾驶等领域的AI商业化前景持积极态度,并给出了具体的标的推荐 [9][31] 根据相关目录分别进行总结 1. 国内:大厂抢占市场,“龙虾热”引爆国产模型增量红利 - **应用端市场战激烈**:腾讯推出全场景AI智能体WorkBuddy,深度兼容OpenClaw并打通企业微信与QQ [6][15];字节跳动火山引擎上线云上SaaS版ArkClaw,深度适配飞书 [6][15];智谱发布国内首个一键安装本地版AutoClaw(澳龙),预置超50个技能以降低部署门槛 [6][15] - **国产模型使用量激增**:根据OpenRouter数据,在报告所述周期内,MiniMax M2.5和Step 3.5 Flash的token消耗量分别为1.89T和1.23T,两者合计占该平台周token消耗量的约1/6,位列全部模型消耗量的前两名 [6][16] - **政策支持力度大**:尽管工信部提示了OpenClaw的安全风险,但多地政府出台扶持政策 [7][20]。例如,深圳市龙岗区对符合条件的OPC项目给予最高1000万元股权投资支持 [7][20];无锡高新区推出单项最高达500万元的支持举措 [7][20];合肥高新区、常熟市、杭州市萧山区也提供千万级算力券等支持 [7][20] 2. 国际:OpenAI收购OpenClaw,AI进入商业化轨道 - **科技巨头加速布局**:OpenAI收购了由奥地利程序员开发的OpenClaw [8][21];英伟达CEO计划推出下一代开源智能体平台“NemoClaw” [8][21];Meta收购了由OpenClaw智能体衍生的网络平台Moltbook [8][21] - **安全问题凸显,欧美热度有限**:截至2026年3月13日,OpenClaw已披露共258个漏洞,其中包含关键和高风险漏洞 [22];报告指出欧美国家对于“养龙虾”热情不高,热潮主要局限于技术群体 [8][22] 3. 周度数据更新 - **港股市场表现**:报告期内,恒生指数下跌1.13%,在全球主要市场中跌幅居中 [23];恒生科技指数上涨0.62% [23] - **资金流向**:本周港股通成交净额为流入464.6亿元 [24];资金净流入居前的个股包括中国海洋石油(+51.2亿港元)、腾讯控股(+34.6亿港元)、阿里巴巴-W(+19.0亿港元) [24][28] - **AH股溢价**:本周恒生沪港通AH溢价指数为122.17,环比有所提升 [28] 4. 投资建议 - **互联网**:关注AI商业化及应用场景拓展,推荐阿里巴巴-W、拼多多、百度集团-SW,受益标的腾讯控股 [9][31] - **计算机**:AI需求可预见性提升,软件侧孕育机会,重点推荐浪潮数字企业,受益标的有金蝶国际、百融云、北森控股、第四范式、AI大模型标的MiniMax、智谱 [9][31] - **汽车&自动驾驶**:国内L3级获准入试点许可,高阶智驾商业化有望迎来拐点;Robotaxi有望加速落地 [9][31]。受益标的包括整车(小鹏汽车-W、小米集团-W、特斯拉)、自动驾驶解决方案(百度集团-SW、小马智行-W、文远知行-W)、零部件(地平线机器人-W、速腾聚创、禾赛-W)[9][31]
海外行业周报:国内大厂抢占市场,“龙虾热”引爆国产模型增量红利-20260315
开源证券· 2026-03-15 22:31
报告行业投资评级 - 投资评级:看好(维持) [2] 报告的核心观点 - 国内大厂正积极抢占AI应用市场,由“OpenClaw”(报告中比喻为“龙虾”)生态引发的“龙虾热”正在引爆国产大模型的增量红利 [1][6] - 国际科技巨头通过收购等方式推动AI进入商业化轨道,但欧美市场热度主要局限于技术群体 [8][21] - 国产模型在接入OpenClaw后使用量激增,带动相关token消耗量数倍增长 [6][16] - 尽管存在安全风险提示,但国内多地政府出台了积极的扶持政策,为产业发展提供资金和场景支持 [7][20] 根据相关目录分别进行总结 国内:大厂抢占市场,“龙虾热”引爆国产模型增量红利 - **应用端竞争激烈**:腾讯推出全场景AI智能体WorkBuddy,深度兼容OpenClaw并打通企业微信与QQ [6][15];字节跳动火山引擎上线云上SaaS版ArkClaw,深度适配飞书以抢占协同办公场景 [6][15];智谱发布国内首个一键安装本地版AutoClaw(澳龙),预置超50个技能以降低部署门槛 [6][15] - **国产模型使用量激增**:根据OpenRouter数据,在2026年3月9日至15日当周,MiniMax M2.5和Step 3.5 Flash的token消耗量分别为1.89T和1.23T,两者合计占该平台周token消耗量的约1/6,位列全部模型消耗量的前两名 [6][16] - **政府政策大力扶持**:深圳市龙岗区拟对符合条件的OPC项目给予最高1000万元股权投资支持 [7][20];无锡高新区推出12条“养龙虾”举措,单项支持最高达500万元,覆盖算力补贴、数据采购及场景应用 [7][20];合肥高新区、常熟市、杭州市萧山区也相继出台政策,提供千万级算力券、创业资金及场景补贴 [7][20] - **安全风险与增长并存**:工信部等部门指出OpenClaw存在配置脆弱、提示词注入等隐患 [7][20];但中国境内活跃的OpenClaw互联网资产呈现爆炸式增长,已超过2.3万个,主要分布在北京、上海、广东、浙江等地 [22] 国际:OpenAI收购OpenClaw,AI进入商业化轨道 - **巨头收购推动商业化**:OpenAI收购了由奥地利程序员于2025年11月开发的OpenClaw [8][21];英伟达CEO黄仁勋称其为“史上最重要的软件发布之一”,并计划推出下一代开源智能体平台“NemoClaw” [8][21];Meta收购了由OpenClaw智能体衍生的网络平台Moltbook,该平台允许上百万AI智能体自主社交 [8][21] - **安全问题引发关注**:截至2026年3月13日,OpenClaw已披露共258个漏洞,其中近期案例中包括12个关键风险和21个高风险 [22];安全研究人员发现其核心系统存在“ClawJacked”重大安全漏洞,攻击者可能通过恶意网页接管AI智能体 [8][22] - **欧美市场热度有限**:相较于中国的“龙虾热”,欧美国家对于“养龙虾”热情不高,热潮主要局限于技术群体中,部分原因在于普通用户配置门槛高、安全隐患大 [8][22] 周度数据更新 - **市场表现**:本周(报告期,推测为2026年3月9日至13日)恒生指数下跌1.13%,在全球主要市场中跌幅居中 [23][26];恒生科技指数本周上涨0.62% [23] - **资金流向**:本周港股通成交净额为流入464.6亿元人民币,环比由负转正 [24];头部活跃个股中,中国海洋石油(+51.2亿港元)、腾讯控股(+34.6亿港元)、阿里巴巴-W(+19.0亿港元)资金净流入居前 [24][28] - **AH股溢价**:本周恒生沪港通AH溢价指数为122.17,环比有所提升,或已触底 [28][31] 投资建议 - **互联网行业**:关注AI商业化及应用场景拓展;推荐阿里巴巴-W、拼多多、百度集团-SW,受益标的腾讯控股 [9][31] - **计算机行业**:AI需求可预见性提升,软件侧孕育机会;重点推荐受益于央国企IT支出的浪潮数字企业;受益标的有金蝶国际、百融云、北森控股、第四范式、AI大模型标的MiniMax、智谱 [9][31] - **汽车及自动驾驶行业**:国内L3级获准入试点许可,高阶智驾商业化有望迎来拐点;Robotaxi有望加速落地;受益标的包括整车(小鹏汽车-W、小米集团-W、特斯拉)、自动驾驶解决方案(百度集团-SW、小马智行-W、文远知行-W)、零部件(地平线机器人-W、速腾聚创、禾赛-W) [9][31]
智微智能(001339):战略投资元川微,加码边缘及端侧AI推理赛道
国信证券· 2026-03-15 20:21
报告投资评级 - 投资评级:优于大市(维持) [2][4][44] 核心观点与事件 - 智微智能通过全资控股的曜腾投资,战略投资了国内LPU架构先行者杭州元川微科技有限公司,加码边缘及端侧AI推理赛道 [1][3][5] - 元川微是国内首家专注于AI实时推理算力芯片的初创企业,其LPU产品精准满足行业对超低时延、高吞吐算力、极致能效比及高性价比的核心诉求 [4][5] - 基于Token出海、国内大模型快速发展带来的智算需求增长,报告认为智微智能2026年智算业务有望快速增长,且2027年LPU服务器产品有望开始放量,打开第二增长曲线,因此上调了盈利预测 [4][44] LPU技术架构与优势 - LPU是专为推理设计的AI芯片,其核心是张量流处理器(TSP)架构,该架构将功能单元以2D网络方式排列成切片,指令流与数据流垂直交叉运行,实现确定性计算 [4][8][9] - LPU设计遵循四大原则:软件为先(采用静态调度)、可编程流水线架构、确定性的计算和网络、片上存储(以SRAM为主)[18][20] - 与GPU相比,LPU在推理性能上具备显著优势:以Llama 3.3 Instruct 70B测试,Groq LPU的输出速度达306 Token/s,端到端响应时间为2.4秒(输出500个Token),每Token能耗不到GPU的1/4 [4][28] 公司业务分析与盈利预测 - 报告将智微智能业务分为四部分进行预测: - **行业终端业务**(PC、OPS、云终端):预计2025-2027年收入为25.57/24.20/25.83亿元,增速承压 [36][41] - **ICT基础设施业务**(服务器、交换机、网安设备):预计2025-2027年收入为7.73/9.37/18.47亿元,其中2027年因LPU服务器放量预计增长97.2% [37][41] - **工业物联网业务**:预计2025-2027年收入为2.59/3.61/4.83亿元,保持较高增速 [38][41] - **智算业务**:预计2025-2027年收入为5.35/17.25/18.55亿元,2026年受益于算力需求爆发预计增长222.4%,毛利率维持在65%以上 [39][40][41] - **整体财务预测**:上调2025-2027年营收至44.96/58.24/71.62亿元(前值46.93/53.27/59.60亿元),归母净利润至1.99/6.14/7.30亿元(前值2.21/2.69/3.29亿元)[4][41][43] - 受益于高毛利的智算业务占比提升,预计公司整体毛利率将从2025年的18.7%大幅提升至2026年的29.0% [41] - 当前股价对应2025-2027年市盈率(PE)分别为92/30/25倍 [4][44]
百度实习生放倒百度,一个时代轰然倒塌
商业洞察· 2026-03-15 17:42
核心事件与市场表现 - 2025年3月10日,成立仅4年的AI公司MiniMax在港股市值达到3826亿港币,超越百度的3363亿港币,实现里程碑式超越 [3] - MiniMax市值暴涨,其于今年初上市,在2个多月内市值从1000亿港币飙升至3000多亿港币 [9] - 此次市值变动被描述为“又一个deepseek时刻的开始”,并将百度作为市值计量单位进行对比 [3] “全民养虾”热潮的行业影响 - 近期市场出现“全民养虾”热潮,直接利好大模型厂商,并催生出以MiniMax、月之暗面、智谱AI为代表的“龙虾三兄弟” [7] - 该热潮带动了产业链多个环节的爆发性增长,具体受益赛道及成果如下 [8]: - **大模型厂商**:作为核心赢家,营收规模指数级暴涨,资本市场市值或估值翻倍式跃升 - **云服务厂商**:作为“卖铲人”,迎来算力订单与新增用户双重爆发,锁定了大量长期高粘性付费客户,相关上市公司市值同步大幅拉升 - **产业链衍生玩家**:包括硬件商家、技能开发者等,本地部署硬件销量与价格翻倍,配套服务形成完整变现闭环,从业者收入大幅增长 - **二级市场概念股**:A股/港股算力、云计算、AI硬件相关标的因“龙虾概念”连续涨停,相关上市公司市值短期实现翻倍增长 MiniMax的核心竞争优势 - MiniMax专注的多模态大模型精准切中“养虾”痛点——高昂的token消耗成本 [8] - 公司将token价格大幅降低,其MiniMax M2.5模型的输入价格仅为0.3美元/百万token,输出价格为1.1美元/百万token,仅为国际主流模型价格的1/10至1/6 [8][9] - 公司产品低价策略,结合各大厂“送虾”降低用户门槛的推广活动,共同推动了其市场热度与市值飙升 [9] 百度的历史地位与现实困境 - 百度曾是中国最强的AI研究机构,被誉为“中国AI的黄埔军校”,汇集了包括吴恩达、余凯、阿莫代伊等国内外顶尖AI人才 [12] - 许多轰动全球的AI技术早在多年前的百度研究院已现雏形,但未能在公司内部开花结果 [12] - 公司被指多次“起大早赶晚集”,在多个前沿领域先行但最终未能保持领先,例如 [13][15]: - 近10年前率先在国内提出“all in AI”,文心大模型早期可与ChatGPT竞争,但后期表现平平 - 百度外卖曾拥有超30%的最高市占率,最终被对手超越 - 与吉利合作造车(极越汽车)未能持续辉煌 - 在自动驾驶领域,百度是国内最早一批参与者,拥有最多的路测牌照(100张,占全国101张牌照中的大部分),但除“萝卜快跑”外,其他相关声量微弱 [15][16] - 公司创始人李彦宏将问题根源归结为“不聚焦”,即内部派系林立、资源分散、各自为战,导致缺乏突破点和侧重点,最终错失机会 [18]
京东集团-SW(09618):集团收入稳健,外卖投入与亏损持续收窄
国盛证券· 2026-03-15 14:42
投资评级与目标价 - 报告对京东集团-SW重申“增持”评级 [3] - 基于8倍2027年预测市盈率,给予美股(JD.O)目标价31美元,港股(09618.HK)目标价121港元 [3] 核心观点总结 - 公司2025年第四季度收入实现稳健增长,但整体盈利能力承压,外卖业务亏损持续收窄,新业务与物流板块表现亮眼 [1][2] - 用户规模与活跃度显著提升,日百品类成为商品收入增长核心驱动力,在国补政策支持下,带电品类增长有望恢复 [2] - 外卖业务与核心零售协同效应显现,未来将聚焦订单健康增长与市场份额提升,并通过运营优化降低投入 [2] - 海外业务(Joybuy)与AI技术(JoyAI)取得积极进展,为公司长期发展提供新动能 [3] - 分析师预测公司2026-2028年收入及Non-GAAP净利润将保持增长态势 [3] 财务业绩与预测 - **2025Q4业绩**:总收入3523亿元,同比增长1.5% [1]。京东零售/京东物流/新业务收入分别为3019/635/141亿元,同比变化-1.7%/+21.9%/+200.9% [1]。商品/服务收入分别为2730/793亿元,同比变化-2.8%/+20.1% [1]。合并经营亏损58亿元,Non-GAAP归母净利润11亿元,利润率约0.3% [1] - **用户与品类表现**:2025年年度活跃用户超7亿,四季度活跃用户数和购物频次同比增长均超30% [2]。四季度日百品类收入同比增长12.1%,占商品收入比例超四成,其下的商超收入已连续8个季度保持双位数增长 [2]。四季度平台及广告收入同比增长15.0% [2] - **外卖业务**:2025Q4外卖业务亏损环比收窄20%,与零售业务的交叉销售和购物频率呈上升趋势,并为Q4广告业务贡献2-3%的增量收入 [2]。目标是将市场份额从2025年的15%提升至30% [2] - **财务预测**:预测2026-2028年收入分别为13854/14640/15187亿元,同比增长5.8%/5.7%/3.7% [3]。预测同期Non-GAAP归母净利润分别为319/390/411亿元,同比增长18.0%/22.2%/5.4% [3] - **历史与预测财务数据**:2025年营业收入13090.85亿元(即1.31万亿元),同比增长13.0%;Non-GAAP归母净利润270.32亿元,同比下降43.5% [4]。预测毛利率将从2025年的16.0%逐步提升至2027-2028年的16.7% [12]。预测Non-GAAP归母净利率将从2025年的2.1%恢复至2027-2028年的2.7% [12] 业务分部表现与展望 - **京东零售**:2025Q4收入3019亿元,同比下滑1.7%,经营利润率3.2% [1]。预测2026年收入11546亿元,同比增长2.5%(基于图表12分部收入计算)[12] - **京东物流**:2025Q4收入635亿元,同比增长21.9%,经营利润率3.0% [1]。预测2026年收入2520亿元,同比增长16.1% [12] - **新业务**:2025Q4收入141亿元,同比大幅增长200.9%,但经营利润率为-105.1% [1]。预测2026年收入588亿元 [12] - **海外与AI业务**:欧洲线上零售业务Joybuy已在多国试运营,计划于2026年3月正式上线 [3]。自研大模型JoyAI已落地超过2000个业务场景 [3]