大模型
搜索文档
亚马逊(AMZN):云计算进入AI推理时代,AWS有望后发先至
申万宏源证券· 2026-03-23 19:09
投资评级与估值 - 首次覆盖亚马逊,给予“买入”评级,目标股价271.5美元 [1][5] - 采用分部估值法,目标总市值29149亿美元,其中:北美业务给予2026年20倍市值/EBIT估值(7182亿美元),国际业务给予2026年3倍PS估值(5490亿美元),AWS业务给予2026年10倍PS估值(16477亿美元) [5][10][11] 核心观点与行业趋势 - 云计算行业正从AI训练时代迈入AI推理时代,价值重心有望从硬件环节向云厂商迁移 [5] - 当前AI算力环节获取了产业链大部分价值,例如英伟达营收从FY23的269.7亿美元增长至FY26的2159.4亿美元,而同期三大云厂商(AWS、谷歌云、微软智能云)的公有云业务营收总和仅增长1043.5亿美元 [5][27] - 推理时代对算力性价比、网络稳定性和云生态丰富度要求更高,看好拥有自研芯片能力、丰富企业客户积累及全栈AI技术能力的传统云巨头(AWS、Azure、Google Cloud)重获竞争优势 [5][24] - 2025年以来北美云厂商资本开支大幅抬升,市场关注焦点已从投入规模转向投资回报率(ROI) [5][39] 亚马逊AWS业务竞争力 - **自研芯片与网络优势**:AWS通过自研Trainium系列AI芯片和EFA(弹性网络适配器)网络架构,在推理时代的算力性价比和网络稳定性上逐渐体现优势 [5][7][54] - **战略合作绑定核心客户**:亚马逊是AI公司Anthropic的最大单一股东(截至25Q4持股价值606亿美元),并与OpenAI达成战略合作,获得其算力订单与芯片迭代合作 [5][73][74] - **关键客户贡献增长**:预计Anthropic对AWS的营收贡献将从2025年的1.9%提升至2028年的8.0%,OpenAI也将在FY26开始对AWS形成贡献 [5][80] - **AI云业务高速增长**:预计AWS营收在2026-2028年将保持28.0%、27.0%、26.0%的高速增长,其中AI云业务占比将从2026年的15.6%提升至2028年的31.2% [12][47] - **盈利能力改善**:自研芯片有望优化成本结构,提升云服务利润率,预计AWS营业利润率在2026-2028年分别为34.5%、35.0%、35.5% [12][47] 亚马逊电商与零售业务 - **物流体系护城河稳固**:已完成物流网络区域化重构,履约费用率进入平稳区间,盈利质量逐步改善 [5][88] - **AI重构流量入口**:公司正将AI能力深度整合至Alexa+和Rufus等助手,依托Anthropic的Claude模型能力,有望演进为下一代AI电商核心入口,强化用户粘性与转化效率 [5][9][97] - **业务结构健康**:第三方(3P)平台业务已成为核心营收来源,2025年营收达1722亿美元,高毛利的广告业务占比提升驱动利润率改善 [5][85][91] 财务预测与关键假设 - **整体营收与利润**:预计公司营业收入将从2025年的7169.2亿美元增长至2028年的10341.8亿美元,年复合增长率约13% [2] - **净利润增长**:预计GAAP净利润将从2025年的776.7亿美元增长至2028年的1362.5亿美元 [2] - **各业务增长假设**: - AWS业务:2026-2028年营收增速假设为28.0%、27.0%、26.0% [12] - 1P自营业务:2026-2028年营收增速假设为9.0%、9.0%、9.0% [12] - 3P平台业务:2026-2028年营收增速假设为8.0%、9.0%、9.0% [12] - 广告业务:2026-2028年营收增速假设为16%、15%、13% [12] 资本开支与投资回报 - **行业Capex高增**:预计谷歌、微软、亚马逊、META、Oracle在FY26的资本开支总和将接近7000亿美元,同比增长73% [36] - **亚马逊Capex指引**:公司上调2026年Capex指引至2000亿美元,Capex与经营性现金流比率预计达到110% [36] - **关注AI云ROI**:市场对高资本开支的投资回报率担忧加剧,预计随着Anthropic、OpenAI等客户工作负载部署及自研芯片成本优化,AWS的AI云业务资本密集度(Capex/营收)有望持续改善 [46][49]
110万美元悬赏!AMD发起全球战书:谁能打破DeepSeek与Kimi的推理速度极限?
AI科技大本营· 2026-03-23 11:43
赛事概述 - 由AMD与GPU MODE联合发起一项名为“2026线上黑客松:AMD E2E Model Speedrun”的全球性AI性能优化竞赛,旨在通过极客对决定义下一代AI推理的工业标准[2][3][4] 赛事目标与意义 - 竞赛聚焦于在极高并发下突破内存墙限制,并通过优雅的代码实现最高效的算子重构,强调在AI战场中速度与吞吐量的决定性作用[2] - 参赛者的极限优化成果将有机会直接合入主流开源框架,从而影响行业标准[4] 奖金设置 - 赛事总奖金池高达110万美元[10] - 进入决赛的Top 10队伍每支保底获得1万美元奖金[5][11] - 赛道一(DeepSeek-R1-0528 FP4 + MTP)的冠军奖金为35万美元[5][11] - 赛道二(Kimi K2.5 1T FP4)的冠军奖金为65万美元[5][11] - 两大赛道独立,团队可双线作战以包揽奖金[11] 赛制结构 - 比赛采用“底层算子突围 + 端到端决赛大考”的双阶段赛制[13] - **预选赛阶段**:参赛者需对三大核心GPU算子进行极限优化,包括MXFP4 MoE(最高1500分)、MLA Decode(最高1250分)和MXFP4 GEMM(最高1000分)[14][15] - 每个内核问题的得分计算公式为:最大分值 × [1 -(排名分值/20)],排名分值从0到19[15][16] - 总分为三项内核得分之和,仅排名前20的算子可获得积分,总分排名前10的战队或个人晋级决赛[17][18] - **总决赛阶段**:Top 10选手将获得AMD提供的单节点8卡云端Instinct™ GPU集群,在指定并发度下优化两大明星模型的端到端性能[19] 决赛赛道与评判标准 - **赛道1:DeepSeek-R1-0528 FP4 + MTP** - 需在4、32、128三种并发度下同时满足吞吐量、交互性和端到端延迟的硬性指标,并保证模型精度(GSM8K ≥ 0.93)[19] - 具体性能门槛包括:在4并发时吞吐量≥1500 token/s/GPU,交互性≥165 token/s/user,E2E延迟≤22秒;在32并发时吞吐量≥3900 token/s/GPU,交互性≥50 token/s/user,延迟<18秒;在128并发时吞吐量≥6000 token/s/GPU,交互性≥48 token/s/user,延迟<5秒[20] - **赛道2:Kimi K2.5 1T FP4** - 同样需在4、32、128三种并发度下同时满足多项性能指标,并保证模型精度(GSM8K ≥ 0.93)[20] - 具体性能门槛包括:在4并发时吞吐量≥1350 token/s/GPU,交互性≥150 token/s/user,延迟≤65秒;在32并发时吞吐量≥4500 token/s/GPU,交互性≥65 token/s/user,延迟≤14秒;在128并发时吞吐量≥5300 token/s/GPU,交互性≥50 token/s/user,延迟≤24.5秒[20] - 决赛评分基于每GPU的Token Throughput(最高600分)和Interactivity(最高400分),三个并发级别总满分3000分[21] 参赛要求与成果归属 - 赛事面向AI底层优化工程师、CUDA/Triton极客、系统架构师及开源社区贡献者,支持个人或最多3人组队参赛[26] - 所有具备获奖资格的团队,其提交的代码必须在赛后2-4周内,在AMD工程师指导下向AMD官方仓库发起Pull Request并完成合并,以确保优化成果能造福AI社区[22][23] 关键时间节点 - 报名及预选赛截止时间为4月7日14:59(中国标准时间),届时将产生Top 10决赛队伍[25][26] - 决赛排位战时间为4月8日00:00至5月16日14:59[25] - 全球颁奖典礼于5月19日举行[25] 参赛资源与社区 - 参赛者需先加入AMD AI Developer Program以获取官方资源[26] - 预选赛参考内核及工具库可通过GitHub获取[27][28] - 官方鼓励参赛者加入GPU MODE Discord社区及微信比赛专属群,以获取技术支持并与全球开发者交流[5][28]
Meta计划大规模裁员,“牛油果”AI模型推迟发布;Kimi 新一轮10亿美元融资正在进行,估值涨至180亿美元丨AI周报
创业邦· 2026-03-23 11:42
全球AI产业动态与模型发布 - 小米发布新一代基础大模型体系,其旗舰模型MiMo-V2-Pro(内部测试版“Hunter Alpha”)拥有万亿参数和百万级上下文,被视为小米全面押注智能体(Agent)时代的重要信号 [7][9] - 腾讯混元新模型HY 3.0即将在4月对外发布,相比HY 2.0版本效果进步明显,推理和Agent能力有显著提升 [13] - 智谱发布首个专为OpenClaw(龙虾)场景深度优化的通用大模型GLM-5-Turbo,并上调新模型API价格20%,2026年第一季度其API价格已累计上涨83% [21] - 月之暗面Kimi发布技术报告,对模型核心结构残差连接进行重新设计,使48B模型训练效率提升1.25倍,获得马斯克“令人印象深刻”的评价 [33] - 科大讯飞发布基于AstronClaw打造的桌面AI助理Loomy,支持多步骤任务自动执行,并已适配飞书、钉钉、QQ等主流IM工具 [19] AI智能体(Agent/“龙虾”)生态发展 - 英伟达CEO黄仁勋将OpenClaw称为“绝对是下一个ChatGPT”,认为这项技术是基础性变革,能极大地拓展个人使用AI的能力 [31] - 马化腾首次公开谈及“养虾”,认为“龙虾”应用能让AI落地到丰富场景,未来腾讯发展Agent将结合中心化和去中心化理念,并考虑融入微信的去中心化生态 [28][29] - 企业微信已支持一键扫码接入OpenClaw,各大主流云服务、大模型厂商及OpenClaw生态产品正陆续上线此支持 [25] - 钉钉创始人陈航指出员工在公司使用“龙虾”存在权限脆弱、越权执行、数据泄露、恶意技能四大安全风险,并称有超39万个Claw站点资产存在数据暴露风险 [36] - 中国互联网金融协会发布风险提示,指出OpenClaw智能体的高系统权限与弱安全配置易被利用,建议金融消费者和从业机构谨慎使用并加强安全管理 [39][40] 公司战略与业务进展 - 月之暗面Kimi正在进行新一轮10亿美元融资,估值已涨至180亿美元,在3个月内翻了4倍,并成为国内估值最快突破百亿美元的十角兽公司 [8] - 百度2025年第四季度AI业务收入占其一般性业务收入的43%,超出市场预期;2025年AI应用全年收入突破100亿元,AI原生营销服务收入同比增长301% [30] - 字节跳动安全团队发布《OpenClaw安全规范和使用指引》,并面向员工推出基于火山引擎ArkClaw企业版构建的ByteClaw服务 [8] - 阿里正推进内部计划,向员工提供Token额度,鼓励员工在工作中使用悟空、Qoder系列等付费AI工具 [37] - Meta计划大规模裁员,员工规模或缩减20%,以抵消人工智能基础设施的巨额投入 [9] 产品发布与行业应用 - 百度发布“家用小龙虾”——小度龙虾,将OpenClaw复杂任务能力引入家庭空间,实现自然语音交互的共享家庭助手 [17] - 智己汽车发布AI超级智能体IM Ultra Agent,首次将千问大模型量产上车,打通智舱、智驾与底盘控制 [11] - 阅文集团旗下“作家助手”宣布其Claw应用已开启内测,成为“全民养虾”热潮中首家部署在网文创作工具的应用 [22][23] - 体育AI科技品牌XbotGo发布第三代旗舰球场相机猎鹰Falcon,凭借AI追拍技术实现全自动跟拍 [13] - 奈飞联合CEO泰德・萨兰多斯表示AI应该成为创作者工具,让制作更高效、效果更好,但强调优秀配音演员至关重要,AI配音缺乏人类表演会拉低作品质量 [38][39] 基础设施、算力与安全 - Meta与AI云公司Nebius签署新的五年期AI基础设施供应协议,协议总价值最高可达近270亿美元 [21] - 德国政府计划到2030年,将通用数据中心的算力在2025年基础上至少翻一番,其中专门用于AI的算力将至少增至2025年的4倍 [31] - 人工智能安全初创公司Xbow完成1.2亿美元融资,估值突破10亿美元,目前已拥有超过100家客户 [29] - 360回应“安全龙虾”私钥泄露事件,称是发布流程中的配置疏漏,误将内部域名证书打包进安装程序,该证书已第一时间吊销 [37] 资本市场与投融资 - 本周期全球披露人工智能融资事件33起,总融资规模为56.46亿元人民币,平均融资金额为2.69亿元人民币 [40] - 本周国内人工智能领域已披露融资总额为26.11亿元人民币,融资额最高的为地瓜机器人(机器人软硬件通用底座提供商),完成8.3亿元人民币B1轮融资 [45] - 本周海外人工智能领域已披露融资总额为30.36亿元人民币,融资额最高的为AI网络安全平台研发商XBOW,完成1.2亿美元C轮融资 [62] - 从融资阶段分布看,本周全球获投AI企业中早期阶段(种子/天使/A轮)有25个,成长期(B/C轮)有8个 [42] - 国内融资地区主要集中在北京(8起)、广东(7起)、上海(6起) [43] 法律、争议与行业观点 - 微软正在权衡针对亚马逊和OpenAI的法律诉讼,因亚马逊可能提供OpenAI新产品,这或破坏微软与OpenAI的独家云合作伙伴关系 [31] - 马斯克表示,如果在对OpenAI的诉讼中获胜,所有由此获得的法律收益(此前索赔高达1340亿美元)将会全部捐赠给慈善机构 [35][36] - OpenAI计划为ChatGPT推出“成人模式”,仅允许生成带有成人主题的文字对话并限制生成露骨图像,该计划遭到其内部心理健康顾问委员会全票反对 [32][33]
绿联科技20260320
2026-03-22 22:35
公司概况 * 公司为绿联科技,是一家消费电子配件及网络附加存储设备制造商[1] * 公司产品定位为“终端性价比”,类似于小米,在同等硬件配置下提供最具竞争力的价格,与采取高溢价、高端定位的安克创新形成差异[8] 近期经营表现与增长趋势 * 公司整体增速维持高位,2025年第三季度收入增长约60%,其中海外业务增长约65%,国内业务增长约55%[3] * 2026年1至2月销售额增速相比2025年第四季度有进一步加速的迹象[3] * 预计2026年归母净利润达10亿元,同比增长约50%[2] 产品结构、占比与增长 * 产品分为三大类[9] * **传统数码周边产品**:如转接头、数据线等,营收占比约40%出头,常规增速约15%,2025年受益政策增速达30%附近[9] * **充电类产品**:包括大功率充电器和充电宝,营收占比约40%,自2023年起维持50%以上增速,2025年下半年增速可能突破50%[9][10] * **NAS产品**:营收占比约10%出头,是增长的核心驱动力[10] NAS业务核心分析 * **营收与市场地位**:2025年NAS业务营收约10亿元,较2024年约2亿元高速增长[11];国内市占率超30%居首,海外主流市场市占率达双位数,海外收入占比约50%[11] * **未来增长预测**:预计2026年NAS业务收入达15-20亿元,增速接近100%[2][11] * **增长驱动力**: 1. **市场份额提升**:产品性能具备竞争力,价格相比传统龙头群晖有显著优势(国内近五折)[11] 2. **市场规模扩大**:AI等新需求带动国内C端NAS市场规模增长30%-50%,高性价比产品吸引边缘用户推动市场扩容[11] * **AI NAS产品进展**:已发布搭载英特尔Ultra系列移动CPU的AI NAS产品,支持本地运行50-100亿参数大模型,未来计划基于开源模型进行针对性精调以匹配NAS使用场景[4][5] * **政策与生态**:深圳市龙岗区政府对可运行“龙虾盒子”的AI NAS产品提供30%的专项补贴,利好放量[2][5];NAS可作为AI生态的数据中转站和仓库,配合“龙虾”等AI工具提供无缝体验[5] 渠道结构与盈利能力 * **海内外业务占比**:收入结构中,国内业务约占40%,海外业务约占60%[6] * **渠道结构**:以线上为主,线上渠道占比约80%,线下占20%左右[6];正积极拓展海外线下渠道,已进驻沃尔玛、塔吉特、Costco等[6] * **盈利能力差异**:海外业务毛利率超40%,国内毛利率不足30%,差距接近15个百分点[2][7] * **利润增长**:公司利润增速更贴近海外业务增速,近年来维持在30%-40%的水平[7] 盈利模式与市场潜力 * **盈利结构**:NAS业务在国内C端市场利润率较低,盈利主力预计来自海外C端及未来B端市场[12] * **海外定价优势**:海外产品定价普遍比国内高出30%以上[13] * **B端市场潜力**:高端型号已能满足部分中小企业需求,企业市场更注重系统稳定性和服务,利润空间大;参考威联通,中小企业业务净利润率接近20%[13] 业绩与估值预测 * **2025年业绩**:预计归母净利润约7亿元[14] * **2026年业绩驱动**:预计归母净利润达10亿元,增长主要由NAS业务贡献更显著利润及传统产品业务贡献30%-40%维度的利润增长驱动[14] * **估值水平**:以当前不到300亿元市值计算,对应2026年预测利润的市盈率约为30倍[14]
杨植麟讲如何scaled Kimi K2.5完整图文版/压缩版/视频版
理想TOP2· 2026-03-22 20:52
文章核心观点 - 公司致力于通过技术创新构建更优秀的开源模型,以实现智能的民主化,其核心策略是围绕“Scaling Law”从多个维度扩展模型能力,包括提升Token效率、扩展上下文长度以及引入智能体群范式 [8][9][13] - 公司最新发布的Kimi 2.5模型及下一代架构Attention Residue,通过Muon优化器、Kimi Linear架构、原生多模态融合等多项自研技术,在性能上实现了对现有主流架构和优化方法的全面超越,并展示了开源模型触及前沿的潜力 [4][70][72][87][111] 模型扩展的核心维度与技术 Token效率提升 - **核心原理**:Token效率不仅关乎基础设施成本,更决定了智能的上限,提高Token效率相当于在有限的高质量数据下获得更优的模型性能 [15][21] - **Muon优化器**:作为公司大力投资的二阶优化器,其梯度更新方式使每个条目彼此正交,相比传统Adam优化器能获得**两倍**的Token效率提升,例如将**50万亿**个高质量Token的效用提升至相当于**100万亿**个 [2][23][24] - **QK-Clip技术**:在向万亿参数规模扩展时,为解决训练中出现的logits爆炸问题,公司引入了QK-Clip技术,通过在前向传播中计算并限制每个注意力头的Query和Key投影最大值,确保了训练的稳定性 [2][30][34] - **实际效果**:在相同参数和训练Token数量下,使用Muon优化器替换AdamW,模型在MMLU、代码生成(HumanEval)、数学(GSM8K)等多个基准测试上性能显著提升,并成功扩展到万亿参数模型的训练 [27][28][35] 长上下文能力扩展 - **架构挑战**:原始线性注意力的全局单一衰减因子导致模型在长上下文处理中陷入“全盘保留或彻底遗忘”的困境,缺乏精准剔除冗余信息的能力 [3][44][45] - **Kimi Delta Attention**:通过将全局标量衰减因子升级为细粒度的对角矩阵,赋予每个通道独立的衰减控制权,允许特定通道长效留存关键信息而其他通道快速刷新,从而增强了模型的表达能力 [3][46][47] - **Kimi Linear架构**:以**1:3**的比例混合线性注意力层与全注意力层,并利用数学等价变换实现分块并行化计算,在不损失精度的前提下适配现代GPU算力,实现了对全注意力架构的全面超越,在短上下文和长上下文任务上均表现更优 [3][42][53][55][56] 智能体群(Agent Swarms)范式 - **范式原理**:为突破单智能体在复杂任务中串行执行时间和处理容量的瓶颈,智能体群范式借鉴人类社会分工,通过一个协调器将任务拆解并分配给多个并行工作的子智能体,在输入、输出和行动维度实现规模化扩展 [4][16][58] - **训练创新**:为克服训练中的串行崩溃与子任务作弊行为,引入了由实例化奖励、完成奖励和结果奖励构成的三位一体目标函数,有效引导系统学习并行、有意义的任务分解与执行 [4][67] - **性能优势**:与单智能体相比,智能体群能显著降低复杂任务的执行时间,并能扩展至由数百甚至数千个子智能体协同工作,以在可接受的时间内完成产生经济价值的复杂任务 [4][62][65] Kimi 2.5模型的关键创新 - **训练稳定性**:模型训练过程超过**15万亿**个Token(另有额外**15万亿**个Token的训练),全程非常稳定,没有损失尖峰,这得益于Muon等新技术的引入 [74] - **原生多模态融合**:Kimi 2.5是首个从预训练第一天起就将视觉与文本模态统一映射到共享嵌入空间和表示空间的开源模型,这种早期融合策略优于后期添加视觉能力的做法,催生了如“视觉到代码”等新兴能力 [4][77][78][79] - **模态相互增强**: - **视觉增强文本**:仅使用视觉任务进行强化学习后,模型在纯文本任务(如MMLU-Pro、GPQA-Diamond)上的性能也得到了提升,例如MMLU-Pro从**84.7**提升至**86.4** [80][81] - **文本增强视觉**:凭借强大的文本基础,模型在**不使用任何视觉SFT数据**,仅通过文本SFT与联合强化学习的情况下,在视觉问答等任务上实现了接近最先进的性能 [4][83][84] 下一代架构展望:Attention Residue - **设计灵感**:将时间维度(如LSTM)的成功经验平移至深度维度,将传统的固定加法形式的残差连接(被视为旋转了90度的LSTM)推广为旋转了90度的注意力机制 [4][93][94][95] - **核心机制**:通过聚合所有先前层的隐藏状态,并使用注意力机制来计算当前层的输出,而非仅依赖上一层输出 [4][98][99] - **效率优化**:采用块注意力残差方案,将网络层划分为多个块,在块内保留标准残差连接,仅在块间应用注意力残差,以平衡计算开销与性能 [4][100][101] - **预期收益**:该架构能将Token效率提升**24%**(例如,**50万亿**个高质量Token的效用提升至超过**60万亿**),并在验证损失和编码、数学等推理密集型任务上显示出改进 [4][103]
美团开源5677亿参数大模型,两项测试刷新SOTA!
搜狐财经· 2026-03-22 20:22
模型发布与核心参数 - 美团开源了名为LongCat-Flash-Prover的大模型,该模型拥有5677亿参数,并采用混合专家模型架构 [1] - 该模型的核心目标是解决复杂的数学证明问题 [1] 模型架构与技术创新 - 模型引入了混合专家迭代框架,用于生成大规模、高质量的形式化推理轨迹 [3] - 通过整合Lean4以及基于AST的多阶段严格验证流程,旨在消除模型生成内容中的“幻觉”现象 [3] - 在训练中采用了混合专家迭代框架来生成冷启动数据,并在强化学习阶段引入HisPO算法以稳定MoE模型在长程任务上的训练 [3] - 模型加入了定理一致性和合法性检测机制,以防止奖励黑客行为 [3] 性能表现与基准测试 - 在MiniF2F-Test基准测试中,该模型取得了97.1%的成绩,仅需72次推理尝试 [3] - 在PutnamBench任务上,该模型解决了41.5%的问题,使用了118次推理尝试 [3] - 在上述两项测试中,该模型的表现刷新了当前的最优水平 [3] 开源信息 - 该模型已在GitHub和Hugging Face平台开源,提供了具体的访问地址 [4]
计算机周观点第37期:大模型进入可执行Agent时代,入口与算力侧同步演进
国泰海通证券· 2026-03-22 18:45
行业投资评级 - 维持计算机板块“增持”评级 [4] 核心观点 - 大模型进入可执行Agent时代,产业演进持续提速,入口与算力侧同步演进 [2][4] - 小米与MiniMax最新模型进入可执行Agent时代,国产大模型加速向任务执行与自我进化升级 [4] - Anthropic与腾讯QClaw接入Telegram、Discord及微信小程序等入口,推动Agent向即时通讯场景延伸 [4] - 英伟达重启对华H200生产并推出新一代Kyber机架,算力供给与底层架构同步演进 [4] 大模型Agent能力演进 - 小米与MiniMax近期集中强化Agent能力,大模型全面进入强执行、可协同、能自进化的Agent时代 [4] - 小米MiMo-V2-Pro支持1M上下文,在Coding Agent与Tool Use等维度进入第一梯队,且API价格仅为同级竞品的1/5 [4] - 小米MiMo-V2-Omni与TTS进一步补齐多模态感知、办公生成与语音交互能力,推动MiMo向“人车家全生态”智能中枢演进 [4] - MiniMax发布M2.7,在复杂技能环境下指令遵循率达97%,并开始具备自主构建和优化Agent Harness的能力 [4] Agent入口向即时通讯延伸 - Anthropic的Claude Code新增Channels功能,可接入Telegram、Discord等通信工具,用户可直接在手机端发送消息,远程调用AI执行代码、运行测试并接收结果反馈 [4] - 腾讯QClaw正式开启公测,微信入口升级为小程序,支持上传或接收电脑端文件,同时上线“灵感广场”并预置常用任务与skills,实现无需编写指令的一键调用 [4] - QClaw是首个实现微信互联的“龙虾”,显示国内Agent产品正加快与高频社交入口融合 [4] 算力供给与基础设施演进 - 英伟达宣布已恢复为中国市场生产H200人工智能处理器,随着近几周中国客户需求信号增强,公司已获得相关出口许可并收到采购订单,供应链正重新启动 [4] - 英伟达将推出全新MGX NVL机架NVIDIA Kyber,每个机架的NVLink域容量翻倍至可容纳144个GPU,并采用CPO与铜互连实现扩展 [4] - Rubin架构亦有望大规模采用铜互连,显示公司正同步推进中国市场供给修复与下一代算力基础设施演进 [4] 推荐标的 - 报告推荐标的包括:日联科技、金山办公、海光信息、浪潮信息、合合信息、海康威视、赛意信息、新国都、迅策、聚水潭 [4] - 根据盈利预测表,各公司2025年预测市盈率(PE)分别为:日联科技53.56倍、金山办公62.70倍、海光信息159.13倍、浪潮信息30.51倍、合合信息51.05倍、海康威视21.29倍、赛意信息36.85倍、新国都22.69倍、聚水潭46.83倍 [5] - 迅策2026年预测市盈率为474.19倍 [5]
计算机周观点第37期:大模型进入可执行Agent时代,入口与算力侧同步演进-20260322
国泰海通证券· 2026-03-22 16:26
报告行业投资评级 - 维持计算机板块“增持”评级 [4] 报告核心观点 - 大模型进入可执行Agent时代,产业演进持续提速,入口与算力侧同步演进 [1][2] - 小米与MiniMax最新模型进入可执行Agent时代,国产大模型加速向任务执行与自我进化升级 [4] - Anthropic与腾讯QClaw接入Telegram、Discord及微信小程序等入口,推动Agent向即时通讯场景延伸 [4] - 英伟达重启对华H200生产并推出新一代Kyber机架,算力供给与底层架构同步演进 [4] 大模型Agent能力演进 - 小米与MiniMax近期集中强化Agent能力,大模型全面进入强执行、可协同、能自进化的Agent时代 [4] - 小米MiMo-V2-Pro支持1M上下文,在Coding Agent与Tool Use等维度进入第一梯队,且API价格仅为同级竞品的1/5 [4] - 小米MiMo-V2-Omni与TTS进一步补齐多模态感知、办公生成与语音交互能力,推动MiMo向“人车家全生态”智能中枢演进 [4] - MiniMax发布M2.7,在复杂技能环境下指令遵循率达97%,并开始具备自主构建和优化Agent Harness的能力 [4] Agent入口向即时通讯延伸 - Anthropic的Claude Code新增Channels功能,可接入Telegram、Discord等通信工具,用户可直接在手机端发送消息远程调用AI执行代码 [4] - 腾讯QClaw正式开启公测,微信入口升级为小程序,支持上传或接收电脑端文件,同时上线“灵感广场”并预置常用任务与skills [4] - QClaw是首个实现微信互联的“龙虾”,显示国内Agent产品正加快与高频社交入口融合 [4] 算力供给与基础设施演进 - 英伟达宣布已恢复为中国市场生产H200人工智能处理器,已获得相关出口许可并收到采购订单,供应链正重新启动 [4] - 英伟达将推出全新MGX NVL机架NVIDIA Kyber,每个机架的NVLink域容量翻倍至可容纳144个GPU [4] - 新一代机架方案采用CPO与铜互连实现扩展,Rubin架构亦有望大规模采用铜互连,显示“光铜并举”的演进方向 [4] 推荐标的 - 报告推荐标的包括:日联科技、金山办公、海光信息、浪潮信息、合合信息、海康威视、赛意信息、新国都、迅策、聚水潭 [4] - 提供了推荐标的的盈利预测表,包含收盘价、总市值、EPS及PE等数据 [5]
用AI清退全部外包?网易回应;百度挖DeepSeek核心人才入职;曝宇树对外称弹性双休,内部是另一套规则,非常卷|AI周报
AI前线· 2026-03-22 13:33
行业人事动态 - 有消息称DeepSeek核心技术人员已正式加盟百度模型研发部,但并非传闻中的知名专家郭达雅,具体人员身份未披露 [3][4] - 百度内部进行人事调整,原百度APP研发中心负责人赵世奇离职,由原基础模型研发部大模型算法部负责人何径舟接任,此次调动属于内部轮岗 [4] - 腾讯发布内部通知撤销AI Lab,原有人员调整至大语言模型部和产学研合作中心,公司副总裁蒋杰不再担任AI Lab负责人 [6] - 猎豹移动董事长傅盛在朋友圈发文,称360集团创始人周鸿祎曾承诺还款至少一亿让其停止香港官司但未履行,双方恩怨再度公开 [14] 公司运营与劳资状况 - 机器人公司宇树科技被员工发帖爆料,公司对外标榜弹性双休,但内部实行“早九晚九”的长时间工作制,项目期需通宵 [7] - 宇树科技已向上交所提交科创板IPO申请,拟融资金额42.02亿元 [9] - 网易回应“使用AI清退全部外包员工”传闻,称该信息不实,近期人员变动仅为部分项目的正常业务调整与人员汰换 [10] - 一名男子因在网上捏造散布“科大讯飞裁员30%”的不实信息,被公安机关依法处以行政拘留 [12][13] - PC巨头戴尔宣布2026财年员工总数将削减约10%,涉及约11000名员工,相关遣散费用为5.69亿美元(约合人民币39.2亿元) [21] - 戴尔此次裁员是科技行业趋势的缩影,今年以来已有60家科技公司启动裁员,累计影响超过3.8万人,Meta也计划实施比例或超20%的大规模裁员 [22] 技术产品与市场动态 - AI编程工具Cursor发布新模型Composer 2后,被开发者发现其调用的模型ID指向月之暗面的Kimi K2.5,陷入“套壳”质疑 [15] - Cursor联创回应,承认Composer 2基于Kimi K2.5基础模型,并进行了持续预训练和高计算强度的强化学习,未在博客中提及是疏忽 [17] - 月之暗面团队确认与Cursor存在授权商业合作,Cursor通过FireworksAI平台访问Kimi-k2.5 [18] - 日本乐天集团发布的高性能AI模型Rakuten AI 3.0,被技术社区发现核心架构完全基于中国深度求索的开源模型DeepSeek V3,且初期未标注来源,引发舆论风波 [23][24] - 椰树集团发布招标公告,计划采购50台人形机器人用于椰子破壳削皮工序,要求每小时处理超过360个椰子 [18] 大模型与AI产品发布 - 此前在OpenRouter平台引发猜测的匿名模型“Hunter Alpha”和“Healer Alpha”,被证实为小米MiMo-V2系列大模型的早期内测版本 [34][35] - 小米在春季新品发布会上宣布,未来三年在AI领域的投资计划将至少达到600亿元,今年AI研发与资本开支已超过160亿元 [35] - 小米发布三款模型:旗舰文本基座MiMo-V2-Pro、全模态Agent基座MiMo-V2-Omni、语音合成大模型MiMo-V2-TTS [35] - 字节跳动旗下小云雀AI上线全球首个搭载Seedance2.0的短剧Agent功能,支持10万字剧本一键成片 [36] - 飞书发布多款企业级Agent产品,包括智能体平台飞书aily等 [36] - 阿里巴巴发布全球首个企业级AI原生工作平台“悟空”,将内置到钉钉中 [37][38] - MiniMax发布新一代Agent旗舰大模型M2.7,该模型通过构建Agent Harness体系,在部分研发场景中可承担30%-50%的工作量 [39] - 智谱发布专为龙虾(Agent)场景优化的通用大模型GLM-5-Turbo,并同步将其API价格上涨20% [40] AI行业趋势与战略布局 - 市场出现AI大厂高薪招聘文科生的趋势,字节跳动、百度、美团、小红书等公司放出AI训练师、提示词工程师等岗位,对应届生月薪普遍2.5万-3万,资深岗位年薪直逼50万+ [19][20] - 360创始人周鸿祎认为,随着AI发展,文科生将比理科生更吃香,因为需要他们解决技术应用带来的社会问题及管理智能体 [19] - OpenAI计划收购Python工具初创公司Astral,该团队将加入OpenAI的Codex项目,Codex用户已超200万,自年初以来增长了两倍 [26] - 阿里巴巴成立名为Alibaba Token Hub的新事业群,由CEO吴泳铭亲自挂帅,整合其AI研发、消费应用及相关产品,旨在强化AI业务的战略协同与商业化 [28][29] - 因全球AI需求爆发及供应链涨价,百度智能云和阿里云相继上调AI算力、存储等产品价格,涨幅约5%-34% [29][30] - 据供应链人士透露,字节跳动“豆包AI眼镜”一代产品的生产计划已整体延后,原计划大概率不会上市,因产品差异化不强 [31] - 阿里巴巴集团正推进一项内部计划,向员工提供Token额度,鼓励员工在工作中使用付费AI工具 [40] 企业合作与生态 - 自动驾驶软件公司Applied Intuition宣布与英伟达达成合作,旨在加速面向全球汽车制造商的L2+级驾驶辅助系统的开发与部署 [40] - 阿里旗下跨境电商平台速卖通与YouTube达成合作,正式加入YouTube“购物联盟计划”,YouTube将成为其新的分销渠道 [40][41]
库克回应Mac mini卖爆,马斯克被判误导投资者,美团开源大模型,《红色沙漠》首日销量200万份,这就是今天的其他大新闻!
搜狐财经· 2026-03-22 01:29
苹果公司AI战略与产品定位 - 苹果公司首席执行官库克回应了OpenClaw带动Mac mini大卖的现象 强调苹果十年前就在Mac中加入了神经网络引擎 其硬件与软件的集成使Mac mini成为最适合执行AI任务的电脑[4] - 苹果公司表示将持续优化针对AI工作流的Mac性能 并指出用户现在已可以在MacBook Pro上训练大语言模型[4] 马斯克法律纠纷与潜在财务影响 - 美国旧金山联邦法院陪审团裁定 埃隆·马斯克在2022年收购推特期间故意压低股价并"误导投资者"负有责任[7] - 陪审团裁定相关股东应获得每股每日约3-8美元的赔偿金 原告律师称马斯克可能被迫向前股东支付约25亿美元赔偿金[7] 美团开源大模型技术进展 - 美团开源了名为LongCat-Flash-Prover的大模型 该模型采用5677亿参数和混合专家模型形态 旨在解决复杂的数学证明问题[10] - 该模型引入了混合专家迭代框架 并通过整合Lean4及多阶段严格验证流程来消除"幻觉"现象[10] - 基准测试显示 该模型在MiniF2F-Test上取得97.1%的成绩 在PutnamBench任务上解决了41.5%的问题 在上述两项测试中均刷新了SOTA水平[10] 游戏行业产品发布与市场反应 - 游戏《红色沙漠》发售首日全球销量突破200万份[14] - 尽管销量强劲 但该游戏媒体评分呈现两极分化 M站平均分约78分 IGN给出初期评分6分 Steam简体中文评测为"多半差评"[14] - 两极分化的评分对开发商珍艾碧丝造成冲击 公司股价一度下跌30%[14]