Workflow
Deepseek R1
icon
搜索文档
中美AI行业的关键时刻
虎嗅APP· 2026-01-29 22:10
文章核心观点 - 2025年是中美AI竞争格局发生深刻变化的一年,中国AI力量(如DeepSeek、Manus、Qwen、K2)在工程能力、开源和商业化方面赢得全球认可,开始与美国并行竞争 [7][8][72] - 地缘政治(如美国反向投资审查OIR)深刻影响资本与人才的流动,迫使华人AI创业者在“中国公司”与“美国公司”之间做出明确选择,全球化创业模式发生根本性转变 [12][18][22] - 中国一级市场在2025年迎来AI早期项目的短暂春天,资本狂热涌向具身智能、AI应用与Agent、多模态、AI硬件四大方向,其中硬件投资尤为火爆 [32][40][44] - 硅谷巨头(OpenAI、谷歌、Meta、英伟达)的竞争进入生态团战新阶段,模型能力差异缩小,竞争焦点从单纯的技术领先转向资本、基建和生态的整合 [57][64][65] - 技术演进面临Scaling Law的天花板争议,行业探索从预训练数据堆砌转向推理侧扩展、智能体协作及物理世界融合,同时高昂的算力成本仍是商业化的核心挑战 [75][76][80] 一、不平凡的春节 - 2025年春节期间,DeepSeek R1和宇树机器人展示了中国团队卓越的工程能力,以更少算力、更高效率做出了媲美GPT-4o的模型,震撼硅谷 [10][11] - DeepSeek的成功在美国引发政策分歧:一派认为算力卡脖子无效,另一派(以Anthropic CEO Dario为代表)主张对华加强管制 [11] - 随着美国政治变化,针对中国AI的算力限制、投资限制和AI扩散规则升级,将中美科技竞争推向新高潮 [12] 二、Manus的7500万美元融资 - 2025年第一季度,DeepSeek、宇树和Manus让硅谷热议中国,市场情绪高涨 [14] - 硅谷顶级风投Benchmark创始人来华,以7500万美元投资Manus母公司蝴蝶效应,将其估值推高至5亿美元,此举被视为针对中国背景AI项目的“超级支票”,极具象征意义 [15][16] - DeepSeek和Qwen等中国开源模型将AI推入普惠的推理时代,降低了使用成本,而Manus则展示了产品定义和工程创新的力量,共同宣告AI应用时代到来,重新激活了美元VC的投资热情 [15][16] 三、Reverse CFIUS下,华人的AI创业 - 美国“反向投资审查”(OIR)规则限制美国资本投资中国AI公司,且“中国公司”的界定范围被扩大,导致如Benchmark投资Manus的交易面临美国财政部的审查风险 [18] - 规则造成寒蝉效应,顶级美元机构(如红杉、GGV)已通过设立独立分支应对,而纯美元机构则形成新默契:追求“资本与人才的脱钩”,即投资华人团队的前提是项目必须在法律、数据和市场上彻底剥离“中国属性” [19] - Manus在收到问询函后,裁撤武汉团队并将总部迁至新加坡,被视为一种示范,但律师指出这并非成为“美国公司”的标准答案,美国的核心关切是企业最终是否会完全站在美国一边 [20][21] - 地缘政治张力下,立场必须明确,上一代利用中美成本洼地的全球化创业模式终结,若想获得本土美元大额投资,必须彻底成为一家美国公司 [22] 四、3亿美金前很热闹,3亿美金后融不到 - 中国AI创业公司估值达到3亿美元后,面临国内融资天花板,因为市场缺乏PE资金,只有VC和投机资金,促使许多创始人考虑前往硅谷融资 [23][24] - 融入硅谷面临语言表达、文化差异和思维模式挑战,需要数年时间适应,而非简单认为硅谷“人傻钱多” [25][27] - Hygen(诗云科技)是成功范本:作为华人团队,在实现产品市场匹配(PMF)和强劲现金流(ARR逼近1亿美元)后,通过资本隔离(回购早期股份)、物理隔离(总部迁至洛杉矶)和吸引顶级美元机构(Benchmark合伙人入董事会),跑通了“华人团队+中国技术红利+硅谷资本+全球市场”的路径 [26][27] - 新一代华人创业者更具野心和全球视野,DeepSeek等中国项目的成功也助力打破了硅谷的“竹子天花板” [27][28] 五、中国一级市场的短暂春天 - 2025年初,受美股AI龙头估值飙升的溢出效应影响,中国AI一级市场情绪高涨,资本主要流向具身智能、AI应用与Agent、多模态、AI硬件四个方向 [32] - **具身智能**:因宇树机器人春晚表演爆火,成为年度关键词,头部公司账上现金不少于10亿元人民币,大量吸收国资人民币基金,因其符合长周期、硬科技的国家战略导向 [33] - **AI应用与Agent**:基础模型格局收敛及开源普惠推动应用时代成熟,头部美元基金(如红杉、高瓴)上半年投资活跃,中东主权基金也加大投资,案例显示liblib日收入达15万美元,下一轮融资额预计达8亿美元 [36] - **多模态**:中国市场急需视觉AI底座模型,快手因推出可灵模型市值重估,创业公司Vivix.AI因创始人稀缺的大规模模型训练经验,估值在一年内从1-2亿美元飙升至13.4亿美元 [37][38] - **AI硬件**:2025年是AI硬件投资爆发元年,技术成熟、政策推动(“人工智能+行动”)、中国供应链红利共同催生热潮,5月份流向硬件的资金占AI领域总投融资额50%以上,截至8月,具身智能与AI硬件领域投融资总额突破386亿元 [40][44] - 投资机构策略分化:高瓴等机构“口袋深”,广泛孵化大厂精英创业;云启等机构则发起专项计划投资“98后”年轻创业者,认为年轻人将带来无穷可能 [45][46][47] 六、顶尖项目的融资窗口,只在几个月内 - AI时代形成共识的窗口期极短,顶尖项目的融资机会往往只在几个月内,类似十年前的自动驾驶行业 [50][53] - 创业对融资的依赖度降低,优质标的稀少导致资本集中化,市场上绝大部分资金被少数项目拿走 [52] - 投资风格分化为两种:一是在热门赛道“矮子里面拔将军”以求参与;二是坚持寻找能定义未来的颠覆性项目,批评许多项目只是用AI技术重做传统应用 [53] - 年轻一代投资人更为积极,在浪潮中渴望投出代表作以丰富个人履历 [53] 七、硅谷风云:属于巨头的棋局 - 2025年基础模型竞争如季度排位赛,格局变化极快,令二级市场难以定价 [57] - **王者对决**:OpenAI与谷歌是主要竞争者。OpenAI保持先发优势但GPT-5显示Transformer架构 Scaling Law 天花板初现;谷歌凭借Gemini系列(尤其是2.5 Pro和Nano Banana)实现翻身,在多模态和记忆方面表现稳定优异 [58] - **生态博弈**:OpenAI与主要投资者微软关系出现嫌隙,Sam Altman转而联合英伟达启动“星际之门”项目,被视为去微软化举措 [61] - **英伟达的合纵连横**:承诺向OpenAI分批投资1000亿美元(前提是部署英伟达系统),并收购AI推理芯片公司Groq的LPU资产以巩固生态,其与OpenAI、甲骨文形成的“星际之门”闭环导致甲骨文自由现金流转负,股价大幅波动 [62][63][64] - **其他巨头的挣扎**:Meta在基础模型上全面掉队,内部组织分散,为追赶不惜重金挖人;马斯克的X.AI通过错位竞争争取门票 [67][68][66] - **Meta收购Manus的意图**:可能意味着其竞争重心从自研模型转向打造最强智能体执行层,以资本兑换技术时间和市场势能 [70] 八、中国的开源之路 - 2025年,中国AI体系在国际报告中首次从“外围追赶者”被提升为“平行竞争者”,被认为在开源AI和商业化部署方面设定节奏 [72] - 尽管在绝对SOTA水平上因算力基础设施受限而落后,但中国开源模型(DeepSeek、Kimi、Qwen)在多项关键性能上实现对Meta Llama系列的反超,“开源看中国”成为全球共识 [72] - 中国模型凭借更高性价比成为全球选择,例如智谱的coding能力全球靠前,定价仅为Anthropic的1/7,借此获得多国主权大模型订单;下半年硅谷创业公司也开始切换使用Qwen、Deepseek和K2 [73] 九、技术的演进:从2023~2025,以及2026的预判 - 技术演进路径从2022年底的预训练爆发、2024年底的强化学习爆发,到2025年中外模型在预训练和后训练上各有侧重 [75] - 围绕Scaling Law是否到达天花板出现两派思潮:“撞墙派”(如LeCun、Ilya)认为堆算力和数据的边际效应递减;“不死派”(如Hinton、Dario)认为Scaling Law依然有效,正转向推理侧扩展(Inference-time Scaling) [76] - Scaling Law正经历从“模型尺寸大小”扩展,过渡到“模型思考深度”扩展,未来将走向“智能体协作网络效应”扩展 [76] - AI正从数字世界迈向物理世界,商业公司致力于在现实与数字世界间架设桥梁,通过传感器获取数据、构建数字孪生,并探索如“世界模型”等前沿方向 [77][83] 十、回归商业的现实 - 大模型行业仍处早期,巨额算力成本带来巨大盈利压力:OpenAI 2025年年化收入200亿美元,但算力租卡成本高达160亿美元,经营亏损119.2亿美元,相当于每赚1美元净亏损0.6美元 [80] - 推理成本随着推理侧扩展而暴涨,将成为全行业趋势,但新时代AI的商业模式仍在探索中 [80] - 中国算力供给面临瓶颈,进口受限,焦点从“卡的数量”转向“算力可得性”,蚂蚁、米哈游等大企业开始自建算力,但有能力者屈指可数 [84] - 底层算力和基建的自控权是竞争决定性因素,美国正通过债券等形式将算力资产化 [82] - 对于创业公司,追求“模应一体”和产品化是现实选择,模型编排(协调多个模型工作)可能成为其优势所在,而用户增长与留存是检验产品的金线 [85]
模型能力-算力成本与Agent成熟度共振-迎接AI应用投资元年
2026-01-07 11:05
纪要涉及的行业或公司 * **行业**:人工智能(AI)行业,特别是AI应用、大模型、算力与芯片领域 [1] * **公司**: * **中国公司**:字节跳动、快手、阿里巴巴、智谱、Minimax、百度、海光信息、寒武纪、华丰、摩尔线程、云天励飞、康曼道体、中芯国际、金山办公、美图、360、泛微致远、金蝶北森、拓普云农、金桥律师事务所 [2][11][18] * **美国/国际公司**:OpenAI、Anthropic、谷歌、微软、Salesforce、ServiceNow、Duolingo、Palantir、Adobe、Meta、Cursor [4][9][15] 核心观点与论据 * **核心投资策略**:2026年是AI应用投资元年,方正证券计算机组年度投资策略明确聚焦于AI应用方向 [2] * **核心驱动因素**:模型能力、算力成本与Agent成熟度共振,共同推动AI应用大规模启动 [1] * **模型能力提升**:自2023年以来,大模型能力显著提升,解锁了大部分生产生活和工作场景,O1模型后进入Agent时代 [2][5] * **算力成本下降**:自2023年以来,TOKEN使用成本下降了两个数量级以上,大幅降低企业使用大模型的成本,提升经济回报 [1][2] * **产品成熟度提高**:自2024年以来,大量公司在AI应用方面取得显著进展并进入全面推广阶段 [7] * **产业投资规律**:科技产业投资遵循“硬三年、软三年、商业模式优三年”的规律,当前正处于从硬件投资向软件应用过渡的关键节点 [1][3][5] * **市场行情回顾**: * 2025年一、二季度,OpenAI发布Deepseek R1模型引发全球震撼,加速应用端发展,带动国内推理、算力板块(芯片、IDC)及海外应用端出现显著行情 [1][4] * 2025年7月,中国人工智能大会及美国一级市场编程类公司业绩加速,推动二级市场AI应用公司行情 [4] * **关键拐点预测**:预计到2026年底,中国和美国公司的AI业务收入占比将突破10%,甚至达到15%,标志着产品成熟度和客户接受度达到关键拐点 [1][7] * **中美发展态势**: * 自2025年4月起,中美两国在AI领域加速发展 [1][2] * 中国顶尖大模型与美国一线大模型的能力差距已从过去的一到两年缩小至3至6个月 [2][12] * 中国在多模态领域表现突出,以快手和字节跳动为代表,比美国更强,优势源于丰富的视频数据 [14] * 在开源市场,Deepseek和阿里巴巴表现突出,Deepseek在十几天到二十天内月活跃用户达到2000万以上,阿里的千问模型已超过Meta的水平 [13] * **商业模式创新**:AI时代软件行业商业模式更加多元化,包括:微软的AI功能单独订阅、美图/金山将AI打包进传统会员、Salesforce按绘画次数收费(每次1至2美元)、基于结果付费(如招聘)、基于成本节省分成(如智能客服)等 [16] 其他重要内容 * **对产业链的影响**: * 国内大模型进步带动下游推理和训练需求增长 [2] * 字节跳动、阿里巴巴、百度等公司加大基础设施投资,资本支出大幅增长,利好芯片设计(海光信息、寒武纪等)及制造端(康曼道体、中芯国际)公司 [2][17][18] * 大模型发展,特别是O1进入推理阶段、Deepseek的降本措施、开源趋势以及多模态技术(如Banana Two)进展,共同推动了下游应用能力的大幅提升 [10] * **具体应用进展**: * 2025年第二、三季度,中国厂商AI收入占比平均达到6%到7%,且趋势在加速 [15] * Anthropic在API业务上的表现超过OpenAI,其编程相关产品ARR(SaaS)已超过10亿美元 [9] * **投资者关注方向**: * **方向一**:国内大模型及多模态技术进步带动的推理与训练需求增长,以及相关的芯片设计、制造公司 [17][18] * **方向二**:通用工具软件(如金山办公、美图、快手、360)及垂直领域应用公司(如人力资源领域的泛微致远、金蝶北森,农业法律领域的拓普云农、金桥律师事务所) [18]
黄仁勋新年第一场演讲,提了DeepSeek
第一财经· 2026-01-06 07:45
行业核心观点 - 英伟达CEO黄仁勋在发布会上总结AI行业进展,认为开源模型的崛起已成为全球创新的催化剂 [1] - 其中Deepseek R1的出现意外推动了整个行业的变革 [1] - 目前全球涌现出多个开源模型,其性能越来越逼近领先的前沿大模型 [1] 开源模型发展现状 - 全球涌现出多个开源模型,性能正逼近前沿大模型 [1] - 发布会上展示的开源模型图片中,包含了三家中国开源模型,分别是Kimi K2、Qwen、DeepseekV3.2 [1]
黄仁勋新年第一场演讲,提了DeepSeek
第一财经· 2026-01-06 07:18
行业核心观点 - 开源模型的崛起成为全球创新的催化剂,其中Deepseek R1的出现意外推动了整个行业的变革 [1] - 未来十年里,世界上很大一部分汽车将是自动驾驶或高度自动驾驶的 [3][4] AI模型与开源生态 - 全球涌现出多个开源模型,其性能越来越逼近领先的前沿大模型 [1] - 发布会上展示了多家中国开源模型,包括Kimi K2、Qwen、DeepseekV3.2 [1] - 模型规模每年增长10倍,Test-Time Scaling思考产生的token数每年增长5倍,每token的成本每年便宜10倍 [3] - 公司发布了Alpamayo系列VLA开源AI模型和工具,用于自动驾驶车辆开发 [4] 硬件与算力进展 - 公司发布了新一代Rubin GPU [6] - Rubin GPU的NVFP4推理算力为50 PFLOPS,是Blackwell的5倍 [6] - Rubin GPU的NVFP4训练算力为35 PFLOPS,是Blackwell的3.5倍 [6] - Rubin GPU的HBM4带宽为22 TB/s,是Blackwell的2.8倍 [6] - Rubin GPU的晶体管数量为3360亿个,是Blackwell的1.6倍 [6]
最爱喝奶茶的AI科学家,要做最能懂你的“智能体”
36氪· 2025-11-24 16:02
公司与技术进展 - 清华大学与蚂蚁集团合作,于2025年5月开源首个异步强化学习训练框架AReaL-lite,旨在提升AI训练效率并减少GPU浪费[1] - 团队负责人吴翼强调创业心态,主张快速迭代、不怕踩坑,并认为从0到1的本质是创造资源而非等待条件完备[1][25] - AReaL团队采用极简组织形态,目前核心成员为6人,并通过算法与基础设施团队融合的全栈模式提升创新效率与战斗力[52][54][57] 技术方向与核心观点 - 强化学习被视为提升AI智能水平的关键,其特点是让AI在实践中自主学习,培养探索能力,优于需要人工持续指导的监督学习[6][33][34] - 智能体的未来发展方向是能够理解人类模糊意图、完成长程任务,并最终从数字世界走向物理世界,成为具身智能的“大脑”[4][12][41] - 实现具身智能需结合负责底层运动控制(如机器狗跑跳)的强化学习与负责长程推理规划、基于大模型预训练的强化学习,形成“大脑”与“小脑”的分层协作体系[36][38][42] 产品与市场展望 - AI产品将出现从用户主动驱动到AI提前预测并满足需求的根本性变化,最终形态可能是一个能服务“懒人”需求的全新产品[12] - 在AI时代,产品开发和组织形态可极度简化,小型团队借助AI工具可完成过去需多人协作的任务,并可能催生新的产品机会[50][51][52] - 多智能体系统可通过协作提升效率,例如在数字世界中由主智能体进行规划,其他智能体执行;在物理世界中多个机器人可沟通协作完成复杂任务如打扫房间[17][18][20] 研发方法论 - 创新不能依靠多点布局“赌一把”,而应基于深度思考与长期坚持,创业需要对所做的事情有坚信[4][26] - 强化学习训练框架的成功要素包括高质量的提示词、有效的搜索探索机制以及奖励模型,其中创造大量高质量的提示词被视为当前最重要的挑战[35] - 技术研发应避免算法与基础设施团队的严格分工,主张两者共同设计、协同演进,以保持对技术底层的感知和创新的自驱力[54][56][57]
AIoT行业专题
2025-09-28 22:57
行业与公司 * 纪要涉及的行业为AIoT(人工智能物联网)行业,特别是端侧AI和IoT领域 [1] * 纪要重点分析的公司包括乐鑫科技(全球领先的WiFi MCU供应商)、英伟达、Deepseek、Yuran创新、涂鸦智能和小米 [2] 核心观点与论据 **端侧AI发展基础** * 端侧AI落地基础日益稳固,主要驱动力为推理成本大幅下降、模型性能持续提升以及模型厂商竞争加剧 [2] * 英伟达通过硬件升级和架构优化降低AI推理成本和功耗,例如从Hopper到Blackwell再到Ruby系列的演进,并推出针对特定工作负载的Robin CPX GPU [4] * Deepseek通过架构创新降低成本,其V2模型采用稀疏MOE架构,相比V1稠密模型节约40%以上训练成本,并使用MLA注意力机制优化推理成本 [5] * Deepseek R1运用蒸馏技术,在保持性能的同时降低计算复杂度和存储需求,加速端侧AI落地,同时模型价格因竞争而普惠化 [5] **端侧AI应用落地** * 端侧AI目前主要以AR玩具为先导实现落地,因AR玩具用于非严肃场景,对硬件和模型性能要求较低 [6] * Yuran创新推出的AR玩具Bubble Popper上市首月销量突破1万台,目前累计销量超过20万台,其第二代产品Coco Mate体验更丝滑 [6] **AIoT行业景气度与关联** * IoT行业整体景气度向上,云平台如涂鸦智能自2023年三季度持续高增长,今年上半年同比增长15%,二季度首次实现单季度GAAP经营性盈利 [8] * 下游终端方面,小米最新季度IoT业务创历史新高,同比增长45%左右,其中智能家电收入增长66% [8] * AIoT是端侧AI的关键路径,IoT连接设备数量增长拉动端侧AI需求,端侧AI则通过提升设备智能化程度加速物联网应用落地,两者相辅相成 [3] **乐鑫科技业务表现** * 乐鑫科技连续多个季度营收超预期增长,今年单二季度在去年高基数上仍实现接近30%的营收增速,预计全年营收增长可达30% [2][9] * 公司传统智能家居业务维持10%-15%的行业增速且高于整体水平,同时AR玩具等新产品开始贡献营收 [9] * 公司产品矩阵包括成长期产品(C2, C3, C6, S3)和新兴期产品,S3是端侧AI落地的核心产品,可外接屏幕 [10] * 公司在研发下一代P4/P5芯片(聚焦camera领域)、WiFi 6E产品(计划2026年1月量产)以及端侧AI芯片,为未来增长提供动力 [10] **乐鑫科技盈利能力与商业模式** * 公司凭借高可靠性维持约40%的毛利率,费用管控良好,利润率持续提升,2025年单二季度归母净利润实现70%以上的增长速度 [11] * 公司采取to D to B商业模式,通过开发者生态拓展业务,拥有超过15万个开源项目,吸引了字节跳动和OpenAI等大厂合作 [12] * 开发者生态降低了客户IoT开发门槛,形成了独特优势,助力公司占据全球WiFi MCU市场30%以上份额,在细分WiFi领域位居全球第一 [12][14] 其他重要内容 * IoT连接方式中,短距连接(如蓝牙、WiFi)是主流,占总数超过70%,当前多数AR玩具都配备WiFi功能 [7] * 乐鑫科技与字节跳动联合发布AR加硬件制约计划,OpenAI发布了基于乐鑫S3芯片的嵌入式SDK,实现IoT设备直接连接OpenAI模型 [13] * 公司业务正从传统IoT WiFi连接拓展到路由、WiFi 7及未来端侧AI芯片 [14]
Alibaba shares rise after it reveals new AI model, Qwen-3
Youtube· 2025-09-12 04:27
阿里巴巴AI模型进展 - 推出下一代AI模型Quen 3 宣称更高效率且降低计算成本 [1] - Quen 3为开源模型 类似深度求索的R1模型 [2] 中国AI芯片自主化趋势 - 阿里巴巴和BU开始采用自研芯片训练模型 减少对英伟达依赖 [2] - 中国AI自给自足能力持续提升 反映技术自主化趋势 [3] - 企业转向内部技术开发 规避美国芯片出口限制不确定性 [5] 中国科技板块表现 - Kweb ETF当日上涨2% 年初至今累计涨幅达40% [3] - 中国低成本高效能芯片开发预期升温 类似历史模式重现 [4] 行业竞争格局变化 - 中国AI模型构成对OpenAI和Anthropic等硅谷企业的竞争威胁 [2] - 除Quen 3外 竞品模型Kimmy K2同样值得关注 [5] - 中国AI领域竞争意识强化 打破美国主导预期 [4]
2025Agent元年,AI行业从L2向L3发展
2025-08-28 23:15
涉及的行业或公司 * AI行业 特别是人工智能代理(Agent)领域[1][5][17] * 涉及公司包括OpenAI、谷歌、Deepseek、Cursor、Devin、Metas、Salesforce、苹果、Manas、Genspark、Minimax等[1][4][16][18][19][21] 核心观点和论据 **技术发展推动Agent爆发** * 底层模型突破是Agent发展的关键 如Deepseek R1推理模型使Agent能执行复杂任务[1][6] * 模型在预训练、强化学习、推理能力、编程能力、多模态能力等多个维度有明显提升[3] * MCP(Multi-Context Processing)技术推出显著提升Agent能力 简化大模型与工具交互过程[3][9][11] * 底层模型成功率对任务执行至关重要 多步骤任务需高成功率保证最终结果[10] **市场需求驱动发展** * 从2022年底ChatGPT推出到2023年模型竞赛 市场一直在等待能带来生产力提升和降本增效的工具[1][3][7] * 早期AI应用如Chatbot未能达到预期效果 被视为"玩具"[7][8] * 2025年市场需要看到AI带来的实际降本增效、营收增长及客户满意度提升等明确效果[1][14] **产品类型与能力定义** * 主流Agent产品分为三类:编程类(Cursor、Devin)、研究型(谷歌、OpenAI的Deep Research)、综合性应用(Metas)[4] * 真正意义上的Agent产品需具备五项核心能力:对话能力、推理能力、长记忆能力、调用工具能力以及规划能力[15] * 目前多数Agent仍处于半自动状态(human in the loop) 完全自动化产品失败率较高[15] **发展阶段与重要性** * Agent处于L3阶段 具备聊天、推理及动手能力 是从L2到L4的重要过渡环节[1][5] * Agent不仅是效率提升工具 更是通往AGI的关键环节 会影响未来互联网流量入口格局[5][18] 其他重要内容 **开源生态影响** * 开源生态通过MCP等技术降低开发门槛 促进技术共享与创新 加速行业发展[1][9] **竞争格局差异** * 垂直型Agent因聚焦单一领域而落地更快 工作流明确且高频重复 已签约大客户并带来收入增长[20][25] * 通用型Agent目前成功率较低且缺乏明确商业场景 但代表未来竞争方向 是用户流量入口[20] * 科技巨头将在通用型Agent领域展开激烈竞争 初创公司可能面临闭源模型API服务停止的风险[24] **资源消耗与成本** * Agent普及将大幅增加tokens消耗 完成一个任务通常需要多个步骤 每个步骤都需消耗大量tokens[19] * 一些人工智能服务如Manas、Genspark、Minimax等 完成一个任务约需10元人民币[19] * 智能体目前消耗大量tokens成本 而订阅费用与成本之间存在错配问题[24] **投资建议与市场展望** * 未来几年AI智能体将围绕工具调用、规划、记忆及可靠性迭代 垂直领域智能体先行落地[2][26] * 长期配置平台巨头 关注足够垂直且壁垒深厚的玩家[2][26] * 行业估值可能回归理性 有利于长期健康发展[27]
MiniMax闫俊杰:AI领域会多玩家共存,成本也会更可控
21世纪经济报道· 2025-07-26 23:44
行业竞争格局 - 年初Deepseek R1开源模型引发行业震动,几乎成为所有下游AI应用厂商的选择,部分资本市场人士认为大模型战争已结束 [1] - MiniMax CEO闫俊杰认为AI领域将维持多玩家并存格局,不同模型因对齐目标差异而具备独特优势(如程序员能力、情商对话、想象力等)[2] - 开源模型影响力持续扩大,最佳开源模型性能已逼近闭源模型,例如月之暗面Kimi K2在代码和Agent任务能力上接近OpenAI/Anthropic水平 [3] 技术演进趋势 - MiniMax推出全球首个开源大规模混合架构推理模型MiniMax-M1,在长文本处理任务中计算量仅为DeepSeek R1的25% [4] - 模型优化带来显著成本优势:8万Token深度推理时算力需求为竞品30%,10万Token生成时仅需25%算力 [4] - 行业算力增长未导致模型规模同比扩张(如Kimi K2总参数1T,激活参数32B),因公司需平衡参数量与计算速度 [4] 成本与需求动态 - 未来1-2年顶级模型的推理成本可能再降一个数量级,单模型训练成本不会显著增加 [5] - 算力消耗呈指数级增长:单个对话Token消耗从几千增至几百万,因AI解决更复杂问题且用户基数扩大 [5] - 混合架构技术(如闪电注意力机制)推动效率提升,使模型在保持性能同时降低资源需求 [4]
各方关于H20的观点
傅里叶的猫· 2025-07-16 23:04
H20芯片库存与生产情况 - 大摩预计H20芯片库存可达100万片 其中成品芯片库存约70万个 需采购1万片CoWoS-S晶圆进行封装 KYEC可能额外提供20-30万个芯片 [1][2] - JP Morgan预测H20初期季度需求高达100万个 主要受中国AI推理需求驱动且无替代产品 库存可能在一个季度内消耗完毕 [3][4] - 瑞银估算H20销售额将达130亿美元 按每台1.2万美元均价计算对应销量略超100万台 销量恢复比例或达15%-20% [5][6] - Jefferies推测现有H20库存约55-60万个 基于150亿美元收入损失推算 后续将推出采用GDDR6内存的降级版本 [7] 市场需求与行业动态 - JP Morgan指出H20需求旺盛源于中国AI推理市场及客户提前下单行为 与2025年Q2 Deepseek R1的60万需求形成对比 [3] - 瑞银提到中国市场占英伟达数据中心销售额百分之十几 H20出口放宽将支撑下半年业绩 GB200产能提升及GB300量产将推动增长 [5] - Jefferies透露美国可能重新引入数据传输速度限制 HBM3内存的H20将停产 转向GDDR6版本 [7] 行业信息与资源 - 英伟达B系列服务器已在国内开放样品订单 接受行业客户咨询 [8] - 行业研究平台持续更新投行数据及关键信息 提供网盘资源整合服务 [10]