Workflow
DeepSeek
icon
搜索文档
李开复:中美大模型竞争关键在于开源与闭源之争
格隆汇APP· 2025-07-17 19:06
生成式AI与AI 2.0 - 生成式AI驱动的AI 2.0是未来5到10年最重要的技术领域,将快速走出实验室并赋能千行百业[3][8] - AI 2.0时代全球GDP增长幅度将超过PC和移动互联网时代[4] - 大模型智能每年提升30个百分点,推理成本每年下降10倍,为AI-First应用爆发奠定基础[8] 技术范式转变 - 预训练Scaling Law已失效,万张GPU集群算力提升仅2倍,高质量训练数据面临瓶颈[9] - 推理阶段Scaling Law成为新范式,推动大模型智力加速成长[10] - DeepSeek开源慢思考推理模型性能媲美顶级闭源模型[11] 中美AI竞争格局 - 中国在开源模型路径上赶超美国,工程能力和创业者拼劲突出[13][15] - 竞争核心是开源与闭源路线之争,中国选择开源可能带来全球生态红利[16][17] - 美国在2B/2C付费能力上占优,但闭源路线可能使其失去竞争优势[14][16] 投资标的分析 - 英伟达仍是稳妥投资标的,其芯片技术对预训练和无人驾驶等领域不可或缺[19][20] - 微软是美国科技七巨头中优选,因其创新投入和清晰的盈利模式认知[22] - 英伟达面临中国市场准入等潜在风险,微软增长空间受限于大体量[21][22]
Token推动计算Compute需求:非线形增长
华泰证券· 2025-07-17 18:46
报告行业投资评级 - 科技行业评级为增持(维持),计算机行业评级为增持(维持) [6] 报告的核心观点 - 未来算力需求中存在Token调用量随推理扩展倍数增长、算力需求随Token增长倍数增长两个倍数关系,共同决定推理端未来算力需求广阔,目前市场存在较大预期差,长期看好算力需求持续快速增长 [89][90] 根据相关目录分别进行总结 New Scaling:不止于预训练,三条Scaling推动算力需求增长 - 市场认为预训练Scaling law可能见顶,但考虑后训练Scaling和推理Scaling,AI对算力需求仍有大量空间 [10] 从三条Scaling law的差异看为什么算力需求将继续增长 - 预训练和后训练Scaling属训练阶段,推理Scaling属推理阶段 [11] - 预训练Scaling性能和数据、参数量相关,后训练Scaling利用微调等技术提高模型能力和领域特异性,推理Scaling性能与推理时间相关 [13] 推理Scaling的必要性和算力消耗量化 - 推理Scaling能大幅提高模型回答困难问题能力,是通往Agentic AI的重要路径 [15] - 预训练受训练数据约束,推理Scaling能提高模型性能,特别是困难问题方面 [15] - 推理模型的Token消耗可能是传统模型的10倍左右 [18] Grok系列模型的发展对应了三条Scaling曲线 - Grok系列模型发展历程对应三条Scaling曲线,Grok 3对应预训练阶段的Scaling law,Grok 4对应后训练与推理过程的Scaling law [19] - Grok 4在HLE测评集上的突破证明了推理Scaling的有效性 [22] 从Deep Research看Agentic对Token量的影响 - Deep Research是“Agentic化”的AI Search,以其为研究Agentic AI的抓手,分析Token量变化并拓展到广泛Agentic AI场景进行量化 [28] - Agentic AI与狭义AI Agent存在差异,前者涉及多流程多工具调用,任务更复杂 [32] Deep Research是研究Agentic AI的重要抓手之一 - AI Search成为Token消耗的重要组成,Google Token量增长可能源于搜索业务 [34] - Deep Research产品是AI Search的Agent路径拓展,被多家厂商竞相推出 [37] Deep Research的Token多在哪?基于底层系统设计视角的分析 - 以Anthropic的Deep Research系统设计为例,其将任务分配给多个Agent,带来成倍Token消耗 [41] - 搜索过程是迭代式的,Token量进一步增加 [44] 从Search到Research,量化Agentic的Token影响 - Anthropic Deep Research的Token消耗达到聊天的15倍 [46] - Google/OpenAI Deep Research的Token消耗量可能接近聊天的50倍 [50] - Agent使用和多工具调用能进一步提升Grok 4在HLE测试中的结果 [55] Deep Research在Agentic AI中并不复杂,真实Token量会更高 - Deep Research任务相对简单,普遍的Agentic AI会有更高Token消耗量,未来Token量增长可能是指数增长 [57][58] Token量的增长会带来算力需求的非线性增长 - 算力需求增长远高于Token量的增长,Token量增长10倍,所需算力量可能增长百倍 [60] 延迟和吞吐量是推理过程中两个重要指标 - 延迟和吞吐量是推理过程的关键指标,相互关联,分别决定用户使用体验和厂商总任务处理量 [61] 为什么延迟和吞吐量互相制约?中间变量——批处理 - 为提升吞吐量需进行批处理,延迟随批量大小线性增长,吞吐量随批量增长先增后缓,两者相互制约 [68] 模型厂商的帕累托最优需要追求“量价”的平衡 - 模型/AI应用厂商需追求用户使用量与AI服务质量之间的平衡,实现收益最大化 [74] 增加硬件是实现模型最优收益边界前移的重要方式 - 增加硬件可减少模型服务延迟,实现模型最优收益边界前移,算力需求增长与Token增长呈倍数关系 [81][82] 总结:两个倍数关系决定未来推理算力需求空间广阔 - 未来算力需求中Token调用量随推理扩展倍数增长,算力需求随Token增长倍数增长,决定推理端未来算力需求广阔 [89] 产业链相关公司 - 海外算力链涉及PCB、铜互联、光模块光器件光芯片相关公司,国内算力链涉及中芯国际、寒武纪等公司 [92]
大模型商业化进入淘汰赛,赢家正在变少
36氪· 2025-07-17 18:15
行业趋势 - AI产业正经历深度分化,平台型巨头通过饱和式投入将AI纳入主营生态,而初创公司在技术与商业之间徘徊[1] - 大模型行业从技术热潮转向商业化落地阶段,面临高昂成本、C端不确定性和ToB复杂交付等挑战[1] - AI价值必须通过商业化实现闭环,单纯的技术创新无法持续[1][7] 大厂战略 - 百度将文心大模型嵌入搜索、地图、网盘等核心产品,通过千帆平台打入垂直行业,自动驾驶平台萝卜快跑积累千万订单[2] - 阿里将通义千问融入钉钉、天猫精灵等应用,借助百炼平台向B端输出能力[2] - 腾讯在社交和办公生态植入混元大模型,通过腾讯云提供行业解决方案[2] - 字节以豆包大模型为核心布局C端和B端,火山引擎2024年营收突破120亿元[3] - 快手通过可灵AI提升内容生态与商业化效率,累计收入1.8亿元,企业API调用量超4000万次[4] 初创公司路径 - 智谱、阶跃星辰、商汤等专注ToB市场,面临回款周期长和项目转化门槛高的问题[5] - Minimax和月之暗面选择ToC市场,通过创新产品吸引用户但面临留存和变现挑战[5][6] - DeepSeek通过开源积累开发者社区,月活达1.7亿但用户活跃度从7.5%降至3%[6] 商业化挑战 - C端市场用户基数大但留存变现难,需要产品体验、留存机制和成本结构协同[9][11] - ToB市场交付周期长,大厂竞争加剧初创公司压力[10][11] - GPU成本居高不下,初创公司面临资金链断裂风险[10][11] - 技术必须与具体行业需求结合才能产生可观收入[10] 未来方向 - AI产品核心将从模型通用性转向任务完成力,聚焦垂直刚需场景[13] - 生态协同成为关键,需要构建"平台-模型-产品"联动闭环[13] - 开源与出海成为重要路径,多家公司布局海外市场[13] - 行业竞争焦点转向将模型能力嵌入真实业务并形成可持续现金流[13][14]
中美芯片战,正在变成黄仁勋的机会
虎嗅· 2025-07-17 16:29
英伟达在中美芯片战中的战略定位 - 黄仁勋通过"主权AI"概念推动全球各国发展本土AI基础设施,促进英伟达GPU销售 [3] - 公司在中美科技脱钩背景下持续为中国市场定制缩水版芯片(A800/H800/H20)以维持市场份额 [3][10] - 英伟达市值突破4万亿美元,成为AI技术革命的核心受益者 [2] 中国市场策略与表现 - 2024年初H20芯片在中国市场销售额达160亿美元 [11] - 黄仁勋年内三次访华,强调中国供应链先进性和科技创新活力 [1][2] - 公司重要客户包括DeepSeek、阿里巴巴等中国AI领军企业 [1] 地缘政治博弈 - 英伟达成功游说特朗普政府废除拜登时期的AI芯片出口限制政策 [4][5] - 公司通过"技术代差"策略向中国出售性能缩减70%的H20芯片(相比H100) [10] - 黄仁勋同时强化与中东(阿联酋/沙特)的芯片合作 [5] 产品与技术路线 - 计划2024年9月推出为中国定制的Blackwell架构缩水版B30芯片 [11] - 正在出货新一代G200芯片,保持对中国的技术领先 [10] - 通过差异化产品策略延长每代架构的盈利周期 [11] 行业竞争格局 - 中国AI崛起打破硅谷垄断,客观上扩大英伟达GPU需求 [2] - 华为昇腾芯片被黄仁勋公开认可为H20级别竞争对手 [7][8] - 中国具备构建独立AI生态的潜力(算力节点/通信网络/电力供应) [7]
大语言模型离“数学证明高手”还有多远?斯坦福、伯克利、MIT 团队提出 IneqMath 评测标准
AI前线· 2025-07-17 12:47
大语言模型数学推理能力评估 - 不等式问题可作为检验AI数学推理能力的理想工具,因其结构简单且易暴露逻辑漏洞[1] - 形式化数学系统(如Lean/Coq)虽能验证证明严谨性,但存在门槛高、自动化程度低等局限性[1] - 大语言模型在自然语言环境下表现优于形式化证明,适合开展"非正式推理"研究[4] IneqMath创新研究方法 - 斯坦福等团队提出将不等式证明拆解为"界限估计"和"关系预测"两个可验证子任务[4] - 构建包含1,252道训练题+200道奥赛级测试题的IneqMath数据集,建立自然语言与形式逻辑的桥梁[8] - 采用自然语言+LaTeX表达方式,平衡可证明性与易用性,答案具有唯一可验证性[6][7] AI裁判系统性能 - 四维度评审器(Toy Case/Logical Gap/Numerical Approximation/Computation)实现F1=0.93的高准确率[15][16] - 系统可检测71.5%答案正确但仅6%过程严谨的案例(Grok 3 mini),揭示模型"蒙答案"现象[18] - 评审器类型中Logical Gap Judge表现最佳(F1=0.96),计算验证类相对较弱(F1=0.80)[17] 模型规模与推理能力关系 - 参数增加仅提升答案准确率,对推理严谨性无显著改善[20] - 延长推理token数量对质量提升有限,存在明显瓶颈效应[23][24] - Gemini 2.5 Pro通过自我批判机制提升5%准确率,定理提示方法最高可提升10%[25] 行业应用与展望 - IneqMath框架为AI数学推理能力提供标准化评估工具[4][8] - 研究证实单纯扩大模型规模无法解决推理严谨性问题,需结合反思机制与工具使用[21][25] - 该方向发展将推动AI从"答案生成"向"过程验证"的范式转变[28][29]
AI人才“天价薪酬”的蕴意与警示
证券时报· 2025-07-17 08:20
美国硅谷AI人才争夺战 - Meta为挖角苹果AI基础模型团队负责人庞若鸣开出超2亿美元薪酬总包 这一数字超过苹果CEO库克2024年薪酬并接近C罗年收入水平 [1] - 谷歌以24亿美元代价通过"人才收购"方式获取AI编程公司Windsurf核心技术团队 [1] - 科技巨头天价薪酬反映AI人才已成为比资本土地更核心的生产要素 典型案例DeepSeek凭借人才密度优势通过算法优化大幅降低大模型训练成本并引发资本市场强烈反响 [1] 中国AI产业发展启示 - 中国AI人才缺口超500万人 且人才结构失衡 应用层人才集中而基础层(芯片/算法/架构系统)人才极度短缺 [2] - 需通过加大教育投资培养本土人才与引进海外高端人才双轨并行 企业应提供有竞争力的薪酬/算力资源/发展空间以增强吸引力 [2] - 需警惕资本非理性竞价导致泡沫化 应推动AI人才价值回归理性坐标系以实现技术红利向产业升级转化 [2]
时报观察丨AI人才“天价薪酬”的蕴意与警示
证券时报· 2025-07-17 08:11
AI人才争夺战 - Meta以超2亿美元天价薪酬总包挖角苹果AI基础模型团队负责人庞若鸣 该金额超过苹果CEO库克2024年薪酬并接近足坛巨星C罗年收入 [1] - 谷歌斥资24亿美元以"人才收购"形式获取AI编程公司Windsurf核心技术团队 [1] - 科技巨头不计代价争夺顶尖AI人才 反映人才已成为AI时代最核心生产要素 取代工业革命时期资本与土地的主导地位 [1] 顶尖AI人才价值重构 - DeepSeek凭借高人才密度团队 通过算法优化与工程创新大幅降低大模型训练成本 引发资本市场万亿级资金关注 [1] - 掌握关键技术的个体正重塑传统价值分配链条 甚至影响国家在全球科技版图中的地位 [1] 中国AI产业人才现状 - 中国AI人才缺口超500万人 且集中在应用层 基础层领域如AI芯片、算法研究、底层架构系统等人才极度短缺 [2] - 需通过加大AI教育投资培养本土人才 同时引进海外高端人才 企业应提供有竞争力的薪酬、充足算力资源及发展空间 [2] 行业潜在风险 - 资本对AI人才的非理性竞价可能催生泡沫 需警惕天价薪酬现象 让人才价值回归理性以推动产业升级 [2]
Why SoundHound AI Stock Plummeted 46% in the First Half of 2025 but Has Been Bouncing Back
The Motley Fool· 2025-07-17 03:07
股价表现 - SoundHound AI股价在2025年上半年大幅下跌459% 而同期标普500指数上涨55% [1] - 股价下跌部分源于2024年强劲涨幅后的回调 同时受宏观经济及公司特定因素影响 [2] - 7月股价反弹约8% 因投资者增持成长股 [8] 下跌驱动因素 - 中国AI公司DeepSeek推出R1模型导致估值下挫 [4] - 在CES展会上未公布突破性产品或合作 且英伟达宣布进军代理AI领域对其形成竞争 [5] - 英伟达向SEC披露已出售所持股份 引发大规模抛售 [6] 财务表现 - 第一季度销售额同比增长151%至2910万美元 超出市场预期 [7] - 非GAAP每股亏损006美元 [7] - 2025年营收指引157-177亿美元 中值对应97%增速 显著高于去年85%的增速 [9] 估值与增长 - 当前估值达预期销售额的29倍 高度依赖增长预期 [10] - 服务收入增长曲线表现亮眼 [10]
黄仁勋中文首秀 A股英伟达概念股走强
深圳商报· 2025-07-17 00:38
英伟达CEO黄仁勋演讲内容 - 英伟达CEO黄仁勋在第三届中国国际供应链促进博览会开幕式上用中文演讲,提及腾讯、网易、米哈游、字节跳动、DeepSeek、阿里巴巴、MiniMax、百度、小米等中国公司,并肯定中国企业的AI模型 [2] - 黄仁勋表示中国的开源人工智能是全球进步的催化剂,使每个国家和行业都有机会参与AI变革 [2] - AI正改变各行各业,包括科研、医疗保健、能源、交通和物流领域 [2] - 黄仁勋称赞中国的"超快速"创新,由研究人员、开发者和企业家驱动 [2] 英伟达业务进展与市场表现 - 美国已批准H20芯片销往中国 [2] - 英伟达将推出RTXpro GPU [2] - 英伟达股价报170.7美元/股,上涨4.04%,市值达41650.8亿美元,比苹果高出1万亿美元 [2] A股相关概念股表现 - 英伟达股价上涨带动A股相关概念股走强,鸿博股份涨停,新易盛股价上涨8.1%创历史新高 [3] - 浪潮信息、同方股份、启明星辰、鼎阳科技等跟涨 [3] - A股多家光模块企业与英伟达存在合作,受益于其算力需求增长 [3] - 5月以来新易盛股价累计上涨166.08%,中际旭创上涨105.76%,天孚通信、长芯博创等涨超八成 [3] - 工业富联、生益科技股价上涨近五成,华工科技、世运电路、奥比中光等涨超一成 [3]
提及11家中国科技公司,黄仁勋:低估华为和中国制造的人都极其天真
21世纪经济报道· 2025-07-16 21:30
英伟达H20加速生产与供应链 - H20将恢复在中国市场的销售,目前已经有很多订单 [3][4] - 英伟达供应链周期长达9个月,从下单到交付AI超级计算机需要9个月左右时间 [4] - 公司正在努力加速H20的生产进程,以满足客户需求 [4] 中国科技公司与AI创新 - 黄仁勋赞赏11家中国科技公司,包括腾讯、网易、米哈游、字节跳动、DeepSeek、阿里巴巴、美团、MiniMax、百度、小米等 [5][6] - 中国有100万名开发者投身AI领域,推动全球人工智能发展 [6] - DeepSeek、阿里巴巴、MiniMax、百度开发的产品是世界级的,推动了全球AI进步 [6] - 中国的开源AI是全球进步的催化剂,促进了AI产业的全球合作 [7] 华为的竞争力 - 黄仁勋认为低估华为和中国制造能力的人极其天真 [8][9] - 华为是一家不可思议的强大科技公司,在手机和通信技术领域领先 [9] - 华为在生态和客户上与英伟达仍有差距,但只是时间问题 [9] - 华为已经可以与英伟达相提并论,尽管进入该领域时间较短 [9] 贸易关税与公司适应能力 - 公司需要适应贸易、税收、关税等条件的变化 [11] - 英伟达是一家适应能力很强的公司,会找到新的方法应对变化 [11] - 长期来看,关键在于是否提供对世界重要的产品和技术 [11] 英伟达市值与行业地位 - 英伟达市值突破4万亿美元,成为全球市值第一的科技公司 [12] - 公司是全球绝大多数人工智能计算基础设施的提供者 [12] - 英伟达重新发明了计算,创造了一个全新的AI行业 [12] - AI行业将成为社会必不可少的基础设施,公司处于激动人心的开端 [12]