推理模型

搜索文档
速递|英伟达黄仁勋强调DeepSeek利好英伟达,将2025年实现强劲增长
Z Potentials· 2025-02-27 12:09
Nvidia CEO 黄仁勋(Jensen Huang) 对公司的未来一如既往地充满信心,他在2月26日周三的最新财报电话会议上重申, DeepSeek 不会影响销售。 有关 DeepSeek 的 R1 模型训练所需芯片数量大幅减少的猜测,推动了 Nvidia 股价上个月创纪录的下跌。 图片来源: Nvidia 但在财报电话会议上,黄仁勋将 R1 誉为"卓越的创新",并强调它和其他"推理"模型对 Nvidia 来说是重大利好消息,因为它们需要更多的计算资源。 "推理模型的计算消耗可能是现在的 100 倍,而未来的推理模型将消耗更多的计算资源,"黄说。 " DeepSeek R1 已经点燃了全球的热情。这是一项卓越的 创新,但更重要的是,它开源了一个世界级的推理 AI 模型。几乎每一位 AI 开发者都在应用 R1 。" Nvidia 的销售未见放缓迹象。 Nvidia 报告了又一个破纪录的季度,其收入达到 393 亿美元——超过了公司自身的预测和华尔街的预期。 公司还表示,预计 下一季度的收入将再次增长,达到约 430 亿美元。 的确,尽管上个月人们对 DeepSeek 的恐慌情绪蔓延,但 AI 芯片市场并未显 ...
OpenAI 再次给大模型 “泡沫” 续命
晚点LatePost· 2024-09-13 23:58
OpenAI o1模型发布 - OpenAI发布新型推理模型o1系列,包括o1-preview和o1-mini,性能在数学、编程等领域大幅超越GPT-4o [3][5][7] - o1采用强化学习和思维链技术,通过自我纠偏和分步推理提升逻辑能力,解题时处理字符量达6632个,是GPT-4o的4.2倍 [8][9][19][25] - 模型响应时间显著延长,o1-preview回答简单问题需32秒,是GPT-4o的10倍,且目前功能受限,开发者API调用被限制为每分钟20次 [25][29] 技术路径革新 - o1突破传统Scaling Laws瓶颈,通过增加"答题时思考"的算力分配(test-time compute)实现性能跃升,AIME数学竞赛得分达GPT-4o的4倍 [5][19][26][27] - 训练数据来源扩展至三类:公开数据集、合作伙伴专有数据和内部定制数据,研发团队规模与GPT-4o相当(212人) [21] - 模型架构可能向"推理核心+知识存储"方向演进,OpenAI暗示将把o1技术整合至下一代GPT模型 [27][29] 行业影响 - o1发布刺激英伟达股价两天累计上涨10%,缓解市场对AI进步停滞的担忧,此前英伟达市值从6月高点已下跌20% [3][4][29] - 红杉研究显示AI领域2023年投入产出差达1200亿美元,2024年可能扩大至5000亿美元,除英伟达外多数公司未实现收入大幅增长 [4] - 中国部分科技公司已暂缓基础模型训练转向应用开发,o1发布可能重启算力竞赛,OpenAI借此时机以1500亿美元估值寻求70亿美元融资 [4][6][30] 产品特性对比 - o1在数学/编程测试中表现突出:Codeforces编程竞赛成绩超GPT-4o 5.6倍,但语言创作能力弱于GPT-4o [19][22][24] - 相比GPT-4o,o1系列暂缺网页浏览、文件处理等功能,付费用户使用频次受限(每周30次o1-preview) [25][29] - 下一代o1模型在物理/化学等学科测试表现预计达到博士生水平,当前模型相当于硕士生水平 [21]