o1 模型

搜索文档
硅谷模型大厂变化:对预训练和Capex的影响?
2025-07-02 23:49
硅谷模型大厂变化:对预训练和 Capex 的影响? 20250702 摘要 Meta 积极挖角 OpenAI、谷歌和 Anthropic 等公司人才,尤其集中在 多模态处理、后训练和推理模型领域,旨在提升 LLAMA 模型竞争力, 加速下一代大模型研发。 Meta 通过收购 Skill AI 加强数据筛选能力,弥补参数量不足,同时加速 集群建设,学习 OpenAI 模式,综合提升数据、人力和算力,推动下一 代模型发展。 OpenAI 的 O1 模型核心团队成员流失,任宏宇、赵胜佳和余佳慧等关 键人物被挖走,对 OpenAI 造成一定冲击,促使其加快发展步伐。 AI 人才薪酬大幅上涨,顶尖人才年薪高达一亿美元,显示科技公司对 AI 人才的争夺白热化,扎克伯格通过高薪全面压制竞争对手。 2025 年下半年,科技公司将回归预训练阶段,Meta、谷歌和 OpenAI 采取不同策略:Meta 侧重数据,谷歌优化架构,OpenAI 坚持大集群战 略。 Q&A 近期硅谷的变化对全球大模型 AI 演绎节奏有何影响? 近期硅谷的变化显著加快了全球大模型 AI 演绎的节奏。今年(2025 年)下半 年,美国将进入新一轮的大模型迭 ...
Now, Scaling What?
机器之心· 2025-05-24 22:12
机器之心PRO · 会员通讯 Week 21 --- 本周为您解读 ② 个值得细品的 AI & Robotics 业内要事 --- 1. Now, Scaling What? 「Scaling What」的阶段性答案是什么?如何从确定「What to Scale」到搞定「How to Scale」?「Tuning」和 「Inference」在后训练中为何同等重要?Scaling Law 正在继续蔓延到哪些领域?... 2. Meta CEO X 微软 CEO 对话解读:「蒸馏工厂」为何成为开源的魅力之源? 「蒸馏工厂」是什么?为什么「蒸馏工厂」是开源最大的魅力之一?为何说当前 AI 浪潮是新一轮技术平台革命?微软如何在开 源与闭源 AI 模型之间找到战略平衡?... 本期完整版通讯含 2 项专题解读 + 29 项 AI & Robotics 赛道要事速递,其中技术方面 12 项,国内方面 7 项,国外方面 10 项。 本期通讯总计 22878 字,可免费试读至 9% 消耗 99 微信豆即可兑换完整本期解读(约合人民币 9.9 元) 要事解读① Now, Scaling What? 引言 : 自 2024 年起 ...
万字长文带你读懂强化学习,去中心化强化学习又能否实现?
机器之心· 2025-05-07 12:34
选自 Symbolic Capital 作者:Sam Lehman 机器之心编译 AI / 机器学习 scaling 简史 (极简版) 强化学习(RL)是当今 AI 领域最热门的词汇之一。近日,一篇长文梳理了新时代的强化学习范式对于模型提升的作用,同时还探索了强化学习对去中心化的意 义。 原文地址:https://www.symbolic.capital/writing/the-worlds-rl-gym 「有时候几十年什么也不会发生;有时候几周时间仿佛过了几十年。」这句话形容当今的现代 AI 领域最为贴切。似乎每天都有新的突破性模型、训练方法或公司 涌现,迫使我们重新思考 AI 世界的可能性。今年早些时候是 DeepSeek,接下来是星际之门项目,现在还有 Qwen、Manus、MCP 等。谁知道接下来会发生什么? 目前,在打造更好的模型方面,通过预训练以及最近的测试时间计算进行 scaling 是引领性方法。但最近,随着 DeepSeek-R1 和 R1-Zero 的发布,人们开始更加亲 睐一种不同的模型 scaling 方法 —— 强化学习(RL)。本文的目标是探索基于 RL 的模型改进的含义,并会特别 ...
DeepSeek对英伟达长期股价的潜在影响
致富证券· 2025-03-12 14:38
报告行业投资评级 未提及 报告的核心观点 - DeepSeek在训练和推理成本上有显著优势,引发科技股大幅波动,短期内冲击英伟达股价,但长远看随着AI技术普及和商业化加速,英伟达芯片需求可能进一步增长,AI产业将迈向新阶段 [2][3][16] 根据相关目录分别进行总结 DeepSeek引发市场波动 - 1月27日,DeepSeek在中国区和美国区苹果App Store免费榜登顶,美国科技股市场大幅下跌,费城半导体指数下跌9.2%,英伟达股价下跌近17%,市值蒸发近6000亿美元,WTI原油价格盘中一度下跌3% [2] DeepSeek成本优势 - 训练成本方面,DeepSeek使用约2000张H800 GPU训练,V3模型训练成本不超过600万美元,预训练阶段每万亿Token训练用2048个H800 GPU集群,180K个GPU小时(约3.7天)完成,总耗时约2788K GPU小时 [5][6] - 推理成本方面,OpenAI的o1模型每百万输入和输出Token分别收费15美元和60美元,DeepSeek的R1模型相同输入和输出价格仅为OpenAI的3%,DeepSeek推理成本API报价每百万Token输入成本仅1元 [3][7] DeepSeek低成本训练实现方式 - DeepSeek团队创新训练策略,在监督微调环节优化,最初尝试跳过SFT步骤仅用强化学习训练,引入少量冷启动数据提升稳定性和推理能力,R1系列模型摒弃RLHF中的人类反馈部分 [9] - 为解决纯强化学习训练文本中英混杂问题,用数千条链式思考数据微调V3 - Base模型,再启动强化学习流程生成样本数据微调得到R1模型,降低成本同时提升推理和语言生成质量 [10] DeepSeek对AI产业影响 - 对依赖自研大模型构建商业模式的公司影响更显著,如引发Meta内部AI团队担忧,Meta成立小组分析其技术原理并计划用于Llama模型优化 [12] - 美国大型科技企业以保持技术领先为首要目标,虽可能借鉴DeepSeek方法优化成本,但不会作为核心战略,现阶段大语言模型发展需大量算力,未来其他机器学习模型也可能有巨大算力需求 [13] - 英伟达认为DeepSeek成果会增加市场对其芯片需求,依据杰文斯悖论,技术进步降低资源使用成本会使市场对资源总体需求上升 [14] - DeepSeek降低大语言模型开发门槛,促使更多中小型企业和个人训练私有模型,若引发推理需求“第二波”增长,增量需求将远超AI巨头减少的GPU采购量,且商业化后推理环节算力消耗更大 [15]
速递|DeepSeek 声称其“理论”利润率为 545%
Z Potentials· 2025-03-02 10:37
DeepSeek AI模型盈利潜力 - 公司公布在线服务"成本利润率"高达545% 该数据基于"理论收入"计算 [1] - 若V3和R1模型24小时使用量均按R1定价计费 日收入可达562,027美元 而对应GPU租赁成本仅为87,072美元 [1][2] - 实际收入显著低于理论值 主因包括夜间折扣 V3定价较低 及部分服务未商业化 [2] 商业化现状与挑战 - 当前网络和应用程序访问仍免费 若取消免费政策可能导致使用量大幅下降 [2] - 面临美国贸易限制 无法获取最强大芯片 影响技术发展 [2] - 科技股下跌背景下 行业分析师对人工智能支出持质疑态度 [2] 市场表现与技术突破 - 应用程序曾取代ChatGPT登顶苹果App Store榜首 当前在生产力类排名第6 [3] - 1月发布的新模型在部分基准测试中与OpenAI o1性能相当 但开发成本显著更低 [2] - 通过优化方法实现更高吞吐量和更低延迟 技术细节发布于GitHub [1]
DeepSeek 刷新全球 AI 格局;50 美元模型蒸馏术;美国公司们宣布 8000 亿美元算力投资丨AI 月报
晚点LatePost· 2025-02-10 17:50
DeepSeek 在 1 月 20 日上线 R1 模型后,凭借高性能(比肩 OpenAI o1)、低使用成本(API 价格是 o1 的 1/30)、开源模型权重 等,迅速接管 OpenAI 等公司主导的大模型叙事。 DeepSeek 怎么刷新全球大模型格局 李飞飞在内的团队如何低成本 "蒸馏" 出特定领域追赶 o1 的模型 到去年底,OpenAI 年化收入超 60 亿美元 OpenAI 的星门计划:投 5000 亿美元建算力 26 家获得超过 5000 万美元融资的 AI 公司,中国有 2 家 大模型公司的爬虫遭 "下毒" 抵抗 这之前,因为 OpenAI 展示能力超强的 o3 模型,不少 OpenAI 和硅谷的研究者正在讨论 AGI (通用人工智能)即将到来。R1 发 布后,行业焦点变成 DeepSeek,一些媒体用 "DeepShock" 形容它带来的冲击。 市值大跌的英伟达、台积电,现在已经开始反弹 2025 年 1 月的全球 AI 大事记。 文丨贺乾明 编辑丨程曼祺 2025 年 1 月的 AI 月报,你会看到: 以下是我们第 3 期 AI 月报,欢迎大家在留言区补充我们没有提到的重要进展。 格局丨D ...
AI 月报:马斯克加速 GPU 竞赛;大模型真撞墙了? 风口转到 Agent
晚点LatePost· 2024-12-11 22:30
技术发展 - OpenAI在12月开启为期12天的密集发布活动,包括推出完整版o1模型、每月200美元的ChatGPT Pro、视频生成模型Sora等 [2] - 大模型行业面临能力提升瓶颈,Google、OpenAI、Anthropic等公司在开发下一代模型时未能实现前几年的显著性能跃升 [4][5] - OpenAI尝试用合成数据训练新模型Orion但效果不理想,同时行业探索更高精度数据、后训练优化等新方向 [16][17][18][19] 市场竞争 - OpenAI企业市场份额从50%降至34%,Anthropic份额从12%增至24% [22] - xAI以500亿美元估值融资50亿美元,Anthropic获亚马逊追加40亿美元投资,Writer以19亿美元估值融资2亿美元 [27] - 视频生成领域竞争加剧,Runway上线新功能,腾讯开源对标Sora的HunyuanVideo模型 [25][26] 算力竞赛 - 亚马逊、微软、Meta、Google四家公司今年资本支出超2000亿美元建设算力中心,并计划加大投资 [28] - Anthropic CEO预测2026年将出现耗资超100亿美元的算力集群,OpenAI提议建造千亿美元级数据中心 [28] - 英伟达加速产品迭代,计划2025年发布机器人专用芯片Jetson Thor [35][37] 应用落地 - ChatGPT周活用户达3亿,企业生成式AI支出飙升500%至138亿美元 [38] - AI编程成为竞争焦点,GitHub Copilot生成微软近半启动代码,Cursor以25亿美元估值获融资 [6][23][43] - Agent成为行业新赛点,OpenAI、Anthropic、智谱等公司加速布局智能体产品 [51][52][53] 行业投资 - 沙特宣布500-1000亿美元AI投资计划,波兰投入2.44亿美元开发本土大模型 [31] - AI制药公司Cradle获7300万美元融资,Enveda筹1.3亿美元推进药物研发 [61] - 具身智能领域Physical Intelligence以24亿美元估值融资4亿美元,银河通用获5亿元人民币投资 [29]