Workflow
DeepSeek
icon
搜索文档
DeepSeek-R1与Grok-3:AI规模扩展的两条技术路线启示
Counterpoint Research· 2025-04-09 21:01
核心观点 - DeepSeek-R1 和 Grok-3 代表了AI发展的两种不同路径:前者通过算法创新和高效资源利用实现高性能,后者依赖大规模计算资源投入 [2][8] - 行业趋势正从“原始规模主导”转向“战略效率优先”,算法设计、混合专家模型(MoE)和强化学习成为关键杠杆 [8][10] - 未来AI发展将更注重投资回报率(ROI),平衡规模扩展与算法优化 [8][10] 模型性能与资源对比 - DeepSeek-R1 仅使用约2000块NVIDIA H800 GPU即达到全球前沿推理模型性能,展现高效训练能力 [2] - Grok-3 动用约20万块NVIDIA H100 GPU,性能略优于DeepSeek-R1、GPT-o1和Gemini 2,但资源消耗相差百倍 [2][8] - 两者性能相近,但资源投入差异显著,凸显算法创新可抗衡纯计算规模 [8] 发展路径差异 - Grok-3 采用“蛮力策略”,依赖数十亿美元GPU计算规模,边际性能提升显著但ROI递减 [8] - DeepSeek-R1 通过混合专家模型(MoE)、推理强化学习和高质量数据,以最小硬件代价实现顶尖性能 [8] - 行业可能从“规模法则”转向“算法突破+工程实用主义”的全局发展观 [10] 未来AI趋势 - 集中式训练项目(如Grok-3)成本过高,仅限少数巨头参与,中小机构需转向效率优化策略 [10] - 混合专家模型(MoE)、稀疏化、改进微调和强化学习将成为核心,降低资源消耗 [10] - 新数据训练与强基础模型结合(如RAG或定期微调),可避免持续大规模计算负担 [10]
2025,创业者不要“死”在黎明前
混沌学园· 2025-04-09 19:32
仿佛所有人都在关注 AI,只是大多数人在感到惊奇与焦虑时,并不知道AI与自己的关联到底是什 么? 有人说:再不上车,你就会被 AI淘汰。于是焦虑不安的情绪在扩散。 这不仅对于混沌来说是个好问题,对所有企业家都是个好问题。 有人说:离 AI真的影响人类生活和工作的日子还远呢。于是两派声音在争执。 无论哪一种声音,如果你是企业的 1号位,即便你不参与纷争,你也会好奇:近两年热度如此之 高的AI,到底能不能帮助到我的企业? 先给你看一组数据: ChapGPT在2023年大放异彩时,OpenAI员工仅375人,如今扩张至1700人,其估值已达3000 亿美金, 仅次于 SpaceX的3500亿美元,成为全球估值最高的私营公司之一。 DeepSeek目前约有150名员工,其APP在全球范围内下载量已超过1.1亿次,周活跃用户规模最 高接近9700万。 马斯克的大裁员计划,用了 6个天才去执行,然而再天才的人也无法面对如此巨大的数据库吧?6 个天才加上AI,干了6000人的活。 我们能得出一个结论: AI是企业1号位的福利是真,但也是对靠堆人力完成目标的创业者的一场 噩梦。 所以,企业的 1号位要怎样适应AI时代? 企业 ...
斯坦福调查:中美AI的性能差距缩小至1.7%
日经中文网· 2025-04-09 11:13
DeepSeek与OpenAI 在通过人类投票决定对话AI是否作出恰当回答的测试方面,2024年1月调查时,美国顶尖AI在得 分上领先中国9.26%,但到2025年2月,这一差距缩小到1.7%。从特别重要的AI模型数量来看,美 国拥有40个,中国是15个…… 从2024年民间的AI投资来看,美国达到1091亿美元,达到中国的约12倍、英国的约24倍,显 著拉开了差距。从特别重要的AI模型数量来看,美国拥有40个,远远超过中国的15个和欧洲 的3个。 另外,在AI性能方面,在图像分类、语言理解和数学等特定技能上超越人类能力的项目正在 增加。据称谷歌、OpenAI、DeepSeek、xAI、Anthropic、Meta、Mistral AI等企业之间的竞争 日益激烈,前十大模型的性能差距正在缩小。 在商业领域的渗透也取得进展,使用AI的组织在2024年为78%,与2023年的55%相比有所上 升。另一方面,报告指出,AI因错误行为而引发问题的案例增加56%,创出历史新高,美国的 监管数量增加了逾一倍。 日本经济新闻(中文版:日经中文网)渡边直树 硅谷 版权声明:日本经济新闻社版权所有,未经授权不得转载或部分复制, ...
整理:每日科技要闻速递(4月9日)
快讯· 2025-04-09 07:42
新能源汽车 - 理想汽车L6车型累计交付量突破24万辆[2] - 禾赛科技与零跑汽车达成合作 获得20万台激光雷达订单[2] - 小米汽车新增支持苹果Siri语音控车功能[2] - 长安汽车4月将推出9款新车型 包括阿维塔06/07探索版和启源Q07[2] - 比亚迪一季度预计盈利85亿-100亿元人民币 同比增长86.04%-118.88%[2] - 长城汽车与宇树科技签署战略合作协议 将在机器人技术领域开展合作[2] 集成电路(芯片) - 中国在二维半导体芯片研发领域取得重要突破[2] - 美光通知美国客户将对部分产品征收关税相关附加费[2] - 瑞芯微澄清"三星晶圆厂暂停所有中国业务"为虚假消息[2] 人工智能与科技 - 酷狗音乐与DeepSeek达成深度合作[2] - 开源模型DeepCoder性能媲美OpenAI-o3模型[2] - 工业富联一季度净利润预计同比增长24.4%-26.8%[2] 新兴科技应用 - 广州市番禺区发布全市首个"空中的士"快速出行网络[2]
拧巴的扎克伯格
虎嗅· 2025-04-09 07:01
出品 | 虎嗅科技组 作者 | 房晓楠 编辑 | 苗正卿 头图 | 视觉中国 无疑,这几天AI圈最大的流量都被Meta承包了。 先是4月6日,迟迟不出手的Meta终于亮相,一举扔出包括Llama 4 Scout(109B)、Llama 4 Maverick (400B)和Llama 4 Behemoth在内的Llama 4套餐,凭借"原生多模态MoE架构""性能超越DeepSeek V3""1000万token上下文"等亮点,一路高举高打。业界也是喜闻乐见,"开源之光依旧能打"等声音持续 不断,Llama 4出道即巅峰。 但没想到,紧接着负面声音层出不穷。 一方面,开发者在实际测评时发现,Llama 4的性能并没有官方宣扬的那样强大,甚至在代码、逻辑推 理方面,远不如GPT-4o、DeepSeek R1 、 Gemini 2.5 pro。 另一方面,有自称Meta内部员工的人员爆料,Llama 4存在造假嫌疑,为了"赶工期",在后训练阶段 中,将多个benchmark测试集混入训练数据,以提升基准分数。甚至,技术负责人看不过去这样的造假 行为,递交辞职报告。传闻一出,立即发酵,Meta陷入舆论风波中,各种声讨 ...
「AI新世代」解码“AI六小虎”之“理想派”月之暗面:大幅降价失先机,是破局还是无奈
华夏时报· 2025-04-08 22:19
文章核心观点 月之暗面宣布下调模型推理服务与上下文缓存价格加入大模型价格战,但降价姗姗来迟,且公司面临理想与现实的平衡难题,需提升技术水平以应对竞争 [2][3][5] 姗姗来迟的降价措施 - 月之暗面4月7日宣布下调模型推理服务与上下文缓存价格,推理服务不同上下文长度版本输入输出价格均降低,上下文缓存创建、存储、调用价格也降低 [2][3] - 此次降价幅度最高约83%,公司称通过技术创新降低推理成本、提高推理速度,成本降低反映在Tokens定价上 [3][4] - 今年2月月之暗面与清华合作的Mooncake项目技术报告获计算机存储领域顶会FAST 2025最佳论文奖,该平台应用于Kimi内部多场景推进智能降本 [4] - 此前公司仅公开过一次针对上下文缓存Cache存储费用的调价,文渊智库创始人王超认为降价时机晚,此时降价只能与DeepSeek以外厂商比较 [5] 理想派的左右为难 - 2024年3月Kimi智能助手月访问量达1218万次仅次于百度文心一言,2025年2月AIGC APP行业月活Kimi排第四为2451万 [6] - DeepSeek爆火冲击月之暗面,纳米AI搜索、腾讯元宝APP接入其大模型后日活显著提升,且DeepSeek流量非靠投流获得,月之暗面去年曾大规模投流 [6] - 今年2月媒体报道月之暗面暂停多渠道投放并改变战略,公司未回应,公司坚持技术取胜优先,但无DeepSeek资本背景需考虑商业化 [6][7] - 去年Kimi开始测试打赏功能、发布企业级API开展toB业务,商业化情况未公布,公司依赖融资生存,今年无融资消息且面临仲裁未回应 [7] 开源与技术提升 - 月之暗面宣布将阶段性成果开源,王超认为技术水平是关键,公司需让下一版模型达到新高度 [8]
速递|DeepSeek联手清华新模型GRM开源,算力降低性能反升
Z Potentials· 2025-04-08 20:30
图片来源: DeepSeek DeepSeek 正与清华大学合作,致力于减少其 AI 模型所需的训练量,以降低运营成本, 开发自我进 化的 AI 模型。 DeepSeek 曾以一月份推出的低成本推理模型震动市场,现与高校研究人员联合发表论文,详述了一 种提升模型效率的强化学习新路径。研究人员写道,这种新方法旨在通过为更准确且易于理解的回答 提供奖励,帮助人工智能模型更好地遵循人类偏好。 强化学习在加速特定应用和领域内的 AI 任务方面已被证明有效,但将其扩展到更通用的场景一直充 满挑战——这正是 DeepSeek 团队试图通过其所谓的 " 自我原则批判调优 " 来解决的问题。 论文指出,该策略在多项基准测试中超越了现有方法和模型,结果显示能以更少的计算资源实现更优 性能。 DeepSeek 公司表示,将这些新模型命名为 DeepSeek-GRM (通用奖励建模的缩写),并将以开源形 式发布。 包括中国科技巨头阿里巴巴集团和美国旧金山的 OpenAI 在内的其他 AI 开发者,也正在开拓新领 域,致力于提升 AI 模型实时执行任务时的推理与自我优化能力。 Meta 于上周末发布了其最新 AI 模型系列 Llam ...
Llama 4遭竞技场背刺!实锤用特供版刷榜,2000+对战记录公开
量子位· 2025-04-08 12:46
大模型竞技场事件核心观点 - 大模型竞技场官方团队公开质疑Meta提供的Llama-4-Maverick-03-26-Experimental为特供版 未明确标注经过人类偏好优化的定制模型属性 [1][2][7] - 官方公开2000余组模型对战数据 包含用户提示词、模型回复及用户偏好数据以增强透明度 [1][6] - 竞技场正在更新排行榜政策 强化公平性和可复现性评估承诺 [3][7] Llama-4模型表现分析 - 代码生成任务表现:Llama-4-Maverick生成可运行的"Blob Hunter"网页游戏 计分准确 而对比模型command-a-03-2025存在明显bug [9][13][14][15] - 学术标题生成任务:相比claude-3-5-sonnet的简洁回复 Llama-4-Maverick提供更详细建议 包含情绪价值和选择建议 [20][22][24] - 中文文本解析:展现超长输出特点 对微小说进行深度拆解 超出基础分析需求 [27][28] 竞技场排名争议 - Llama-4-Maverick以1417分位列竞技场第二 超越DeepSeek-V3成为开源模型榜首 较Llama-3-405B提升149分 [31][32][33] - 实际表现与排名严重不符 第三方基准测试中多处于末尾 经典编程测试出现基础错误 [35][37] - Meta GenAI负责人解释表现差异源于部署问题 但用户质疑该现象在其他模型中未出现 [38][39][40] 行业评价体系讨论 - 竞技场评价方法受质疑 人类偏好被认为不适用于评估高级大模型能力 投票基准被指过时 [44] - 用户指出模型亲和力(非官方认定的表情符号)才是获得高票关键因素 [45] - 行业建议更新评价体系 包括修改ELO算法或启用强制风格转换等方案 [46]
Nasdaq in Bear Market: Buy the Dip in ETFs?
ZACKS· 2025-04-08 02:01
文章核心观点 - 特朗普实施两步关税策略引发中美贸易战担忧,纳斯达克综合指数进入熊市,科技股受重创,但部分分析师认为估值调整后存在投资机会 [1][2][10] 特朗普关税策略及影响 - 4月2日特朗普推出并实施两步关税策略,4月5日起对多国进口商品征收10%基准关税 [1] - 中国对美国商品加征新关税进行报复,股市受挫,引发全球贸易战担忧,多数股票受影响,纳斯达克综合指数受冲击严重 [2] - 4月9日将对部分被视为最严重违规的国家加征额外关税 [2] 纳斯达克指数表现 - 4月4日纳斯达克综合指数下跌5.8%,本周下跌8.6%,较12月纪录下跌22%,进入熊市 [3] - 纳斯达克100市盈率从2024年9月初的41.24倍降至2025年3月底的29.27倍 [9] - 纳斯达克100指数虽回调但估值仍高于20倍的二十年平均水平,为24倍预估利润 [11] 科技股下跌原因 - 苹果、英伟达、特斯拉等科技股受中国报复性关税冲击,4月4日苹果暴跌7%,本周累计下跌13%,英伟达下跌7%,特斯拉下跌10% [4] - 科技公司对人工智能投资热潮超过需求,引发市场担忧 [5] - 中国初创公司DeepSeek推出低成本AI模型R1,训练成本仅560万美元,远低于OpenAI的GPT - 4模型的1亿美元,对现有市场格局构成威胁 [6] - 阿里巴巴联合创始人警告AI基础设施增长超过实际需求,微软因供应过剩取消部分数据中心项目 [7] 投资机会分析 - 微软、谷歌、亚马逊和Meta本财年仍承诺超过3000亿美元资本支出,部分分析师认为近期抛售带来买入机会 [8] - 分析师认为英伟达当前23倍远期收益的估值具有“防御性” [9] - 纳斯达克100估值调整后,相关ETF如QQQ、QQQM和QQQE可能具有投资价值,QQQ的50日移动平均线高于200日移动平均线,显示看涨信号 [9][13] 行业总结 - 去年行业巨额投资需要时间产生效益,苹果、特斯拉和英伟达与中国联系紧密,中国报复性关税可能影响这些股票及纳斯达克100指数,这三只股票约占纳斯达克100指数的20% [12] - 市场情绪可能仍偏悲观,但较低估值对该领域是利好,风险偏好较高的投资者可考虑投资纳斯达克100相关ETF [13][14]
考东大Open AI和DeepSeek谁得分高?
日经中文网· 2025-04-07 11:36
中美AI模型在东京大学入学考试中的表现 - 美国OpenAI的"o1"和中国DeepSeek的"R1"在2025年度东京大学理科3类入学考试中均超过最低合格线368 7分,其中"o1"得374分,"R1"得369分 [1][2] - 这是AI首次在预备学校讲师的评分中获得合格判定,尽管东京大学理科3类考试包含面试环节 [2] - 在文科和其他理科科类中,两模型同样获得合格成绩,但"R1"在理科1类和2类的共通考试中未达合格线 [2] 各科目得分情况 - 英语科目表现突出:"o1"和"R1"得分率均超75%,单词和语法错误极少,远超考生平均水平 [2] - 数学科目存在明显短板:理科数学满分120分下,"o1"仅得38分,"R1"得49分,论证错误频发且说明不足 [2] 测试方法与参与机构 - 测试由日本经济新闻联合LifePrompt输出答案,河合塾讲师评分,采用东京大学2025年度真题 [1] - 参与评分的河合塾讲师指出数学成绩"明显低于合格者平均分",印证AI在复杂逻辑推理上的局限性 [2]