Workflow
GPT 4.5
icon
搜索文档
DeepSeek终于丢了开源第一王座,但继任者依然来自中国
猿大侠· 2025-07-19 11:43
模型排名与性能 - Kimi K2在全球开源模型中排名第一,总榜第五,紧追顶尖闭源模型Grok 4 [1] - 开源模型DeepSeek R1位列总榜第八,与Kimi K2成为唯二进入TOP 10的开源模型且均来自中国 [2] - Kimi K2在多项能力中表现突出:连续多轮对话并列第一、编程能力第二、应对复杂提示词能力第二 [3] 社区热度与行业认可 - Kimi K2发布一周内GitHub标星达5.6K,Hugging Face下载量近10万 [5] - Perplexity CEO公开支持Kimi K2,透露计划基于该模型进行后训练 [5] - 用户访问量激增导致API响应延迟,反映模型热度极高 [6] 架构设计与技术优化 - Kimi K2继承DeepSeek V3架构,但通过四项关键参数调整优化性能:增加专家数量、注意力头减半、仅保留第一层Dense、专家无分组 [12] - 调整后总参数增至1.5倍,但推理耗时理论值更低,成本与V3架构相当 [13] - 团队选择V3架构因其已验证高效且符合有限资源条件,避免"为不同而不同" [10][11] 开源模型行业趋势 - 开源模型性能差距缩小,TOP 10模型总分均超1400分,开源与闭源近乎同一起跑线 [20][21] - 行业专家预测开源将更普遍击败闭源,并在AI本地化定制中发挥关键作用 [24] - 开源模型打破"性能弱"刻板印象,国产开源模型表现尤为亮眼 [18][22]
梁文锋等来及时雨
是说芯语· 2025-07-19 09:26
行业竞争格局 - 国内大模型行业进入密集更新期,Kimi、阶跃星辰、智谱AI、科大讯飞等玩家将在7月底集中发布新一代基础大模型 [3] - DeepSeek自4月起月活用户持续下滑,5月MAU为1.69亿(环比-5.1%),官网访问量下降29%,使用率从7.5%峰值回落至3% [3][4][18] - 第三方平台托管的DeepSeek模型使用量逆势增长20倍,形成与官方流量下滑的反差 [13] 技术发展动态 - Kimi K2成为国内首个万亿参数MoE架构开源模型,在代码/数学推理任务反超DeepSeek,支持128K上下文窗口 [10][15] - MiniMax-M1以53.47万美元低成本完成训练(512块H800三周),对比DeepSeek V3训练成本557万美元(2048块H800) [11] - 行业普遍提升上下文窗口能力(MiniMax达100万token),而DeepSeek保持64K最小窗口的保守策略 [15] 商业模式对比 - 科技大厂通过低价API争夺市场:百度李彦宏公开批评DeepSeek"慢且贵",阿里/字节/百度等推出更低价模型 [10] - Kimi K2定价与DeepSeek标准时段对齐(输入4元/百万tokens,输出16元/百万tokens) [11] - DeepSeek坚持开源路线但面临商业化压力,需平衡开发者生态与产品使用率 [17] 供应链挑战 - 英伟达H20芯片禁售导致DeepSeek R2模型延迟发布,算力储备出现紧缺 [5][7] - 7月15日英伟达获准重新销售H20芯片,将缓解DeepSeek算力瓶颈 [7] - H20芯片因DeepSeek的低成本训练方法在中国需求激增,引发4月美国出口管制 [5] 产品能力短板 - DeepSeek暂不支持多模态功能(语音/图片/视频生成),成为主流AI助手中唯一缺失该能力的产品 [19] - 调用工具能力不足:字节测试发现其工具调用表现不理想,最终改用自研模型 [19] - 小版本更新策略(如DeepSeek-R1-0528仍基于2024年V3 Base模型)导致竞争力下降 [8][10] 国际对标差异 - OpenAI通过高频更新保持领先(GPT 4.1系列发布后份额达10%),而DeepSeek R1仅持平o1水平 [17][18] - DeepSeek缺乏OpenAI的代际优势,使用率从7%峰值降至3%(跌幅超50%) [18] - 行业普遍学习OpenAI的快速迭代策略,如奥特曼每周更新产品的运营方法 [17]
DeepSeek终于丢了开源第一王座,但继任者依然来自中国
量子位· 2025-07-18 16:36
模型排名与性能 - Kimi K2在全球开源模型中排名第一,总榜第五,紧追Grok 4等顶尖闭源模型 [1] - Kimi K2得分为1420,与Grok 4(1437)和GPT 4.5(1437)差距较小 [2][23] - 唯二进入总榜TOP 10的开源模型均来自中国(Kimi K2和DeepSeek R1) [2][28] 技术能力表现 - 连续多轮对话能力并列第一,与Grok 4和o3持平 [3] - 编程能力排名第二,与GPT 4.5和Grok 4相当 [3] - 应对复杂提示词能力排名第二,与o3和4o同梯队 [3] 社区热度与影响力 - GitHub标星达5.6K,Hugging Face下载量近10万 [5] - Perplexity CEO公开站台,计划基于K2进行后训练 [5] - 用户访问量过大导致API响应变慢 [6] 架构设计与优化 - 继承DeepSeek V3架构,但进行了参数调整 [9][12] - 增加专家数量,MoE总参数增加但激活参数量不变 [13] - 注意力头数减半以平衡成本,效果影响微小 [13] - 仅保留第一层Dense,其余使用MoE,推理效率无影响 [13] - 专家无分组设计,通过自由路由提升灵活性 [13] - 总参数增至1.5倍,但推理耗时更小且成本可控 [15] 行业趋势与观点 - 开源模型性能已接近闭源,TOP 10分数均超1400 [21][23] - 开源与闭源差距缩小,Kimi K2接近Grok 4和GPT 4.5 [22] - 行业人士认为开源击败闭源将更普遍 [25][27] - 开源模型在AI能力全球扩散中扮演关键角色 [27]
梁文锋等来及时雨
36氪· 2025-07-16 18:19
行业竞争格局 - Kimi发布K2新模型引发试用高潮,Perplexity CEO表示将引入K2提供服务[3] - 阶跃星辰、智谱AI、科大讯飞等公司计划在7月底发布新一代基础大模型[3] - DeepSeek月活跃用户规模从1.69亿环比下滑5.1%,下载排名跌至30名开外[4] - DeepSeek官网访问量下降29%,用户使用率从7.5%峰值回落至3%[4][17] 技术发展动态 - DeepSeek加速推出R2模型但受H20芯片禁售影响延迟发布[5] - 英伟达H20芯片因DeepSeek需求激增被美国禁售,7月15日宣布重新申请销售许可[6][8] - Kimi K2成为国内首个总参数量达1万亿的MoE架构开源模型,在多项基准测试中超越DeepSeek[14] - MiniMax-M1仅用512块H800三周时间完成训练,成本53.47万美元,远低于DeepSeek V3的557万美元[15] 商业模式比较 - DeepSeek因缺乏大版本更新被质疑性价比,科技大厂推出更低价的API模型[13] - Kimi K2定价与DeepSeek对齐,输入/输出tokens价格分别为4元/16元每百万[15] - DeepSeek在第三方平台模型使用量增长20倍,但官方应用流量持续下滑[17] - 上下文窗口限制(64K)影响DeepSeek竞争力,Kimi K2支持128K,MiniMax-M1达100万[22][23] 产品能力短板 - DeepSeek暂不支持多模态功能,落后于行业主流AI助手[28] - 调用工具能力不足导致字节放弃采用DeepSeek-R1[28] - OpenAI通过高频更新保持热度,GPT-4.1系列使用率快速升至10%,而DeepSeek R1使用率下降超50%[26] 战略方向差异 - DeepSeek坚持开源路线但面临商业化挑战,需平衡开发者活跃度与产品使用率[24][25] - 竞争对手在新模型中均强化Agent构建能力,DeepSeek需补足工具调用短板[29] - 行业转向Agent生态发展,多模态能力重要性日益凸显[28][29]
Think a Recession Is Coming? This AI Stock Can Still Thrive.
The Motley Fool· 2025-05-06 17:15
One of the core assumptions that underpins the artificial intelligence (AI) boom is that each new generation of AI model will require ever-increasing computational horsepower to train and run. DeepSeek, the Chinese AI company that managed to put out an AI model that performed well using a fraction of the computational resources of top-tier AI models, raised some serious questions about the future of the AI industry. There are some other signs, as well, that more computing power may not be the answer. OpenAI ...
速递|百度推理模型X1上线,开源Ernie 4.5,正面迎战DeepSeek
Z Potentials· 2025-03-16 11:54
文章核心观点 百度发布新AI模型并升级旗舰基础模型,在AI领域有诸多举措,同时面临竞争,其财报显示营收和利润有不同表现,还完成收购计划投资AI和云基础设施 [1][2][6] 产品动态 - 百度发布能阐明推理过程的新AI模型,与DeepSeek等竞争 [1] - 百度将旗舰基础模型升级至Ernie 4.5,向聊天机器人用户免费开放所有层级服务,比原计划提前几周 [2] - 文心大模型4.5已同步上线,约为GPT4.5价格的1%,输入价格为0.004元/千tokens,输出0.016元/千tokens;文心大模型X1定价为输入0.002元/千tokens,输出0.008元/千tokens,即将在千帆平台上线 [2] - 百度推出的Ernie X1模型与DeepSeek R1工作原理相似 [3] - 百度推理模型在日常对话、复杂计算和逻辑推理等领域表现出色 [4] - 百度宣布自6月30日起将Ernie AI模型开源,还将R1模型整合进搜索引擎 [6] 行业竞争 - 百度是行业中首个推出基于OpenAI的ChatGPT模型聊天机器人的企业,但需与字节跳动、Moonshot AI等产品竞争 [5] - 阿里巴巴的Qwen以及DeepSeek等开源模型在全球开发者社区获得更高认可 [5] 财报情况 - 生成式AI繁荣使百度第四季度云收入增长26%,但经济疲软下广告销售疲软 [6] - 2024年总营收达1331亿元,同比减少1%;归属百度净利润为237.6亿,同比增长17%,不按美国通用会计准则,归属于百度的净利润为270亿元,同比下降6%,每股美国存托股摊薄收益为76.85元,同比下降5% [6] 收购投资 - 百度上月完成21亿美元收购YY直播平台Joyy的交易,释放约16亿美元计划投资于人工智能和云基础设施 [6]