GPT 4.5

搜索文档
梁文锋等来及时雨
是说芯语· 2025-07-19 09:26
以下文章来源于字母榜 ,作者赵晋杰 字母榜 . 让未来不止于大 被梁文锋靠着DeepSeek抢走风头近180天后,杨植麟正借助Kimi更新试图卷土重来。 近期,Kimi K2新模型发布后,引来外部试用高潮。Perplexity CEO阿拉温德发文称,内部将很快用K2 进行后训练,以对外提供服务。此前DeepSeek R1上市后,也被第一时间引入Perplexity。 试图通过模型更新从DeepSeek手中抢回注意力的不止Kimi一家。 据字母榜(ID:wujicaijing)获悉,7 月底,"AI六小龙"中的阶跃星辰、智谱AI,都将发布自研的新一代基础大模型,科大讯飞也将赶在月 底推出自家全新模型。 当一众大模型玩家都在比拼模型更新和产品体验之际, 迟迟没有大动作的DeepSeek,不出意外迎来了 自身流量和产品使用率的下滑。 DeepSeek自1月以来的爆发式增长,仅持续了2个月时间。 从4月份开始,DeepSeek月活跃用户数便掉头 向下。QuestMobile数据显示,截至5月份,DeepSeek月活跃用户规模为1.69亿,环比下滑5.1%。 随着月活用户规模下降,DeepSeek的下载量排名也急速下坠 ...
DeepSeek终于丢了开源第一王座,但继任者依然来自中国
量子位· 2025-07-18 16:36
模型排名与性能 - Kimi K2在全球开源模型中排名第一,总榜第五,紧追Grok 4等顶尖闭源模型 [1] - Kimi K2得分为1420,与Grok 4(1437)和GPT 4.5(1437)差距较小 [2][23] - 唯二进入总榜TOP 10的开源模型均来自中国(Kimi K2和DeepSeek R1) [2][28] 技术能力表现 - 连续多轮对话能力并列第一,与Grok 4和o3持平 [3] - 编程能力排名第二,与GPT 4.5和Grok 4相当 [3] - 应对复杂提示词能力排名第二,与o3和4o同梯队 [3] 社区热度与影响力 - GitHub标星达5.6K,Hugging Face下载量近10万 [5] - Perplexity CEO公开站台,计划基于K2进行后训练 [5] - 用户访问量过大导致API响应变慢 [6] 架构设计与优化 - 继承DeepSeek V3架构,但进行了参数调整 [9][12] - 增加专家数量,MoE总参数增加但激活参数量不变 [13] - 注意力头数减半以平衡成本,效果影响微小 [13] - 仅保留第一层Dense,其余使用MoE,推理效率无影响 [13] - 专家无分组设计,通过自由路由提升灵活性 [13] - 总参数增至1.5倍,但推理耗时更小且成本可控 [15] 行业趋势与观点 - 开源模型性能已接近闭源,TOP 10分数均超1400 [21][23] - 开源与闭源差距缩小,Kimi K2接近Grok 4和GPT 4.5 [22] - 行业人士认为开源击败闭源将更普遍 [25][27] - 开源模型在AI能力全球扩散中扮演关键角色 [27]
梁文锋等来及时雨
36氪· 2025-07-16 18:19
行业竞争格局 - Kimi发布K2新模型引发试用高潮,Perplexity CEO表示将引入K2提供服务[3] - 阶跃星辰、智谱AI、科大讯飞等公司计划在7月底发布新一代基础大模型[3] - DeepSeek月活跃用户规模从1.69亿环比下滑5.1%,下载排名跌至30名开外[4] - DeepSeek官网访问量下降29%,用户使用率从7.5%峰值回落至3%[4][17] 技术发展动态 - DeepSeek加速推出R2模型但受H20芯片禁售影响延迟发布[5] - 英伟达H20芯片因DeepSeek需求激增被美国禁售,7月15日宣布重新申请销售许可[6][8] - Kimi K2成为国内首个总参数量达1万亿的MoE架构开源模型,在多项基准测试中超越DeepSeek[14] - MiniMax-M1仅用512块H800三周时间完成训练,成本53.47万美元,远低于DeepSeek V3的557万美元[15] 商业模式比较 - DeepSeek因缺乏大版本更新被质疑性价比,科技大厂推出更低价的API模型[13] - Kimi K2定价与DeepSeek对齐,输入/输出tokens价格分别为4元/16元每百万[15] - DeepSeek在第三方平台模型使用量增长20倍,但官方应用流量持续下滑[17] - 上下文窗口限制(64K)影响DeepSeek竞争力,Kimi K2支持128K,MiniMax-M1达100万[22][23] 产品能力短板 - DeepSeek暂不支持多模态功能,落后于行业主流AI助手[28] - 调用工具能力不足导致字节放弃采用DeepSeek-R1[28] - OpenAI通过高频更新保持热度,GPT-4.1系列使用率快速升至10%,而DeepSeek R1使用率下降超50%[26] 战略方向差异 - DeepSeek坚持开源路线但面临商业化挑战,需平衡开发者活跃度与产品使用率[24][25] - 竞争对手在新模型中均强化Agent构建能力,DeepSeek需补足工具调用短板[29] - 行业转向Agent生态发展,多模态能力重要性日益凸显[28][29]
速递|百度推理模型X1上线,开源Ernie 4.5,正面迎战DeepSeek
Z Potentials· 2025-03-16 11:54
文章核心观点 百度发布新AI模型并升级旗舰基础模型,在AI领域有诸多举措,同时面临竞争,其财报显示营收和利润有不同表现,还完成收购计划投资AI和云基础设施 [1][2][6] 产品动态 - 百度发布能阐明推理过程的新AI模型,与DeepSeek等竞争 [1] - 百度将旗舰基础模型升级至Ernie 4.5,向聊天机器人用户免费开放所有层级服务,比原计划提前几周 [2] - 文心大模型4.5已同步上线,约为GPT4.5价格的1%,输入价格为0.004元/千tokens,输出0.016元/千tokens;文心大模型X1定价为输入0.002元/千tokens,输出0.008元/千tokens,即将在千帆平台上线 [2] - 百度推出的Ernie X1模型与DeepSeek R1工作原理相似 [3] - 百度推理模型在日常对话、复杂计算和逻辑推理等领域表现出色 [4] - 百度宣布自6月30日起将Ernie AI模型开源,还将R1模型整合进搜索引擎 [6] 行业竞争 - 百度是行业中首个推出基于OpenAI的ChatGPT模型聊天机器人的企业,但需与字节跳动、Moonshot AI等产品竞争 [5] - 阿里巴巴的Qwen以及DeepSeek等开源模型在全球开发者社区获得更高认可 [5] 财报情况 - 生成式AI繁荣使百度第四季度云收入增长26%,但经济疲软下广告销售疲软 [6] - 2024年总营收达1331亿元,同比减少1%;归属百度净利润为237.6亿,同比增长17%,不按美国通用会计准则,归属于百度的净利润为270亿元,同比下降6%,每股美国存托股摊薄收益为76.85元,同比下降5% [6] 收购投资 - 百度上月完成21亿美元收购YY直播平台Joyy的交易,释放约16亿美元计划投资于人工智能和云基础设施 [6]
【兴证计算机】DeepSeek跟踪:AI平权领军,加力开源及降价
兴业计算机团队· 2025-03-02 19:41
本周观点聚焦 - 坚定中长期信心,在调整中加仓核心龙头,建议围绕政策及技术两大维度,积极加仓人工智能及国产化赛道 [2] - 板块出现调整受前期上涨较快及业绩快报披露等因素影响,即将进入重要政策窗口期,2025Q1业绩改善值得期待 [2] AI产业动态 - 全球AI产业加速共振,建议持续超配AI赛道,国内DeepSeek开源包括DeepEP、DeepGEMM等解决方案,覆盖底层硬件优化到上层应用多环节 [2] - DeepSeek实施"错峰定价"策略,大幅下调夜间空闲时段API调用价格,有望加速AI应用发展 [2] - 海外OpenAI发布ChatGPT 4.5,人性化交互实现明显提升,国产大模型如豆包、DeepSeek突破推动产业趋势发酵 [2] DeepSeek业务进展 - DeepSeek作为AI平权领军企业,加力开源及降价策略,业务进展显著 [3][4]
【兴证计算机】DeepSeek跟踪:AI平权领军,加力开源及降价
兴业计算机团队· 2025-03-02 19:41
本周观点聚焦 - 坚定中长期信心,在调整中加仓核心龙头,建议围绕政策及技术两大维度,积极加仓人工智能及国产化赛道 [1] - 板块出现调整受前期上涨较快及业绩快报披露等因素影响,但即将进入重要政策窗口期,2025Q1业绩改善值得期待 [1] AI产业动态 - 全球AI产业加速共振,建议持续超配AI赛道,国内DeepSeek开源包括DeepEP、DeepGEMM等解决方案,覆盖从底层硬件优化到上层应用多环节 [1] - DeepSeek实施"错峰定价"策略,大幅下调夜间空闲时段的API调用价格,有望加速AI应用发展 [1] - 海外OpenAI发布ChatGPT 4.5,在人性化交互方面实现明显提升 [1] - 国产大模型如豆包、DeepSeek取得突破,推动全球AI产业趋势持续发酵 [1] DeepSeek业务进展 - DeepSeek作为AI平权领军企业,加力开源及降价策略,业务进展显著 [2][4]