deepseek r1

搜索文档
现在全世界最好的开源模型,是 Kimi、DeepSeek 和 Qwen
Founder Park· 2025-07-21 21:26
关于 Kimi K2 的讨论还在发酵。 Anthropic 的联创 Jack Clark 今天发文,称 K2 是一个伟大的模型,这似乎成为中国开源 SOTA 模型发布的标配。 LMArena,这个由数千位开发者盲测评选的榜单上, 来自中国的开源模型占据前三,分别是 Kimi K2、DeepSeek R1 和 Qwen 3,Kimi K2 也成为全球最强 的开源模型。 | Rank (UB) ↑ | Model 1↓ | Score 1J | 95% Cl (±) ↑↓ | Votes 1J | Organization 14 | License 1J | | --- | --- | --- | --- | --- | --- | --- | | 1 | G gemini-2.5-pro | 1462 | +4/-5 | 19,209 | Google | Proprietary | | 2 | S o3-2025-04-16 | 1452 | +3/-4 | 25,442 | OpenAl | Proprietary | | 3 | Chatgpt-4o-latest-20250326 | 1443 | +3 ...
OpenAI将启动5000万美元基金,支持非营利组织和社区组织;Kimi K2登顶全球开源模型冠军丨AIGC日报
创业邦· 2025-07-20 09:15
1.【Manus联合创始人发长文总结经验教训】7月19日,Manus联合创始人季逸超通过官方博客发布 了上千字的技术解析长文,复盘公司从今年年初爆火至今历经"起起落落"的开发思路与教训。前段时 间,AI智能体平台Manus被曝裁员、清空国内多平台账号等消息。(IT之家) 当地时间周五,其CEO阿拉文德・斯里尼瓦斯(Aravind Srinivas)向路透社透露,该公司正在与移 动设备制造商(OEM)洽谈,希望能够在智能手机上预装其新推出的Comet AI移动浏览器。斯里尼 瓦斯表示,"说服移动OEM将默认浏览器从Chrome改为 Comet 并不容易",他还强调了移动平台上 用户惯性带来的挑战。(IT之家) 更多AIGC资讯 …… 扫码订阅 AIGC 产业日报, 精选行业新闻,帮你省时间! 此外,如果您还想 查公司、找项目、看行业,深入了解人形机器人、商业航天、AGI等热门赛道 ,欢迎加入睿兽分析会员,解锁相关行业图谱和报告等。 3.【OpenAI将启动5000万美元基金,支持非营利组织和社区组织】OpenAI宣布将启动一项5000万 美元的初始基金,用于支持非营利组织和社区组织。声明称,通过这笔基金,Ope ...
DeepSeek终于丢了开源第一王座。。。
自动驾驶之心· 2025-07-19 18:19
作者 | 量子位 来源 | 量子位 点击下方 卡片 ,关注" 自动驾驶之心 "公众号 戳我-> 领取 自动驾驶近15个 方向 学习 路线 >>自动驾驶前沿信息获取 → 自动驾驶之心知识星球 本文只做学术分享,如有侵权,联系删文 几千人盲投, Kimi K2超越DeepSeek拿下全球开源第一 ! 歪果网友们直接炸了,评论区秒变夸夸打卡现场: | Rank (UB) ↑ Model 1J | | Score 14 | 95% CI (±) 1V | Votes 14 | Organization 11 | License 14 | | --- | --- | --- | --- | --- | --- | --- | | 1 | G gemini-2.5-pro | 1462 | +4/-5 | 19,209 | Google | Proprietary | | 2 | S 03-2025-04-16 | 1452 | +3/-4 | 25,442 | OpenAl | Proprietary | | 3 | Chatgpt-4o-latest-20250326 | 1443 | +3/-3 | 26,230 ...
杨植麟摸着DeepSeek过河
36氪· 2025-07-19 12:30
模型性能与技术突破 - Kimi K2是一款万亿参数MoE模型,包含1T总参数和32B激活参数,推出Kimi-Base和Kimi-instruct两个版本[1] - 在编程、智能体任务上表现突出,测评显示其自主编程、工具调用和数学推理能力超越开源模型DeepSeek-V3和阿里Qwen3[1] - 采用新型优化器Muon替代AdamW,算力需求降低至52%,实现万亿参数规模训练突破[13] 市场反响与开发者生态 - 开源一周Hugging Face下载量超10万,LMSYS竞技场排名第四,OpenRouter趋势榜全球第二[1][4] - API定价显著低于竞品,输入/输出tokens成本较Claude 4 Sonnet下降75%,推动AI编程普及[10] - 社区运营策略创新,通过工程师直接互动引发"自来水"传播,获Hugging Face联合创始人公开赞赏[4][17] 战略定位与行业影响 - 明确聚焦Agentic AI赛道,优化工具调用速度和任务完成质量,支持PPT/Excel/3D建模等场景[7][8] - 被《Nature》评价为"又一个DeepSeek时刻",验证其技术路线影响力[6] - 国内大模型初创分化明显,公司选择类似Anthropic的技术路径,与Minimax多模态、智谱ToB路线形成差异[16] 产品商业化表现 - Web端访问量6月环比增长30%,显示技术突破对产品反哺效应[20] - Cursor等AI编程公司ARR两个月增长60%至5亿美元,显示赛道爆发潜力[10] - 放弃C端投流转向模型研发,反映行业从用户增长向技术突破的范式转变[15][16] 技术应用案例 - 可快速生成3D场景(如昼夜变化山脉)和专业数据分析报告(含箱线图、回归模型等)[9] - 支持接入Owl/Cline等框架实现自主编程,处理13万行数据生成可视化分析[8][9]
DeepSeek终于丢了开源第一王座,但继任者依然来自中国
猿大侠· 2025-07-19 11:43
模型排名与性能 - Kimi K2在全球开源模型中排名第一,总榜第五,紧追顶尖闭源模型Grok 4 [1] - 开源模型DeepSeek R1位列总榜第八,与Kimi K2成为唯二进入TOP 10的开源模型且均来自中国 [2] - Kimi K2在多项能力中表现突出:连续多轮对话并列第一、编程能力第二、应对复杂提示词能力第二 [3] 社区热度与行业认可 - Kimi K2发布一周内GitHub标星达5.6K,Hugging Face下载量近10万 [5] - Perplexity CEO公开支持Kimi K2,透露计划基于该模型进行后训练 [5] - 用户访问量激增导致API响应延迟,反映模型热度极高 [6] 架构设计与技术优化 - Kimi K2继承DeepSeek V3架构,但通过四项关键参数调整优化性能:增加专家数量、注意力头减半、仅保留第一层Dense、专家无分组 [12] - 调整后总参数增至1.5倍,但推理耗时理论值更低,成本与V3架构相当 [13] - 团队选择V3架构因其已验证高效且符合有限资源条件,避免"为不同而不同" [10][11] 开源模型行业趋势 - 开源模型性能差距缩小,TOP 10模型总分均超1400分,开源与闭源近乎同一起跑线 [20][21] - 行业专家预测开源将更普遍击败闭源,并在AI本地化定制中发挥关键作用 [24] - 开源模型打破"性能弱"刻板印象,国产开源模型表现尤为亮眼 [18][22]
黄仁勋交流会15000字实录:谈中美芯片、H20、CUDA兼容
海豚投研· 2025-07-19 10:57
英伟达CEO黄仁勋访华核心观点 - 中国供应链系统复杂高效且极具制造优势,构成全球AI硬件和智能工厂建设的重要基础[3] - H20芯片已被重新批准销售,未来将推动更多Blackwell架构产品落地中国[3] - 中国在AI模型、工程人才与产业应用上全球领先,约50%的AI研究人员在中国[3][23] - 中国电动汽车是全球惊喜,小米等企业正在重塑全球竞争格局[3][32] - 华为在芯片、网络解决方案、光子技术等方面取得重大突破[3][49] 中国市场观察 - 中国供应链基础设施完善、生态系统成熟、技术先进、制造规模庞大[2][5] - 全球供应链高度相互依存,参展企业遍布全球技术生态[2][5] - 中国计算机科学和软件能力世界一流,移动支付等技术应用走在全球前列[29][34] - 中国教育系统培养了世界上最优秀的AI研究人员,科学和数学优势明显[23][64] 技术合作与竞争 - 不介意中国厂商开发CUDA兼容平台,CUDA本身比较开放[2][27] - 华为是值得学习的对象,其综合实力令人钦佩[3][49] - 竞争对手带来各种挑战,但竞争能让彼此更好[54] - 英伟达专注于全栈技术创新,从算法架构到芯片设计保持顶尖[50][51] 产品与技术布局 - H20内存带宽出色,适合训练大模型,RTX Pro专为数字孪生设计[14][61] - 推理AI将广泛应用于云端和边缘计算,分为感知、生成、推理和机器人四个阶段[38][40] - AI工厂将具备更强敏捷性和可重构性,结合机器人技术显著提升生产效率[41][47] - 现有算力已能训练出智能模型,AGI可能很快实现且无需根本性技术突破[40] 行业发展趋势 - AI是最伟大的技术平衡器,开放性让全球都能参与其中[28][59] - 算力需求远远不够,算力焦虑在未来十年内都不会消失[37][38] - 人形机器人发展恰逢其时,中国具备AI技术储备、机电一体化实力和应用场景优势[46][47] - AI将成为每个国家和行业的基础设施,市场规模可能达数十万亿美元[44][57] 人才与创新 - 年轻人进入AI行业不怕晚,关键在于保持对技术的热情[63][67] - 中国在开源AI领域贡献突出,DeepSeek R1是全球首个开源推理模型[28][39] - 英伟达员工流失率几乎为零,公司文化注重对员工的关注与尊重[65] - 日常使用多款AI工具进行交叉验证,代表未来发展方向[69]
梁文锋等来及时雨
是说芯语· 2025-07-19 09:26
行业竞争格局 - 国内大模型行业进入密集更新期,Kimi、阶跃星辰、智谱AI、科大讯飞等玩家将在7月底集中发布新一代基础大模型 [3] - DeepSeek自4月起月活用户持续下滑,5月MAU为1.69亿(环比-5.1%),官网访问量下降29%,使用率从7.5%峰值回落至3% [3][4][18] - 第三方平台托管的DeepSeek模型使用量逆势增长20倍,形成与官方流量下滑的反差 [13] 技术发展动态 - Kimi K2成为国内首个万亿参数MoE架构开源模型,在代码/数学推理任务反超DeepSeek,支持128K上下文窗口 [10][15] - MiniMax-M1以53.47万美元低成本完成训练(512块H800三周),对比DeepSeek V3训练成本557万美元(2048块H800) [11] - 行业普遍提升上下文窗口能力(MiniMax达100万token),而DeepSeek保持64K最小窗口的保守策略 [15] 商业模式对比 - 科技大厂通过低价API争夺市场:百度李彦宏公开批评DeepSeek"慢且贵",阿里/字节/百度等推出更低价模型 [10] - Kimi K2定价与DeepSeek标准时段对齐(输入4元/百万tokens,输出16元/百万tokens) [11] - DeepSeek坚持开源路线但面临商业化压力,需平衡开发者生态与产品使用率 [17] 供应链挑战 - 英伟达H20芯片禁售导致DeepSeek R2模型延迟发布,算力储备出现紧缺 [5][7] - 7月15日英伟达获准重新销售H20芯片,将缓解DeepSeek算力瓶颈 [7] - H20芯片因DeepSeek的低成本训练方法在中国需求激增,引发4月美国出口管制 [5] 产品能力短板 - DeepSeek暂不支持多模态功能(语音/图片/视频生成),成为主流AI助手中唯一缺失该能力的产品 [19] - 调用工具能力不足:字节测试发现其工具调用表现不理想,最终改用自研模型 [19] - 小版本更新策略(如DeepSeek-R1-0528仍基于2024年V3 Base模型)导致竞争力下降 [8][10] 国际对标差异 - OpenAI通过高频更新保持领先(GPT 4.1系列发布后份额达10%),而DeepSeek R1仅持平o1水平 [17][18] - DeepSeek缺乏OpenAI的代际优势,使用率从7%峰值降至3%(跌幅超50%) [18] - 行业普遍学习OpenAI的快速迭代策略,如奥特曼每周更新产品的运营方法 [17]
Top China Tech Stocks to Add to Your Portfolio for Impressive Returns
ZACKS· 2025-07-18 23:26
中国科技行业投资机会 - 中国科技行业在2025年展现出卓越投资机会,由突破性创新、大规模政府支持和有吸引力的估值驱动 [1] - AI领导力、半导体进步和政府战略支持相结合,为高科技行业及其参与者如哔哩哔哩、网易和VNET集团创造了前所未有的增长潜力 [1] AI革命 - DeepSeek的R1模型以560万美元的训练成本匹配OpenAI性能,远低于西方竞争对手的千万美元成本 [2] - 中国AI基础设施目标在2025年达到300 EFLOPS计算能力,并通过"AI+倡议"将AI整合到所有经济领域 [3] - 阿里巴巴云2025年第一季度收入增长18%,AI产品连续七个季度保持三位数增长 [3] - 国家风险投资引导基金在2025年3月宣布投入1380亿美元,重点支持AI发展 [2] 半导体行业突破 - 475亿美元的"大基金三期"是中国最大的半导体投资,SMEE的28纳米光刻机标志着制造独立性的关键进展 [4] - 中国晶圆厂2024年每月生产885万片晶圆,预计2025年将达到1010万片 [4] - 中芯国际收入达到80.3亿美元,增长27%,显示出强劲的财务表现 [4] - 中国半导体制造成本比美国低37%,目标到2030年占据全球晶圆厂产能的30% [5] - 成功使用国产技术生产7纳米芯片,证明中国有能力克服技术障碍 [5] 机器人与太空探索 - 中国机器人行业在北京举办了世界上首次人形机器人半程马拉松,展示了先进的AI集成能力 [6] - 预计到2034年,机器人市场价值将达到146亿美元,中国公司控制全球人形机器人供应链的63% [6] - 2023年制造业机器人安装量达到276,288台,占全球安装量的51% [6] - 嫦娥六号成功完成月球背面采样返回,并突破卫星激光测距技术 [7] - 中国商业太空行业目标到2025年达到3440亿美元规模,得到政府投资和私营部门快速扩张的支持 [7] 有吸引力的市场估值 - 中国科技股市盈率在11-15倍之间,显著低于美国市场的26倍 [8] - 恒生科技指数在2025年迄今上涨30% [8] - 腾讯和阿里巴巴等公司展现出强劲的基本面,收入增长稳定且市场领导地位扩大 [8] - 监管环境转向支持创新,取消投资限制并推出多项资助计划 [8] 三只值得买入的中国科技股 哔哩哔哩 - 2025年第一季度收入增长24%至70亿元人民币,GAAP净亏损减少99%至1100万元人民币 [10] - 毛利率从28.3%提升至36.3%,游戏收入增长76%,广告收入增长20% [10] - 平台拥有1.07亿日活跃用户,日均使用时长108分钟,月付费用户达到创纪录的3200万 [11] 网易 - 2025年第一季度游戏收入增长12.1%至240亿元人民币,净利润跃升35%至103亿元人民币 [12] - 通过AI驱动的NPC和NVIDIA光线追踪合作实现技术差异化 [12] - 净现金达1370亿元人民币,2025年下半年有多款高潜力游戏发布 [12] - 《漫威争锋》登顶Steam排行榜,《逆水寒》玩家达3000万 [13] VNET集团 - 2025年第一季度收入增长18.3%,调整后EBITDA增长26.4% [14] - 批发业务收入创纪录达6.73亿元人民币,同比增长86.5%,产能利用率达76.2% [14] - 实施5000万美元股票回购计划,2025年收入指引上调至91.5-93.5亿元人民币 [15] - 计划资本支出100-120亿元人民币,目标交付400-450MW容量 [15]
DeepSeek终于丢了开源第一王座,但继任者依然来自中国
量子位· 2025-07-18 16:36
模型排名与性能 - Kimi K2在全球开源模型中排名第一,总榜第五,紧追Grok 4等顶尖闭源模型 [1] - Kimi K2得分为1420,与Grok 4(1437)和GPT 4.5(1437)差距较小 [2][23] - 唯二进入总榜TOP 10的开源模型均来自中国(Kimi K2和DeepSeek R1) [2][28] 技术能力表现 - 连续多轮对话能力并列第一,与Grok 4和o3持平 [3] - 编程能力排名第二,与GPT 4.5和Grok 4相当 [3] - 应对复杂提示词能力排名第二,与o3和4o同梯队 [3] 社区热度与影响力 - GitHub标星达5.6K,Hugging Face下载量近10万 [5] - Perplexity CEO公开站台,计划基于K2进行后训练 [5] - 用户访问量过大导致API响应变慢 [6] 架构设计与优化 - 继承DeepSeek V3架构,但进行了参数调整 [9][12] - 增加专家数量,MoE总参数增加但激活参数量不变 [13] - 注意力头数减半以平衡成本,效果影响微小 [13] - 仅保留第一层Dense,其余使用MoE,推理效率无影响 [13] - 专家无分组设计,通过自由路由提升灵活性 [13] - 总参数增至1.5倍,但推理耗时更小且成本可控 [15] 行业趋势与观点 - 开源模型性能已接近闭源,TOP 10分数均超1400 [21][23] - 开源与闭源差距缩小,Kimi K2接近Grok 4和GPT 4.5 [22] - 行业人士认为开源击败闭源将更普遍 [25][27] - 开源模型在AI能力全球扩散中扮演关键角色 [27]
黄仁勋北京交流会实录
投资界· 2025-07-18 15:19
英伟达CEO黄仁勋访华核心观点 - 中国供应链系统复杂高效且极具制造优势,是构成全球AI硬件和智能工厂建设的重要基础 [4] - H20芯片已被重新批准销售,未来将推动更多Blackwell架构产品落地中国 [5] - 中国在AI模型、工程人才与产业应用上全球领先,全球约50%的AI研究人员在中国 [6][9] 对中国科技企业的评价 - 中国电动汽车是全球惊喜,小米、蔚来、小鹏等企业正在重塑全球竞争格局 [7][52] - 华为在芯片、网络解决方案、光子技术等方面取得重大突破,是值得学习的对象 [8][35] - 中国开源AI如DeepSeek R1是全球进步的催化剂,首个开源推理模型已被全球广泛下载适配 [46] 技术战略与产品布局 - RTX Pro专为数字孪生和机器人模拟设计,基于Blackwell架构,具备H20不具备的计算图形和AI功能 [42][87] - CUDA技术开放兼容,不介意中国厂商开发兼容平台,与英特尔X86架构的封闭策略形成对比 [3][45] - AI发展分为四个阶段:感知、生成、推理和机器人,当前处于推理AI阶段 [58][59] 全球供应链与竞争格局 - 中国供应链基础设施完善、生态系统成熟,是英伟达全球布局的重要环节 [15][89] - 英伟达供应链周期长达9个月,正全力加速Hopper架构产品产能恢复 [19] - 尊重华为等竞争对手,认为低估中国制造能力是极其天真的 [66] AI行业趋势与算力需求 - 算力焦虑将持续十年,当前算力远不能满足AI训练需求 [57] - AGI可能很快实现且无需根本性技术突破,具体进展取决于定义标准 [12][63] - AI工厂将成为新型基础设施,输入电力产出AI智能,推动全球产业升级 [68] 中国市场战略 - 中国是全球第二大科技市场且增长迅速,英伟达将持续投资扩张 [41][95] - 中国在移动支付、金融科技等应用层面领先全球,创新实践被全球借鉴 [48] - 教育体系培养了大量顶尖AI人才,为技术发展提供坚实基础 [9][91] 技术合作与开放生态 - AI领域具有独特开放性,全球研究者通过论文实现"虚拟合作" [29] - 多AI工具协同使用(OpenAI/Gemini Pro/Claude/Perplexity)可提升决策质量与安全性 [98] - 开放性确保AI技术安全进步,全球合作是未来发展关键 [85]