Workflow
DeepSeek
icon
搜索文档
马斯克吹的牛实现了?Grok4横空出世,电动车和机器人行业要被降维打击了!
老徐抓AI趋势· 2025-07-20 15:03
核心观点 - AI领域即将迎来"智力爆炸",Grok4的发布标志着技术突破性进展 [1] - Grok4在多项测试中表现远超人类和其他AI模型,实现能力跃迁 [6][8][10][12][14][16] - 马斯克团队通过算力投入、训练策略创新、工作机制优化和领导力实现后来居上 [17][18][20][21][22][23][24][26] - Grok4与特斯拉、SpaceX深度结合将重塑电动车和机器人行业 [27][28][29][30][31] - AI行业格局将因芯片、算力和工程能力三重共振而改变 [32] Grok4技术性能 - Human's Last Exam测试中纯模型得分26.9%,工具辅助后达41%,远超谷歌Gemini 2.5 Pro的21.6% [8] - ARC-AGI-2推理测试分数从8.6%提升至15.9%,实现翻倍突破 [10] - 实战场景测试中经营自动售货机的盈利能力是第二名的两倍、人类的六倍 [14] - 语音助手Eve反应速度无延迟,交互体验远超现有产品 [16] 成功底层原因 - 算力建设速度惊人:122天建成10万张H100芯片算力中心,92天后翻倍至20万张 [17] - 电力供应系统创新:采用PowerPack矩阵精确匹配AI训练电力需求波动 [18] - 训练策略差异化:Grok4将全部算力投入强化学习后训练而非预训练 [20][21] - 工作机制突破:引入工具链调用和多智能体讨论机制提升能力 [22] - 领导力优势:马斯克亲自参与技术细节并深刻理解AI发展路径 [24][26] 行业影响 - 工程模拟领域:Grok4成为模拟器调度层,将数月创新周期缩短至几小时 [28][29] - 汽车行业:语音助手Eve将彻底升级特斯拉车载系统体验 [30] - 机器人领域:Optimus可通过"看视频学动作+模拟器训练"实现效率亿倍提升 [31] - 芯片产业:验证算力投入有效性,利好英伟达、AMD等芯片厂商 [32] 商业模式定位 - Grok4定位为工程工具而非对话AI,目标是通过提升集团效率创造价值 [29][34] - 未来可能成为SpaceX轨道调度、特斯拉风阻优化等核心系统 [34] - 商业模式区别于订阅制AI,更接近工程仿真+AI中台的组合 [29]
DeepSeek终于丢了开源第一王座,但继任者依然来自中国
猿大侠· 2025-07-19 11:43
模型排名与性能 - Kimi K2在全球开源模型中排名第一,总榜第五,紧追顶尖闭源模型Grok 4 [1] - 开源模型DeepSeek R1位列总榜第八,与Kimi K2成为唯二进入TOP 10的开源模型且均来自中国 [2] - Kimi K2在多项能力中表现突出:连续多轮对话并列第一、编程能力第二、应对复杂提示词能力第二 [3] 社区热度与行业认可 - Kimi K2发布一周内GitHub标星达5.6K,Hugging Face下载量近10万 [5] - Perplexity CEO公开支持Kimi K2,透露计划基于该模型进行后训练 [5] - 用户访问量激增导致API响应延迟,反映模型热度极高 [6] 架构设计与技术优化 - Kimi K2继承DeepSeek V3架构,但通过四项关键参数调整优化性能:增加专家数量、注意力头减半、仅保留第一层Dense、专家无分组 [12] - 调整后总参数增至1.5倍,但推理耗时理论值更低,成本与V3架构相当 [13] - 团队选择V3架构因其已验证高效且符合有限资源条件,避免"为不同而不同" [10][11] 开源模型行业趋势 - 开源模型性能差距缩小,TOP 10模型总分均超1400分,开源与闭源近乎同一起跑线 [20][21] - 行业专家预测开源将更普遍击败闭源,并在AI本地化定制中发挥关键作用 [24] - 开源模型打破"性能弱"刻板印象,国产开源模型表现尤为亮眼 [18][22]
梁文锋等来及时雨
是说芯语· 2025-07-19 09:26
行业竞争格局 - 国内大模型行业进入密集更新期,Kimi、阶跃星辰、智谱AI、科大讯飞等玩家将在7月底集中发布新一代基础大模型 [3] - DeepSeek自4月起月活用户持续下滑,5月MAU为1.69亿(环比-5.1%),官网访问量下降29%,使用率从7.5%峰值回落至3% [3][4][18] - 第三方平台托管的DeepSeek模型使用量逆势增长20倍,形成与官方流量下滑的反差 [13] 技术发展动态 - Kimi K2成为国内首个万亿参数MoE架构开源模型,在代码/数学推理任务反超DeepSeek,支持128K上下文窗口 [10][15] - MiniMax-M1以53.47万美元低成本完成训练(512块H800三周),对比DeepSeek V3训练成本557万美元(2048块H800) [11] - 行业普遍提升上下文窗口能力(MiniMax达100万token),而DeepSeek保持64K最小窗口的保守策略 [15] 商业模式对比 - 科技大厂通过低价API争夺市场:百度李彦宏公开批评DeepSeek"慢且贵",阿里/字节/百度等推出更低价模型 [10] - Kimi K2定价与DeepSeek标准时段对齐(输入4元/百万tokens,输出16元/百万tokens) [11] - DeepSeek坚持开源路线但面临商业化压力,需平衡开发者生态与产品使用率 [17] 供应链挑战 - 英伟达H20芯片禁售导致DeepSeek R2模型延迟发布,算力储备出现紧缺 [5][7] - 7月15日英伟达获准重新销售H20芯片,将缓解DeepSeek算力瓶颈 [7] - H20芯片因DeepSeek的低成本训练方法在中国需求激增,引发4月美国出口管制 [5] 产品能力短板 - DeepSeek暂不支持多模态功能(语音/图片/视频生成),成为主流AI助手中唯一缺失该能力的产品 [19] - 调用工具能力不足:字节测试发现其工具调用表现不理想,最终改用自研模型 [19] - 小版本更新策略(如DeepSeek-R1-0528仍基于2024年V3 Base模型)导致竞争力下降 [8][10] 国际对标差异 - OpenAI通过高频更新保持领先(GPT 4.1系列发布后份额达10%),而DeepSeek R1仅持平o1水平 [17][18] - DeepSeek缺乏OpenAI的代际优势,使用率从7%峰值降至3%(跌幅超50%) [18] - 行业普遍学习OpenAI的快速迭代策略,如奥特曼每周更新产品的运营方法 [17]
100个大厂人,拼凑出互联网这六年
虎嗅· 2025-07-18 21:23
行业变迁与员工心态 - 2019年互联网行业充满热情与理想,关键词为"颠覆"和"情怀" [2] - 2023年行业氛围转变,100位受访者中几乎无人提及理想和情怀 [2] - 行业6年发展可分为三个阶段:2019-2021年最后的红利期、2021-AI来临前紧日子期、AI来临后熬过来期 [4][27][28][29] - 2021年起行业开始普遍降本增效和裁员,员工心态从追求发展到求稳转变 [6][21] - 35岁左右员工群体表现出高度焦虑,主要担忧职业稳定性和家庭负担 [6][10] 企业运营与市场格局 - 大厂开始复苏,战略聚焦AI领域,如阿里将AI作为核心战略,百度全力投入AI竞争 [19][20] - 中厂面临发展困境,如喜马拉雅被腾讯音乐收购,在业务、人才和资金方面难以与大厂竞争 [17][21] - 新一线大厂如小红书、得物在细分领域表现突出,采用大厂运营模式 [17] - AI领域公司如DeepSeek被视为未来大厂 [18] - 行业福利普遍缩减,如取消企业滴滴随意打车权限,削减非必要开支 [22] 人才流动与职业发展 - 技术岗员工占比最高,约80%受访者为基层员工,20%为中层 [10] - 大厂人才流动首选仍为大厂,其次为中厂,表现出对大厂体系的依赖 [14][15] - AI业务人员职业前景较好,跳槽头部公司相对容易 [13] - 被裁员工转型路径包括自媒体、开店等,但多数经营不善 [11] - 部分高管求职困难,如前大厂总监频繁刷招聘软件仍难找到工作 [12] 职场文化与行业认知 - 出现"铁三角模式"等站队文化,反映员工在变动中寻求稳定的心态 [8][9] - 大厂光环逐渐褪去,表现为晒工牌现象减少和在相亲市场吸引力下降 [33][34][35] - 员工关注点转向实际利益:offer选择、薪酬待遇、部门核心程度等 [38] - 当前职场环境推行动力不足,员工更关注防止成果被夺取而非创新发展 [38] - 尽管环境变化,大厂仍被推荐为年轻人职业起点,可积累人脉和经验 [38]
140位投资人眼中的2025上半年
钛媒体APP· 2025-07-18 19:57
市场情绪与投资节奏 - 一级市场呈现"理性回暖"态势,投资人表现出"带着冷静的信心",出手节奏加快但标准更高[2] - 2025年上半年"零出手"机构比例大幅下降,部分活跃VC基金已投资接近15个或更多新项目[4] - 超过1/3投资人计划未来6个月内"显著增加"出手次数,"显著减少"比例较去年Q3下降超10个百分点[18] 赛道热度与估值变化 - AI与具身智能仍是最热赛道,但估值分歧加剧,部分具身项目A轮估值达10亿人民币但商业回报路径不清晰[6][7][20] - 消费、半导体、新能源板块呈现"低估中的机会",消费赛道因港股消费股反弹出现结构性抄底窗口[7] - 航空航天及低空经济赛道活跃度从第一位降至第三,新能源与新材料、新能源车与医疗赛道整体低迷[24] 退出路径与港股IPO - 港股超越A股成为最主流退出通道,过半人民币机构倾向推动被投企业港股IPO[8] - 推动港股IPO三大原因:流程确定性高、流动性改善明显、发行估值合理[13] - 近50%投资人预计2025年港股IPO数量和融资金额将超去年同期,70%受访者已推动企业加快IPO准备[15] 医疗投资策略转变 - 医疗投资从"冷观"转向"精选",形成三大策略:聚焦盈利项目、关注AI+医疗交叉创新、采用PE+并购逻辑[25][27] - 仿制药、器械、专科医院等盈利项目受青睐,AI4S、AI制药、脑机接口等科技+医疗方向成为焦点[27] 出海战略与区域变化 - 北美市场关注度从17%降至8.8%,东南亚与欧洲成为重点区域,东南亚因市场准入灵活、并购机会丰富受关注[29] - 34%投资人关注绿地投资形式出海,新能源领域出现投资海外电站资产趋势[33] - 品牌与文化类出海项目受关注,如AI玩具、智能硬件等产品,要求收入达5亿以上且具备出海属性[33] 具身智能与AI领域 - 具身智能赛道因融合AI大模型与机器人技术吸引多家机构入局,但多数公司仍停留在demo阶段[20] - 投资人开始关注具身模型真实任务解决能力及商业化收入,同时聚焦芯片、关节等上游技术壁垒领域[20] - AI Agent方向关注度显著上升,尤其看好面向C端或Prosumer群体、具备出海能力的产品公司[22]
DeepSeek终于丢了开源第一王座,但继任者依然来自中国
量子位· 2025-07-18 16:36
模型排名与性能 - Kimi K2在全球开源模型中排名第一,总榜第五,紧追Grok 4等顶尖闭源模型 [1] - Kimi K2得分为1420,与Grok 4(1437)和GPT 4.5(1437)差距较小 [2][23] - 唯二进入总榜TOP 10的开源模型均来自中国(Kimi K2和DeepSeek R1) [2][28] 技术能力表现 - 连续多轮对话能力并列第一,与Grok 4和o3持平 [3] - 编程能力排名第二,与GPT 4.5和Grok 4相当 [3] - 应对复杂提示词能力排名第二,与o3和4o同梯队 [3] 社区热度与影响力 - GitHub标星达5.6K,Hugging Face下载量近10万 [5] - Perplexity CEO公开站台,计划基于K2进行后训练 [5] - 用户访问量过大导致API响应变慢 [6] 架构设计与优化 - 继承DeepSeek V3架构,但进行了参数调整 [9][12] - 增加专家数量,MoE总参数增加但激活参数量不变 [13] - 注意力头数减半以平衡成本,效果影响微小 [13] - 仅保留第一层Dense,其余使用MoE,推理效率无影响 [13] - 专家无分组设计,通过自由路由提升灵活性 [13] - 总参数增至1.5倍,但推理耗时更小且成本可控 [15] 行业趋势与观点 - 开源模型性能已接近闭源,TOP 10分数均超1400 [21][23] - 开源与闭源差距缩小,Kimi K2接近Grok 4和GPT 4.5 [22] - 行业人士认为开源击败闭源将更普遍 [25][27] - 开源模型在AI能力全球扩散中扮演关键角色 [27]
中国AI模型获国际认可,NVIDIA释放中美算力缓和信号
海通国际证券· 2025-07-18 15:34
报告行业投资评级 未提及 报告的核心观点 - 中美 AI 供应格局缓和,出口重启或缓解中国算力紧张,产业链应抓住窗口期加速落地 [2] - 中国 AI 模型获国际认可,推动国际资源配置,开源模型成全球竞争支点,本土模型厂商有望在国际合作中发挥更大作用 [3] - H20 芯片引入或催化中国 AI 推理产业规模化,云服务商和模型落地厂商受益,推理服务成本将降低,相关适配厂商有望优先获益 [4] - Google 开源 Gemini CLI 项目,通过开源免费策略抢占 AI 开发者入口,具备技术差异化和企业级架构优势 [10][11][12] 各部分总结 中国 AI 模型获国际认可及算力缓和事件 - 2025 年 7 月 16 日,NVIDIA 首席执行官黄仁勋在中国国际供应链博览会上高度评价中国 AI 模型,称中国拥有全球最多 AI 研究人员,在模型训练与推理领域表现出色 [1] - 中美 AI 供应格局出现缓和迹象,美国对部分 AI 芯片出口限制松动,Hopper 架构的降配版 H20 成中高端替代产品,当前窗口是政策短期平衡结果 [2] - 黄仁勋肯定中国开源大模型价值,或推动国际资源向中国 AI 生态配置,开源模型成全球竞争支点,本土模型厂商有望在国际合作中扮演更大角色 [3] - H20 芯片重新引入或催化中国 AI 推理产业规模化,云服务商和模型落地厂商受益,推理服务成本预计从 20 元/千 token 降至 10 元以下,浪潮信息等适配厂商有望优先获益 [4] - 黄仁勋采用亲和策略稳住中国核心客户,避免关键客户流失,因中国 AI 芯片年需求约占全球总量 30%,中端市场是利润核心区 [5] Google 开源 Gemini CLI 项目 - 2025 年 6 月,Google 正式在 GitHub 开源 Gemini CLI 项目,支持自然语言编程等功能,基于 Gemini 2.5 Pro 模型,有 100 万 token 上下文窗口,每日提供 1000 次免费 API 调用 [8] - Gemini CLI 可通过自然语言提示实现代码生成等功能,集成 Google 的 MCP 协议,支持网页搜索等扩展功能 [9] - Google 通过开源免费策略抢占 AI 开发者入口,Gemini CLI 有望形成社区飞轮 [10] - Gemini CLI 有 100 万 token 上下文窗口,远超多数工具,支持多模态集成,是未来多模态本地代理的标准入口 [11] - Gemini CLI 支持全本地执行,适合安全敏感的企业环境,支持 MCP 标准,可无缝集成到现有开发流程,或成大中型企业混合 AI 开发路径的关键部分 [12] 与主流 AI 编程工具对比 - 模型能力和上下文长度方面,Gemini CLI 支持 100 万 token 上下文窗口,远超 Codex 等工具,适合大规模跨文件开发任务 [15] - 开源和免费使用方面,Gemini CLI 完全开源,有免费额度,多数现有解决方案为付费服务,Google 此举降低试用和使用成本 [15] - 多模态能力和扩展性方面,Gemini CLI 支持多模态生成和插件扩展,功能更广泛,有潜力发展成成熟开发平台 [15]
DeepSeek半年沉默,谁偷走了中国AI的奇迹?
老徐抓AI趋势· 2025-07-18 12:52
DeepSeek发展现状 - 公司2月凭借DeepSeek-VL与DeepSeek-R1版本以低算力实现超高性能引发全球关注,甚至影响英伟达股价[7] - 半年后R2版本因算力瓶颈迟迟未发布,技术进展陷入停滞[4][7] - 早期"算力不再重要"的行业讨论被证伪,当前困境凸显算力仍是AI发展核心[7][10] 算力与AI发展关系 - AI智能本质依赖算力支撑,工业级应用无法通过小算力模型实现[7] - 公司R1版本热度被质疑虚高,低算力跑出的性能难以持续[8][9] - 大模型发展逻辑需"大而强"而非"小而美",算力短缺直接限制算法突破[10] 行业竞争格局 - 马斯克旗下XAI推进速度远超同行,GROK 4已部署至特斯拉和SpaceX进行工程优化[5][12] - 竞争对手OpenAI/Anthropic处于论文阶段,Google Gemini/Claude面临团队重组[12] - 马斯克被视作行业"大鲶鱼",其激进创新迫使全行业加速竞争[12] 差异化竞争策略 - 第二梯队企业可通过延长研发周期(如10年10人团队)复制头部技术路径[13] - 在中后段市场保持领先优势仍具商业价值,全球多数国家尚未具备同类技术能力[13] - 建议聚焦模型应用落地而非直接对标头部,利用现有技术框架开拓细分市场[14] 行业启示 - 技术创新需遵循本质规律,过度宣传低算力突破易导致发展失衡[7][14] - 当前差距提醒行业重视算力基建与长期积累,避免概念炒作[14]
Grok-4登顶,Kimi K2非思考模型SOTA,豆包、DeepSeek新模型性能提升|xbench月报
红杉汇· 2025-07-18 08:47
AI大模型竞争格局 - xAI发布的Grok-4以65分登顶ScienceQA榜单榜首,相比前代Grok-3-mini提升50%性能,成为当前SOTA模型[1][4] - Kimi K2以1万亿参数规模成为最大开源MoE模型,首次进入榜单前十(49.6分),位列Non-Thinking模型第一[1][11][24] - OpenAI的o3-high(60.8分)、Google Gemini 2.5 Pro(59.4分)、字节跳动Doubao-Seed-1.6(56.6分)保持第二至第五名[3][8] 模型性能突破 - Grok-4采用多智能体协作模块和实时网页检索技术,在Humanity's Last Exam等专家级测试中取得突破[21][23] - Kimi K2通过MuonClip优化器实现15T token稳定训练,预训练阶段即具备agentic tool use能力[24] - o3-pro针对科学/编程领域优化,支持200k token长上下文处理,但存在过度思考现象[25] 成本与效率对比 - 高价高质区:Grok-4($15/百万token)性能优于o3-pro($80)且成本仅其1/4,Gemini 2.5 Pro($10)实现50s内快速响应[15][17] - 性价比区:字节跳动Doubao-Seed-1.6($1.1)与DeepSeek-R1($2.24)成本优势显著,性能均超54分[15][19] - 响应时间:Grok-4达227秒最长,Gemini 2.5 Pro保持59.4分同时将响应时间压缩至44.82秒[3][17] 技术指标分析 - BoN指标显示Grok-4与o3-high以78分并列多步推理第一,DeepSeek-R1(77分)成本更低[22] - 国产模型中DeepSeek-R1(77分)领先,Kimi K2与Doubao-Seed-1.6(73分)并列第二[22] - 推理模型普遍呈现响应时间与得分正相关,非推理模型Kimi K2在低延迟下取得73分BoN成绩[11][14] 行业动态 - xbench开源ScienceQA和DeepSearch评测集,覆盖16家公司43个模型版本[6][26][27] - 主流厂商模型偏序保持稳定,OpenAI/Google/字节跳动/DeepSeek/Anthropic维持原有排名[8] - 万亿参数时代开启,Kimi K2开源推动行业技术共享,xAI通过十倍算力投入实现Grok系列跨越式发展[21][24]
Nvidia CEO: Next Wave of AI is "Physical AI," Taps China's Expanding Role in Global AI Ecosystem
钛媒体APP· 2025-07-17 19:33
公司动态 - 英伟达CEO黄仁勋本周在北京公开亮相 强调中国市场对这家全球市值最高半导体公司的战略重要性 [2] - 此次是黄仁勋今年第三次访华 恰逢一系列重要进展:H20 AI芯片获监管批准 RTX Pro GPU即将发布 公司市值突破4.1万亿美元超越日本2024年GDP [2] - 黄仁勋在第三届中国国际供应链博览会开幕式上首次身着唐装 并用部分中文致辞 当天还与30多家媒体举行闭门圆桌会议阐述对中国AI发展的愿景 [3] 中国市场战略 - 公司获得H20芯片的监管批准 该芯片专为符合美国出口管制而开发 适合大模型训练 但供应链仍存在不确定性 [6] - 公司与中国科技巨头保持紧密合作 与腾讯、网易和小米等企业有长达三十年的伙伴关系 目前支持中国超过150万开发者 [8][9] - RTX Pro GPU专注于数字孪生模拟和机器人技术 是公司深入企业和工业AI应用的关键增长领域 [7] 技术发展 - 中国在基础模型和应用系统开发方面日益突出 深度求索推出全球首个开源推理模型DeepSeek-R1 代表中国在模型创新方面的加速 [4] - 中国拥有全球约半数AI研究人员 在数学和计算机科学方面基础深厚 阿里巴巴、Kimi和深度求索等公司在模型开发和产品集成方面进展迅速 [5] - 公司平台现支持阿里巴巴、月之暗面和MiniMax等领先企业在其架构上构建开源系统 这些AI模型不仅技术先进 还具有商业可行性 [9] 行业前景 - 机器人被视为下一个主要AI前沿领域 中国在AI软件、机械工程和大规模制造交叉领域的独特地位使其具有决定性优势 [10] - 先进机电一体化、强大AI能力和深厚制造基础的结合可能使中国在全球机器人经济中发挥领导作用 [11] - 随着自动化成为应对全球劳动力短缺的必要措施 能够扩展智能机器人的国家将在生产力方面获得不成比例的收益 [11] 公司历史与定位 - 公司成立于1993年 从游戏芯片设计商发展为全球AI基础设施的关键 通过CUDA和DGX超级计算机等技术推动计算性能提升远超摩尔定律 [14] - 黄仁勋2016年向OpenAI早期交付DGX系统 预示了现在重塑从医疗到交通等各领域的生成式AI繁荣 [14] - 公司定位为全球技术提供商 随着AI需求高涨 各国政府越来越多地与其接触以了解如何部署技术服务于国家优先事项 [12]