Workflow
DeepSeek
icon
搜索文档
晚点播客丨IMO 金牌、Kimi 翻盘、抢人大战,与真格戴雨森复盘 2025 AI 中场战事
晚点LatePost· 2025-07-31 13:37
AI模型能力突破 - OpenAI通用大语言模型首次达到IMO金牌水准,六道题做对五道,未针对数学优化且未联网[7][8] - Google DeepMind的Gemini DeepThink模型同样取得IMO金牌,使用纯自然语言解题[14] - 数学证明题属于"hard to produce, hard to verify"任务,突破意义大于编程和围棋[16][18] - 模型推理能力提升验证inference scaling law,优化空间来自post-training而非底层架构[9][10] 技术演进趋势 - 解锁AI生产力的三大主线:推理(reasoning)、编程(coding)、工具使用(tool use)[56][68] - 模型架构仍处Transformer范式内演进,但能力从1到10提升显著[57] - 工具使用呈现两条路径:API接口调用和视觉模拟操作现有软件[68] - 上下文工程(Context Engineering)成为关键,分通用信息、组织层面、个性化记忆三层[26][61] 应用层发展 - Agent产品进入Early Adopter阶段,Manus/Genspark等完成模糊目标到任务执行的闭环[34] - 应用价值被低估,优秀产品设计能形成护城河,如Kimi长文本技术方向的前瞻布局[49][51] - 生产力场景token消耗呈10-100倍增长,远超聊天场景,如分析师可同时覆盖50家财报[83] - 订阅制商业模式验证成功,高端用户月均AI产品支出达1000美元[79] 行业竞争格局 - 中美模型差距缩小,Kimi K2开源模型在coding/Agent工作流等表现优于Claude[40][41] - Google强势回归,Gemini 2.5在多模态和云服务表现突出,TPU优势明显[58][59] - 人才争夺白热化,硅谷出现百万美元年薪挖角,创业公司面临人才保留压力[86][89] - 资源分配策略分化:字节全栈布局vs DeepSeek选择性突破[46][47] 团队与创新 - 稳定团队+技术前瞻性是突破关键,如Kimi核心成员合作超10年[48][49] - 优秀团队价值被低估,实际创新能力常超市场预期,如Kimi逆风翻盘[40][41] - 早期采用者(Early Adopter)社区生态活跃,开源项目获得积极反馈[5][53] - 产品设计需为未来模型预留空间,如Cursor等待Claude 3.5实现完整愿景[41][98]
DeepSeek V4 借实习生获奖论文“起飞”?梁文峰剑指上下文:处理速度提10倍、要“完美”准确率
AI前线· 2025-07-31 13:02
中国作者在ACL获奖论文中的表现 - 2025年ACL获奖论文中中国作者比例超过51% 美国作者占比仅为14% [1] - DeepSeek梁文锋作为通讯作者与北京大学联合发表的论文获得Best Paper奖 [1] - 论文第一作者袁境阳在撰写论文时仅为DeepSeek实习生 [1] NSA技术创新与设计 - 提出NSA(Natively trainable Sparse Attention)机制 结合算法创新与硬件优化以实现高效长上下文建模 [4] - NSA采用动态分层稀疏策略 结合粗粒度token压缩和细粒度token选择 保留全局上下文感知和局部精度 [4] - 引入两项核心创新:算术强度平衡的算法设计实现显著加速 高效算法和反向算子实现稳定端到端训练 [6] NSA性能表现 - 在270亿参数Transformer骨干网络上预训练 使用2600亿token 激活参数为30亿 [8] - 在9项指标中的7项上超过全注意力模型在内的所有基线 DROP提升0.042 GSM8K提升0.034 [8] - 在64k上下文"大海捞针"测试中实现完美检索准确率 解码、前向传播和反向传播速度显著提升 [9] - 在多跳问答任务(HPQ和2Wiki)上比全注意力模型分别提升0.087和0.051 代码理解任务(LCC)超出基线0.069 [10] 计算效率优势 - 在64k上下文长度下 前向速度提升高达9.0倍 反向速度提升高达6.0倍 [15] - 解码长度增加时延迟显著降低 64k上下文长度下提速高达11.6倍 [15] DeepSeek下一代模型规划 - 论文成果将应用于DeepSeek下一代前沿模型 支持100万tokens上下文长度 [1][17] - DeepSeek R2发布计划可能与V4相关 创始人梁文锋对当前模型性能不满意导致推迟 [17]
DeepSeek下一代技术提前曝光,梁文锋署名论文获ACL2025最佳论文奖
量子位· 2025-07-31 07:56
论文获奖与技术突破 - DeepSeek梁文锋与北京大学联合发表的论文荣获ACL 2025最佳论文奖,论文提出原生稀疏注意力(NSA)机制[1] - ACL 2025总投稿量达8360篇,较去年4407篇增长近一倍,竞争激烈[2] - NSA机制通过算法与硬件协同优化,将长文本处理速度提升11倍,性能超越传统全注意力模型[3] NSA技术细节 - NSA采用动态分层稀疏策略,包含三条并行注意力分支:压缩注意力(全局信息)、选择性注意力(关键词块)、滑动注意力(局部上下文)[10][17] - 架构针对现代GPU深度优化,实现端到端原生可训练模式[13] - 处理64k长度序列时,NSA解码速度提升11.6倍,前向传播提升9倍,反向传播提升6倍[15][16] 性能表现 - 27B参数NSA模型在9项基准测试中7项超越全注意力基线,DROP提升0.042,GSM8K提升0.034[19] - 64k上下文"大海捞针"测试中检索准确率100%,LongBench基准平均分0.469,领先全注意力基线0.032[21] - 微调后NSA-R模型在AIME 24数学测试中,8k上下文准确率0.121(全注意力0.046),16k上下文达0.146(全注意力0.092)[22][23] 应用前景 - 技术可扩展至1百万tokens上下文长度,预计应用于下一代DeepSeek-V4及DeepSeek-R2模型[4][6] - 实验使用DeepSeek-R1蒸馏数据微调新模型,显示技术迭代路径[5] 其他获奖研究 - 北大团队揭示语言模型对齐后易因微调"反弹",需开发更稳固的对齐技术[26] - 斯坦福研究提出"差异感知"公平性新视角,发现传统去偏见方法可能削弱模型情境判断力[28] - 亥姆霍兹中心指出LLMs生成回答存在向"理想值"偏移现象,可能导致医疗等领域决策偏差[29]
刚刚,DeepSeek梁文锋NSA论文、北大杨耀东团队摘得ACL 2025最佳论文
机器之心· 2025-07-31 00:25
机器之心报道 机器之心编辑部 在这届 ACL 大会上,华人团队收获颇丰。 ACL 是计算语言学和自然语言处理领域的顶级国际会议,由国际计算语言学协会组织,每年举办一次。一直以来,ACL 在 NLP 领域的学术影响力都位列第一,它 也是 CCF-A 类推荐会议。今年的 ACL 大会已是第 63 届,于 2025 年 7 月 27 日至 8 月 1 日在奥地利维也纳举行。 今年总投稿数创历史之最,高达 8000 多篇(去年为 4407 篇),分为主会论文和 Findings,二者的接收率分别为 20.3% 和 16.7%。 根据官方数据分析,在所有论文的第一作者中,超过半数作者来自中国(51.3%),而去年不到三成(30.6%)。紧随中国,美国作者的数量排名第二,但只占 14.0%。 今年共评选出 4 篇最佳论文,2 篇最佳社会影响力论文、3 篇最佳资源论文、3 篇最佳主题论文、26 篇杰出论文,2 篇 TACL 最佳论文、1 篇最佳 Demo 论文以及 47 篇 SAC Highlights。 以下是具体的获奖信息。 最佳论文奖 在本届4篇最佳论文中,DeepSeek(梁文锋参与撰写)团队以及北大杨耀东团队摘得 ...
干货 | 基于深度强化学习的轨迹规划(附代码解读)
自动驾驶之心· 2025-07-30 07:32
自动驾驶技术中的强化学习应用 核心观点 - 强化学习在自动驾驶领域从机器人早期阶段已有应用,但受限于训练效率低和复杂度高,工业界普及度有限 随着AlphaGo、ChatGPT RLHF和DeepSeek-O1等技术的突破,强化学习在时序决策任务(如轨迹规划)中展现出潜力 [3][7] - 自动驾驶的强化学习需结合模仿学习、逆强化学习等技术,通过动态reward设计(安全性/舒适性指标)和闭环训练解决环境交互问题 [8][62] 技术范式分类 1 基础学习概念 - **监督式学习**:用于感知任务(目标检测),通过固定训练集优化模型输出与监督信号的均方误差 [5] - **模仿学习**:以专家动作为监督信号,扩展至短时序轨迹生成,是端到端自动驾驶的主流方法 [6] - **强化学习**:通过环境交互的延迟反馈(如轨迹规划中的碰撞避免)优化策略,依赖动态reward信号 [7] - **逆强化学习**:从专家数据中学习reward-model,解决自然语言或驾驶舒适性等难以定义的奖励问题 [8] 2 核心算法框架 - **值优化方法**:包括动态规划、蒙特卡洛(统计大数原理)、时序差分(SARSA/Q-Learning)及混合算法(GAE) [29][30][33][44] - **策略优化方法**: - **REINFORCE**:蒙特卡洛估计策略梯度 [50] - **Actor-Critic**:结合策略网络与价值函数拟合 [51] - **PPO**:通过clip函数简化TRPO的约束条件,提升训练稳定性 [57] - **GRPO**:DeepSeek提出的轻量化算法,利用在线group样本替代value-model [59] 自动驾驶场景关键技术 - **预训练**:策略网络与价值网络通过模仿学习初始化,提升训练收敛性 [60] - **概率建模**:自回归/Diffusion模型对action多步rollout,通过环境反馈优化策略 [61] - **闭环训练**:需建模多智能体博弈(他车动态响应),避免静态环境导致的策略偏差 [62] - **端到端融合**:结合NeRF/3DGS生成动态环境感知数据,实时更新传感器输入 [63] 行业应用趋势 - 技术社区活跃度显著提升,涉及大模型、VLA、BEV感知等30+技术栈,近4000人参与交流,300+企业与科研机构加入 [65]
我逛了两天WAIC 展,一些真实感受
佩妮Penny的世界· 2025-07-29 20:06
展会概况 - 2023年WAIC上海世界人工智能大会规模空前,展览区人流密集,南门入场需排长队,门票在二手平台炒至1300-3000元[1] - 展览区以企业展示为主,论坛多为免费预约且可线上观看,展览区体验项目丰富但部分展示因人流和网络问题较保守[1][2] - 展会单次持续3小时以上易疲劳,建议合理安排观展时间[2] 机器人领域 - 展会呈现机器人“物种大爆发”现象,涵盖便利店取物、分拣、做奶茶、写毛笔字、打麻将等多样化功能,工业场景机器人行动效率最高[3][14][17] - 人形机器人受资本关注,因人类基础设施适配性被视为潜在主流形态,但行业收入规模目前可能低于展会门票收入[18][19][22] - 2022年机器人领域资本投入达200-300亿元,行业处于早期竞争阶段,预计存活企业数量将远超大模型领域[22] - 宇树科技展台人气最高,机器人打拳表演吸引大量观众,云深处等公司关注度相对较低[17] 大模型与算力 - 大模型在软硬件端百花齐放,华为首次展出“算力核弹”昇腾384超节点,投入数十亿,其他算力公司参展数量达数十家[24][25] - 阿里展示AI全业务线整合案例,包括通义、夸克、支付宝,并推出可换电AI眼镜(未开放体验),腾讯展台表现稍逊[25] - 阶跃星辰和Minimax为大模型展区规模最大企业,智谱AI推多模态陪伴产品,Kimi仅设小型抽奖展台[27] - 快手可灵(Kling)低调参展,其视频生成应用当前为AI领域收入最高方向[27] 其他技术方向 - 低空经济受关注,时的科技展出中国首款倾转旋翼eVTOL飞行器[29] - AI眼镜展示区域较集中,小米新品带动行业热度但普及仍需时间[28] - 海外企业仅Google、亚马逊AWS、特斯拉参展,特斯拉展台仅静态展示Optimus机器人[31] 创业生态与投资动态 - H4创业公司展区氛围轻松,覆盖科学、医疗、心理、陪伴等垂直领域,创业者交流意愿强[35] - 闭门AfterParty为机构间非官方合作重要场景,Agents&Robotics领域热度持续[33] - 创投行业参会者特征明显,表现为高频交流(如单日接触30家公司)并提出基础性问题[37][39]
21社论丨以开放合作促进人工智能向善普惠发展
21世纪经济报道· 2025-07-29 08:06
一直以来,中国积极参与并推动全球人工智能治理规则的制定。2023年,在联合国成立人工 智能高级别咨询机构的同时,中国提出《全球人工智能治理倡议》,支持在充分尊重各国政 策和实践基础上,推动形成具有广泛共识的全球人工智能治理框架和标准规范,中国坚持多 边主义与国际合作的立场。 中国企业也在致力于AI技术创新。今年初,中国企业DeepSeek推出先进的R1大模型,打破了 美国垄断AI技术的企图。DeepSeek通过算法创新,可以用较低版本的硬件达到与美国大模型 类似的水平,并以开源模式赋能全球各国的企业与机构,这与美国公司此前建立算力墙与模 型私有化完全不同,大幅提升了各国能够公平普惠地获得AI技术的机会。 近日,在2025世界人工智能大会暨人工智能全球治理高级别会议上,中国政府发布《人工智 能全球治理行动计划》,并倡议成立总部设在上海的世界人工智能合作组织,旨在推动全球 AI治理多边合作,协力推进全球人工智能发展与治理。 近些年来,人工智能的快速发展驱动全球技术与政治的深刻变革,如何防范人工智能科技价 值异化,引导人工智能朝"善治"方向发展,确保其发展的安全性、可靠性、可控性和公平 性,是事关世界和平与发展的重 ...
新加坡欢迎DeepSeek之类高性价比人工智能
财富FORTUNE· 2025-07-28 20:04
新加坡对低成本AI模型的欢迎态度 - 新加坡欢迎类似DeepSeek的低成本AI模型 因小国和小企业希望使用AI但不愿支付高昂费用[1] - 企业在应用AI时需权衡成本 DeepSeek等创新从降低成本视角受到欢迎[2][3] DeepSeek对全球AI行业的影响 - DeepSeek推出的大模型曾引发美国金融市场万亿美元规模抛售 因证明用较少资源可训练出顶尖性能模型[3] - 投资者重新评估科技巨头在AI军备竞赛中的巨额资本支出 导致科技股暴跌[3] - DeepSeek带动中国科技股飙升 投资者争相押注中国AI技术发展[4] 东南亚AI发展的本地化需求 - 大语言模型主要基于西方语料库 在东南亚语境下可能水土不服[6] - 仅用英语训练的AI无法满足新加坡及周边国家需求 需覆盖东南亚数百种语言[7] - 新加坡推进SEA-LION项目 开发用越南语、马来语等地区语言训练的开源大语言模型[8] 新加坡在中美之间的AI发展策略 - 新加坡在中美之间走中间路线 既与美国合作AI治理 又学习中国AI应用案例[9][10] - 中国提供丰富的AI应用场景 产业基础广阔深厚值得观察学习[11] - 新加坡计划扩大AI从业者群体 涵盖律师、医生、会计师、制造业工人等各行业专业人士[11]
脉脉:AI 人才呈现空前活跃态势,有跳槽意向的人才数量月增过万
证券时报网· 2025-07-28 18:16
在AI人才大量活跃的同时,AI公司也掀起新一轮AI人才争夺战。杨滢表示,截至7月,已有超过1000家 公司在脉脉发布AI岗位,更有企业的高管和团队负责人亲自下场招人。华为、小红书、DeepSeek等多 个大厂高管在脉脉的个人主页签名显示"长期招人",HR和猎头也保持着近乎"分钟级"的活跃,多个认 证信息为AI公司员工的用户主页访问量激增,人才争夺呈现白热化状态。 AI人才的互动与流动具有明显的圈层聚集效应。脉脉平台上AI相关的行业圈、同事圈、校友圈里,已 聚集超过12万名AI人才,形成了高密度、专业化的信息交流场域。2025年上半年,AI人才在这些圈子 里频繁发布高质量内容,包含内推岗位、工作体验、业务探讨等。MiniMax、趣丸科技等多家公司员工 发布内推信息,也有AI领域从业者分享中兴通讯等企业的AI岗位。 (原标题:脉脉:AI 人才呈现空前活跃态势,有跳槽意向的人才数量月增过万) 近日,职场社交平台脉脉发布的数据显示,2025年,AI人才呈现空前活跃态势。自2025年2月以来,脉 脉平台每月新增上万名AI人才将求职状态改为"正在看机会",截至2025年7月,有41.07%国内AI头部公 司员工的求职状态 ...
大模型六小龙底牌对决
第一财经· 2025-07-28 11:33
行业格局与竞争态势 - AI领域将存在多个玩家长期共存 不同公司价值观塑造模型差异化特点 开源模型影响力提升且逼近闭源模型性能 [1] - 2024年成为基座模型分水岭 市场玩家数量收缩至个位数 头部大厂与少数创业公司留存 幸存需具备AGI使命感/高人才密度/强融资能力 [2] - 国内大模型技术差异度不足 产品切换成本低导致竞争惨烈 兼容OpenAI API标准加剧同质化 [7] 企业动态与战略分化 - 智谱即将发布GLM-4.5多模态模型 同步推出C端陪伴型AI产品 软硬件均规划付费业务 推进A股+港股双上市 [4][8] - 月之暗面发布K2基座模型后 将推出同规模推理模型 技术重点转向智能体任务调度 港股上市面临仲裁风险 [5][8] - 阶跃星辰展示端到端语音大模型车载应用 成立"模芯生态创新联盟"联合国产芯片厂商 预估年营收10亿人民币 [5][8][15] - MiniMax侧重To C应用而非纯基础模型 同步筹备A+H股上市 百川智能转型医疗 零一万物聚焦B端产业落地 [8][11] 技术演进与AGI路径 - 大模型进入1.0模仿学习→2.0强化学习阶段 技术迭代导致部分公司掉队 [9] - AGI发展存在两大路径争议:单一超级智能系统 vs 多模型多代理架构 MainFunc指出专业模型+Agent组合是关键 [13] - 多模态成为AGI必由之路 智谱采用MoE结构 阶跃星辰发布Step-3多模态模型 强调基础研发与商业化分层融合 [15] 商业化与生态建设 - 创业公司差异化路径包括To C出海/To B服务/产业资源对接/多模态发展 头部企业启动上市筹备 [8] - 行业尚未建立稳固竞争壁垒 技术窗口期需转化为数据闭环护城河 阶跃星辰强调应用落地形成数据飞轮 [16] - 投资热点从基础模型转向具身智能 宇树机器人等硬件厂商关注度超越大模型展台 [5]