Agentic Intelligence

搜索文档
Kimi K2拿到了世界第一,也杀死了过去的自己
新财富· 2025-07-28 10:58
月之暗面Kimi K2大模型发布 - 7月12日月之暗面发布最新大模型Kimi K2 模型权重和代码全部开源 在LMArena排行榜中综合排名全球第五 开源大模型中位居全球第一 超越Claude 4和DeepSeek-R1-0528 [2] - Kimi K2提出"模型即Agent"新概念 原生具有调用各种工具的能力 在LiveCodeBench测试中取得53.7%的成绩 超越GPT-4.1的44.7%和Claude 3.5 Opus的47.4% [23][35][44] - Kimi K2参数量扩展至1T量级 放弃自研架构转向DeepSeek V3 通过减少Attention Heads数量增加Experts数量 突破智能上限 [24][28][29] Kimi发展历程与战略转型 - 月之暗面曾是Scaling Law忠实信徒 采取激进买量策略 2024年营销预算接近9亿人民币 但6月月活降至2352万 同比下降2.19% [8][11][17] - 2024年底全球高质量公开数据耗尽 深度求索通过DeepSeek R1开辟新范式 依靠后训练强化学习突破智能上限 月活暴涨至6181万 [13][16][17] - 2025年初公司停掉所有市场营销 集中资源研发K2 转向技术驱动 加入开源阵营 战略重心回归大模型性能提升 [55] Kimi K2技术创新 - 开发MuonClip优化器 解决15.5T tokens预训练稳定性问题 实现零崩溃表现 被海外AI圈称为"完美的Loss曲线" [32][33] - 提出Agent训练新路径 通过AI生成模拟场景合成数百个垂直领域工具调用轨迹 建立自动化Agent数据生产工厂 [38][39][41] - 模型架构上减少DeepSeek V3的Attention Heads 增加Experts数量 在算力有限情况下最大化模型潜力 [28][29] 行业影响与竞争格局 - DeepSeek R1引发AI创业公司存在主义危机 其不花营销预算单靠产品实力月活达6181万 促使行业重新思考发展路径 [17][54] - Kimi K2开源后迅速被阿里Qwen反超 但公司战略转型意义重大 体现从产品驱动转向技术驱动的决心 [55] - 行业验证"模型能力决定市场认可"逻辑 AI公司价值创造核心转向付费用户关注的效率和结果 [53][54]
Kimi K2官方技术报告出炉:采用384个专家,训练不靠刷题靠“用自己的话再讲一遍”
量子位· 2025-07-22 14:39
Kimi K2模型技术亮点 - 采用MoE架构,总参数1T,激活参数32B,包含384个专家,每层激活8个,通过稀疏设计优化计算效率 [4][16] - 创新使用MuonClip优化器,结合Muon的token效率与QK-Clip稳定性,支持15.5万亿token无损失spike预训练 [11][21][22] - 引入MLA(Multi-head Latent Attention)结构替代传统密集注意力,每层注意力头降至64个,减少计算量和带宽压力 [16][17] 训练数据与方法 - 预训练数据覆盖网页、代码、数学、知识四大板块,采用"重述法"提升token效用,用重写10次的数据训练1轮(28.94%准确率)优于原始数据训练10轮(23.76%) [24][25][26] - 数学类文本改写成"学习笔记"风格并加入多语言翻译,知识类文本通过多样化表述增强理解 [28] - 后训练阶段通过大规模Agentic Tool Use数据合成,覆盖3000多真实工具和20000多合成工具,生成多轮工具使用轨迹 [35] 强化学习与性能表现 - 构建可验证奖励环境(如GitHub PR/issue自动化测试)和自我评估奖励机制,形成闭环优化 [33][34][36] - 采用温度衰减策略和PTX辅助损失,平衡探索与稳定性,避免知识遗忘 [43] - 在SWE Bench Verified、Tau2等测试中达到开源模型SOTA,上线一周即登顶竞技场千人盲评,媲美Grok 4和GPT 4.5 [5][12] 基础设施与行业动态 - 训练依托NVIDIA H800集群,节点配备2TB内存,8块GPU通过NVLink/NVSwitch互联,节点间采用8×400 Gbps RoCE网络 [38][39] - 阿里通义Qwen3最新版本(Qwen3-235B-A22B-2507)通过分训Instruct/Thinking模型提升质量,官方测评显示其性能反超Kimi K2 [40][41]
VERSES Announces Conversion of Analog to Genius Enterprise after successful UAE Pilot
Globenewswire· 2025-06-13 20:34
文章核心观点 VERSES AI与Analog在智慧城市出行试点成功后,打算扩大合作,将VERSES的Genius应用于更多智慧城市项目,Genius在试点中展现出提升运营效率和增加收入的潜力 [1][2][4] 合作背景 - VERSES是认知计算公司,专注下一代智能软件系统;Analog是物理智能公司,致力于打造自适应智能等前沿技术 [1][6][7] - 双方此前进行了智慧城市出行试点,Analog将转换为Genius Enterprise许可证 [1] 试点成果 - Genius分析两大国际城市的历史拼车和交通数据,在模拟中使已完成行程最多增加32% [2] - 单队运营商用400辆活跃车辆采用两班制,每年可增收1600万美元 [2] - Genius编排算法推荐车队管理策略,减少空驶里程和闲置时间,提高利润率和降低成本 [3] 未来计划 - 双方计划开展一系列新项目,将Genius应用于能源管理、物流、自主检查机器人和城市规模传感器融合等智慧城市项目 [4] - Genius将在Analog的安全边缘基础设施内本地托管,实现近实时决策并保持数据控制,还将在阿联酋本地测试和部署 [4] 双方表态 - Analog创始人兼CEO认为Genius能应对复杂性并创造性回应现实挑战,嵌入Genius将打造未来城市的神经系统 [5] - VERSES创始人兼CEO指出中东在智慧城市投资巨大,当前AI解决方案不足,此次试点显示了Analog与Genius合作的潜力 [5]
VERSES Issues Inaugural Monthly Newsletter May 2025
Globenewswire· 2025-05-07 20:55
文章核心观点 VERSES AI Inc. 发布首份月度通讯,介绍公司发展动态,包括产品 Genius 发布、研究进展、人员晋升等,还提及行业动态 [1][2] 产品更新 - Genius 于 4 月 30 日正式推出,面向机器学习和数据科学专业人士,提供构建特定领域模型工具,通过 SDKs/APIs 和模型编辑器增强第三方代理决策能力 [4] - Genius 基于测试和反馈进行重大升级,更新模型编辑器、API 和客户门户,采用基于消费和性能定价及企业许可模式 [5] 用例聚焦 - Genius 可用于优化胰岛素输送,解决当前糖尿病管理方案无法适应患者个体行为问题,降低低血糖/高血糖事件发生率 [7] - 全球 20 - 79 岁糖尿病患者达 5.89 亿,预计到 2050 年增至 8.53 亿,2024 年糖尿病导致 340 万人死亡,造成至少 1 万亿美元医疗支出 [9] 研究进展 - 研发稳步推进,制定更全面框架应对挑战,预计近期出结果;3 月在 AI UK 2025 活动展示基于主动推理的多智能体模拟 EcoNet [11] - 员工发表多篇学术论文,预计本月分享 “Atari 基准” 结果及相关研究论文 [12][15] 专家视角 - 首席科学家 Karl Friston 领导 AI 研究,公司与他续签独家协议,推进 Genius 研究 [16] - Friston 受邀在 NeurIPS 24 作主题演讲和小组讨论,其团队发表多篇论文,还与研究实验室合著环保相关论文 [17][19] - Friston 对 Genius 发布表示满意,认可团队让主动推理更易获取及潜在应用价值 [20] 公司新闻 - 晋升 Lori Pike 为工程副总裁,Tim Bellay 为产品总监,此前任命 James Hendrickson 为总裁兼首席运营官,James Christodoulou 为首席财务官 [21][22] 行业动态 - NVIDIA 举办 GTC AI 大会,CEO 描述 AI 代理改变行业未来,提及 “代理式 AI” 及 AI 采用曲线 [23][24] - 摩根士丹利在科技、媒体与电信会议上强调 5 大 AI 趋势 [26][28] 新闻与关键时刻 - 2025 年 1 月至 4 月公司有多项动态,包括 Genius 发布、融资、合作、人员任命等 [27][29] 关于公司 - VERSES 是认知计算公司,以自然为模型构建下一代智能软件系统,旗舰产品 Genius 帮助机器学习从业者建模复杂动态系统 [30]
VERSES® Announces Commercial Launch of Genius™
Globenewswire· 2025-04-30 20:35
文章核心观点 - VERSES AI公司正式推出旗舰产品Genius,从研究导向过渡到营收驱动,有望推动企业客户获取、产品采用和营收增长 [1][2] 产品发布情况 - 公司正式推出为企业提供代理智能的旗舰产品Genius,将以基于消费和绩效的定价方式以及企业许可证形式提供付费服务 [1] - 公司创始人兼CEO表示Genius商业发布标志着公司从研究导向过渡到营收驱动 [2] - 公司CTO称很高兴向首批客户商业推出Genius,并期待未来几周向更多用户推广,感谢beta合作伙伴提供有价值反馈 [3] 产品优势与市场需求 - 企业面临提高生产力、降低成本等压力,希望用AI代理进行更明智预测和自动化决策,通用AI难以满足企业特定领域需求,Gartner估计到2027年50%的AI模型将是特定领域的,Genius旨在满足这一需求 [4][5] - Genius从底层设计用于解决特定领域企业挑战,有数十项可用性改进,能帮助解决具有模糊性、新颖性或不确定性的企业问题,对需要预测、决策和推荐的用户有价值 [5] 目标受众与产品升级 - Genius初始目标受众是试图解决需要考虑不确定性或隐藏因素的企业问题的机器学习和数据科学专业人士 [6] - Genius商业发布对现有功能进行重大升级和增强,包括智能代理、模型编辑器、应用程序编程接口和开发者门户 [6] 客户转化与定价 - 公司将把当前beta用户转化为付费客户,并预计未来几周开始向数千名已注册的合格开发者申请者推出访问权限 [7] - 公司为研究人员、专业人士和企业许可证提供不同定价计划的付费服务 [7] 公司简介 - VERSES是一家认知计算公司,构建受自然智慧启发的下一代智能软件系统,旗舰产品Genius是机器学习从业者建模复杂动态系统和生成自主智能代理的工具套件 [7]