智能体集群
搜索文档
中国AI“三杰”同日轰炸,召唤百个Agent的门票终于发到每个人手里
观察者网· 2026-01-28 17:37
不过当天霸占热搜C位、让海外科技圈刷屏的,却是Kimi K2.5。截止到今天上午,外网相关发布量超过 1.7万,热度超过了OpenAI发布的科研写作神器Prism。 (文/陈济深 编辑/张广凯) 1月27日,中国AI届上演了一场史无前例的"饱和式轰炸":DeepSeek、通义千问、月之暗面——代表中 国开源最强战力的"三杰",不约而同地在同一天发布重磅更新。 为什么是Kimi?答案藏在杨植麟那段略显朋克的演示视频里。 杨植麟以一贯的极客风格,在一间略显朋克的会议室里,用一段全程中文的视频演示了新模型的各种全 新能力。 这一幕,很容易让人联想到一年前的Manus演示——那个发誓要"终结人类繁琐工作"的通用Agent。 但不同的是,K2.5加入了原生多模态,让模型理解屏幕上的一切;推出了智能体集群,让AI像包工头 一样瞬间调度上百个分身并行协作。 更重要的是,这不再是一个画饼的Demo,而是一次面向中文互联网世界的生产力实装。 从这个视角出发,杨植麟过去两年的技术路线图就变得异常清晰且连贯:从K1时代用超长上下文打 穿"记忆",构建数字员工的大脑;到K2时代通过智能体解决"行动",构建手脚;再到如今K2.5时代用 ...
刚刚,杨植麟亲自开源Kimi K2.5!国产大模型打架的一天
机器之心· 2026-01-27 17:45
模型发布与核心参数 - 月之暗面公司发布了Kimi K2.5模型,这是一个拥有1万亿参数(1 trillion)的MoE基础模型,并且依然保持开源[4] - 新模型相较前代,视觉理解能力大幅增强,可以处理视频,同时编程能力也有明显提升[4] 模型性能与基准测试 - 在极具挑战性的agent评测上取得当前最佳表现(SOTA),例如在HLE(人类最后考试)上拿到50.2%,在BrowseComp上拿到74.9%[4] - 编程能力突出,在SWE-bench Verified上拿到76.8%,缩小了与顶尖闭源模型之间的差距[4] - 在多项视觉理解评测上实现了当前开源最佳效果[4] - 在核心基准测试上,Kimi K2.5的成绩与Opus 4.5、GPT 5.2 XHigh和Gemini 3.0 Pro等当前最强大闭源模型基本相当,部分评分还能超出[6] - 在多项评测中优于GPT-5.2-xhigh的同时,运行成本只有GPT-5.2-xhigh的几分之一[7] 核心能力:全能模型与视觉转代码 - Kimi K2.5是一个全能模型(all in one,Unified model),集成了视觉、文本、对话、agent、思考与非思考等所有能力[12] - 模型主打图像转代码功能,用户只需提供设计稿或界面截图,AI即可生成相应代码,无需编写提示词[12][13] - 模型能理解视频内容,例如将录屏的动画效果自动写成代码进行复现[14] - 结合视觉能力,模型具备一定的“设计审美”,能构建出具有高级审美和动效的网页[15] 智能体集群(Agent Swarm)功能 - Kimi K2.5引入了“Agent Swarm(Agent集群)”功能,在处理复杂任务时,模型能以指挥者身份现场调度并协同最多达100个Agent分身并行工作[21] - 该功能最多支持1500次工具调用,速度比单智能体配置快4.5倍[21] - 智能体集群由Kimi K2.5自动创建和编排,无需任何预定义,经过了并行智能体强化学习训练[22] - 这种并行处理能力能将原本需要数天完成的工作压缩至十几分钟[25] - 在处理真实世界知识工作时,K2.5 Agent可以端到端处理高密度、大规模的办公任务,覆盖文档、电子表格、PDF和幻灯格式,输出能力可达一万字论文或100页文档[29] 实测应用案例 - **多模态推理**:模型能正确识别手绘的《生活大爆炸》谢尔顿公寓平面图背景,并能将其重构成3D版本[37][40] - **智能体集群任务**:在测试中,为一种虚构的深海智慧生物开发一套包含200个基础词条和3篇创世神话的词汇表,整个过程耗时38分钟,创建了名为“流明语”的新语言[47][51] - **编程助手Kimi Code**:基于Kimi K2.5的Kimi Code正式发布,能集成到VSCode、Cursor、Zed等IDE中,支持输入图片和视频[16] - **Kimi Code实测**:在创建黄金价格监控器的任务中,整个执行过程耗时约4分钟[55][56];在批量处理94个文件的任务中,不到两分钟即完成,上下文占用量仅刚超过10%[62] 行业影响与定位 - 中国的开源模型正在逐渐成为新的标准,Kimi K2.5的发布给全球开源大模型树立了新的标杆[65] - 基于K2.5视觉、智能体能力的发展,AI解锁了更多在真实世界中解决复杂问题的能力[66] - 行业认为Kimi 2.5在智能体能力上已经足以比肩前沿模型,其智能体集群模式在解决复杂任务上的表现亮眼[64]
全能视觉助手来了!Kimi低调上线K2.5,可同时调度100个智能体,效率最高提升4.5倍
华尔街见闻· 2026-01-27 14:57
公司产品与技术升级 - 月之暗面低调推出旗舰模型Kimi k2.5,未举行公开发布会,旨在通过技术实质性提升巩固市场地位 [1] - Kimi k2.5采用原生多模态架构,可通过单一提示词同时处理文本、图像和视频 [1] - 模型核心突破是“智能体集群”能力,能自主调度多达100个子智能体并行工作,使复杂任务执行时间相比单智能体配置缩短最高4.5倍 [1] - 模型已通过网页版、App及API平台向用户开放,在强化长文本优势的同时,引入视觉理解和自动化代码生成工具,以拓展企业级应用和开发者生态 [3] 原生多模态与视觉能力 - Kimi k2.5使用约15T的混合视觉和文本标记进行预训练,具备深层视觉理解能力,超越简单OCR [5] - 模型能理解并分析复杂的电路图、手写数学公式或财务报表中的逻辑 [5] - 在编程领域,模型具备强大的视觉编码能力,可根据图像或视频输入直接生成完整前端界面代码,并支持可视化调试 [5] 智能体集群协同技术 - 智能体集群是此次更新的核心亮点,K2.5引入了并行智能体强化学习(PARL)技术,可自主管理编排100个子智能体集群 [7] - 在处理大规模搜索等复杂工作流时,模型能自动分解任务为可并行的子任务,无需预定义角色或流程 [7] - 内部测试显示,并行处理机制将端到端运行时间减少了80%,并支持多达1500个协调步骤的并行工作流 [7] 性能基准与办公效率 - 在HLE、BrowseComp和SWE-Verified等代理基准测试中,K2.5表现优于开源同行,在编程和逻辑推理领域缩小了与顶级专有模型的差距 [9] - 其自动化编码工具旨在与Anthropic PBC旗下的Claude Code竞争 [9] - 内部“AI Office基准测试”显示,相比前代K2 Thinking版本,新模型在处理文档、电子表格及构建金融模型等端到端任务上的性能提升了59.3% [9] 融资背景与市场竞争 - 月之暗面近期完成一轮融资,从包括阿里巴巴和IDG Capital在内的投资者手中筹集了5亿美元,投后估值达43亿美元,目前正寻求以最高50亿美元的估值进行新一轮融资 [3] - 公司由前清华大学教授Yang Zhilin创立,其在Meta和Google均有人工智能项目经验 [10] - 在市场份额上面临智谱(Zhipu)和MiniMax等对手的激烈竞争,后两者近期已在香港通过IPO合计募集超过10亿美元 [10] - 中国大模型市场竞争白热化,进入淘汰赛阶段,月之暗面在竞争对手DeepSeek预计发布重大更新前推出K2.5,意在证明其技术迭代和资本吸引力上的领先地位 [3][10]
红杉AI峰会六大关键议题解读(2):AI操作系统崛起,从“被调用”到“主动调度”的范式转变
海通国际证券· 2025-05-13 21:06
AI操作系统发展趋势 - 2025年红杉AI峰会认为AI操作系统崛起是人工智能应用发展关键转折点,标志AI从“被调用”到“主动调度”转变[1][7] - AI操作系统重构人机交互方式,从工具变为任务执行中枢,ChatGPT成为“操作系统级别的存在”[2][8] - AI从“一个模型”进化为“多个智能体协同”系统结构,“Agent Inbox”范式构建“AI任务流水线”[3][9] AI操作系统核心竞争力与应用 - AI操作系统核心竞争力是“任务执行力”,商业价值基于实际执行成果而非技术演示能力[4][10] - AI操作系统向汽车、金融、教育、政务等行业渗透,构建“全流程智能闭环”执行系统[4][11] 行业前景与风险 - AI操作系统崛起将成下一轮科技浪潮起点,有望成为类iOS/Android级平台机会[5][12] - AI操作系统发展面临需求不及预期、地缘政治干扰供应链、数据中心建造放缓风险[6][13] 评级相关 - 海通国际采用相对评级系统,优于大市指未来12 - 18个月预期相对基准指数涨幅10%以上,中性变化不大,弱于大市跌幅10%以上[20][24][25] - 截至2025年3月31日,海通国际股票研究覆盖率中优于大市占92.2%,中性7.5%,弱于大市0.3%[26][28] 报告发布与合规 - 非印度证券研究报告由HTIRL发行,印度证券由HSIPL发行,均以海通国际为名全球发布[43][44][47][48][49] - 报告对不同地区投资者有分发和交易相关通知,使用有免责声明[54][55][57][58][65][74]