Workflow
Agent模型
icon
搜索文档
资源不到万亿 OpenAI 的 1% ,Kimi 新模型超越 GPT-5
Founder Park· 2025-11-07 20:00
产品发布与核心能力 - 公司推出开源模型K2 Thinking,是其迄今为止最强的开源思考模型[2] - 模型采用1T参数、MoE架构、32B激活参数、原生INT4量化,并支持256k上下文长度,更好支持国产GPU[3] - 在“人类最后的考试”基准测试中取得44.9%的SOTA成绩,表现超过同类型闭源模型[10] - 模型无需人工干预,可自主实现高达300轮的工具调用和多轮思考能力,解决更复杂问题[6] 技术路径与架构演进 - 从K2到K2 Thinking,技术路径从“模型即Agent”演进到“模型即Thinking Agent”[6] - 模型支持多步工具调用,需将思考内容返回模型进行多次推理以保持连贯性,此能力与Claude的“扩展思考”类似,但OpenAI的GPT系列和Google的Gemini模型尚未支持[21][22][23] - 公司选择先做“交互”再做“反思”的技术范式,重点是多轮工具使用和测试时扩展[16][17][18] - 此技术进展被视为实现AI L3级别的重要突破[20] 行业竞争与资源对比 - 公司估值约为33亿美元,而OpenAI估值为5000亿美元,Anthropic估值为1830亿美元,Grok估值为2000亿美元[28][26] - 公司员工约200人,训练成本约460万美元,而xAI拥有20万块H100 GPU集群,员工超1200人,Grok 4训练成本可能达4900万美元[28][29] - 中国基础模型公司面临资源稀缺挑战,但公司用不到1%的资源实现了对国际巨头的技术超越[29] - 在HLE测试集上,旗舰模型成绩从最初不到20%提升至目前超过40%,显示模型能力持续进步[13]
实测Kimi全新Agent模型「OK Computer」,很OK
量子位· 2025-09-27 09:30
产品发布 - Kimi发布全新Agent模型OK Computer 依托Kimi K2技术平台 [1][4] - 模型具备网页制作、PPT生成、数据处理等多项功能 可处理100万行数据并生成交互式仪表板 [4][30] 功能特性 - 设计类任务支持网页自动生成与Python编程 根据单句提示词自主完成模块设计与实现 [9][10][14] - 生成类任务整合文本、图像及音频生成能力 支持儿童故事绘本创作与文艺风格PPT制作 [19][20][22] - 分析类任务实现长文档检索与大数据处理 自动完成数据搜集、分析及可视化呈现 [28][29][30] 技术实现 - 采用像素风界面设计 提供简洁直观的用户交互体验 [7] - 任务执行过程自主生成Todo清单 实时标记进度状态(x表示完成 -表示进行中) [16] - 支持静态部署与动态资源调用 自动完成网页搜索和素材生成等预处理操作 [17] 性能表现 - 网页生成功能实现按钮跳转、等级分类、对比可视化等复杂交互设计 [12] - PPT输出文件支持后期人工编辑 具备完整可修改性 [24][26] - 数据分析模块自动构建评估维度 无需人工设定分析框架 [31]