K2 Thinking
搜索文档
K2 Thinking再炸场,杨植麟凌晨回答了21个问题
36氪· 2025-11-12 21:35
以下文章来源于智能涌现 ,作者邓咏仪 智能涌现 . 直击AI新时代下涌现的产业革命。36氪旗下账号。 Ask Kimi Anything. 文 | 邓咏仪 编辑 | 苏建勋 来源| 智能涌现(ID:AIEmergence) 封面来源 | Unsplash 继上周发布K2 Thinking再度引起全球热议后,很快,北京时间凌晨11月11日,月之暗面创始人杨植麟,以及合伙人周昕宇、吴育昕,在Reddit社区进行了长 达数小时的线上AMA(Ask Me Anything)环节,解答新模型相关的问题。 这也是数位联创第一次共同露面。 从高举高打到转向模型技术冲锋,如今的Kimi不再投流,愈发安静了。这次的新模型发布,和三个月前K2发布一样走低调路线:不开线下正式发布会,在 社区直接发布模型。 团队主创选择在Reddit、知乎上回答问题,也和Kimi现在的开源路线一脉相承——这些社区都是AI从业者、极客聚集的地方。 国外开发者们毫不吝啬对Kimi K2的喜爱。AMA环节开始后,数十个问题很快填满讨论串,夹杂着对Kimi性价比、开源深度的称赞,"绝对伟大的模型!"不 少用户表示。 不少开发者还现场"催更",希望Kimi团 ...
K2 Thinking再炸场,杨植麟凌晨回答了21个问题
36氪· 2025-11-11 18:30
公司战略与沟通 - 公司采用低调的社区发布模式,不开设线下正式发布会,选择在Reddit、知乎等开发者社区进行线上AMA互动[1][2] - 公司明确开源策略,拥抱开源社区,并考虑未来发布安全对齐技术栈以惠及更多开发者[43][44] - 公司专注于将文本模型能力做到极致,探索智能上限,当前重心在模型训练而非开发浏览器等应用外壳[21][41][42] 产品K2 Thinking核心能力 - K2 Thinking是1万亿参数的稀疏混合专家架构开源模型,在实际运行时激活参数控制在300亿以保证速度[7][12] - 模型在HLE、BrowseComp等代表前沿能力的Agent基准测试中表现优异,分数甚至超过GPT-5[8] - 模型专为Agentic能力设计,擅长长思维链,能够连续执行200-300次工具调用来解决复杂问题[12][13][35] 产品定价与技术细节 - K2 Thinking具有显著成本优势,其百万token输出价格为2.5美元,仅为GPT-5(10美元)的四分之一[8] - 模型采用INT4量化手段以提升推理速度并更好地兼容非Blackwell架构的GPU[8][38][39] - 模型训练在配备Infiniband的H800 GPU上完成,团队在GPU数量不占优的情况下将单卡性能压榨到极致[18] 行业竞争格局 - 国产大模型进入丰收季,智谱GLM-4.6、MiniMax M2及K2 Thinking接力开源,在全球榜单上表现活跃[9] - 国内厂商技术路线出现分化,MiniMax侧重性价比与稳定性,智谱GLM定位全面以抢占Claude断供后的市场,而公司则选择性能优先的激进路径[19][20][22] - 国产模型创新速度加快,在芯片等基础设施受限的情况下,于算法层面找到了细分创新方向[18][19] 未来发展规划 - 下一代K3模型计划引入重大架构更改,公司最新的KDA实验架构相关想法很可能会在K3中使用[40] - 公司未来会重新审视更长的上下文窗口,并可能发布更多像Kimi Linear这样的小模型作为研究演示[29][30] - 公司对多模态(如视觉理解)模型持开放态度,但因数据获取和训练需要时间,发布时间线会靠后[17]
资源不到万亿 OpenAI 的 1% ,Kimi 新模型超越 GPT-5
Founder Park· 2025-11-07 20:00
产品发布与核心能力 - 公司推出开源模型K2 Thinking,是其迄今为止最强的开源思考模型[2] - 模型采用1T参数、MoE架构、32B激活参数、原生INT4量化,并支持256k上下文长度,更好支持国产GPU[3] - 在“人类最后的考试”基准测试中取得44.9%的SOTA成绩,表现超过同类型闭源模型[10] - 模型无需人工干预,可自主实现高达300轮的工具调用和多轮思考能力,解决更复杂问题[6] 技术路径与架构演进 - 从K2到K2 Thinking,技术路径从“模型即Agent”演进到“模型即Thinking Agent”[6] - 模型支持多步工具调用,需将思考内容返回模型进行多次推理以保持连贯性,此能力与Claude的“扩展思考”类似,但OpenAI的GPT系列和Google的Gemini模型尚未支持[21][22][23] - 公司选择先做“交互”再做“反思”的技术范式,重点是多轮工具使用和测试时扩展[16][17][18] - 此技术进展被视为实现AI L3级别的重要突破[20] 行业竞争与资源对比 - 公司估值约为33亿美元,而OpenAI估值为5000亿美元,Anthropic估值为1830亿美元,Grok估值为2000亿美元[28][26] - 公司员工约200人,训练成本约460万美元,而xAI拥有20万块H100 GPU集群,员工超1200人,Grok 4训练成本可能达4900万美元[28][29] - 中国基础模型公司面临资源稀缺挑战,但公司用不到1%的资源实现了对国际巨头的技术超越[29] - 在HLE测试集上,旗舰模型成绩从最初不到20%提升至目前超过40%,显示模型能力持续进步[13]