Workflow
Kimi K2
icon
搜索文档
Kimi没有DeepSeek的命
虎嗅APP· 2026-04-01 23:23
文章核心观点 - AI行业技术范式在2025年至2026年间发生关键转变,从注重“聊天”的Chat模型转向注重“行动”的Agent模型 [11][12] - 中国AI公司Kimi在此期间通过技术突破和战略转型,实现了从被市场唱衰到获得全球认可的“逆天改命”,其发展路径与另一家中国公司DeepSeek形成对比 [8][14][22][23][24] - 技术实力、模型实际应用价值(如编程和工具调用)以及开源策略,成为决定AI公司竞争力的核心因素 [12][14][16] 2024年:Kimi的早期定位与市场印象 - 2024年,Kimi凭借“200万字长上下文”的噱头获得市场广泛关注,并成功占据用户“长文本”心智,但其技术影响力在当时并未获得技术圈认可 [4][5][6][7] - 该200万字模型为实验性质,每次运行成本接近3位数人民币,不具备大规模服务可能性 [5] 2025年:行业范式转变与Kimi的转型 - 2025年初,DeepSeek R1因复现并开源OpenAI o1的“深度思考”能力而成为中国AI技术代言人 [8][14] - 同期,AI行业技术范式开始从Chat转向Agent,市场认识到会写代码和调用工具的模型比更会聊天的模型更有价值 [11][12] - 2025年7月,Kimi发布K2模型,主打“Open Agentic Intelligence”,旨在复现Claude模型的Agent能力并开源,标志着公司战略转向 [15] - K2模型发布后,获得英国《自然》杂志积极评价,称其为“另一个DeepSeek时刻”;Anthropic联合创始人Jack Clark评价其编码和工具调用分数已足够高,预计现实中会有人使用 [15][16] - 因K2及后续K2 Thinking模型的表现,Kimi在2025年底完成5亿美元融资,IDG等老股东继续加持 [16] 2026年:Kimi的技术突破与全球认可 - 2026年春节前后,Kimi发布K2.5模型,参数达万亿级别,具备图片和视频多模态理解能力,并支持思考与非思考模式,成为当时少数能发布多模态旗舰模型的创业公司 [18] - 2026年3月,Kimi团队发布“注意力残差”技术论文,挑战已有十年历史的神经网络底层残差连接机制,获得OpenAI联合创始人Andrej Karpathy等人的高度评价 [14][18] - Kimi模型被多家全球领先科技公司采用:被估值3500亿美元的AI编程工具Cursor套壳使用;被市值超过5000亿美元的Cloudflare引入为主力模型;成为全球最大独立AI搜索应用Perplexity唯一引入的开源模型和中国模型 [14][19] - Kimi创始人杨植麟成为英伟达2026年GTC大会唯一受邀演讲的全球独立大模型公司代表,并在演讲中提出优化器、注意力机制、残差连接等基础技术值得重新思考 [14][18][19] - 公司财务表现强劲:K2.5发布后20天收入超过过去一年;2026年春节前后以投前估值48亿、60亿、100亿美元完成总额近20亿美元融资;3月开启的180亿美元估值轮次份额需排队获取 [14][20] - 业务发展受算力制约,市场需求尚有10倍未被满足,部分大厂接入Kimi模型需通过预购获取额度 [21] 中国AI公司发展路径对比 - DeepSeek走极致能效比路线,自研MLA与MoE架构,在2025年凭借DeepSeek R1模型取得突破,为行业带来信心 [23] - Kimi的发展并非一蹴而就,其在2025年初发布Moonlight系列小型MoE模型验证二阶优化器技术,最终应用于K2模型,其采用的Muon优化器已取代沿用10年的Adam,成为行业新标准 [24] - 两家公司均展现出不相信市场格局已定、坚信技术是最大变量、敢于追逐AGI的特质 [25]
不加算力,只改一个算法:Muon在万亿MoE模型中最高2倍加速
机器之心· 2026-03-31 17:00
算法核心创新 - 提出Gram Newton-Schulz方法,核心思想是将迭代计算从原始矩阵X(维度n×m)转移到其更小的Gram矩阵XX^⊤(维度n×n)上进行,从而显著降低计算量并利用对称矩阵的计算优化[3][16] - 该方法是标准Newton-Schulz迭代的数学等价形式重构,主要作用在n×n空间,旨在解决大模型训练中优化器的计算瓶颈[5][15] 技术实现与优势 - 通过将问题转化为对Gram矩阵R进行多项式迭代来近似Y^-1/2,实现了维度从n×m降至n×n,并能够使用高效的对称矩阵乘法GPU kernel,减少了低效的矩形矩阵通用乘法次数[5][18] - 在常见情况(α>1)下,Gram方法比标准方法计算量更低,浮点运算次数最高可降低约42%–58%[29] - 针对半精度下的不稳定性问题,提出了包含重启策略的稳定化版本,在保持算法稳定性的同时仍比原算法更快[5][19][23][27] 性能提升效果 - 在万亿参数稀疏MoE模型Kimi K2的训练中,使用Gram Newton-Schulz替代标准Newton-Schulz,可将优化器步骤时间降低40–50%[1] - 在NVIDIA H100和B300硬件平台上,于Kimi K2的流水线并行配置中,Gram Newton-Schulz的速度是标准Newton-Schulz的2倍[31][33] - 该方法作为Muon优化器中Newton-Schulz的即插即用替代方案,在验证集困惑度上几乎无变化,误差在0.01以内,实现了精度无损的加速[6]
进入2026年,AI开始显露残酷一面
36氪· 2026-02-11 07:37
AI行业未来生态格局展望 - 行业可能呈现三级生态格局:第一级是通用AI助手,提供基础能力;第二级是垂直领域的AI服务;第三级是提供个性化细分技能的庞大创造者群体 [1][7] - 2025年的AI硬件创新主要为“大脑和身体”构建物理载体,例如阿里的夸克AI眼镜、千问个人助手以及豆包AI手机 [7] - 2026年将见证更多AI硬件产品出现,不仅承载基础能力,还可能承载垂直领域的AI服务,如3D打印机、桌面机床、健康监测手表和戒指等 [9] 2025年行业趋势回顾与特征 - 2025年行业趋势快速诞生与轮换:年初DeepSeek引发全民AI热潮,上半年Agent创业火热,下半年Sora2、Gemini3、Kimi K2等模型轮番登场,年末有红包大战和Seedance2.0刷屏 [3] - 用户习惯迅速AI化:AI助手对传统搜索的替代加速,许多人已习惯向AI获取答案;入口与垂类Agent的组合正在蚕食传统“App+算法推荐”的领地 [4] - 明星产品生命周期短暂:承接DeepSeek红利的元宝经历短暂爆发后沉寂,Fellou和Youware也快速淡出舞台中心,行业变化极快 [5] - 部分趋势未完全验证:大模型发展未进入平台期,基础模型创新仍是重要变量;一人公司或超级个体时代尚未完全到来 [6] 2026年行业发展趋势预测 - 软硬件领域将出现创新尝试爆发,通过快速汰换寻找真正具备实用价值的产品市场匹配 [6] - 大厂更确定性的资源投入将加速某些赛道的淘汰进程,甚至奠定入口之争的最终格局 [6] - 非大厂赢得竞争的关键在于获得时间差,通过更前置的用户沟通和更定制化的迭代优化来建立高忠诚度用户圈子 [6] - AI工具的优化升级将带来更繁荣的创造生态,每个框架型AI产品都可能聚拢一个垂直的创造者生态 [6] 大厂战略布局与竞争态势 - 字节跳动在2025年全面释放AI转型力量:豆包日活破亿,豆包大模型日均Tokens使用量超63万亿,Seedance2.0和SeeDream4.0实现能力跃升 [10] - 阿里巴巴通过整合促发展:在to C领域进行AI化整合,推出夸克AI眼镜和千问,并以此支撑其参与入口决赛 [12] - 腾讯通过关键人物调整寻求突破:投入资源提升元宝市场占有率,并期待通过更新AI领军人物或微信找到拥抱AI时代的方式 [12] - 百度进行业务调整以维持牌桌地位:新设基础模型与应用模型研发部,合并文库和网盘成立个人超级智能事业群组,并在春节投入5亿元红包将用户迁移向文心助手 [12][13] - 2026年大厂竞争将更激烈,创始人表态成为关键风向标,各公司均强调AI业务的重要性 [13] 垂类AI服务与创业公司机会 - 垂类企业和创业公司聚焦AI服务生态第二级机会:京东、美团、滴滴等推出Agent化服务,如京东AI购、美团小美AI点外卖、滴滴出行Agent [14] - AI创业公司和超级个体在细分领域寻找机会:涵盖AI玩具、AI视频、AI眼镜等领域,例如Ropet、可豆陪陪、可灵、微光科技等 [14] - 成功的关键在于强化两种能力:搭建垂类服务框架的能力(如奇点灵智的多奇产品)以及习惯“Build in Public”(公开构建)的前置用户沟通能力 [15][17] - “Build in Public”模式通过社区沟通(如AMA)获取反馈,降低试错成本,快速验证需求,并构建用户忠诚度以应对大厂竞争 [17] AI赋能内容与创造者生态 - AI推动内容创作领域繁荣:可灵、Vidu等AI视频模型支撑AI漫剧发展,可灵3.0服务专业创作者,Seedance2.0提供面向C端的新视频体验 [18] - AI工具降低多领域创造门槛:线上,秒哒、灵光等产品允许用一句话生成轻应用;线下,AI 3D模型发展降低设计3D打印图的门槛 [19] - AI将催生庞大的第三级创造者群体:他们分散、非持续产出,负责用AI搭建满足极致细分个性化需求的技能或服务,其产出可能替代线上小程序的作用 [19] - AI带来的新创造工具让普通人拥有“爱迪生时刻”,创造力得到极大释放 [19]
黄仁勋2026大模型座上宾:杨植麟
36氪· 2026-02-03 19:44
英伟达GTC大会嘉宾选择与趋势背书 - 2026年GTC大会,月之暗面创始人兼CEO杨植麟是唯一一位来自独立大模型创业公司的演讲嘉宾,这被视为英伟达的观察和背书[1][6] - 英伟达GTC嘉宾席位具有风向标意义,黄仁勋的邀请基于对即将爆发趋势的洞察,过往嘉宾选择被证明是准确的趋势预言[6][7] - 2023年GTC邀请OpenAI首席科学家Ilya Sutskever,为生成式AI盖章,随后一年成为科技公司焦点[7] - 2024年GTC主题转向“本体”,宇树科技机器人等登上Keynote舞台,标志着资本对机器人领域的关注[9] - 2025年GTC风向从机器人“能走”进化到“能干活”,具身智能赛道爆发[11] 杨植麟与月之暗面(Kimi)的发展路径 - 2024年月之暗面风光但危险,Kimi与字节跳动豆包在App端形成双寡头,但过度依赖融资和广告的商业模式存在隐患[15] - 2025年DeepSeek以极低推理成本冲击行业,严重挤压Kimi日活数据,使其商业模式岌岌可危[15] - 面对冲击,公司砍掉单季度数亿元的营销预算,进行172天技术闭关,退出营销竞争回归硬核技术[17] - 2025年7月发布并开源Kimi K2模型,采用1T参数和MoE架构,在代码和Agent能力上达到SOTA水平[18] - 2026年1月发布Kimi K2.5,通过强化学习获得调度上百智能体的Agent Swarm能力,在HLE-Full、BrowseComp等测试中超越GPT-5.2、Claude 4.5 Opus等旗舰闭源模型[18] - 2025年底公司完成5亿美元C轮融资,投后估值达43亿美元,现金储备超过100亿元人民币[21] - 公司选择以技术、开源和模型能力重回聚光灯,获得开发者推崇,Kimi K2.5在开源社区成为抱抱脸上第一名[18][21] AI行业发展趋势与英伟达的叙事转变 - 2026年AI行业面临新痛点,单纯堆算力的“大力出奇迹”模式让人疲劳,英伟达需要新故事证明算力可用于高强度深度思考[14] - 杨植麟及其Kimi K2.5因专注于推理效率,成为英伟达展示算力新用途的“样板间”[14] - 2026年初大模型创业出现分水岭,智谱和MiniMax实现港股IPO,而月之暗面获得大额融资并专注于长远AGI目标[21] - 具身智能在2025年从单点开花变为全赛道爆发,银河通用等公司成为投资热点[11] - 银河通用作为泛化智能代表,成为英伟达机器人平台Isaac的落地案例[16]
黄仁勋2026大模型座上宾:杨植麟
量子位· 2026-02-03 18:35
文章核心观点 - 月之暗面创始人杨植麟被选为英伟达2026年GTC大会主会演讲嘉宾,这被视为英伟达对AI行业新趋势的洞察和背书,表明其关注点正从“大力出奇迹”的训练转向高强度的深度思考与推理效率 [1][7][27][28][29] - 杨植麟及月之暗面在2025年经历DeepSeek的低成本推理冲击后,通过回归硬核技术路线、大幅削减营销、专注模型研发与开源,成功以K2和K2.5模型重新赢得市场信任和技术领先地位,并获得了巨额融资 [33][34][37][38][44][46] - 英伟达GTC大会的嘉宾选择具有强烈的风向标意义,黄仁勋通过邀请特定领域的代表,提前揭示未来12个月的产业趋势,如2023年的生成式AI、2024-2025年的机器人/具身智能,而2026年则指向推理效率 [11][12][13][17][22][23][30] 根据相关目录分别进行总结 GTC嘉宾选择与行业风向标意义 - 杨植麟是2026年英伟达GTC大会嘉宾中唯一来自独立大模型创业公司的代表 [2] - 过往GTC嘉宾选择精准预示了产业趋势:2023年邀请OpenAI的Ilya Sutskever为生成式AI盖章;2024-2025年聚焦机器人/具身智能,如宇树科技、银河通用,后者成为英伟达Isaac平台的落地案例 [13][14][17][23][24] - 英伟达的嘉宾邀请基于其生态位优势,旨在洞察即将爆发的趋势,并为未来12个月寻找“卖显卡的最佳代言人” [7][11][12] 月之暗面(Kimi)的发展历程与技术转型 - 2024年月之暗面风光但危险,Kimi与字节跳动豆包在App端形成双寡头,但过度依赖融资和营销埋下隐患 [31][32] - 2025年春节,DeepSeek以极低推理成本冲击行业,严重挤压Kimi的日活数据,使其商业模式岌岌可危 [33][34][35] - 面对冲击,公司创始人杨植麟选择回归技术,砍掉单季度数亿元的营销预算,进行为期172天的技术闭关 [37] - 2025年7月,公司通过发布并开源1T参数、MoE架构的K2模型,在代码和Agent能力上达到SOTA,重新证明技术实力 [38][39] - 2026年1月,发布K2.5模型,通过强化学习获得单次调用调度上百智能体的Agent Swarm能力,在多项测试中超越GPT-5.2、Claude 4.5 Opus等旗舰闭源模型 [41][42] 公司近期资本表现与战略定位 - 2025年底,月之暗面完成由IDG资本领投、阿里与腾讯超额跟投的5亿美元C轮融资,投后估值达43亿美元 [46] - 此轮融资使公司现金储备超过100亿元,为持续研发和争夺全球SOTA提供了充足资金支持 [46] - 相较于同赛道智谱和MiniMax的港股IPO,公司选择了以融资强化技术实力的路径,表达了追逐AGI的长远雄心 [46] - Kimi K2.5模型在开源社区(如抱抱脸)获得了开发者的广泛认可,位居榜首 [44][46] 2026年AI行业趋势推断 - 英伟达通过邀请杨植麟,暗示AI行业的新痛点和故事已从大规模训练转向推理效率和高强度深度思考 [28][29][30] - 在算力硬件需求背景下,能够展示如何高效利用算力进行深度思考的团队成为英伟达需要的“样板间” [30] - 黄仁勋在2026年初的中国行异常低调,未组织客户饭局,直到GTC嘉宾公布才揭示其新的关注方向 [47][48]
Kimi海外收入已超国内,要做“Anthropic + Manus”|智能涌现独家
36氪· 2026-02-02 08:06
公司近期业绩与市场表现 - 公司新一代模型K2.5发布后,全球付费用户在短短几天内实现了4倍增长 [2][3] - 公司的海外收入已超过国内收入,且自2025年11月以来,海外API收入增长4倍,海外和国内付费用户数月度环比增速超过170% [2][7] - 在第三方平台OpenRouter上,K2.5模型排名第三,处理了69.9B tokens,市场份额为13% [4][6] 新一代模型K2.5的技术特点与能力 - K2.5是公司迄今最智能的模型,采用原生多模态架构,能力覆盖视觉理解、代码生成、Agent集群、思考与非思考模式 [7] - 模型在HLE、BrowseComp、SWE-Bench Verified等基准测试中达到开源SOTA,部分指标超越GPT-5.2、Claude Opus 4.5等闭源模型 [7] - K2.5的核心创新在于探索Agent集群,可调度多达100个Agent并行处理1500个步骤,在大规模信息收集场景下将效率提升3到10倍 [9] - 公司选择对标Anthropic,专注基础模型智能上限,并从K2开始将模型权重和工具链全部开源 [10] 公司的技术路线与战略定位 - 公司技术迭代路径清晰:从K1.5专注长文本,到K2提升Agent任务能力,再到K2.5实现AI“团队作战” [8][9] - 公司采用Agent Swarm(集群)路线,以应对高质量数据增长不及算力增长的挑战,并将其视为一种扩展方式 [10] - 公司团队规模约300人,仅为不少大厂的十分之一,目标是“用1%的算力资源,研发出全球领先模型” [10] - 公司在算法和效率上持续创新,例如在全球首个于大规模LLM训练中跑通Muon优化器、自研线性注意力机制Linear [11] 产品布局与商业化策略 - 公司产品布局清晰:API端面向开发者,通过Kimi API开放平台吸引全球开发者;C端明确做生产力工具的定位 [11][12] - 公司专注于大模型层、逻辑层、Agent层,以及深入研究、PPT、数据分析、网站开发等偏生产力、偏复杂任务的链路 [14] - 公司正在将C端产品做得更通用且有品味,例如将内测的Agent产品“OK Computer”更名为“Kimi Agent”,并根据不同主题进行风格化 [12] - 产品注重复杂场景中的可编辑性,如在生成PPT、用Excel生成动画后,用户可自动拆分元素进行编辑 [14]
TikTok Shop推出“地平线项目”:拉动美区千万美元年销额品牌入驻;iPhone Air三个月跌近3000元丨Going Global
创业邦· 2026-01-25 18:33
TikTok Shop与Temu的电商动态 - TikTok Shop在美国推出“地平线项目”新招商计划,致力于吸引知名成熟品牌入驻,目标是号召100家电商代运营机构,每家负责招募数十个在亚马逊和Shopify等其他平台上年销售额至少达到1000万美元的品牌,若机构成功招募至少30个品牌且这些品牌在TikTok Shop上的总销售额到2026年底达到5000万美元,TikTok将给予奖励[4] - 国际邮政公司报告显示,2024年亚马逊市场份额下滑至25%,2025年Temu与亚马逊两家平台几乎平分秋色,合计占据全球跨境电商市场半壁江山[5] - 报告调查涵盖全球37个国家约3.1万名高频跨境网购用户,指出中国电商出口尤其是Temu平台业务显著增长,另一家中国零售巨头希音2025年市场份额稳定在9%,阿里巴巴旗下速卖通份额为8%[7] 阿里巴巴相关公司动态 - 阿里巴巴正计划重组旗下芯片公司平头哥半导体并支持其未来独立上市,该公司成立于2018年9月,拥有覆盖云端与终端的全栈产品体系,2021年发布首款通用服务器芯片倚天710,其性能较同期业界标杆提升超20%,能效比提高超过50%[9] - 阿里巴巴集团CEO吴泳铭曾宣布将在未来三年投入超过3800亿元用于云与AI硬件基础设施建设,平头哥作为阿里系AI芯片研发商,分拆上市将为其在激励机制、融资能力及对外合作等方面提供更大空间[9] 消费与零售公司动向 - 国内零食行业龙头鸣鸣很忙正式启动港股招股,计划发行1410.11万股H股,募资净额最高可达约33.4亿港元,按2024年商品交易总额计,公司是中国最大的休闲食品饮料连锁零售商[10] - 鸣鸣很忙旗下拥有“零食很忙”与“赵一鸣零食”两大品牌,业务模式以加盟为主,截至2025年9月30日,门店总数高达19517家,覆盖中国28个省份和所有县级城市,其中约59%位于县城及乡镇[11] - 喜茶2025年度报告显示,其已在海外32个城市开出100多家门店,2025年2月在美国纽约时代广场开设首家海外LAB店,海外市场研发推出了30多款原生产品,海外销量排名前十的产品中有近一半为海外原生产品[13] - 在国内市场,喜茶2025年减少了联名次数,仅推出2次联名活动,同时对130多家门店进行批量重装,并于2025年2月宣布暂停新加盟申请[13] 人工智能与科技行业进展 - 月之暗面Kimi总裁张予彤透露,Kimi很快会发布一个新模型,其仅使用美国顶尖实验室1%的资源就开发出全球领先的开源模型,甚至在部分性能上超越美国的顶尖闭源模型[14][17] - Kimi是全球首个在大型语言模型训练中跑通Muon优化器的公司,其自研的线性注意力机制在处理速度上已显著超越传统的全注意力系统[17] - 张予彤分析了中国在AI竞赛中的三大驱动力:庞大的制造业与零售业提供使用场景、用户与企业对提升生产力的新工具拥抱意愿高、“基建先行”思维模式确保前沿创新不受能源瓶颈阻碍[17] 消费电子与半导体行业动态 - iPhone Air国行版上市三个月,官方价格从7999元起降至5499元起,叠加优惠后第三方平台到手价约5099元,意味着其全新机价格三个月下跌了2900元[19] - iPhone Air是苹果主打超轻薄的新机型,重量仅165克,厚度仅5.6毫米,但有分析指出其销量仅为苹果最高预期的约三分之一,导致苹果在上市仅几周后就将生产计划削减了一半[21][22] - 全球内存巨头SK海力士向全体员工发放人均超1.36亿韩元(约合64万元人民币)的绩效奖金,创公司成立以来最高纪录,其2025年第三季度销售额达24.45万亿韩元,同比增长39%,营业利润11.38万亿韩元,同比增长62%,利润率飙升至47%[23] - 自2025年7月起,DDR5内存价格涨幅超300%,服务器用高端内存条单价逼近5万元,HBM价格突破5000美元/颗[23] - 英伟达CEO黄仁勋今年首度来华,现身上海陆家嘴街道菜市场并参加英伟达上海年会,此前有报道称美国放宽了对英伟达H200芯片出口到中国的监管规定,将由美国商务部负责审批和安全审查[24][26]
慕了!内存芯片巨头年终奖人均64万;32岁程序员猝死背后公司被扒,曾给39万“封口费”;马斯克曝星舰成本将降99%,商业航天受捧|AI周报
AI前线· 2026-01-25 13:33
半导体与芯片行业 - 全球内存芯片巨头SK海力士宣布向全体员工发放人均约1.36亿韩元(约合64万元人民币)的绩效奖金,创公司历史最高纪录[2] - SK海力士为员工提供“股东参与计划”,员工可选择将年终奖的最多50%以公司股票形式领取,持有一年后将获得相当于购买金额15%的额外现金奖励[2] - 根据新协议,SK海力士绩效奖金发放最高限额1000%的规定被废除,改为以上一年度营业利润的10%作为年终奖,其中80%当年发放,20%分两年递延发放并享受每年10%的利息[3][4] - 鉴于SK海力士去年全年营业利润预计达45万亿韩元,员工总数3.3万人,预计每位员工绩效奖金约为1.36亿韩元[4] - 韩国国会正在推进《公司法第三次修订案》,若法案通过,企业将无法用自有股开展员工激励,本次持股计划或面临调整甚至取消[4] - 得益于人工智能热潮,SK海力士的股价在2025年内涨幅达275%,且公司表示其2026年的全部芯片产能已售罄[4] - 传阿里巴巴集团已决定支持旗下芯片公司平头哥未来独立上市[14] - 平头哥在算力芯片领域推出AI推理芯片含光800、CPU倚天710以及AI芯片PPU,在存储芯片领域推出SSD主控芯片镇岳510,在网络芯片领域也将推出相关芯片,已布局数据中心全栈芯片[14] - 平头哥在端侧芯片推出羽阵IoT芯片,已实现数亿出货,布局覆盖云端和终端[14] 人工智能与大型模型 - 月之暗面Kimi总裁张予彤表示,Kimi仅使用美国顶尖实验室1%的资源,就开发出Kimi K2、Kimi K2 Thinking等全球领先的开源模型,甚至在部分性能上超越美国的顶尖闭源模型[5] - Kimi在最新一轮融资中估值达到48亿美元(约合330亿元人民币),较几周前的43亿美元有所上升,由于市场需求旺盛,此轮融资可能很快完成[5] - DeepSeek在官方GitHub仓库更新代码,一个名为“Model 1”的模型引起关注,它很可能是传闻中将于春节前后发布的新模型代号[24] - Model 1是DeepSeek FlashMLA中支持的两个主要模型架构之一,另一个是DeepSeek-V3.2,它可能是一个高效推理模型,内存占用更低,适合边缘设备或成本敏感场景,也可能是一个针对16K+序列优化的长序列专家[25] - 阿里巴巴推出名为“呜哩”的AIGC创意设计生产力平台,深度整合了通义千问团队研发的多款图像大模型,包括Qwen Image25.12生成模型、Qwen Image Turbo模型和Qwen Image25.11编辑模型[26] - 百川智能正式发布Baichuan-M3 Plus医疗大模型,凭借独创的六源循证技术,将幻觉率降低至2.6%,达到全球最低水平,并首创“证据锚定”技术[27] - 微软正邀请全球用户测试Copilot的Real Talk功能,并开始测试视频生成能力,以应对竞争[28] - 在安卓版Copilot中已发现“生成视频”功能开关,可创建最长8秒且包含音频的视频片段[29] - 文心App近期将启动交互界面改版,新增“多人、多Agent群聊”功能,支持用户在同一群聊中调动多个AI角色[30] - 预计今年2月,文心App还将新增支持群聊内布置日程提醒,支持自定义助手人设和回复风格,支持图生图能力和特色玩法类Agent[30] - OpenAI计划于2026年下半年推出其首款硬件设备,该设备旨在创造一种宁静体验,让用户能专注于真正重要的事情[22] - OpenAI将为旗下ChatGPT个人版推出年龄识别模型,以识别未满18周岁用户的账号[38] - 苹果公司于2025年11月在内部推出名为Enchanté的类ChatGPT聊天机器人,以及名为“企业助手”的知识中心应用[36] - Enchanté仅运行苹果批准的模型,且完全在本地或私有服务器上运行,能协助员工完成创意构思、代码开发和校对工作,还能深度分析文档和图像[36] - “企业助手”应用完全基于苹果内部的大语言模型构建,整合了海量的内部政策与技术文档[37] 汽车与出行科技 - 德国大众汽车计划削减管理岗位并整合生产平台,目标是到2030年节约10亿欧元[10] - 大众计划在2026年夏季前将核心品牌集团的董事会成员数量减少约三分之一,从29个减少到19个[10][11] - 到2030年,大众将在德国削减3.5万个工作岗位[11] - 特斯拉首席执行官埃隆·马斯克表示,SpaceX今年的目标是实现“星舰”的完全可重复使用,若达成该目标,将使进入太空的成本降至当前的1%(每磅100美元以下)[16] - 马斯克提及未来两到三年计划发射太阳能驱动的人工智能卫星,由于太空中太阳能持续充足且无大气干扰,太阳能电池板效率将是地球的五倍[16] - 马斯克透露特斯拉计划明年年底向公众销售人形机器人Optimus,目前该机器人已在工厂执行简单任务,预计今年年底将具备更复杂功能[16] - 马斯克称自动驾驶汽车“基本是已解决的问题”,特斯拉“全自动驾驶”软件每周都会更新,部分保险公司已为使用该技术的客户提供半价保险[16] - 特斯拉已在美国多个城市推出自动驾驶出租车服务,计划今年年底在美国大规模推广,欧洲则有望下月获得全面自动驾驶监管批准[16] - 特斯拉中国官网发布Tesla Bot摆件(生肖盲盒版),售价199元,以1:10比例打造,由40多个独立零件组成[33] 互联网与社交媒体 - 腾讯要求GitHub全面下架一批涉及“允许用户导出或分析自己微信聊天记录”的微信开源项目[12] - 腾讯回应称,部分读取微信聊天记录的开源项目通过逆向工程等手段破解本地数据库密钥,威胁用户及第三方数据隐私与客户端安全,且易被黑灰产利用[12] - 苹果就Siri“非法且故意录音”集体诉讼达成和解,赔付总价值9500万美元,每名用户最多可申报5台设备,最终每台设备赔付约8.02美元,单人最多获赔40.1美元[13] - TikTok宣布成立TikTok美国数据安全合资有限责任公司,负责TikTok美国的数据保护等业务,字节跳动继续拥有TikTok算法知识产权并授权其使用[19] - 合资公司中,甲骨文、银湖资本、MGX各持股15%,字节跳动保留19.9%股份为最大单一股东[19] - 马斯克宣布正式开源新的X平台推荐算法,该算法由与xAI的Grok模型相同的Transformer架构驱动[31] - 完整代码已发布在GitHub上,并将每4周更新一次,用户的推荐内容会结合关注账号的帖子与X上发现的帖子,然后使用基于Grok的转换器进行排序[32] 商业航天 - 演员黄景瑜以“009号太空游客”身份官宣成为中国首批商业航天太空旅客,计划2028年搭乘国产可重复使用载人飞船飞赴亚轨道太空[20] - 商业航天公司穿越者已开启船票预售,预售船票300万元/张,预付10%可锁定名额,目前已签约来自多领域的十余位付费太空游客[20] - 穿越者自主研制的穿越者壹号载人飞船试验舱,完成着陆缓冲系统的综合验证试验,成为全球第三家研发并验证了载人飞船着陆缓冲技术的商业航天企业[21] - 穿越者成立于2023年1月,是中国首家商业的“载人航天科技”有限公司,专注可重复使用载人飞船研制和太空旅游运营,计划2028年前后实现太空旅游[21] 企业动态与职场 - 32岁程序员高广辉因长期工作强度大、频繁熬夜,在身体不适晕倒送医后抢救无效死亡[6] - 高广辉所在公司实行“弹性工作制”却无加班费,他需同时承担多项职责,入职7年底薪始终3000元,依赖“多劳多得”维持税前2.9万元月薪,且面临每季度末位淘汰压力[6] - 事发后,公司向家属支付39万元“人道主义抚恤金”,但附带“负面评价需支付50万违约金”的条款,并要求全体员工不得提及此事,且不配合工伤认定相关调查[7][8] - 英伟达CEO黄仁勋现身上海菜市场,此前他到访了英伟达位于上海的新办公室,与员工见面[9] - 手机厂商vivo叫停了已秘密筹备半年的AI眼镜项目,原因是高层判断其“在当下很难做出差异化”,公司将继续聚焦混合现实方向[38]
Kimi将发布新模型,月之暗面估值飙升至48亿美元
21世纪经济报道· 2026-01-23 16:38
公司动态与融资进展 - 月之暗面总裁张予彤在达沃斯世界经济论坛2026年年会上表示,公司很快将发布一个新模型 [1] - 公司正在敲定新一轮融资,投前估值达到48亿美元(约合人民币334.13亿元),较几周前的C轮融资估值43亿美元(约合人民币299.32亿元)有所提升,市场需求旺盛导致投资者兴趣激增 [4] 公司技术研发与效率 - 公司仅使用了美国顶尖实验室1%的资源,便成功研发出了Kimi K2以及Kimi K2 Thinking等全球领先的开源大模型,在部分关键性能指标上超越了美国的顶尖闭源模型 [1][9] - 公司将工程化思维深度融入研究环节,是全球首个在大型语言模型训练中跑通Muon优化器的公司,其自研的线性注意力机制(Kimi Linear)在处理速度上显著超越传统全注意力系统 [9] - 公司清醒地认识到中国初创公司没有随意堆砌算力的条件,这倒逼企业将精力聚焦于基础研究创新以换取极致的研发效率 [9] 中国AI产业的核心优势 - 规模化市场的场景赋能:中国庞大的制造业与零售业为AI技术提供了海量的落地场景,海量数据与复杂业务逻辑的深度融合让企业能够在真实生产环节中构建可扩展的系统 [6] - 社会层面的技术包容度:中国用户与企业对提升生产力的新工具展现出极高的接纳意愿,对技术的开放性和拥抱新技术的态度是独特的优势 [6] - 基建先行的底层支撑:中国在电力供应、跨区域高速公路及巨型数据中心等领域的持续投入,有效降低了能源获取成本,领先的数字基建为技术突破提供了稳固保障 [7] AI技术发展趋势与影响 - 随着AI推理成本在过去一年下降99%至99.9%,“智能”将成为一种新的通用语言,未来的软件将走向“无形化”,人类将通过自然语言由智能体调用各类功能 [10] - 未来的代码创作将进入“氛围编程”阶段,只要用户意图清晰,AI就能即时生成个性化工具并交付结果,软件将变得随手可得且“可丢弃” [10] - AI正在重构劳动力市场与企业组织架构,例如月之暗面仅约300人的规模就支撑起底层模型研发与数千万用户的应用运营,不到10人的应用公司凭借数百个智能体实现了极高的运营杠杆,未来的原生AI组织将更看重员工的通用智能与学习能力 [10] - AI让专业技能平权化,释放了个体创造力,例如简历中PDF格式占比大幅下降,取而代之的是个人借助AI生成的个人网站链接 [9] 行业宏观观点 - NVIDIA创始人兼首席执行官黄仁勋将AI描述为“人类历史上规模最大的基础设施建设”的基础,并将AI描述为涵盖能源、芯片和计算基础设施、云数据中心、AI模型以及最终应用层的“五层蛋糕” [10] - 黄仁勋指出,当前资本主要流向底层基础设施,而非投机性应用,这不是泡沫,这是产业重建,同时由于运行和训练人工智能需要建设数据中心,相关技术工人(如水管工、电工和建筑工人)将能拿到“六位数薪资” [10]
Kimi将发布新模型,月之暗面估值飙升至48亿美元
21世纪经济报道· 2026-01-23 16:33
公司动态与融资进展 - 月之暗面总裁在达沃斯论坛上表示,公司很快将发布一个新模型 [1] - 公司正在敲定新一轮融资,投前估值达到48亿美元(约合人民币334.13亿元),较几周前C轮融资的43亿美元(约合人民币299.32亿元)估值有所提升 [3] - 市场需求旺盛导致投资者兴趣激增,此轮融资预计将很快完成交割 [3] 技术研发与效率优势 - 公司仅使用了美国顶尖实验室1%的资源,便成功研发出了Kimi K2以及Kimi K2 Thinking等全球领先的开源大模型 [1][5] - 在部分关键性能指标上,这些模型甚至超越了美国的顶尖闭源模型 [1][5] - 公司将工程化思维深度融入研究,是全球首个在大型语言模型训练中跑通Muon优化器的公司 [5] - 公司自研的线性注意力机制(Kimi Linear),在处理速度上显著超越传统全注意力系统 [5] 中国AI产业的核心优势 - 规模化市场的场景赋能:中国庞大的制造业与零售业为AI技术提供了海量的落地场景,海量数据与复杂业务逻辑的深度融合推动技术高效迭代 [4] - 社会层面的技术包容度:中国用户与企业对提升生产力的新工具展现出极高的接纳意愿,对技术的开放态度是独特优势 [4] - 基建先行的底层支撑:中国在电力供应、跨区域高速公路及巨型数据中心等领域的持续投入,降低了能源成本,为技术突破提供保障 [4] AI行业趋势与影响 - AI推理成本在过去一年下降了99%至99.9% [5] - “智能”将成为一种新的通用语言,未来的软件将走向“无形化”,人类可通过自然语言由智能体调用各类功能 [5] - 未来的代码创作将进入“氛围编程”阶段,AI能根据用户意图即时生成个性化工具 [6] - AI正在重塑劳动力市场与企业组织架构,例如月之暗面仅约300人规模就支撑起底层模型研发与数千万用户的应用运营 [6] - 未来的原生AI组织将更看重员工的通用智能与学习能力,弱化机械的职能分工 [6] - NVIDIA创始人黄仁勋将AI描述为“人类历史上规模最大的基础设施建设”的基础,涵盖能源、芯片、计算基础设施、云数据中心、AI模型和应用层 [6] - 黄仁勋指出,当前资本主要流向底层基础设施,而非投机性应用,这不是泡沫,是产业重建 [6]