K2.5
搜索文档
DeepSeek之后,智源大模型登Nature:事关“世界模型”统治路线
36氪· 2026-02-02 08:22
核心观点 - 北京智源人工智能研究院研发的“悟界·Emu3”多模态大模型在《自然》正刊发表,这是中国首篇围绕多模态大模型路线的Nature论文,标志着中国在AI基础研究领域的原始创新获得国际顶级学术认可 [1] - 该模型的核心突破在于仅采用“预测下一个token”的自回归路线,实现了文本、图像和视频的统一学习与生成,其性能可与针对特定任务设计的专用模型相媲美,为构建统一、可扩展的多模态智能系统提供了新范式 [3][10] - 该技术路线因其架构极简,被认为具备强大的扩展潜力,能有效降低大模型研发门槛和成本,对推动原生多模态助手、世界模型及具身智能等产业发展具有重大意义 [4][34] 技术突破与架构创新 - **统一的技术路线**:Emu3开创性地仅采用“预测下一个token”的自回归路线,将图像、文本和视频统一离散化到同一表示空间,并联合训练单一的Transformer,实现了多模态的统一学习与生成 [10] - **极简的架构优势**:模型保留了Llama-2等大语言模型的解码器架构,主要修改在于扩展嵌入层以容纳离散视觉标记,这种极简架构简化了多模态AI设计,减少了研发复杂性和潜在错误 [4][35] - **框架核心组件**:包含五个紧密集成的组件:1)大型混合多模态训练数据集;2)统一的标记器(视觉分词器);3)基于Transformer的仅解码器架构;4)两阶段优化方案(预训练与后训练);5)高效的推理后端 [35][37] 模型性能表现 - **图像生成**:在MSCOCO-30K23等基准测试中,Emu3得分70.0,超越了SD-1.5(59.3)和SDXL(66.9)等扩散模型 [3][4] - **视觉语言理解**:在相关测评中得分62.1,略高于LLaVA-1.6(61.8) [3][4] - **视频生成**:在VBench评分中达81.0,超过Open-Sora-1.2(79.8) [3][4] - **综合竞争力**:在文生图任务上,其CLIP-I得分0.689,CLIP-T得分0.313,综合得分(Overall)0.66,与DALL-E 3(0.67)和FLUX.1(Dev)(0.66)等先进模型相当 [13][14] - **视频扩展能力**:可原生生成24帧/秒的5秒视频,并通过自回归方式预测未来帧进行扩展,在与其他视频扩散模型的对比中展现出强竞争力 [25][29][30] 研发历程与产业影响 - **研发背景与挑战**:项目于2024年2月由约50人团队立项,旨在验证自回归路线能否统一多模态,面临技术路径质疑、资源竞争及“多模态能否提升模型智能”等未定论的挑战 [8][12] - **持续迭代与升级**:“悟界·Emu”系列持续迭代,2024年10月发布的Emu3实现了统一多模态理解与生成;2025年10月发布的Emu3.5进一步升级为多模态世界模型,实现了从“预测下一个token”到“预测下一个状态”的能力跃迁 [6][34][42] - **对产业的影响**:模型发布两年多以来,已对多模态领域产生显著影响,推动了产业发展脉络,其极简统一的架构有望降低研发门槛和成本,具有重大的产业应用前景 [12][34] 机构背景与行业地位 - **智源研究院的贡献**:智源研究院自2018年创立以来,持续聚焦大模型原始创新,2021年发布中国首个大语言模型“悟道1.0”,被称为“大模型的黄埔军校” [40] - **开源开放理念**:智源始终坚持开源开放,已开源200多款模型,全球下载量超7.6亿次,并开源180多个数据集,下载量超500万次,有力促进了开源生态和产业链发展 [43] - **北京AI产业生态**:作为“大模型第一城”和“开源之都”,北京通过政策支持与扎实投入,培育了包括智源、智谱、百度、月之暗面等在内的领先AI机构,在AI基础研究领域展现出深远价值 [44][45]
Kimi海外收入已超国内;唐宁街10号官宣:泡泡玛特欧洲总部将设在伦敦丨Going Global
创业邦· 2026-02-01 18:09
出海四小龙 - TikTok Shop东南亚跨境电商推出“春节不打烊”专项激励计划,针对行业在管重点商家完成指定GMV、直播等任务提供500美元激励,并有机会瓜分平台20万美元券补,其他商家完成短视频发布、广告投流等任务可获得满减券、广告金等多重补贴 [5] - 速卖通AliExpress在美国市场2025全年网站访问量同比增长18.7%,成为美国增速最快的十大平台之一,并在英国、德国等多个发达国家市场跻身综合平台增速前十 [5][6] 大公司 - 泡泡玛特宣布将伦敦定为欧洲总部所在地,计划在英国新增伯明翰、卡迪夫及伦敦牛津街旗舰店等7家线下门店,并在欧洲各地拓展20家门店,相关投资预计为英国创造超150个就业岗位 [7][9] - 安踏体育宣布与Groupe Artémis达成购股协议,将收购彪马所属公司PUMA SE 29.06%的股权,成为其最大股东,交易预计于2026年底前完成 [12] - 平头哥“真武”PPU芯片总出货量已达数十万片,其整体性能与英伟达H20相当,已实现多个万卡集群部署,服务了国家电网、中国科学院、小鹏汽车、新浪微博等400多家客户 [10] - Kimi公司海外收入已超过国内收入,新模型K2.5发布后,全球付费用户实现4倍增长,在Openrouter上排名第三,公司近期完成5亿美元C轮超募融资,估值达43亿美元,新一轮融资投前估值达48亿美元 [12][13] - 比亚迪将与越南汽车制造商金龙汽车合作,在越南中部投资1.3亿美元建立工厂用于生产商用电动汽车电池,工厂占地面积4.4公顷,年发电量可达3吉瓦时,第二阶段计划扩大至10公顷,产能提升至每年6吉瓦时 [17] 海外大公司/大事件 - 英伟达创始人黄仁勋与94岁的台积电创始人张忠谋在中国台湾省会面并共进晚餐,这是张忠谋时隔一年多的首次公开露面 [19][22] - SpaceX向美国联邦通信委员会提交申请,计划发射多达100万颗卫星以建立环绕地球的轨道数据中心网络,为先进的AI模型提供支持,远超其现有“星链”星座的超过9600颗卫星规模 [23] - 受AI应用扩散影响,NAND闪存需求增长而供给有限,三星电子已将今年第一季度NAND闪存供货价格上调100%以上,SK海力士的NAND价格涨幅与之相近,闪迪也计划将NAND价格上调100% [24]
氪星晚报|苹果收购人工智能初创公司;诺和诺德中国区总裁将离职;SpaceX发布空间态势感知系统Stargaze
36氪· 2026-01-30 17:57
大公司业绩预告 - 大唐发电预计2025年归母净利润68亿元至78亿元,同比增加51%到73%;扣非净利润72亿元到82亿元,同比增加60%到82% [1] - 洽洽食品预计2025年归母净利润3亿元至3.2亿元,同比下降62.33%至64.68%,主要因原料采购价格上升导致毛利率大幅下降 [2] - 新希望预计2025年净亏损15亿元至18亿元,上年同期盈利4.74亿元,同比转亏,主因生猪价格降幅大于成本降幅及公司有序淘汰低效资产 [3] - 长城汽车2025年营业总收入2227.9亿元,同比增长10.19%;归母净利润99.12亿元,同比下降21.71%,因新渠道、新车型及品牌投入增加 [4] 消费与零售 - 星巴克计划在2028财年全球净新增超2000家门店,包括约400家美国自营店,目标合并净收入增长5%或以上,全球及美国同店销售增长至少3% [4] - Deckers Brands 2026财年第三季度收入19.6亿美元,同比增长7%;每股摊薄收益3.33美元,增长11%;其中HOKA品牌全球净销售额6.289亿美元,同比增长18.5% [7] 人工智能与科技 - Kimi公司表示其海外收入已超过国内收入,新模型K2.5发布后全球付费用户实现4倍增长,在Openrouter上排名第三 [6] - 苹果公司收购了专注于通过识别面部动作解读非语言交流的以色列人工智能初创企业Q.ai [10] - 原新加坡Sea AI Lab高级研究科学家庞天宇即将入职腾讯,加盟混元多模态部Exploration Center,负责强化学习前沿算法探索 [5] - 硅谷AI教育科技品牌Cosmo通过美国WASC的学校级全权认证,成为全球首个通过该级别认证的AI教育机构 [10] 机器人、航天与前沿科技 - 锋物科技与众擎机器人达成战略合作并成立合资公司,将算法与“物业大脑”能力嵌入机器人,构建“人+机器人”协同运营模式,并计划将方案推广至全国及海外市场 [8][9] - 北京人形机器人创新中心中试验证平台正式启动运行,并下线了第1000台客户定制化样机 [11] - SpaceX发布名为Stargaze的新型空间态势感知系统,旨在提高低地球轨道卫星运行安全,其筛选数据将在未来几周免费提供给更多卫星运营商 [11] - 埃隆·马斯克正考虑整合旗下资产推进太空算力布局,潜在方向包括利用SpaceX在轨数据中心为xAI输送算力,或利用特斯拉储能能力在太空利用太阳能运行数据中心 [13] 新产品与服务 - 腾讯“元宝派”进入公测倒计时,新增“一起听音乐”与“一起看视频”功能,疑似打通QQ音乐与腾讯视频内容库,支持免费享用会员内容 [12] 宏观经济数据 - 2025年1-12月,中国外汇市场累计成交304.57万亿元人民币(等值42.64万亿美元) [14] - 香港2025年全年本地生产总值实质上升3.5%,第四季度GDP同比实质上升3.8% [15] 人事变动 - 诺和诺德全球高级副总裁兼大中国区总裁周霞萍将离任,蔡琰被任命为新任大中国区高级副总裁兼总裁,于2026年3月31日生效 [14] 市场观点 - 摩根大通策略师预测未来几年金价有望涨到8000美元至8500美元,理由包括散户投资者更依赖黄金对冲美股下跌风险 [13]
1月29日盘后播报
搜狐财经· 2026-01-29 18:17
市场整体表现 - 主要股指涨跌互现,上证指数收涨0.16%至4157.98点,深证成指跌0.3%,创业板指跌0.57%,北证50跌1.69%,科创50跌3.03% [1] - A股全天成交额3.26万亿元,较上一交易日2.99万亿元进一步放量 [1] - 个股表现分化,超3500只个股收跌 [1] - 白酒、传媒、黄金、油气等板块涨幅居前,半导体产业链出现回调 [1] 贵金属板块 - 贵金属板块持续走强,黄金ETF(518800)收涨5.49% [1] - 伦敦金现价格逼近5600美元/盎司,伦敦银现价格一度突破120美元/盎司 [1] - 美联储1月FOMC会议维持基准利率不变,主席鲍威尔发言克制,但市场担忧美联储独立性受损及降息路径混乱 [1] - 地缘风险升温推升黄金避险溢价,全球央行购金潮及“去美元化”进程为黄金提供中长期结构性支撑 [1] - 当前国际黄金现货RSI指标处于高位,波动率指数创下近十年峰值 [1] AI应用与传媒游戏板块 - AI应用概念表现活跃,影视ETF(516620)收涨2.78%,游戏ETF(516010)收涨1.41% [2] - 国产大模型迭代加速:1月26日阿里推出旗舰推理模型Qwen3-Max-Thinking,在高阶推理领域实现突破;1月27日DeepSeek开源DeepSeek-OCR2模型,Kimi同步发布并开源K2.5模型 [2] - 大模型能力持续迭代优化,使得AI漫剧、短剧的制作成本与周期大幅缩减,垂直场景应用价值得到验证 [2] - 头部厂商持续加大AI应用领域布局与投入,争夺流量入口,随着AI应用加速规模化落地,相关下游场景有望持续受益 [2]
传媒ETF(159805)涨超5.4%,国产大模型加速迭代
新浪财经· 2026-01-29 10:53
文章核心观点 - 国产大模型近期加速迭代,在高阶推理、多模态等领域取得重要突破,推动了AI应用概念在资本市场再度活跃,并带动了传媒板块的强势上涨 [1] - AI技术被视为最具变革性的技术力量之一,已在传媒各子行业应用落地,衍生出覆盖多个场景和赛道的产品,并正朝着提升用户体验的方向迭代发展 [1] 市场表现 - 截至2026年1月29日10:12,中证传媒指数(399971)强势上涨5.74% [2] - 指数成分股表现突出,蓝色光标上涨16.06%,易点天下上涨14.12%,中文在线上涨11.39%,昆仑万维、省广集团等个股跟涨 [2] - 跟踪该指数的传媒ETF(159805)上涨5.48%,最新报价为1.73元 [2] 行业技术进展 - 2026年1月26日,阿里推出新的旗舰推理模型Qwen3-Max-Thinking,其性能媲美OpenAI的GPT-5.2-Thinking和谷歌的Gemini 3 Pro,标志着国产大模型在高阶推理领域实现重要突破 [1] - 2026年1月27日,DeepSeek开源DeepSeek-OCR 2模型,能够处理布局复杂的图片,在多模态领域实现了推理能力 [1] - 同日,Kimi发布并开源K2.5模型,同时具备视觉理解、代码等能力 [1] 行业影响与趋势 - AI已成为全球科技竞争的焦点、未来产业的关键赛道以及经济发展的新动力,展现出巨大的发展潜力和广阔的应用前景 [1] - AI在传媒各子行业均有应用落地,正在推动整体市场全新发展 [1] - AI产业已衍生出多赛道、多场景的应用,产品覆盖包括AI智能助手、AI陪伴、AI相机、AI写作等20个赛道,渗透个人生产力、休闲娱乐、日常生活多维度 [1] - AI应用正逐步围绕多模态、一站式及Agent进行迭代发展,目标在于提升及完善客户的使用体验,满足个性化需求 [1] 相关指数与产品 - 中证传媒指数(399971)从营销与广告、文化娱乐、数字媒体等行业中,选取总市值较大的50只上市公司证券作为指数样本,以反映传媒领域代表性上市公司证券的整体表现 [2] - 截至2025年12月31日,中证传媒指数前十大权重股分别为分众传媒、巨人网络、蓝色光标、岩山科技、利欧股份、恺英网络、昆仑万维、三七互娱、光线传媒、神州泰岳,前十大权重股合计占比51.52% [2]
Kimi发布新模型,月之暗面完成C轮融资现金储备破100亿
21世纪经济报道· 2026-01-27 18:41
公司核心产品与技术发布 - 月之暗面于1月27日正式发布并开源新一代多模态大模型K2.5,该模型在原生多模态架构、Agent集群协作、代码生成等核心领域实现开源state-of-the-art表现,相关能力已全面登陆kimi.com、KimiApp及开放平台 [1] - K2.5是公司迄今最智能、最全能的模型,采用原生多模态架构,同时支持视觉与文本输入、思考与非思考模式、对话与Agent任务,在Agent、代码、图像、视频及一系列通用智能任务上表现领先 [1][3] - 模型显著降低AI交互门槛,用户可直接以拍照、截图或录屏形式提交需求,突破文字表达局限,在办公场景中已掌握Word、Excel、PPT、PDF等常用软件的中高阶技能 [5] - 全新“Agent集群”能力是核心亮点,K2.5可自主创建“分身”智能体,按需组成不同角色团队并行工作,最高能调度100个分身处理1500个步骤,在大规模搜索等场景下,相比单Agent执行,其关键步骤可减少3至4.5倍,实际运行时间最高缩短4.5倍 [5][6] - 代码生成能力突出,支持通过自然语言对话生成完整前端界面及动态效果,可拆解录屏中的交互逻辑并复现专业代码,同步推出的编程工具KimiCode可在终端运行并集成于VSCode等主流编辑器,支持图片、视频输入辅助编程,其配套AgentSDK也将开源 [6] - 目前Kimi K2.5已登陆kimi.com、最新版KimiApp、KimiAPI开放平台及KimiCode,提供快速、思考、Agent、Agent集群四种模式供用户选择,企业和开发者可通过开放平台调用API [6] 公司战略转型与行业定位 - 公司战略经历深刻反思与调整,此前曾是“买量换用户”策略的忠实执行者,2024年在营销上投入接近9亿元人民币,但2025年初DeepSeek的崛起成为行业分水岭,DeepSeek月活用户暴涨至6181万,而Kimi的月活峰值为3600万 [6][7] - 自2025年初开始,公司彻底停止所有市场营销和买量行为,集中资源搞基础算法和K2系列模型,转向技术深耕 [7] - 公司总裁表示,公司仅用美国顶尖实验室1%的资源,就研发出Kimi K2、Kimi K2 Thinking等全球领先的开源模型,部分性能甚至超越美国顶尖闭源模型,目前公司仅300人左右的规模,就支撑起底层模型研发与数千万用户的应用运营 [7] - 当前中国大模型领域发展路径呈现分化,字节跳动豆包大模型、百度文心一言及阿里云的通义千问等主要依托背后大厂生态优势布局,智谱AI与MiniMax等企业选择通过上市融资拓展能力,而月之暗面正尝试走出独特的第三条路径:短期内依靠VC/PE的资金支持,专注于技术前沿突破 [8] 融资与估值进展 - 此次K2.5发布距公司创始人去年12月31日宣布完成5亿美元C轮超募融资仅27天,资本与技术形成高效联动 [1] - 公司估值在C轮融资后攀升至43亿美元(约合人民币299亿元),较B轮融资后的33亿美元实现快速增长,另据1月19日报道,公司正在敲定新一轮融资,此轮融资投前估值达到48亿美元 [1][11] - 公司创始人宣布完成5亿美元C轮融资且实现大幅超募,公司当前现金持有量超过100亿元,B/C轮融资金额已超过绝大部分IPO募资及上市公司定向增发规模,因此短期无上市计划,未来将择机以上市为手段加速AGI发展 [10] - C轮融资资金将主要用于两大方向:一是更加激进地扩增显卡,加速K3模型的训练和研发;二是用于2026年的激励计划和期权回购计划 [10] 技术突破与商业化成果 - 2025年公司已实现技术与商业化的双重突破,当年发布的K2及K2 Thinking模型成为中国首个万亿参数基座模型、首个开源agentic model,在Humanity's Last Exam(Full)等核心基准测试中超越OpenAI取得sota表现,且首次成功使用二阶优化器进行大规模训练 [11] - 技术突破有效推动公司产品迭代与商业化进展,自2025年5月起,公司高频推出Researcher、OK Computer、PPT、Kimi Code等新品,C端商业化实现指数增长,9-11月海外和国内付费用户数平均月环比增长超过170% [11] - K2 Thinking的发布显著带动API收入增加,同期海外API收入增长4倍,技术与商业的双重成绩推动公司估值在C轮融资后快速从43亿美元攀升至48亿美元 [11] - 2025年公司基于技术突破与产品表现,已向员工发放调薪、期权奖励、现金奖励等各类激励措施,累计覆盖324人次,2026年春节前将确定K2 Thinking及后续模型和产品发布的奖励方案并发放,且2026年平均激励预计为2025年的200%,同时计划大幅上调期权回购额度 [10] 未来战略规划 - 按照公司2026年战略规划,核心目标是超越Anthropic等前沿公司,成为世界领先的AGI公司 [12] - 具体将从三方面推进:一是K3模型通过技术改进和进一步scaling,提升等效FLOPs至少一个数量级,在预训练水平上追平世界前沿模型;二是垂直整合模型训练和agent产品taste,让K3成为“更与众不同”的模型,为用户提供全新的、其他模型未定义过的能力;三是产品和商业化聚焦agent,不以绝对用户数量为目标,持续追求智能上限,创造更大生产力价值,实现营收规模数量级增长 [12]