Workflow
大语言模型
icon
搜索文档
刚刚,DeepSeek 突发梁文峰署名新论文:V4 新架构提前曝光?
AI前线· 2026-01-13 06:41
DeepSeek发布Engram技术成果 - 公司DeepSeek于今日凌晨在GitHub官方仓库开源了新论文与模块Engram,论文题为“Conditional Memory via Scalable Lookup: A New Axis of Sparsity for Large Language Models”,公司创始人梁文锋再次出现在合著者名单中 [2] - 该方法提出了一种新的“查—算分离”机制,通过引入可扩展的查找记忆结构,在等参数、等算力条件下显著提升模型在知识调用、推理、代码、数学等任务上的表现 [5] - 代码与论文全文均已开源,论文与代码地址已公布 [6] Engram技术提出的背景与动机 - 当前主流大语言模型架构基于Transformer和MoE结构,MoE通过动态路由机制降低计算成本并扩展任务容量,DeepSeek自家系列模型也采用了先进的MoE方法 [8] - 在传统架构中,模型参数同时承担事实性记忆和逻辑推理与计算两种角色,这导致为增加知识记忆而增加参数量时,计算量会同步激增,MoE专家在处理“死记硬背”任务时依然不够高效 [9] - 神经网络用高昂的矩阵运算模拟简单的“查表检索”是一种浪费,Engram旨在实现“该查表的查表,该算的算”,以解决此困境 [9] Engram的核心思想与架构设计 - “Engram”一词源自神经科学,意为“记忆痕迹”,它是一个可扩展、可查找的记忆模块,用于语言模型在推理过程中检索过去可能已见过的模式或片段 [10] - 核心技术之一是现代化的哈希N-Gram嵌入,它对输入的Token序列进行N-Gram切片,并利用哈希算法将这些片段映射到一个巨大的、可学习的查找表中 [11][13] - 由于采用哈希索引,查找是确定性且O(1)时间复杂度的,这意味着无论存储多少记忆片段,检索速度几乎恒定且算力消耗极低 [13] - 该设计将一部分“记忆职责”从深度神经计算中卸载出来,使得模型拥有活跃神经通道处理复杂计算,也有静态记忆通道高效处理固定模式,这被称为“稀疏性的新轴” [14] - Engram具备条件记忆功能,会根据当前上下文的隐向量来决定提取哪些记忆,在架构设计上,Engram模块位于Transformer层的早期阶段,负责“模式重构” [14] Engram与MoE的关系及协同系统 - Engram提供了一个新的稀疏性轴,与MoE的条件计算不同,它通过条件查找提供静态记忆容量 [15] - 两者在目标、计算方式、优化方向和作用位置上存在区别:MoE目标为条件激活神经专家,计算方式为无极dense计算/激活部分专家,优化方向为降低活跃神经计算量,作用位置在深层推理;Engram目标为条件触发静态记忆查找,计算方式为O(1)查表,优化方向为减少神经计算重建已知模式,作用位置在早期模式重建/记忆检索 [16] - DeepSeek将Engram与MoE结合形成双系统:Engram模块负责海量知识点的“存储与快速检索”,MoE专家则摆脱记忆负担,全身心投入“逻辑推理与合成” [16] - 这种分工极大地优化了参数效率,在27B的实验模型中,Engram模块可以占用大量参数用于记忆,但在实际推理时只消耗极少的计算量 [16] Engram模型的性能表现 - 在多项基准测试中,Engram模型相比同参数规模模型展现出性能提升 [17] - 在27B参数规模下,Engram-27B模型在MMLU上的准确率为60.4%,高于MoE-27B的57.4%和Dense-4B的48.6% [17] - 在知识推理任务上,Engram-27B在ARC-Challenge上的准确率为73.8%,高于MoE-27B的70.1% [17] - 在代码与数学任务上,Engram-27B在GSM8K上的准确率为60.6%,高于MoE-27B的58.4% [17] - 随着参数增加至40B,Engram-40B在多项任务上性能继续提升,例如MMLU准确率达60.6%,ARC-Challenge准确率达76.4% [17] 行业与社区反响 - 在Reddit、X等平台,Engram的技术核心受到用户肯定,被认为让模型架构处理“记忆模式查找”和“神经计算推理”职责分离,开启了新的稀疏性方向 [18] - 有用户评论指出,Engram增加了静态记忆作为补充的稀疏性轴,查找复杂度为O(1),并发现MoE和Engram之间存在U形缩放规律,这指导着如何在两者之间分配容量 [19] - 有用户对基于n-gram lookup的O(1)查找机制表示兴趣,认为即便在不依赖GPU的环境下也能实现,让开发者对本地部署大模型功能有了更实际的期待 [20] - 专家群体开始从纯参数扩张思维转向更“智能”的架构设计,包括查表式模块和神经网络的协同,这种设计被认为是对传统NLP技术的现代化转换,具有较高的可行性和实用性 [21] - 社区评论指出,Engram很可能是DeepSeek即将发布的V4模型的核心技术基础,业内观察者认为该模块可能会成为DeepSeek V4的重要组成部分,预示下一代模型会在记忆和推理协同上实现架构级提升 [22][23] - 有网友表示,Meta之前也有过类似想法,但用到的技术不同 [26]
AI会抢走金融人的饭碗吗?行业大咖秀共识:那1%的灵感与温度机器永远学不会
第一财经· 2026-01-12 19:23
文章核心观点 - 人工智能在金融业的主要角色是创造者和重塑者,而非简单的替代者,人类的判断力、创造力与责任感仍是技术无法逾越的最终疆界 [3] 人工智能在金融业中的角色定位 - 金融创新的首要任务是金融本身,而非科技,相关技术分为金融技术、制度技术和科学技术三个层次,需摆正关系以推动金融科技走向实处 [4][5] - 尽管银行业持续“减员增效”,但人员总数持续增长,表明技术替代部分岗位的同时也催生了新的技术服务需求 [5] - 人工智能的发展离不开人的全方位支持,包括资金供给、算法研发、电力算力保障、数据治理、结果校验及客户关系维护 [5] - “人如何服务好人工智能,是人工智能能否服务好人的前提” [5] 金融智能的技术发展与现状 - 金融科技已进入以“金融智能”为核心的新发展阶段,本质是从信息化、流程自动化迈向智能化决策 [6] - 大语言模型正处于“期望膨胀期”,基于公开互联网数据训练的大模型能将问题解决能力从“小白”的不足10分提升至60-70分,但难以满足金融等高敏感领域至少85分起步的需求,不足以支撑解决具体问题 [6] - 零点有数与合作伙伴通过A-Z的26个字母方法辨识支撑风险控制、服务流程优化等环节的核心技术谱系 [6] 人工智能对金融从业者的影响与要求 - 以ChatGPT诞生为分水岭,AI进入了“假装有人性”且能力涌现的新时代,展现了类似华尔街的风险对冲思维 [7][8] - 在AI时代,只有1%的灵感是机器取代不了的,这存在于探索的勇气、跨界融合思维、人性化思考及应对高度复杂场景的能力中,其余99%的流程性工作终将被取代 [8] - 金融从业者需坚守人类独有的1%的灵感、温度与跨学科洞察力,以端稳饭碗并穿越经济周期 [8] - 不良资产处置中对“人”的理解、监管沟通中的“弦外之音”、灰色地带的判断等基础性工作仍依赖人的经验与决策力,难以被简单替代 [8] - AI在风控、审核等环节出错的责任归属尚未明确,从制度层面制约了其全面替代人类的进程 [8] 金融科技与内容生产的融合实践 - 金融科技为内容创作提供精准触达工具与广阔应用场景,内容创作则为金融科技产品提供用户教育与品牌传播支撑,二者深度融合将推动产业高质量发展 [9] - 应帆科技发布了第一财经万流引擎智能体蜂群,旨在用智能体赋能智能体的应用逻辑,将AI智能体底座像插件一样接入金融机构的AI大底座,以帮助机构更好地理解用户需求,将被动接受的噪音转化为主动的、个性化的陪伴式洞察 [9]
AIforScience大时代,撬动科学研发万亿赛道
国盛证券· 2026-01-12 14:59
行业投资评级 - 增持(维持)[5] 报告核心观点 - AI for Science(AI4S)大时代已至,正推动科学研发范式变革,通过AI算法、大语言模型与高通量机器人实验室的闭环交互,能大大缩短研发周期并破解传统范式难题[1] - AI4S在大部分潜在赛道的渗透才刚刚开始,其远期市场空间将是不亚于民用AI应用的万亿市场[1] - 创新药研发与太空钙钛矿是AI4S值得关注的核心应用领域[3] AI4S如何赋能科学研发 - AI4S的能力圈主要包括“读、算、做”[1] - 以泰控股为例,“读”的能力体现在其专利数据挖掘平台可将传统需数天甚至数周的文献专利数据提取在1小时内完成,准确率达95%[1] - “算”的能力体现在其拥有超过200个AI模型,可通过算法大幅提升研发速度和精度[1] - “做”的能力体现在机器人工作站可将数据收集能力提升40倍[1] AI4S市场空间测算 - 在医药研发领域,AI4S针对临床前研发市场,全球医药市场为1.64万亿美元,海外头部企业研发费用率普遍超过20%[2] - 以临床前研发价值量占比33%测算,AI4S在医药领域可触达市场规模约1082亿美元[2] - 在医药以外领域,假设AI4S渗透率为25%,仅化工、医药、新能源、合金、显示、半导体共6个下游就可创造约1486亿美元的市场需求[2] AI4S核心应用领域 - **创新药研发**:该行业是AI4S率先应用的领域,核心原因在于其研发环节多、分子结构预测难度大,与AI4S技术高度契合,且行业研发投入大并具备研发外包(CXO)生态模式[3] - **太空钙钛矿**:光伏是卫星主要能源,在太空同等组件发电量达地表7-10倍,能源系统占卫星成本约15-20%[3] - 传统刚性太阳翼结构厚重、展开面积上限低,而钙钛矿结合柔性太阳翼在减重降本的同时,展开面积可增长超10倍(例如Starlink V3太阳翼面积达257平米),是卫星太阳翼的理想化终极方案[3] - 钙钛矿稳定性等技术问题亟待解决,其无机晶体结构发现技术路线与AI药物晶型预测高度相似,适合用AI4S技术进行优化[3] 核心标的分析 - **泰控股**被定位为AI4S全球龙头,具备顶级算法(200+垂类模型)、数据(高通量机器人实验室)、资金(稀缺上市平台,现金储备充足)及人才(3位MIT华人物理学家创办)优势[4] - 该公司服务海外头部跨国公司(MNC),并已斩获全生命周期59亿美元的业务发展(BD)合作[4] - 该公司正携手泰科能源布局太空钙钛矿领域[4]
英伟达将AI4S列为AI,三大方向今年或是爆发年
选股宝· 2026-01-11 23:07
行业趋势与前景 - 智谱AI创始人唐杰表示,2024年可能是AI for Science(AI4S)的爆发年,因相关能力将大幅提升[1] - 英伟达将AI4S与大语言模型、具身智能并列为人工智能的三大发展方向[1] - AI4S旨在利用人工智能从海量科学数据中发现新规律、加速科学发现进程[1] - AI4S已超越实验室“概念验证”阶段,成为全球科技巨头竞相角逐的战略主战场[1] - AI4S的应用已涵盖预测蛋白质功能、设计新材料、发现新药物靶点等多个领域,帮助科学家高效获取科研成果[1] 相关上市公司 - A股市场中与AI for Science(AI4S)相关的概念股包括健康元、东北制药等公司[2]
IPO周报 | 智谱、天数智芯、MiniMax 登陆港交所;鸣鸣很忙通过聆讯
IPO早知道· 2026-01-11 20:34
港股IPO挂牌上市 - 智谱于2026年1月8日以股票代码“2513”在港交所主板挂牌上市,成为“全球大模型第一股”[3] - 智谱本次IPO发行37,419,500股H股,香港公开发售获1,159.46倍认购,国际发售获15.28倍认购,发行价每股116.2港元,募资总额超43亿港元[3] - 天数智芯于2026年1月8日以股票代码“9903”在港交所主板挂牌上市[7] - 天数智芯本次IPO发行25,431,800股股份,香港公开发售获414.24倍认购,国际发售获10.68倍认购,引入18家基石投资者累计认购金额15.83亿港元[7] - MiniMax于2026年1月9日以股票代码“0100”在港交所主板挂牌上市,成为历史上IPO规模最大的AI大模型公司[10] - MiniMax本次IPO发行29,197,600股股份,香港公开发售获1,837.17倍认购,国际发售获36.76倍认购,引入14位基石投资者[10] - 精锋医疗于2026年1月8日以股票代码“2675”在港交所主板挂牌上市[13] - 精锋医疗本次IPO发行27,722,200股H股,香港公开发售获1,091.94倍认购,国际发售获25.18倍认购[13] 公司业务与市场地位 - 智谱自2019年成立起瞄准AGI,原创提出GLM预训练范式,研发中国首个预训练大模型框架,并陆续推出首个百亿模型、开源千亿模型、对话模型、多模态模型和全球首个设备操控智能体[4] - 按2024年收入计算,智谱是中国最大的独立大模型厂商[4] - 天数智芯的“天垓”训练系列与“智铠”推理系列产品矩阵覆盖云端训练、边缘推理等核心场景,渗透金融、医疗、教育、交通等行业,支撑超450个AI模型运行[7] - 截至2025年6月30日,天数智芯累计出货超5.2万片,服务客户从22家增至290家,在关键领域完成超900次部署[8] - MiniMax在不到四年内实现文本、视频、语音全模态模型领先,是“全球唯四全模态进入第一梯队”的大模型公司[10] - MiniMax已打造覆盖C端与B端的AI原生产品矩阵,截至2025年9月30日,拥有超200个国家和地区的逾2.12亿名个人用户以及超100个国家的13万企业客户[10] - 精锋医疗是中国手术机器人领域的重要创新力量,聚焦高端微创外科装备的自主研发与产业化[13] - 截至最后可行日期,精锋医疗多孔腔镜手术机器人完成手术超12,000例,单孔腔镜手术机器人完成手术超2,000例[13] - 鸣鸣很忙是中国最大的休闲食品饮料连锁零售商,通过“零食很忙”“赵一鸣零食”双品牌运营[16] - 截至2025年9月30日,鸣鸣很忙全国在营门店数达19517家,覆盖全国28个省份和所有线级城市,为行业首家突破2万店的企业[16] - 按2024年休闲食品饮料产品GMV计算,鸣鸣很忙是中国最大的连锁零售商[17] - COMMUNE是中国规模最大的餐酒吧品牌,截至2025年9月30日在全国40个城市运营112家直营餐酒吧[20] - 2022年至2024年以营业收入计,COMMUNE连续三年在中国餐酒吧品牌中位列第一,2024年市场份额约7.8%[21] - 桑尼森迪是一家以技术驱动的IP玩具企业,按2025年前三季度总销量计算,是IP玩具和IP解决方案行业的第二大中国企业[24] - 按2024年销量计算,桑尼森迪在定价20.0元人民币及以下的平价立体IP玩具中排名第一[24] - 爷爷的农场致力于提供高品质健康食品,产品组合涵盖269个SKU,约三分之一SKU获得有机销售许可[27] - 按2024年中国婴童零辅食商品交易总额计算,爷爷的农场排名第二,按2024年中国有机婴童零辅食商品交易总额计排名第一[28] - 臻驱科技是面向新能源汽车领域的电控解决方案供应商,率先提出并量产了功率砖概念[30] - 截至2025年9月30日,臻驱科技直接或通过一级供应商赢得13家主机厂的50个定点,解决方案已应用于82款车型[30] - 按2024年和2025年前三季度中国主驱功率砖装机量计算,臻驱科技分别排名第一和第二[31] - 德适生物专注于医学影像AI与智能装备领域,产品组合包括六款医学影像软件产品、三款商业化医疗设备等[34] - 其核心产品辅助诊断软件AI AutoVision®专用于染色体核型智能分析,已提交三类创新医疗器械注册申请[35] - 按2024年销售收入计算,德适生物在中国的染色体核型分析领域排名第一,市场份额为30.6%[35] 财务表现与增长 - 智谱2022年至2024年营收分别为0.57亿元、1.25亿元和3.12亿元,复合年增长率达130%[4] - 智谱2025年上半年营收同比增长325%至1.9亿元,2022年至2024年及2025年上半年各期毛利率始终保持在50%以上[4] - 中信证券预计智谱2025年营收将突破1亿美元,2026年和2027年营收分别约为16亿元人民币和27亿元人民币[5] - 天数智芯2022年至2024年营收从1.89亿元跃升至5.40亿元,复合年增长率为68.8%[9] - 天数智芯2025年上半年营收3.24亿元,同比增长64.2%[9] - MiniMax 2023年至2024年营收分别为350万美元和3,050万美元,2024年同比增幅为782.2%[11] - 截至2025年9月30日,MiniMax的To C收入同比增长181%,To B收入同比增长160%[11] - 精锋医疗2025年上半年实现营业收入约1.49亿元,同比增长接近400%,毛利率约为62.8%[14] - 鸣鸣很忙2025年前三季度实现零售额661亿元,同比增长74.5%,并超过2024年全年[17] - 鸣鸣很忙2025年前三季度实现收入463.71亿元,同比增长75.2%,经调整净利润18.10亿元,同比大幅增长240.8%[18] - 鸣鸣很忙2022年至2024年收入从42.86亿元提升至393.44亿元,三年复合增速为203%,经调整净利润从0.81亿元增长至9.13亿元,三年复合增速达234.6%[18] - 鸣鸣很忙毛利率由2022年的7.5%稳步提升至2025年前三季度的9.7%,经调整净利率由1.9%提高至3.9%[18] - 桑尼森迪2023年和2024年营收分别为1.07亿元和2.45亿元,同比增长129.5%[24] - 桑尼森迪2025年前三季度营收同比增长134.7%至3.86亿元[24] - 桑尼森迪毛利率从2023年的16.9%持续提升至2025年前三季度的35.3%,并在2025年前三季度实现扭亏为盈,经调整净利润为5278万元[24][25] - 爷爷的农场2023年和2024年营收分别为6.22亿元和8.75亿元,同比增长40.6%[28] - 爷爷的农场2025年前三季度营收为7.80亿元,同比增长23.2%[28] - 爷爷的农场2023年、2024年及2025年前三季度毛利率分别为55.5%、58.8%以及57.3%[28] - 德适生物2025年前三季度营收为1.12亿元,较2024年同期的0.20亿元增长约470%,毛利率提升至75.9%[34] 行业前景与市场预测 - 据中信证券研报,未来6年国内大语言模型市场规模或将实现20倍增长,企业级需求将主导千亿机会[5] - 天数智芯董事长兼CEO表示,公司将继续深耕通用GPU赛道,构建更广泛的生态体系,赋能千行百业[9] - MiniMax创始人兼CEO表示,一家人工智能公司的真正价值是提供源源不断的先进智能,并为人所用[11] - COMMUNE计划于2026年新开设约30至40家店,2027年新开设约35至45家店,2028年新开设约40至50家店[20] - 按2023年至2024年的零售额增长计算,桑尼森迪在中国平价IP玩具行业前五大公司中增长最快[24] - “爷爷的农场”品牌产品在天猫自营旗舰店的消费者复购率在2023年、2024年及截至2025年9月30日止十二个月期间分别为29%、31%以及34%[28] - 在获得国家药监局批准后,德适生物的AI AutoVision®有望成为全球首款及唯一的智能染色体核型辅助诊断软件[35]
金工专题报告 20260110:深度学习系列之一:AI重塑量化,基于大语言模型驱动的因子改进与情绪Alpha挖掘
东吴证券· 2026-01-10 19:09
核心观点 报告系统性地构建了一套基于大语言模型与提示工程的自动化因子研究框架,旨在探索AI在量化投资全链条中的应用潜力。该框架成功应用于低频量价、基本面和高频数据的因子挖掘与优化,并利用大模型分析非结构化文本构建情绪因子。最终,通过融合AI生成的多维信息,构建的综合中证800指数增强策略实现了超额收益和信息比率的显著提升,验证了AI在量化研究中实现“1+1>2”效果的巨大潜力[1]。 低频量价因子的优化与生成 - 报告以Alpha158因子库为基础,通过人机交互的迭代循环,对经典量价因子进行深度优化与生成。例如,波动率因子std20经过优化后,其RankIC均值从4.03%提升至7.80%,ICIR从0.31提升至0.55[1][37]。 - AI能够识别原始因子的逻辑缺陷并提出有效改进方案。以std20因子为例,其改进方案引入了平均真实波幅和成交量加权机制,优化效果在5至60日的多个窗口期下均具备普适性[1][37][42]。 - 通过为模型提供已验证的“成功案例”作为先验知识,实现了从零生成新因子的突破,成功挖掘出多个与样例因子相关性低、ICIR在0.8以上的新因子。这些AI生成因子在样本外跟踪中表现持续稳健,部分因子的样本外ICIR能达到1.0以上[1]。 基本面因子挖掘 - 在基本面维度,AI展现出强大的因子发现能力,不仅能生成经典因子的增强版本,更能从新颖视角对价值、质量、成长三类因子进行有效拓展与创新[1]。 - 具体案例包括:从留存收益角度构建了REP_LF因子,从应收账款周转率角度构建了ART_QR因子,并生成了现金毛利CGP_TTM的增强版本[1]。 高频因子挖掘 - 在高频维度,通过赋予AI直接生成Python代码的能力,挖掘出一批逻辑新颖且表现优异的高频因子。其中部分强信号因子的多空组合年化收益超过60%[1]。 - 将AI高频因子库融入融合了日K与周K行情数据的AGRU神经网络模型后,模型的年化多头超额收益由18.24%显著提升至25.28%,RankIC均值提升了0.71个百分点[1]。 非结构化文本情绪分析 - 利用Gemini 2.5 Pro大模型对近百万字的上市公司调研纪要进行深度解析,并通过双速动态衰减模型构建了周度情绪因子[1]。 - 研究发现,该情绪因子呈现出独特的非对称预测能力,即正面情绪与股价上涨关系不强,但负面情绪是未来股价下跌的强预警信号,其空头组合年化超额收益达8.26%,显著优于传统因子。该因子与传统量价及基本面因子的相关性极低,可作为独立且有效的补充信息源[1]。 综合策略构建与效果 - 最终构建了一个多维信息融合的综合策略:将AI挖掘的高频因子与低频行情数据融合进AGRU神经网络,形成核心Alpha;再利用AI文本情绪因子对该核心Alpha进行空头端风险调整,构建了最终的中证800指数增强策略[1]。 - 与未加入调研因子调整的策略相比,最终策略在保持换手率基本不变的情况下,年化超额收益由11.15%提升至11.81%,信息比率由2.18提升至2.31,且近三年超额提升皆超过1个百分点[1]。
预计2030年中国大语言模型市场规模或超千亿元
环球网资讯· 2026-01-10 12:10
行业动态与市场表现 - 国产AI大模型企业MiniMax于港交所上市 首日报收345港元 股价涨幅超109% [3] - 另一家国产AI大模型企业智谱于前一交易日登陆港股市场 [3] - 业内普遍认为本轮上市标志着行业从技术研发阶段发展至技术和商业化同步落地、商业模式逐步清晰的阶段 [3] 市场前景与增长预测 - 根据沙利文报告 2024年中国大语言模型市场规模已达到53亿元 [3] - 预计到2030年中国大语言模型市场规模将增至1011亿元 [3] - 2024年至2030年的复合年增长率预计为63.5% [3] - 从更长周期看 人工智能行业仍处在高速扩张通道 [3] 行业影响与意义 - 本轮国产AI大模型企业上市将为后续大模型企业融资及估值提供依据 [3]
Nature子刊:华中科技大学薛宇/彭迪团队开发结合深度学习和大语言模型的组学解读工作流
生物世界· 2026-01-10 11:06
研究突破与核心方法 - 研究团队结合深度学习与大语言模型的推理能力,开发了一个名为LyMOI的混合组学解读工作流,用于从海量组学数据中识别细胞调控网络并进行机制阐释 [2][5] - 该工作流整合GPT-3.5进行生物知识推理,并采用基于图卷积网络的大型图模型,该模型融合进化保守的蛋白质相互作用,通过分层微调技术从多组学数据中预测特定情境的分子调控因子 [5] - GPT-3.5随后生成机器思维链,对预测的调控因子在生物学系统中的功能进行机制性阐释 [5] 应用成果与发现 - 以自噬过程为重点,LyMOI系统解读了1.3TB的转录组、蛋白质组及磷酸化蛋白质组数据,拓展了对自噬调控因子的认知 [7] - LyMOI精准识别出两种人类癌蛋白CTSL和FAM98A,它们能在抗肿瘤剂双硫仑处理下增强自噬效应 [7] - 体外实验表明,沉默CTSL和FAM98A这两个基因可削弱双硫仑介导的自噬并抑制癌细胞增殖 [7] - 联合使用双硫仑与CTSL特异性抑制剂Z-FY-CHO,可显著抑制体内肿瘤生长 [7]
王腾回应新公司不招应届生;阿里千问模型累计下载量达7亿;苹果CEO库克2025年总薪酬为7429.48万美元丨邦早报
搜狐财经· 2026-01-10 09:22
小米集团及前高管动态 - 小米前高管王腾成立新公司,总部位于北京,计划在深圳、杭州设立分部,薪酬向大厂看齐但更侧重股权激励,创业初期不招聘应届生,重点组建产品研发团队,计划春节后启动市场销售等团队 [1] - 小米集团总裁卢伟冰回应2025年公司饱受争议,表示公众以行业标杆企业标准要求小米,部分争议偏离事实,是行业内卷式恶性竞争的产物,公司需保持创业进取心并扛起产业引领者责任 [9] 苹果公司高管薪酬与继任计划 - 苹果公司CEO蒂姆·库克2025年总薪酬为7429.48万美元,其中股票奖励为5753.5293万美元,非股权激励计划薪酬为1200万美元,基本工资为300万美元 [1] - 苹果硬件工程部门负责人约翰·特纳斯成为库克卸任后的热门继任者,库克向高层坦言身心俱疲希望减负,卸任后大概率转任董事会主席,公司也在培养其他内部候选人 [7] 人工智能与科技行业动态 - 阿里千问大模型累计下载量达7亿,2025年12月单月下载量超过第2至第8名总和,增势在全球前十开源模型中最为迅猛 [5] - OpenAI收购企业软件平台Convogo的核心团队,交易为全股票交易,三位联合创始人将加入OpenAI,Convogo现有产品将停止运营 [7] - 马斯克的人工智能初创公司xAI将投资逾200亿美元在美国密西西比州Southaven建设数据中心 [11] - MiniMax关联公司申请公布“一种模型深度思考的控制方法及装置”专利,旨在提高模型处理效率和用户体验 [12] - 研究机构Omdia报告显示,2025年全球人形机器人市场出货量预计达近1.3万台,其中智元机器人出货量超5100台,占据39%市场份额,预测2035年全球年出货量将达260万台 [15] - 美国半导体行业协会数据显示,2025年11月全球半导体销售额达753亿美元,创历史新高,环比增长3.5%,同比增长29.8%,预计2026年全球芯片市场年销售额将接近1万亿美元 [15] - AI大模型企业MiniMax在港交所上市,首日涨幅超109%,另一家企业智谱也于前一交易日登陆港股,弗若斯特沙利文报告估计2030年中国大语言模型市场规模将增至1011亿元,2024年至2030年复合年增长率为63.5% [15] 新能源汽车与智能驾驶 - 小鹏汽车首次向公众开放全球总部与广州、肇庆智造基地,总部有超1万名AI、汽车、机器人及飞行汽车领域研发人员,园区设有全球旗舰店、飞行汽车博物馆和AI出行体验中心 [9] - 宝马全新纯电轿跑SUV iX4路测图曝光,预计2026年上市,锁定特斯拉Model Y为竞争对手 [12] - 极氪公布超级电混高性能旗舰SUV极氪8X的酒红色外观官图 [14] 消费品牌与产品争议 - 波司登一款售价2099元的羽绒服被质疑充绒量仅86克,品牌溢价过高,公司客服回应称充绒量符合国家标准,价格取决于综合性因素 [2] - 迪士尼宣布将在美国Disney+平台推出个人化竖屏视频流媒体内容,旨在锁定Z世代与Alpha世代用户 [11] 企业战略调整与投资 - 通用汽车预计在2025年第四季度因调整电动车业务额外计提约60亿美元费用,此前已在北美公司计提16亿美元费用 [11] - 英伟达任命谷歌云业务高管艾莉森·瓦格纳菲尔德为首席营销官,以提升品牌知名度 [9] - 英伟达投资的数据中心公司Nscale寻求融资近20亿美元,此前在2024年9月和10月已融资逾15亿美元 [11] - 台积电泄密案追查出第四名“内鬼”,前工程师涉嫌窃取2纳米核心关键技术 [11] 生物科技与医疗健康融资 - 前传奇生物研发副总裁潘琦加盟AI生物医药企业水木分子,出任生物医药首席科学家 [11] - 瑞宙生物完成2亿元B轮融资,资金将用于24价肺炎链球菌多糖结合疫苗的临床研究与上市推进,以及新型流脑疫苗研发 [11] 科技与金融领域融资 - 光量子计算企业图灵量子半年内连续完成两轮数亿元战略融资,投资方包括国家级资本及鼎晖百孚等 [11] - 混合现实科技服务商XREAL完成1亿美元股权融资,公司专注于MR技术研发和AR终端眼镜生产 [11] - 数字金融及支付基础设施平台PhotonPay光子易完成数千万美元B轮融资,由IDG资本领投 [11] 慈善捐赠 - 比尔·盖茨于2024年向前妻梅琳达创立的私人基金会捐赠约78.8亿美元(约合551.29亿元人民币),该基金会资产规模从6.04亿美元增至约74亿美元,已跻身美国最大私人基金会之列 [9]
900亿,中国AI最快IPO诞生
投资界· 2026-01-09 11:30
MiniMax上市里程碑与市场表现 - 公司于2025年1月9日在港交所上市,发行价为165港元/股,开盘后股价大涨超70%,市值一度突破900亿港元 [2] - 公开发售部分获得市场热烈追捧,超额认购倍数高达1837倍,吸引了来自欧美、中东、东南亚等地的顶级长线机构及主权基金投资 [2] - 公司从2022年创立到完成IPO,成为全球用时最短的AI独角兽之一,标志着中国AI新浪潮的崛起 [2] 创始人背景与公司创立 - 创始人闫俊杰为前商汤高管,出生于1989年,于2022年在上海创立MiniMax [2] - 公司创立初期的办公场所不足100平米,并以“Intelligence with Everyone(与所有人共创智能)”为使命 [7] - 创始人被描述为外表温和但内心坚定,具备顶级创始人的气质,对AGI(通用人工智能)有早期和深入的思考 [2][5] 明势创投的投资决策过程 - 投资机构明势创投在投资前与创始人团队密集会面四次,首次会面时创始人正在研读论文而非商业计划书,给投资人留下深刻印象 [4][5] - 尽管2022年初全球AI投资处于低谷,但明势创投基于对AI算力和算法未来十年各提升100倍的判断,看到了新一代AI的系统性机会 [7] - 投资决策存在争议,因公司团队年轻(平均年龄不到三十岁)且采取多模态同步开发策略,风险较高,但创始人的深入思考和务实作风最终坚定了投资决心 [8] 明势创投的持续加注与支持 - 明势创投自2022年3月首次投资后,连续六轮加注MiniMax,成为参与轮次最多的投资机构 [2][9] - 在Pre-IPO轮融资前,其累计投资额已超过基金规定的单一项目上限,经与海外LP沟通获得豁免后继续投资 [9] - 投资机构积极为公司引入战略资源,例如曾邀请理想汽车创始人李想、美团创始人王兴与创始人进行产品经验交流 [9] 公司的技术路径与关键决策 - 2023年下半年,公司出人意料地将大量资源投入MoE(混合专家)架构的预训练,该路径在当时并非行业共识 [11] - 公司在MoE研发过程中经历了两次失败,第三次才成功,并基于此推出了abab6.5系列模型,开创了用MoE架构进行大规模商业化部署的先河 [11] - 创始人解释选择MoE路径的核心原因是,只有以此才能用更低的成本向更高的模型阶段演进,以支持服务数千万甚至亿级用户量的目标 [11] 公司的成本与性能优势 - 根据招股书,公司仅用美国头部模型1%的成本,实现了与其仅有5%的性能差距,并达到了高毛利率 [11] - 公司是业内算力芯片租期最短、租金最低的大模型公司,其创始人认为芯片两年一迭代,必须使用最新芯片进行模型训练 [12] - 这一成本控制能力印证了公司能够打破高性能、低成本化与商业盈利的“不可能三角” [11] 明势创投的AI投资版图与策略 - 该机构内部形成判断:自动驾驶、大语言模型和具身智能是同一AI范式在不同领域的延展,并据此进行跨领域整合投资 [13] - 机构是一级市场中少有的、以AI模型快速演进为核心,对产业链上下游进行拉通布局的风险投资机构 [13] - 其投资布局始于2023年,系统覆盖了以计算、存储、通信等为代表的“AIDC供应链”、AI native软硬件、具身智能及上游核心零部件 [13] 在具身智能领域的布局 - 2022年7月,基于Transformer+端到端的技术逻辑,机构预判AI模型与机器人结合将产生新机会,早于“具身智能”概念兴起 [13] - 随后通过论文搜索和引荐,投资了由南方科技大学教授张巍创立的逐际动力,并连续多轮加注 [14] - 目前机构判断具身智能的“GPT-3时刻”尚未到来,因此保持紧密跟踪但出手谨慎 [14] 在AI应用领域的投资案例 - 投资了由前微软小冰、小度科技创始人景鲲创立的GenSpark,双方在AI Agent的发展方向上形成高度共识 [15] - 投资了陈冕创立的Lovart,该公司在海外市场迅速崛起,上线半年已成为国际热门的设计Agent平台 [16][17] - 投资风格体现为敢于在非共识阶段对早期项目持续下重注,如在理想汽车项目上连投七轮直至IPO [17] 对AI行业的前瞻判断与机构调整 - 机构认为AI带来的颠覆性变化被外界严重低估,AI时代变化极快,“今天聊的东西三个月以后可能都是错的” [12][19] - 为适应AI时代的快速变化,机构在2025年加快了投资决策效率,全年投资近20个项目,接触和决策速度均快于往年 [18] - 机构调整组织架构,在扁平化基础上分散成小组,引入年轻同事以激发非共识新思路,并由VP级以上员工直接牵头项目,避免路径依赖 [18][19] 对中国科技企业出海的洞察 - 通过复盘认为,优秀的出海企业创始人未必需要海归背景或流利英语,最关键的是从第一天起就立志做一家全球化公司的决心 [20] - 只有定位为全球化公司而非仅仅是中国公司,才能真正实现“In China, For World” [20] - 相信中国创始人的迭代速度、工程化能力及年轻人才的成长速度远超外界想象 [20] 对未来十年的展望与目标 - 机构预测,到2035年,世界500强中将至少有150家中国科技企业,其中50家将成为全球领军者 [21] - 机构未来十年的目标是成为中国下一代50家全球科技领军企业的可靠长期伙伴,并至少在早期投中其中的三分之一 [21] - 机构已将目光投向商业航天、可控核聚变、低空经济等前沿科技领域,期待下一个“DeepSeek Moment”的出现 [20]