大语言模型
搜索文档
AAAI 2026 Oral | 大模型「爱你在心口难开」?深度隐藏认知让推理更可靠
机器之心· 2026-01-09 10:53
文章核心观点 - 大语言模型的思维链技术存在推理步骤不可靠的问题,但模型内部激活中隐含对推理正确性的判断,即“隐藏的真伪认知” [2][4] - 合肥工业大学研究团队提出一种新方法,通过探测模型内部激活来构建置信度预测器,并以此引导推理路径搜索,从而提升思维链推理的稳定性和准确性 [2][8][10] - 该方法在多项单模态和多模态推理基准测试中表现优异,验证了利用模型内部信号指导生成的有效性 [22][23][24] 方法与创新 - 核心思想是利用模型内部激活中隐含的“真伪认知”来评估推理步骤的可信度,而非依赖表面的Token生成概率 [10] - 创新方法一:从多层注意力头中探测“真伪敏感性”,发现中间层的特定注意力头能区分正确与错误推理步骤,准确率可达80%以上 [10][11][20] - 创新方法二:基于最敏感的注意力头激活,构建轻量级置信度预测器,输出不依赖Token概率的推理质量评分 [12] - 创新方法三:结合生成概率与内部置信度评分,设计新的推理路径搜索策略,主动避开不可靠步骤并优先扩展有潜力的方向 [13][14][16] 实验结果 - 置信度预测器评估显示,其能从模型内部激活中有效提取真伪判别信号,并在校准指标上优于基线方法 [18] - 在单模态推理任务中,该方法在多个数据集上超越基线,例如在SVAMP数据集上比少样本思维链提升5个百分点 [23] - 在多模态推理任务中,该方法同样表现突出,如在RealWorldQA数据集上实现了10.7个百分点的提升 [23] - 消融实验证实,基于置信度的引导至关重要,若采用随机选择策略,方法性能会显著下降甚至低于基线 [25][27] 研究背景与问题 - 大语言模型在复杂推理任务中依赖思维链技术,但其生成的推理链质量不稳定,存在偏差和累积误差 [2][4][6] - 研究聚焦两个关键问题:模型内部激活是否蕴含推理步骤真伪的有效区分信息;能否构建机制利用这些信息选择更可靠的推理路径 [7][8][15] 论文与作者信息 - 论文标题为“Deep Hidden Cognition Facilitates Reliable Chain-of-Thought Reasoning”,已被AAAI 2026录用为口头报告论文 [2][5] - 论文代码已在GitHub开源 [5] - 第一作者为合肥工业大学博士生陈紫军,通讯作者为该校副教授胡文波 [28]
你在考AI?其实是AI在“考”你 | 红杉Library
红杉汇· 2026-01-09 08:07
文章核心观点 - 神经网络先驱特伦斯·谢诺夫斯基在其新作中提出“反向图灵测试”假说,认为大语言模型如同“厄里斯魔镜”,通过映射对话者的反应来检验其智能水平与提示质量,而非被动接受人类测试 [2][4] - 传统基于自然智能的认知框架已难以适配大语言模型的特性,人类对“智能”“理解”等核心概念的定义亟待更新,将评判标准从理想化人类转向普通人能更客观看待模型智能水平 [2][11] - 大语言模型的发展速度远超生物进化,其研究不仅可能推动新的智能原理与数学理论发现,还能助力人类深入探索自身智能的本质,为人工智能领域带来类似DNA之于生物学的革命性突破 [2][13][14] 大语言模型的交互特性与“反向图灵测试” - 在实际交互中,大语言模型似乎在执行一种“反向图灵测试”,通过映射对话者的反应来检验其智能水平和提示质量 [7] - 具体表现为:对话者思维水平越高、提示越有深度,大语言模型展现的智能表现就越高;当对话者表达强烈观点时,模型也会展现出更大的互动热情 [7] - 这种映射现象可理解为启动效应与语言能力的协同作用,展示了模型在模仿人类个性特征方面的卓越能力,但并不能说明其具备与人类相同的智能或意识 [8] - 大语言模型在映射用户需求和智慧时,可能就像《哈利·波特》中的厄里斯魔镜,只能映照出观看者内心最深切、最渴望的愿望 [8] 对“智能”与“理解”传统定义的挑战与更新 - 关于大语言模型是否具有智能的讨论,最终取决于如何定义“智能” [10] - 专家们的认知分歧凸显出基于自然智能的传统认知框架已难以适应当前形势,需要突破固有思维,超越19世纪心理学遗留的过时概念 [12] - 需要重新审视并深化对“智能”“理解”“伦理”以及“人工”等核心概念的认识 [12] - 人类的智能不仅限于语言能力,可能在某些领域与大语言模型有共同特征,但在其他方面存在本质差异 [12] - 如果将评判标准从理想化的人类转向普通人,或许能得到更切实的比较结果 [11] - 人类倾向于对能与之交谈的个体产生积极偏见,即便其实际智能水平可能并不高 [11] 大语言模型展现的能力与潜力 - 大语言模型在处理和提取海量文本数据方面已经超越了人类的能力 [7] - 通用人工智能的通用能力正在大语言模型中逐步显现,其实现形式与早期研究者的设想有所不同 [8] - 大语言模型不仅展现出在各类语言任务中的多面性,还具备编程等跨领域能力 [8] - 这些模型表现出了超乎预期的社交智能 [8] - 在语法生成能力方面,大语言模型实际上比多数人更为出色 [10] - 大语言模型LaMDA通过了阿尔卡斯设计的心智理论测试,而心智理论被认为是自我意识的重要标志之一 [11] - 大语言模型确实展现出了创造性思维的潜质 [12] 对智能本质研究的革命性意义 - 镜像假说提供了一个新角度:通用智能是否首先源于人类的社交互动能力,而语言能力是在进化过程中发展出来的社交强化工具 [8] - 大语言模型的出现为人类提供了一个重要契机,促使我们突破固有思维模式,重新思考人类“通用智能”的本质和起源 [8][12] - 在研究大语言模型的过程中,很可能会发现关于智能本质的新原理,就像20世纪物理学家揭示物理世界的基本原理一样 [13] - 通过研究大语言模型展现的语言处理能力,可能会发现一些关于语言智能的基本原理,这些原理或许能够推广到社会智能、机械智能等其他智能形式 [13] - 与生物进化相比,大语言模型的发展速度要快得多,一旦相关技术基础确立,其性能就会在持续改进中不断提升 [13] - 在探索其发展的过程中,可能会深入理解人类智能的本质 [13] - 当前围绕“智能”和“理解”的争论,与一个世纪前关于“生命本质”的辩论相似,机器学习的进步最终可能会催生一个全新的概念框架,为人工智能领域带来根本性突破,类似DNA结构之于生物学 [14]
报告称东南亚正成为人工智能投资新热点地区
中国新闻网· 2026-01-09 07:37
东南亚人工智能投资与市场格局 - 咨询公司报告指出,东南亚正成为人工智能投资的新热点地区,并成为中美AI模型的“试点高地” [1] - 尽管东南亚市场较为分散、语言多样,但AI应用正快速增长,主要集中于金融科技、电子商务和物流等领域 [1] - 东南亚的企业和政府根据不同需求采用不同技术,博采众长,例如采用中国企业的开源模型和美国企业的闭源模型算力 [1] 全球人工智能发展格局与关键转折 - 报告分析指出,长期以来大语言模型的开发主要以美国为主导,但2025年全球人工智能与大模型发展格局迎来关键转折,中国是重要推动力量 [1] - 以DeepSeek为代表的先进模型正助力中国在AI领域逐步实现从“跟跑”到“领跑”的跨越 [1] - 中国AI的发展路径日益依托于越来越多的国产模型,以及充满活力、百舸争流的创新体系 [1] 中国人工智能发展基础与产业应用 - 中国企业对AI开源模型的探索加速了人工智能的普及与创新 [2] - 中国已构建起高度数字化的生态系统,为AI训练与部署提供了海量数据基础 [2] - 人工智能与物联网等技术深度融合,形成显著的协同效应,持续推动中国企业运营效率提升,制造与零售等领域受益尤为显著 [2] 中国人工智能技术的海外拓展路径 - 作为“世界工厂”,中国企业可以将AI技术嵌入实体产品,通过出口推动中国人工智能技术走向海外,特别是发展中国家 [2]
智元机器人发布AI大模型开源仿真平台Genie Sim 3.0
新浪财经· 2026-01-08 21:22
核心观点 - 智元机器人在CES 2024上发布了其最新的大语言模型驱动的开源机器人仿真平台Genie Sim 3.0 [2][4] - 公司同时开源了规模庞大的真实机器人作业仿真数据集,旨在为机器人模型研发提供关键的数据基础设施 [2][4] 产品发布详情 - 发布产品为Genie Sim 3.0,是一个由大语言模型驱动的开源仿真平台 [2][4] - 该平台基于NVIDIA Isaac Sim构建 [2][4] - 平台融合了三维重建与视觉生成技术,能够打造数字孪生级的高保真环境 [2][4] - 核心功能是允许开发者通过输入自然语言指令,驱动平台在“分钟级”时间内自动生成并泛化“成千上万个”训练与测试场景 [2][4] 配套数据开源 - 智元机器人开源了包含真实机器人作业场景的仿真数据集,数据量达“上万小时” [2][4] - 该数据集涵盖“200余项”不同的任务 [2][4] - 数据集包含多传感器信息,具体有RGB-D、双目视觉、全身关节状态等 [2][4] - 数据集在多个维度上进行了泛化覆盖,包括背景、布局、光照、噪声等 [2][4] - 该数据集被定位为模型研发的“坚实的数据基石” [2][4]
智元远征A2机器人与韩国总统握手
观察者网· 2026-01-08 15:12
公司动态与产品发布 - 2026年1月7日,韩国总统李在明在访华期间与智元创新(上海)科技股份有限公司的智元远征A2人形机器人进行了互动,机器人以“这可让我受宠若惊呢!”回应握手[1][3] - 智元远征A2是面向商业服务与文娱商演场景的全尺寸通用人形机器人,也是全球首个实现规模化商业部署并获得中美欧三重认证的全尺寸人形机器人[3] - 在美国拉斯维加斯举行的国际消费电子展(CES 2026)上,智元机器人展示了其具身智能生态,包括远征A2、灵犀X2、精灵G2、酷拓D1在内的多款人形机器人产品,远征A2在现场运用多语种交互并表演舞蹈[3] - 智元机器人在CES 2026发布了首个大语言模型驱动的开源仿真平台Genie Sim 3.0,该平台基于NVIDIA Isaac Sim,融合三维重建与视觉生成技术,能够快速生成高保真数字孪生环境[4] - Genie Sim 3.0平台利用MetaCam手持3D激光扫描仪,结合高分辨率RGB、LiDAR点云与RTK定位,实现真实环境的毫米级复刻,对于任意物体,仅需一段60秒环拍视频即可生成带精确网格的仿真模型[4] - 智元机器人宣布将同步开源包含真机作业场景的上万小时仿真数据集,构建覆盖超过10万个场景的多维度评估体系,所有仿真资产、数据集及评测源代码均已通过GitHub完全开源[4] - 在CES 2026上,由上纬新材旗下品牌“上纬启元”打造的全身力控小尺寸人形机器人启元Q1首次公开亮相,该机器人可实现背包级收纳,核心QDD关节仅鸡蛋大小[5][7] - 上纬启元董事长彭志辉(稚晖君)称,启元Q1让市场进入“每个人可拥有、可使用、可创作”的新阶段,主要面向科研人员、创作者与家庭用户三类核心人群[7] 战略合作与业务整合 - 在CES 2026展会前夕,智元机器人已与AI公司MiniMax(上海稀宇科技)达成合作,MiniMax将为智元机器人提供文本到语音全流程AI技术支持[4] - MiniMax将针对智元机器人的产品定位与功能特性,量身打造专属人设体系,优化语音交互体验,并基于人设体系构建定制化提示词策略,为用户生成专属音色[5] - MiniMax还将基于自研音乐生成模型,助力智元机器人拓展娱乐场景玩法,这一合作标志着全模态AI技术加速向具身智能领域渗透[5] - 2025年7月,智元机器人通过协议转让与要约收购方式收购上纬新材,并于同年11月完成股份交割,收购后,智元机器人联合创始人彭志辉出任上纬新材董事长[7] - 业务整合后明确了分工:上纬新材将更多聚焦面向消费者的C端个人机器人产品,智元机器人则继续深耕B端及产业级市场[7] 技术研发与人才布局 - 酷拓D1四足机器人搭载RL强化学习运控算法,适用于复杂地形巡检,同时展出的还有用于精细化操作的OmniHand灵巧手系列产品[3] - 2026年1月6日,北京大学长聘副教授董豪加入上纬新材(上纬启元)并出任首席科学家,将负责具身智能模型领域的技术研发与战略布局[8] - 董豪现任北京大学计算机学院前沿计算研究中心长聘副教授,是科技创新2030国家重大项目负责人,主要研究方向包括具身智能、强化学习、大模型、计算机视觉及机器人系统[8] - 董豪在国际顶级会议和期刊发表论文90余篇,谷歌学术引用过万次,曾获得多项国际奖项并担任多个顶级会议领域主席或程序委员会成员[8]
中信证券:看好智谱领军国内通用大模型 公司2025年收入超1亿美元
证券日报之声· 2026-01-08 13:37
行业市场前景 - 中国大语言模型市场规模预计从2024年的53亿元增长至2030年的1011亿元,2024-2030年复合年均增长率达63.7% [1] - 到2030年,中国企业级大语言模型市场规模预计达到904亿元,占整体市场比例接近90% [1] - 未来6年,国内大语言模型市场规模或将实现同比20倍增长,企业级需求将主导千亿元机会 [1] 公司市场地位与财务预测 - 智谱是国内通用大模型领军企业,按2024年大语言模型收入计,其市占率为6.6%,是最大的独立大语言模型厂商 [1] - 公司过去两年收入实现持续翻倍以上增长,2025年收入超1亿美元 [1] - 中信证券预计公司2025年、2026年、2027年营业收入分别为7.38亿元、16.04亿元、26.86亿元 [1] 公司技术与产品能力 - 公司模型具备高性价比、低幻觉率等特点,GLM-4-9B模型在顶级模型中实现了最低的幻觉率之一(1.3%) [2] - 模型参数规模覆盖从端侧部署(9B)到旗舰模型(355B),满足不同企业需求 [2] - 最新旗舰模型GLM-4.7在代码和Agent能力方面表现优异,刷新国产模型代码SOTA,在逻辑推理、代码生成、屏幕识别等领域达到国际先进水平,与海外头部模型差距进一步缩小 [2] - GLM-4.7在CodeArena和LiveCodeBeach上位列开源第一 [3] 公司业务结构与客户 - 当前公司收入中,本地部署收入占比85%,云端收入占比过去两年从0提升至15%,预计中期云端收入占比将持续提升 [2] - 在本地部署业务方面,单客户年费付费2024年超过200万元,过去两年翻倍增长 [3] - 分行业看,2024年50%收入来源于互联网与科技行业,未来六个月将优先拓展消费电子及物联网行业,中期计划进军教育和医疗等高准入门槛行业 [3] 公司增长驱动与市场认可 - 模型能力提升带动各领域应用加速落地,公司本地部署业务有望迎来客户数和客单价的快速同步提升 [3] - 新产品如GLMCodingPlan、AutoGLM性能优异,2025年带动公司全球付费用户数快速提升 [3] - 开放平台Bigmodel.cn全年平台付费客户数同比增长10倍,2026年高性价比代码工具或对公司云端收入产生更大影响 [3] - 公司在OpenRouter、Fireworks等海外平台上得到企业认可 [2] - 公司于1月8日正式挂牌港交所,盘中最高触及128港元,较发行价116.2港元上涨约10.15% [3]
黄仁勋、杨元庆官宣合作:推出“人工智能云超级工厂”;智元发布开源仿真平台Genie Sim 3.0丨AIGC日报
创业邦· 2026-01-08 12:34
联想与英伟达合作推出AI云超级工厂 - 联想集团与英伟达官宣合作,将携手推出“联想人工智能云超级工厂”[2] - 合作将采用英伟达最新发布的Rubin Platform,旨在帮助云服务提供商极大缩短AI部署的“time to first token”[2] - 该计划可迅速扩展规模至十万台GPU,支持万亿参数级别的智能体和大语言模型[2] - 合作基础在于联想制造了全球大部分的超级计算机,并具备大规模自主设计、制造与全球化服务整合能力[2] - 联想的海神液冷技术也将深度融入该合作计划[2] 道通科技发布智能充电产品并推进合作 - 道通科技正与全球自动驾驶领域头部公司推进自动充电网络合作,该合作方核心业务为提供无安全员的自动驾驶出租车服务,并已在美国多地开展付费运营[2] - 公司在CES 2026上发布了智能充电机器人,可在云端调度与站端控制协同下,完成充电枪自动插拔、回收等动作,并与车队队列管理形成连续作业流程[2] - 道通科技展示了“新一代智能充电网络”的系统能力布局,包括V2G交流充电新品AC Compact Gen 2、紧凑型直流快充新品MaxiCharger DC50以及充电云平台[2] 智元机器人发布开源仿真平台Genie Sim 3.0 - 智元机器人在CES上正式发布首个大语言模型驱动的开源仿真平台——Genie Sim 3.0[2] - 该平台基于NVIDIA Isaac Sim,融合三维重建与视觉生成,打造数字孪生级的高保真环境[2] - 平台首创大语言模型驱动的场景泛化技术,使万级场景的生成只需几分钟[2] - 公司同步开源了包含真实机器人作业场景的上万小时仿真数据集[2] - 平台构建了覆盖10万+场景的多维度智能评估体系,为模型能力绘制全景画像[2] 石头科技推出新型扫地机器人 - 石头科技展示了一款名为Saros Rover的家用扫地机器人,该机器人配有两条腿、能够爬楼梯[2] - Saros Rover利用人工智能、多个运动传感器和3D空间信息进行导航,其双腿可独立升降,从而实现跨越阶梯和在不平整地面行驶[2] - 在媒体演示中,该机器人成功爬上了几级台阶,走下斜坡,并完成了一次可用于下楼或避开障碍物的小跳跃[2]
强强联合!晶泰科技(02228)与晶科能源共建合资公司 AI 推进光伏效率极限
智通财经网· 2026-01-08 09:33
合作核心内容 - 晶泰科技与晶科能源子公司签署战略合作协议,将共同成立合资公司,共建全球首个“AI决策-机器人执行-数据反馈”全闭环叠层电池智造线,开发高效率、高稳定性的太阳能电池产品 [1] - 合作旨在通过AI+自动化高通量研发,重塑光伏研发范式,加速钙钛矿叠层等下一代光伏技术的产业化进程 [1] - 双方将采用“技术导入+联合开发”模式,产出的知识产权在钙钛矿领域将由晶科能源与晶泰科技共同实现商业化 [8] - 晶科能源预计钙钛矿叠层电池有望在未来三年左右迈向规模化量产 [8] 晶泰科技的核心能力 - 公司聚焦AI与材料科学交叉创新,打造了行业领先的AI for Science研发平台,整合量子物理算法、AI预测模型与大规模机器人自动化实验 [3] - 智能自主实验平台拥有超200台自动化机器人,规模全球领先,能以传统实验室40倍的效率收集高精度研发数据 [3] - 开发了超200种AI算法与垂直领域模型,可对分子、晶体、聚合物进行高精度理性设计开发及工艺优化 [3] - 平台已服务于17家全球排名前20的国际药企,并将技术积淀迁移至新材料研发 [3] - 打造了量子物理与AI双驱动的算法引擎,能从分子、原子层面优化钙钛矿材料及界面,高精度预测材料性能 [4] - 自主研发了为AI算法引擎而生的自动化机器人数据基建,其高通量、模块化智造线可覆盖光伏材料研发全链条流程闭环,替代传统人工实验 [4] - 拥有PatSight文献数据挖掘平台与机器人自动实验与原位表征能力 [4] 晶科能源的核心能力 - 公司是光伏行业技术领军企业,累计研发投入超过200亿元,研发团队规模近2000人 [5] - 拥有超过5500件专利,其中已授权专利超过3100件,是行业内专利申请和授权数量最多的企业之一 [5] - 在N型TOPCon技术领域拥有相关专利731件,并推动了该技术成为行业主流 [5] - 研发基础设施完善,拥有多项国家级资质认证,并设有叠层技术重点实验室等20个省级科研平台 [5] - 基于TOPCon技术平台的高效电池转换效率达到27.79%,基于N型钙钛矿叠层电池转换效率达到34.76%,分别打破世界纪录 [5] 合作的技术路径与目标 - 双方将结合晶科的产业经验数据、晶泰的文献挖掘数据与自动化实验平台生成的高精度数据,首次将上百种钙钛矿材料配方与复杂的薄膜制备工艺参数编码化(tokenize),建立专属化的钙钛矿-晶硅叠层实验数据库 [4][7] - 基于数据库关键参数,晶泰科技将开发专属小模型与大语言模型驱动的AI研发引擎,整合多任务深度学习模型与物理约束机器学习模型,实现多模态AI推理和进化迭代循环 [1][7] - AI引擎将专注于叠层结构设计、材料筛选、电学与光学性能预测、工艺参数优化等关键任务 [7] - 将构建业内首条千平米级AI高通量叠层太阳能电池实验线,实验通量预计将达到1000片/天,带来实验通量的百倍级提升 [8] - 机器人工作站可自动执行前驱体合成、薄膜制备与原位表征等关键步骤,形成“设计-实验-反馈-优化”的闭环机制,一站式完成材料配方、制备工艺设计 [8] 技术应用前景与行业影响 - 钙钛矿-晶硅叠层组件有望显著降低度电成本,较传统技术提升15%左右的系统经济性 [6] - 钙钛矿叠层电池凭借“高效率、低成本、轻量化、柔性化”等优势,是太空光伏中长期的最优解,可显著缩减卫星太阳能翼展开面积 [6] - 基于自动化平台加速开发出的高性能钙钛矿-晶硅叠层太阳能电池,将为高密度算力基础设施提供更优质的持续供能支持,加速下一代光伏技术在极端环境与高可靠性应用中的技术融合 [8] - 此次合作预示着当AI与自动化机器人取代传统“试错法”,整个光伏产业的创新速率与边界将被重新定义,开启光伏研发范式的革新 [9]
晶泰科技与晶科能源将共建合资公司
新浪财经· 2026-01-08 09:13
公司与晶科能源子公司达成战略合作 - 晶泰控股与晶科能源股份有限公司子公司签署了人工智能与自动化高通量叠层太阳能电池研发战略合作协议 [1] - 双方将共同成立合资公司 [1] - 合作旨在共建全球首个“AI决策—机器人执行数据反馈”全闭环叠层电池智造线 [1] 合作项目具体内容与目标 - 合资公司将开发适用于不同应用场景的高效率、高稳定性太阳能电池产品 [1] - 合作将建立联合实验室 [1] - 实验室将突破性地对材料结构、配方、工艺、表征结果、器件性能等关键参数进行编码化 [1] 技术路径与行业影响 - 项目将实现基于大语言模型以及多模态AI推理和进化的迭代循环 [1] - 此举旨在重塑光伏研发范式 [1] - 目标是加速颠覆性技术的产业化进程 [1]
一图看懂智谱(02513.HK)IPO
格隆汇· 2026-01-08 09:06
发行信息 - 本次发行股份数量为37.4195百万股 [3] - 发售价为每股116.20港元 [5] 公司概况与市场地位 - 智谱是一家中国领先的人工智能公司,成立于2019年,致力于开发先进的通用大模型(AGI)[6] - 公司是中国最早独立自主完成逾千亿参数规模大模型研发的厂商 [12] - 按2024年收入计,公司是中国第二大语言模型开发商 [13] - 按2024年收入计,公司是中国第三大整体大模型开发商 [14] 商业模式 - 公司采用模型即服务(MaaS)平台商业模式 [7] - 该平台提供灵活的模型部署选项,包括访问模型矩阵和一系列智能体工具,使机构客户能高效、低成本地进行模型调用、微调和应用开发 [43] 市场前景 - 以收入计,中国大语言模型市场规模从2022年至2024年的年复合增长率为+264.0% [11] - 预计从2024年至2030年,该市场规模年复合增长率为+63.5% [11] - 2024年市场规模为10.7十亿元人民币,其中企业级市场为10.1十亿元,消费者市场为0.6十亿元 [11] - 预计到2030年,市场规模将增长至90.4十亿元人民币,其中企业级市场为85.7十亿元,消费者市场为4.7十亿元 [11] 技术实力与产品里程碑 - 2020年底:研发GLM预训练架构 [20] - 2021年:训练完成百亿参数模型GLM-10B [21] - 2022年:研发并开源了中英双语千亿级超大规模预训练模型GLM-130B,成为中国首个千亿参数规模的开源预训练大模型 [23] - 2023年:推出千亿基座对话模型ChatGLM并两次升级 [24] - 2024年1月:推出新一代基座大模型GLM-4 [24] - 2024年10月:发布为手机应用使用设计的装置控制智能体模型AutoGLM,以及为计算机使用设计的AI Agent GLM-PC [24] - 2025年3月:发布AutoGLM-Rumination,能够自主执行需要“边想边干”的智能体任务并持续数十分钟 [24] - 2025年7月:推出最新旗舰基座模型GLM-4.5,根据弗若斯特沙利文资料,在2025年7月进行的12项业界标准基准测试评估结果中,该模型全球排名第3,中国排名第1 [24] - 2025年12月:新版本模型GLM-4.7在多项主流公开基准测试中取得开源模型中的最佳表现,以1768分综合成绩荣登开源模型与国产模型双料榜首 [24] - 在全球知名的权威大模型评测榜单Artificial Analysis Intelligence Index (AA智能指数) 中,公司模型排名开源第一、国产第一,超过GPT-5.2 [26][27] - 在全球百万用户参与盲测的权威编码评估系统Code Arena中,公司模型同样表现领先 [28] 产品矩阵 - 公司拥有全面的大模型矩阵,包括语言大模型、多模态模型、代码模型和智能体模型 [29][31][32][33] - 具体产品包括GLM-4系列、GLM-4.5V、CogView、VideoX-2、Realtime-Voice、GLM-Z1-Rumination、AutoGLM、GLM-PC、CodeGeeX4-ALL-9B、CodeGeeXAgent等 [31][32][33] 研发与学术背景 - 公司核心团队具有清华大学等顶尖科研机构和高校的专家背景 [39] - 截至2025年6月30日,公司研发人员占比超过74% [38][39] - 截至2025年6月30日,公司的精英科研团队和顾问团队已发表约500篇顶尖高影响力论文,累计引用次数超过58,000次 [35][36] - 2024年5月,国际顶级学术期刊《NATURE》报道ChatGLM模型,将其视为中国基座大模型的代表 [34] - 公司曾在国际学习表征会议(ICLR)和国际万维网大会(WWW)等国际顶级学术会议上发布研究成果 [34] 商业化与客户基础 - 公司于2021年开始商业化,比中国通用大模型领域开始大规模商业化实践早了两年,具有先发优势 [28] - 公司赋能了全球超过12,000家企业客户和290万以上的开发者用户 [19] - 公司API平台的企业和开发者用户数超过15万 [16] - 公司服务超过8,000家机构客户 [40] - 公司产品及解决方案已赋能超过4,500万台终端用户设备 [19] - 根据弗若斯特沙利文资料,公司模型GLM-4.5/4.6在全球大模型超市OpenRouter上的调用量稳居全球前10,付费API收入超过所有国产模型 [15] - 针对AI编程场景的订阅产品GLM Coding plan上线两个月,即实现年度经常性收入(ARR)快速增长 [18] 开源战略与生态 - 公司是中国首家发布自研开源大模型的人工智能公司 [47] - 2023年,公司获评为斯坦福大学全球第五大最受欢迎的开源大模型厂商 [47] - 截至2025年6月30日,公司开源了50多个模型,累计下载量超过4500万次 [47] - 公司模型与超过40款主流硬件芯片兼容 [47] 财务表现 - 公司总收入已连续三年营收翻倍 [49] - 2022年总收入为0.45亿元人民币,2023年为1.25亿元,2024年为3.12亿元 [50] - 从2022年至2024年,总收入年复合增长率超过325% [50] - 2024年收入同比增长超过130% [50] - 2022年毛利为0.22亿元人民币,2023年为0.80亿元,2024年为1.76亿元 [53] - 截至2024年5月31日的五个月毛利为0.31亿元,截至2025年5月31日的五个月毛利为0.95亿元 [53]