Workflow
通用人工智能
icon
搜索文档
字节大模型的收敛之年
36氪· 2026-02-12 17:58
公司战略与组织调整 - 2025年字节跳动大模型业务进入“吴永辉时间”,战略从快速突击转向深度整合与长期主义 [1] - 新任负责人吴永辉上任后,取消了Seed团队的季度及半年OKR考核,以摆脱“小步快跑”模式在大模型领域的不适用性 [1][2] - 2025年初公司内部存在严重的“大公司病”,AI Lab、Seed团队、视觉生成团队、豆包产品技术部四支队伍资源分散、隐性竞争 [3][4] - 公司于2025年进行了三次关键的组织收敛:3月将AI Lab并入Seed;年中将视觉多模态团队纳入Seed体系;10月将豆包技术负责人朱文佳的汇报线调整至吴永辉 [5][6] - 此次整合是公司为数不多以“收敛”而非“扩张”为核心目的的组织调整,旨在打造统一、粗壮的“技术主干” [7][8] - 公司鼓励基础研究,2025年上半年Seed团队在国际顶级学术会议发布的论文数量较2024年同期翻倍增长 [8] - 公司核心目标从“探索智能上限”转变为“勇攀高峰”和“AI模型能力要做到行业前列”,体现了从参与者向第一梯队甚至唯一领导者转变的决心 [9] 产品能力演进与用户策略 - 2025年上半年,豆包产品存在“聊天机器”与“办事助理”之间的能力鸿沟,公司选择通过提升“听懂人话”和“把事办成”能力来填补 [10] - 2025年11月,豆包上线支持同一音色流畅切换四种方言(粤语、四川话、东北话、陕西话)并能识别20种方言的语音功能,旨在服务中国超过10亿的方言用户,争夺“下一个10亿用户” [10][11] - 公司通过发展Agent(智能体)能力提升产品“行动力”:2025年6月发布的豆包1.6版本可实现拍照整理表格、自动操作浏览器预订酒店;12月发布的1.8版本可实现跨平台比价等复杂任务 [12] - Agent能力的提升带来了成本挑战,其单次任务消耗的Token是普通聊天的几十倍,降低成本成为大规模推广的关键 [13] 技术架构与成本优化 - 2025年11月,火山引擎宣布逐步停止服务十余款2024年发布的旧版本模型,引导用户迁移至最新的Seed系列模型,这是公司当年最激进的关键动作之一 [14][15] - 公司坚决推动模型版本统一,旨在清除多套技术架构并存带来的“技术债”,避免未来调用量指数级增长时成本窟窿扩大,并重构商业模式 [16][17] - 公司通过“算力精算”构建成本优势,核心解决“快车等慢车”造成的算力浪费问题 [17] - 2025年6月,豆包1.6版本推出“区间定价”策略,0-32K输入区间的价格降至0.8元/百万tokens,综合成本比1.5版本和DeepSeek R1降低63% [18] - 更深层的优化逻辑是“PD分离”,即将文本处理的“预填充”与“解码”阶段拆解并用不同硬件处理,大幅提升效率 [18] - “旧模型大下架”是达成“降价99%”目标、发起“成本战争”的必要前提,统一的架构使得优化只需做一遍,边际成本得以持续下降 [19] - 成本策略成效显著:豆包日均Token调用量从2025年5月底的16.7万亿增长至12月的超过50万亿,较2024年同期增长超10倍 [21] - 2025年上半年,火山引擎在中国公有云大模型服务市场份额达到49.2%,通过清除技术债获得了结构性成本优势 [21] 研发节奏与市场定位 - 公司形成了以春节为锚点的“研发倒逼机制”,按春节倒排工期,将年度重磅发布集中在春节前后,旨在建立自身的行业节奏和领先优势 [22][23] - 2026年春节,公司通过成为春晚独家AI云合作伙伴、发布豆包2.0及多模态能力升级,集中展示了2025年组织、技术、成本优化的成果,从“缺席者”转变为“造浪者” [23] 行业竞争与未来挑战 - 在开源策略上,字节跳动是中国大厂中唯一坚持闭源路线的公司,而阿里、百度、腾讯均在2025年有不同程度的开源动作 [25] - 公司的闭源模式依赖于火山引擎To B服务收入与豆包To C用户黏性能持续反哺研发,形成正向循环 [26] - 固定以春节为研发节点存在风险,若发布被对手狙击或产品不及预期,将付出巨大代价 [27] - 面临强劲的竞争对手:腾讯重组AI Infra部并拥有微信12亿用户的超级入口;阿里云在开源生态和云服务领域根基深厚;DeepSeek作为创业公司仍具创新潜力 [28][29][30]
“大模型第一股”智谱宣布涨价,股价一度涨超41%
新浪财经· 2026-02-12 17:24
股价表现与市值 - 2026年2月12日,智谱(02513.HK)股价盘中一度上涨超过41%,收盘报402港元/股,涨幅为28.68%,公司市值达到1792.3亿港元 [1] GLM Coding Plan价格调整 - 公司于2026年2月12日发布GLM Coding Plan价格调整函,因市场需求强劲增长、用户规模与调用量快速提升,为保障服务稳定与质量,决定对套餐价格体系进行结构性调整 [3] - 价格调整内容包括:取消首购优惠,保留按季按年订阅优惠;套餐价格进行结构性调整,整体涨幅自30%起;已订阅用户价格保持不变,调整自2026年2月12日生效 [3] 业务与产品进展 - GLM Coding Plan是公司的AI编程服务,截至2025年12月,其付费用户数量已达到270万 [9] - 2025年1月,随着旗舰模型GLM-4.7发布,GLM Coding Plan用户量激增,公司自1月23日起对该服务实施限售,将每日可销售量降为当前的20%以保障现有用户体验,其核心用户群主要集中在美国市场 [9] - 同期,GLM-4.7模型在全球编程能力榜单上并列全球第一 [9] - 2026年2月12日,公司上线并开源GLM-5模型,该模型在编码方法与智能体能力上取得开源SOTA表现,在真实编程场景的使用体感逼近Claude Opus 4.5,在全球权威的Artificial Analysis榜单中,GLM-5位居全球第四、开源第一 [9] - GLM-5已完成与华为昇腾、摩尔线程、寒武纪、昆仑芯、沐曦、燧原、海光等国产算力平台的深度推理适配,在国产芯片集群上实现高吞吐、低延迟的稳定运行 [10] 公司市场地位与财务概况 - 智谱成立于2019年6月11日,致力于开发通用大模型,按2024年的收入计,公司在中国独立通用大模型开发商中位列第一,在所有通用大模型开发商中位列第二,市场份额为6.6% [10] - 公司于2025年1月8日完成港股上市,成为全球首家以通用人工智能基座模型为核心业务的上市公司,被称为“全球大模型第一股” [10] - 财务数据显示,公司2022年、2023年、2024年收入分别为5740万元、1.245亿元、3.124亿元,三年间连续收入翻倍,年复合增长率达到130%,2025年上半年收入为1.909亿元 [10] - 在高研发投入下,公司2022年、2023年、2024年净亏损分别为1.43亿元、7.88亿元、29.58亿元,2025年上半年净亏损达23.58亿元,累计亏损超62亿元 [10] A股上市筹备 - 公司正推进A股上市筹备工作,2025年4月,公司正式向中国证监会北京证监局提交上市辅导备案,由中金公司担任辅导机构 [11] - 2026年1月,中国证监会官网更新了公司IPO辅导进展信息,中金公司已递交了智谱的第三期IPO辅导工作进展情况报告 [11]
AI大模型第一股智谱盘中涨超41%,市值超1900亿港元
环球老虎财经· 2026-02-12 15:17
公司股价表现与直接驱动因素 - 2026年2月12日早盘,公司股价高开8%,随后大幅上涨,截至发稿涨幅达41%,总市值超过1900亿港元 [1] - 股价飙升主要源于两大关键利好:GLM Coding Plan套餐价格上涨与GLM-5模型的正式开源 [1] - 自港股上市以来,公司股价已从120港元飙升至422港元,累计涨幅达251.67% [2] GLM Coding Plan价格调整详情 - 由于市场需求强劲增长,用户规模与调用量快速提升,公司为保障服务稳定性与质量加大了算力与模型优化投入 [1] - 公司对GLM Coding Plan套餐价格体系进行结构性调整,取消首购优惠,保留按季按年订阅优惠 [1] - 套餐价格整体涨幅自30%起,已订阅用户价格保持不变,调整自2026年2月12日起生效 [1] GLM-5模型发布与性能表现 - 公司于2026年2月12日正式上线并同步开源GLM-5模型 [1] - 在Coding与Agent能力上,GLM-5已取得开源SOTA表现,在真实编程场景的使用体感逼近Claude Opus4.5,擅长复杂系统工程与长程Agent任务 [1] - 此前在全球模型服务平台OpenRouter登顶热度榜首的神秘模型"Pony Alpha",经证实即为GLM-5,目前该模型已正式上线chat.z.ai平台 [2] 技术适配与公司业务概况 - GLM-5已与摩尔线程、寒武纪等主流国产芯片平台完成深度适配与算子级优化,可在国产算力集群上实现稳定高效运行 [2] - 公司是国内专注于通用人工智能研发的科技企业,核心业务围绕全栈大模型技术体系展开,拥有国产原创GLM大模型架构 [2] - 公司旗下产品涵盖GLM系列大模型、智谱清言、AutoGLM等,业务覆盖模型服务、智能体应用、全流程开发套件等多个领域 [2] 公司上市进程与资本市场动态 - 公司于2026年1月8日完成港股上市,成为首家以基座大模型研发为核心主业、依据港交所18C章上市的特专科技公司 [2] - 在港股上市后,公司正稳步推进A股上市筹备工作,已于2025年4月向中国证监会北京证监局提交上市辅导备案,由中金公司担任辅导机构 [2] - 公司成为国内大模型"六小虎"中首家启动IPO的企业,辅导机构中金公司已于2026年1月15日递交了公司第三期IPO辅导工作进展情况报告 [2][3]
xAI 关键人物跑路,马斯克 AI 野心遭重创
投中网· 2026-02-12 14:31
xAI联合创始人离职事件分析 - 公司xAI在AI行业竞争最激烈、人才最稀缺的当下,于2026年2月10日失去了第二位联合创始人Tony Wu,他负责被视为下一代AI系统核心竞争力的AI推理能力[6] - 此次离职发生在OpenAI发布新的代码模型、Anthropic的Claude在推理任务上表现越来越出色的关键时期,可能使公司在关键技术赛道上掉队[9] - 过去一年中,xAI创始团队的12名成员已有5名离开,离职率接近一半[9] xAI关键技术负责人离职的影响 - 离职的Tony Wu直接向马斯克汇报,其负责的AI推理能力被认为是当前大模型与真正「通用人工智能」之间的关键桥梁[8] - 从技术角度看,一个推理专家的离开会带走个人能力、技术思路、实验数据及对未来研发方向的判断,在快速迭代的AI行业可能导致至少6个月的研发停滞[9] - 有观点认为,失去Tony Wu对xAI的打击是致命的,就像特斯拉失去电池技术负责人一样,表面运转但核心竞争力已受冲击[9] 公司管理风格与人才流失的关联 - 连续两位联合创始人离职可能源于管理理念的冲突,而非薪酬问题[10] - 马斯克以「极限压榨」式管理著称,这种强调执行效率的风格可能与AI研发所需的创造性思维和长期专注相悖[10] - 在xAI,最终决策权往往掌握在马斯克手中,其宏大的技术愿景(如追求「最大程度的真实」和「理解宇宙」)可能与技术团队更务实的路径选择产生分歧,当CEO意志覆盖技术判断时,容易引发冲突[10] AI行业人才竞争格局 - AI行业顶级人才稀缺程度堪比上世纪核物理学家,优秀研究员可能同时收到多家顶级公司offer,年薪轻松超过50万美元[12] - 留住人才的关键不仅是薪酬,更是平台和氛围,研究员倾向于选择能专注技术、有清晰研发路径且管理层干预少的环境[12] - 与OpenAI、Anthropic等技术团队拥有较大话语权的公司相比,xAI被视作一家「CEO驱动」的公司,在当前的AI人才血战中可能处于劣势[12] 对xAI及行业竞争的潜在影响 - AI行业具有「赢家通吃」的特性,落后半年可能意味着彻底出局,连续失去关键人才对一家仍在寻找技术突破口的公司代价沉重[12] - 在这场AI军备竞赛中,最稀缺的资源是那些真正懂得如何让机器「思考」的人[13] - 有观点指出,马斯克擅长工程化和产品化,但AI研究的前半程更类似于科学研究,需要耐心和试错空间,这与当前公司的管理风格可能存在错配[12]
大多数具身智能创业者并不真正理解 PMF
36氪· 2026-02-12 09:34
行业现状与核心矛盾 - 具身智能赛道热度高涨、资本涌入,但绝大多数创业者尚未找到产品与市场契合点[1] - 行业存在用自动驾驶的旧方法探索具身智能新领域的普遍现象,过度关注外观拟人与模型规模,忽视了机器人在三维世界所需的常识与物理直觉[2] - 许多公司为了融资讲述宏大故事,执着于开发高大上但冗余笨重的人形机器人本体,而非解决产业中如灵巧手等具体痛点[5] 产品与市场契合问题 - 产品与市场契合是创业成功的第一步,在机器人领域需真实用户长期使用验证,而非仅凭订单或好奇心判断[1] - 当前许多产品定价基于硬件成本加利润率,而非真正的市场价值认知,与产品市场契合度无关[4] - 行业缺乏长线的产品定义能力,定义有真实投资回报率的细分工具极难,导致公司倾向于讲述通用人工智能载体的宏大故事以吸引投资[6] 市场定价与商业闭环 - 当前市场定价呈现两极分化:一端是数百至数千元的情感消费产品,另一端是十万元乃至数十万元起的生产力工具,后者需明确投资回报率[4] - 中间价格带产品面临尴尬,约1万多美元的产品既不足以打动大众消费,也无法通过替代人工创造明确投资回报率[4] - 制造业客户最为现实,只关注投资回报率,若机器人效率与稳定性不如低成本自动化方案,则不会购买[5] 订单与商业模式真实性 - 行业存在将机器人卖给上游供应商以美化营收数据、助力融资的潜规则,这种资源置换模式难以为继[5] - 此类订单并非源于工厂、仓库等真实作业场景的需求,无法形成可持续的商业模式[5] 研发策略与行业惯性 - 许多公司研发策略类似“手枪模式”,资源有限、目标不清、依赖运气,缺乏预留失败与迭代空间的规划[7] - 团队背景多来自自动驾驶或消费电子领域,其强大的工程化能力与惯性思维可能导致用硬件思维主导开发,而非算法优先[9] - 试图复刻自动驾驶的数据飞轮模式面临挑战,机器人所处的非结构化三维环境更复杂,昂贵硬件可能先于飞轮运转而损坏[9] 技术整合与产品开发 - 软件与硬件团队协作不畅,产品如“缝合怪”,导致强壮昂贵的身体与反应迟钝的大脑不匹配[8] - 正确的开发逻辑应是算法先行,在虚拟环境中训练成熟后,再反向定制最精简、适配的身体硬件[10] - 过度专注于打磨如关节阻尼、排线走位等硬件细节,在企业级人工智能战略转型中可能失效[9] 行业发展瓶颈与出路 - 当前瓶颈主要在于行业分工理解缺失,而非算力或算法问题,现状类似早期微机时代的高度垂直一体化,公司精力耗在造零件而非琢磨用户需求[11] - 商用客户核心关切是稳定性、明确的人力替代能力以及足够低的边际成本,而非技术炫技[11] - 全球商用服务机器人市场规模预计从2025年的80亿美元增长至2034年的308亿美元,年复合增长率约21.3%,但高部署成本与投资回报率证明困难是主要 adoption 障碍[13] - 成功企业将率先理解社会化分工与边际成本曲线,将非差异化部分交给成熟供应链,集中资源创造核心价值[13] - 应深入真实场景发现痛点,例如专注解决“抱抱”需求的Lovot产品更接近产品市场契合真相[14] - 关键在于厘清谁愿付费及为何付费,而非仅关注技术光环[14]
xAI 关键人物跑路,马斯克 AI 野心遭重创
36氪· 2026-02-11 14:13
文章核心观点 - 马斯克旗下人工智能公司xAI面临严重的人才流失问题 特别是在AI推理这一关键技术领域连续失去两位联合创始人 这可能冲击其技术研发进度与核心竞争力 并在激烈的行业竞争中面临掉队风险[1][3][4][14] 关键人才流失 - xAI联合创始人Tony Wu于2026年2月10日宣布离职 其负责被视为下一代AI系统核心竞争力的AI推理能力[1] - 这是继2025年8月Igor Babuschkin离职后 xAI失去的第二位联合创始人[1] - 过去一年中 xAI创始团队的12名成员已有5名离开 离职率接近50%[5] 对xAI的技术与竞争影响 - Tony Wu的离职对xAI打击致命 其负责的AI推理能力是当前大模型与通用人工智能之间的关键桥梁[2][3] - 在AI这个以月计快速迭代的行业 失去关键技术负责人可能导致至少6个月的研发停滞[4] - 离职时机关键 正值OpenAI在AI编程取得突破 Anthropic的Claude在推理任务表现出色之际 xAI可能在最关键的技术赛道上掉队[4] - 有观点认为 失去Tony Wu如同特斯拉失去电池技术负责人 公司核心竞争力已受冲击[5] 人才流失的潜在原因 - 问题可能源于管理理念冲突 马斯克以“极限压榨”式管理著称 强调执行效率 但这可能与AI研发所需的创造性思维和长期专注相悖[7][8][9] - 存在技术路线分歧风险 马斯克为xAI设定了“最大程度的真实”和“理解宇宙”的宏大愿景 但在具体技术实现上可能需要更务实的选择[9] - 在xAI 最终决策权往往掌握在马斯克手中 这与传统AI研究机构中技术专家拥有更大话语权的模式不同[10][13] AI行业人才竞争背景 - 当前AI行业顶级人才稀缺程度堪比上世纪核物理学家[12] - 优秀AI研究员可能同时收到OpenAI、Anthropic、Google DeepMind的邀约 年薪轻松超过50万美元 股权价值巨大[13] - 留住人才的关键不仅是薪酬 更是平台与研发氛围 研究员倾向于选择能专注技术、有清晰研发路径且不受管理层频繁打扰的环境[13] - OpenAI和Anthropic由AI研究员主导 技术团队在关键决策中有足够话语权 而xAI被视为一家“CEO驱动”的公司[13] - 在AI这场“赢家通吃”的竞争中 落后半年可能意味着彻底出局[14]
破解行业“硬骨头”难题,中国成全球最大规模AI“练兵场”
环球时报· 2026-02-09 06:53
全球AI竞争格局与中美路径差异 - 全球人工智能竞赛进入以产业深度赋能为标志的“下半场”,核心在于率先实现AI对产业变革的深度赋能[1][3] - 中美呈现双强格局但路径迥异:美国模式以供给侧创新为驱动,聚焦“从0到1”的基础突破,试图通过掌控高端芯片与闭源大模型构筑技术霸权[3] - 中国模式以需求侧应用为驱动,依托全球最完整、规模最大的产业体系,致力于将AI技术深度融入实体经济,在行业渗透与规模化应用方面展现出追赶乃至反超势头[1][3][4] AI成为经济增长核心动能与关键窗口期 - AI正成为全球经济增长核心动能,预计到2030年将为全球经济贡献19.9万亿美元,并推动全球GDP增长3.5%[4] - 在中国,AI预计将贡献GDP增量的26.1%[4] - AI发展已迈入“赋能产业”的深水区,处在应用落地的关键窗口期,社会各界应用需求强烈[5] - 在一份涵盖32个典型AI应用案例的调查中,有15个案例来自中国企业,比例接近一半[5] 中国AI算力发展的挑战与创新 - AI算力需求结构已从“训练主导”全面转向“推理主导”,推理对算力的规模化、即时性要求更高[7] - 高端芯片受限倒逼中国AI产业进行“效率革命”,通过架构创新弥补硬件差距,例如华为云CloudMatrix384超节点用384颗昇腾NPU和192颗鲲鹏CPU实现单节点算力超300P[8] - 国产算力硬实力显著提升,但生态建设是核心瓶颈,国产芯片的编程生态在使用便捷性、场景适配度上仍需打磨[8] - 为应对高企的算力成本,建议由政府牵头建设区域性算力中心,供中小企业按需使用并给予一定支持[8] AI深度赋能千行百业的实践案例 - 在农业领域,AI被用于研究和预测猪周期,并通过智能系统自动控制养猪环境的温度、湿度和空气流通[9] - 新希望集团利用AI自主育种,其研发的“中新北京鸭”已累计推广20多亿只[9] - 在白酒行业,AI大模型被用于质量检测,可检测100微米(头发丝精度)的异物,检出率达到99.99%[9] - AI技术通过采集优秀技工的生产数据并训练大模型,使白酒酿造的传统经验可量化、可传承,提升了生产质量和效率[9] - 在汽车产业,智能驾驶融合AI、高端芯片、传感器等技术,大模型通过海量数据学习为智驾产业带来新解法,提升系统泛化能力和场景理解能力[9] AI的战略定位与核心使命演变 - “十五五”规划建议提出全面实施“人工智能+”行动,加强AI同产业发展、文化建设等相结合,抢占人工智能产业应用制高点[1] - AI已不再是单一技术,而是像水电煤一样,成为推动千行百业转型升级的基础设施与关键驱动力,是发展新质生产力的核心引擎[4] - AI的核心使命正从“预测下一个词”的语言游戏,升级为解决真实物理世界的问题,致力于让人们摆脱危险工作,提升行业场景效率,实现生产力的规模化提升[4][6][9]
全新视角看世界模型:从视频生成迈向通用世界模拟器
机器之心· 2026-02-07 12:09
文章核心观点 - 视频生成与世界模型是人工智能领域的热点,其目标是从生成逼真短片发展为可用于推理、规划与控制的通用世界模拟器,并与具身智能、自动驾驶等前沿场景深度交织,被视为通往通用人工智能的重要路径[2] - 当前研究存在定义模糊、分类重叠等问题,限制了技术标准化发展,为此快手可灵团队与香港科技大学(广州)团队联合发表了一篇系统综述,旨在弥合当代“无状态”视频架构与经典“以状态为中心”世界模型理论之间的鸿沟[2][3] - 该综述首次提出了以“状态构建”与“动态建模”为双支柱的全新分类体系,并倡导将评估标准从单纯的“视觉保真度”转向“功能性基准”,为视频生成演进为鲁棒的通用世界模拟器提供了清晰的路线图[3] 核心理论贡献 - 提出了全链路视角,涵盖从底层理论定义、中层架构设计到上层功能性评估的全生命周期分析,确保对视频世界模型全方位的理解[8] - 首次将当代“无状态”的视频扩散架构与经典的基于模型强化学习、控制理论进行深度映射,为世界模型找到了坚实的理论根基[8] - 明确了“持久性”与“因果性”是迈向通用世界模拟器的两大核心关隘,为业界从被动的“像素预测”转向具备闭环交互与因果干预能力的模拟器提供了清晰的路径参考[8] - 深度梳理了2024至2025年间涌现的视频生成最新工作,反映了当前技术从视觉保真度向物理一致性转化的前沿趋势[8] 世界模型的三大基石与核心操作 - 观察:环境的原始感官数据,在视频模型中表现为高维的像素级输入,提供世界的局部、间接视图[8] - 状态:模型通过提炼历史观察,过滤噪声,形成的足以解释当前世界的“内部表示”[8] - 动态变化:预判未来的“引擎”,它刻画了状态随时间演变的规律,让模型具备在脑海中“预演”物理法则的能力[9] - 状态估计:把高维、连续的观测序列压缩成一个紧凑的状态表示,用来刻画环境在当前时刻的关键状态[13] - 状态转移:刻画环境在动作作用下的因果演化,是世界模型的“内部模拟引擎”,用于预测未来状态或观测[13] 世界模型的学习方式 - 闭环学习:世界模型与策略模型联合训练,世界模型的参数更新直接受策略目标影响,可进一步分为顺序组合架构与统一架构[14] - 开环学习:将世界模型视为通过大规模被动数据预训练得到的独立模拟器;策略模型可在自身优化中调用世界模型进行“想象/规划”,但世界模型不接收来自策略奖励信号或损失函数的梯度更新[14] 支柱一:状态构建 - 现代视频生成模型在状态层面存在关键差距:多数模型缺乏显式压缩状态,而以观测序列充当隐式状态,随时间增长带来计算/记忆负担并削弱长程持久性[12] - 隐式状态范式:不构建固定大小的显式状态变量,而是通过外部记忆机制管理历史观测,动态提炼出“工作记忆”来支撑生成所需的长期一致性与上下文连贯[16] - 显式状态范式:将状态构建内化为模型自身的压缩过程,把历史上下文持续蒸馏进一个全局更新的潜在变量中,使其成为对视频演化过程的固定维度、可递推的数学摘要[17] - 隐式状态的管理机制主要包括压缩、检索和巩固三种核心操作,以处理长上下文信息[18] - 显式状态根据其与生成骨干的融合程度,可分为耦合状态与解耦状态[19] - 隐式状态与显式状态的系统性对比:隐式状态机制依赖外部管理,上下文选择多为启发式学习或基于规则,持久性受限于窗口,计算复杂度随历史长度线性或二次增长;显式状态机制依赖内部递归,上下文选择基于学习的物理/转移规律,支持全局连续性和无限时长,计算复杂度为常数[23] - 总体取舍是:隐式状态目前更稳妥地支持高保真视频生成,而显式状态更像通往高效、可长期推理的自主智能体与世界模拟的前沿方向[22] 支柱二:动态建模 - 现代视频生成模型在动态层面存在关键差距:标准模型常以双向注意力“一次性渲染”固定时长片段,缺少显式时间因果推进[12] - 增强因果推理能力的两条主要路径:一是因果架构重构,从模型结构与训练目标入手,把生成过程从“一次性渲染”改造成“按时间顺序预测”;二是因果知识集成,引入具备更强推理能力的多模态大模型作为“规划者/导演”,先在高层完成规划,再由视频生成模型负责高保真“渲染”[25] 评估标准的演进 - 主张将评估从“视觉美感”推进到“功能基准”,并提出三条核心评价轴:质量、持久性和因果性[26] - 质量:关注基础视觉保真度、短程时序相干性以及文本/条件对齐能力,代表性工具如VBench/VBench++等[44] - 持久性:关注长时程生成的稳定性与一致性,并通过“场景重访”等记忆任务检验模型能力,相关评测包括WCS以及基于rFID的重建一致性测试等[44] - 因果性:重点检验模型是否真正内化物理与逻辑规律,评测包括时间顺序与物理有效性,以及反事实干预下的响应是否合理,并进一步延伸到agent-in-the-loop的任务成功率与规划表现[44] 未来研究方向 - 视频生成迈向世界模拟的关键在于补齐两项核心能力:持久性与因果性[27] - 持久性方面:隐式状态需要从固定窗口等启发式记忆升级为可学习、可动态筛选的信息管理机制;显式状态则要在压缩效率与细节保真之间找到更好的平衡[27] - 因果性方面:一条路线是通过架构与数据设计提升因果推断能力,另一条路线是引入理解模型的推理先验来约束生成,但如何有效对齐生成与理解仍是核心挑战[27]
品茗科技市值管理“新范式”?增长乏力战投“拉爆”市值 公司高管精准高位套现
新浪财经· 2026-02-06 15:58
公司业绩与财务表现 - 公司发布2025年业绩预增公告,预计营业收入为4.20亿元至4.50亿元,与上年基本持平 [1][11] - 预计2025年归母净利润为4600万元至5000万元,同比增长46.13%至58.83% [1][11] - 预计2025年扣非净利润为3440万元至3840万元,同比增幅达63.60%至82.62% [1][11] 行业背景与公司经营状况 - 公司专注于建筑信息化领域,主营业务包括建筑行业软件开发、销售及技术服务,产品涵盖工程造价、施工管理、BIM应用等 [2][12] - 建筑行业处于底部修复期,政府资金紧平衡等因素拖累行业增长,行业效益下滑 [4][14] - 地产行业景气度处于周期底部,对建筑业发展形成阻力 [4][14] - 公司员工规模大幅缩水,2021年员工数量超1500人,截至2025年6月底总人数为1010人,较2021年缩水超三成 [4][15] 业务构成与战略调整 - 2025年上半年,公司建筑信息化软件业务营收为10,769.11万元,占总营收57.44%,同比增长14.15% [6][13] - 2025年上半年,智慧工地产品业务营收为7,979.43万元,占总营收42.56%,同比下滑12.15% [6][13] - 公司称造价软件业务快速适配新版工程量清单标准,实现政策红利转化,带来业务增长 [6][13] - 公司表示正持续提升软件业务的营收比重,因该业务具有高毛利、快速回款等特点 [6][16] - 公司高度重视并持续加大对AI技术在建筑信息化软件的升级改造,推动AI技术赋能建筑产业 [6][16] 控制权变更与战略投资者引入 - 2025年9月,公司公告筹划控制权变更事项并停牌,后于9月24日公告终止筹划控制权变更,但确认了权益变动 [7][17] - 公司控股股东、实际控制人及其他主要股东与通智清研签署《股份转让协议》,转让方合计转让1255.22万股,占公司股份总数的15.9206% [7][17] - 股份转让价格为39.504元/股,转让价款合计4.96亿元 [7][17] - 协议转让后,莫绪军持有公司20.06%股份,仍为控股股东及实控人,通智清研持有15.92%股份,成为公司第二大股东 [8][18] - 通智清研的实际控制人为通智人工智能科技(北京)有限公司,后者是北京通用人工智能研究院(通研院)的全资产业转化平台 [8][9][18] 股价表现与高管减持 - 自2025年9月17日至2025年12月11日,公司股价区间涨幅接近3倍 [9][19] - 2025年12月2日,公司高管陈飞军累计减持公司股份42,943股,占公司总股本比例0.05% [11][20] - 陈飞军于2025年8月7日辞去公司董事职务,辞任后仍担任公司副总经理 [11][20]
科学智能领域迎来“上海时刻”
新浪财经· 2026-02-05 15:53
公司发布与战略 - 上海人工智能实验室开源了全球首个基于“通专融合”架构的万亿参数科学多模态大模型Intern(书生)-S1-Pro [1] - 该模型是全球开源社区中参数规模最大的科学模型,其性能表现稳居全球第一梯队 [1] - 公司旨在通过开源降低全球科研门槛,与学术界和产业界共同推动以通用人工智能驱动科学发现的范式革命 [1] - 该模型验证了从原创模型架构到国产算力基座自主技术的完整链路 [1] 技术架构与创新 - 模型通过多项SAGE基础模型层的技术创新,拓宽了应用边界并提升了超大规模训练可行性 [2] - 研究团队引入了傅里叶位置编码并重构时序编码器,以构建能更深层次理解物理世界规律的科学大模型 [2] - 团队革新了内部的“路由机制”,通过“路由稠密估计”提升模型学习充分性和稳定性 [2] - 采用“分组路由”策略实现海量计算芯片的负载均衡,避免了资源闲置和算力浪费 [2] 行业影响与愿景 - 该模型为AI for Science从“工具革命”的1.0阶段迈向以“革命的工具”驱动科学发现的2.0时代提供了创新的系统性开源基座 [1] - 公司首席科学家提出,可深度专业化通用模型是实现通用人工智能的可行路径 [1] - 实现路径的关键挑战包括需要低成本、能规模化的密集反馈,以及持续学习、主动探索和多视角解决问题的能力 [1] - 另一关键挑战是需引入对物理世界规律的考量,并兼顾多项差异化能力的学习效率与性能 [1]