小米集团(01810)
搜索文档
手机全面涨价,这回有得等了
芯世相· 2026-03-28 09:07
文章核心观点 - 由AI基础设施需求爆发引发的存储芯片史诗级涨价潮,正通过供应链传导至智能手机行业,导致中低端手机机型集体涨价,而高端机型因成本结构不同和品牌策略差异,部分出现价格下调,行业格局与厂商盈利能力面临重塑[5][6][7][8] 手机行业涨价现状与特征 - OPPO、vivo(含iQOO)、荣耀、小米(红米)等品牌已对多款在售机型进行价格上调,涨幅从100元至700元不等,其中中低端机型是涨价重灾区[5][9][17][18] - 与此相反,华为和苹果对部分新机型及老款机型采取降价策略,例如华为Mate 80较上一代便宜800元,Pura 80 Pro+降价1500元;iPhone 17标准版存储容量翻倍但价格不变,iPhone 17 Air降价2800元[16][17][18][19][20] 存储芯片涨价对手机成本的影响机制 - 存储芯片(内存+存储)属于手机BOM成本中的刚性成本,低端机与高端机在此环节配置差距最小,导致存储成本在中低端手机BOM成本中占比天然更高[10][11] - 研究机构Counterpoint Research预测,对于批发价200美元以下、配置6GB+128GB的低端机,2026年一季度存储成本将环比增长25%,占BOM成本比例达43%[14] - 以iPhone 17 Pro Max为例,其存储成本约300元,占万元售价比例极低;但同样成本对定价2000元的中端机构成显著压力[14] 当前涨价潮与历史周期的差异及原因 - 与2016-2018年存储超级周期相比,当前手机厂商面临更大压力,原因在于行业缓冲层消失及对上游话语权减弱[21][27][29] - 上一轮周期中,大量二线品牌(如乐视、金立、酷派)因成本压力出局,其市场份额被一线品牌吸收,后者通过出货量增长覆盖了成本压力[22][23][27] - 当前中国手机市场前五大厂商市场份额已从2016年的66.5%集中至2025年的79.4%,缺乏可替代的缓冲品牌来吸收冲击[28] - 存储芯片上游集中度极高(三星、SK海力士、美光在DRAM领域垄断99%份额),而下游手机厂商面临来自AI数据中心(HBM内存)等新客户的激烈产能争夺,导致其议价能力下降[29][32][33] 存储芯片市场动态与产能分配 - 研究机构TrendForce自2025年10月以来三次上调2026年Q1 DRAM价格环比涨幅预期,最新预测涨幅达90%-95%[7] - 存储芯片产能正优先向AI领域倾斜,美光明确表示2026年将优先保障AI供应,手机用DRAM晶圆产能保持零增长;三星和SK海力士也将重心转向利润更高的HBM内存[32] - 即便供应链管理能力强大的苹果,也仅确保了2026年一季度的存储和上半年的内存供货协议,剩余产能供应存在不确定性[34]
杨植麟当主持人的大模型圆桌:张鹏罗福莉夏立雪都放开说了
量子位· 2026-03-28 00:01
文章核心观点 本次中关村论坛汇集了中国大模型领域的顶尖专家,围绕Agent(智能体)的下一代演进、行业发展趋势、技术挑战与机遇进行了深入探讨。核心观点聚焦于:Agent框架(如OpenClaw)正成为推动大模型从对话工具转向生产力工具的关键催化剂,引发了推理需求(token消耗量)的爆发式增长,这进而对模型架构创新(尤其是长上下文与效率)、算力基础设施、以及行业生态的可持续发展提出了全新要求。专家们普遍认为,行业正从“训练时代”迈向“推理时代”,竞争维度已扩展至模型、算力、能源乃至全球化的“token经济学”层面 [5][12][32][45][65]。 对OpenClaw及Agent框架的认知与影响 - **OpenClaw被定位为革命性的“脚手架”**:它降低了使用顶尖模型能力的门槛,让非程序员也能通过简单交流构建复杂应用,其开源特性和社区参与度是成功的关键 [11][16]。 - **重新定义了模型能力的上下限**:此类框架能将次闭源水平模型的性能上限拉高,在多数场景下接近顶级闭源模型,同时通过体系化设计保证任务完成的下限(准确率)[17]。 - **带来交互模式的革新**:其IM软件嵌入方式提供了更强的“活人感”和“贾维斯”体验,区别于以往工具感更强的Agent [19][21]。 - **引爆了token使用量的激增**:从一月底开始,某基础设施厂商的token调用量每两周翻一倍,至今已增长十倍,增速堪比3G时代手机流量的普及速度 [12]。 - **激活了社区生态**:让更多非研究员参与AGI变革,推动了面向Agent的应用(skills、harness)开发,撬动了整个工具生态 [18][23]。 大模型技术演进与竞争焦点 - **中国团队的核心优势在于“算力受限下的最优解能力”**:在互联带宽等限制下,催生了如细粒度MoE、MLA等模型结构创新,追求更高的训练与推理效率 [40][42]。 - **竞争的关键是“长上下文”与“推理效率”的结合**:未来竞争不仅是做出原生适配长上下文的模型架构,更关键的是能否在100万甚至1000万级上下文下,将推理成本打下来、速度提上去 [42][43]。 - **超长上下文是模型“自迭代”的前提**:只有当上下文长度达到1000万甚至上亿级,模型才可能在复杂环境中依靠超强上下文完成对自身的持续进化 [5][44]。 - **模型正从“简单对话”转向“真正干活”**:完成复杂任务(如规划、尝试、debug)所消耗的token量是简单问答的十倍甚至百倍,这直接推动了模型能力的专门优化和定价策略的调整 [26][30]。 行业发展趋势与市场动态 - **推理需求爆发,行业进入“推理时代”**:由Agent驱动,token需求正经历十倍甚至百倍的增长,对算力基础设施构成巨大压力 [32][45][65]。 - **模型定价策略反映价值回归**:为完成复杂任务而增强的模型,因消耗token量巨大、推理成本增加,其涨价被视为回归正常商业价值,长期低价竞争不利于行业发展 [26][30]。 - **竞争维度扩展至全链路**:未来的竞争不仅是模型间的竞争,更是算力、推理芯片乃至能源层面的全方位竞争 [45]。 - **基础设施需为AI原生(Agent-native)重构**:当前云计算基础设施是为服务人类工程师设计的,未来需要能支持Agent毫秒级任务调度的“智慧化工厂”,甚至基础设施本身也应进化为智能体 [37]。 未来12个月的关键词与展望 - **生态**:Agent的发展依赖开源社区共同建设,未来软件可能不再以人类为中心,而是转向原生面向Agent(agent-native),需要整个技术栈朝此方向重构 [56][57]。 - **自进化**:在Agent框架加持下,模型能够通过可验证的目标约束进行持续自我优化,未来一两年内可能对科学研究带来指数级加速,研究效率已可提升近十倍 [59][60][61]。 - **可持续**:关注如何将中国在能源等方面的优势,通过“token工厂”持续转化为高质量token并输出全球,构建可持续的“AI Made in China”经济化迭代链路 [62][63][64]。 - **算力**:推理需求的爆发性增长使得算力成为未来12个月最关键的制约因素,确保用户“用得起、用得上”是行业发展的前提 [65]。
小米集团(01810) - 翌日披露报表

2026-03-27 18:35
股份发行 - 2026年3月23日已发行股份(不包括库存股份)数目为21,458,105,898[3] - 2026年3月24 - 27日因股份奖励或期权发行新股,分别为75,000、617,600、177,800、276,400股,占比分别为0.0003%、0.0024%、0.0007%、0.0011%,每股发行价分别为2.7、0.51、2.69、2港元[3][4] - 2026年3月27日已发行股份(不包括库存股份)数目为21,459,252,698[4] - 2026年3月23日,已发行股份数目(不包括库存股份)为259.325035亿股,包括44.74397602亿股A类普通股及214.58105898亿股B类普通股[14] 股份购回 - 2026年2月24 - 27日购回股份,分别为2,794,200、2,809,400、2,832,200、2,858,200股,占比均为0.011%,每股购回价分别为35.79、35.59、35.31、34.99港元[4] - 2026年3月27日公司购回股份220万股,付出价格总额7140.356万港元,每股购回价32.5港元,每股最低购回价32.36港元[13] - 公司可根据购回授权购回股份总数为25.94916968亿股[13] - 根据购回授权在交易所购回股份数目为2.815766亿股,占购回授权决议获通过当日已发行股份(不包括库存股份)数目的1.09%[13] - 购回授权的决议获通过日期为2025年6月5日[13] 其他 - 股份购回后再进行新股发行或库存股份再出售或转让的暂停期截至2026年4月26日[13] - 公司确认在交易所的购回是根据相关规则进行,2025年4月25日说明函件资料无重大变动[14] - 公司确认在另一家证券交易所的购股活动根据当地适用规则进行[14] - 除特定豁免外,未经交易所批准,公司购回股份后30天内不得发行新股或出售转让库存股份[15] - 在场内出售库存股份报告不适用[16]
“龙虾”出现后,大模型时代的共识被推翻了
虎嗅APP· 2026-03-27 18:12
文章核心观点 - 以OpenClaw为代表的智能体(Agent)技术正在引发大模型行业从“训练时代”向“推理时代”的加速转变,其核心价值在于使大模型能够执行完整的复杂任务,而不仅仅是回答问题,这正在重塑行业的技术路线、商业模式和竞争格局 [9][10][13] 行业动态与公司进展 - 月之暗面正考虑在香港进行首次公开募股(IPO),并已与中金公司及高盛展开初步磋商 [5] - 在OpenRouter平台上,代号为Hunter Alpha的模型(即小米MiMo-V2-Pro)调用量迅速冲上榜首,显示模型厂商正从OpenClaw引发的浪潮中直接获益 [9] - 智谱AI发布了新的GLM Turbo模型,旨在从“简单的对话”转向支持完成任务的“干活”能力 [27] OpenClaw(智能体)带来的范式转变 - **任务执行取代问答交互**:OpenClaw将模型拉入任务执行环节,用户交互从“提问-回答”转向“目标-执行-迭代”,模型更像一个帮助完成完整任务链路的“脚手架” [13] - **评价体系改变**:评价重点从单轮回答质量,转向复杂任务能否稳定收敛并交付结果,同时用户对系统响应产生了“慢”的感知,因为这涉及规划、调度和试错过程 [13] - **Token消耗与属性剧变**:智能体场景下,单个任务的Token消耗是传统问答的10倍甚至100倍 [15]。无问芯穹公司的Token用量从1月底开始,每两周翻一倍 [15][26]。Token不再仅是成本指标,而是对应规划、执行、调用工具的全过程,具备了“生产力”或“机器工时”属性,这将重塑价格体系 [16] - **技术竞争维度下沉**:行业竞争焦点从模型参数规模,转向推理效率、系统调度能力甚至能源成本 [20]。随着任务复杂度上升,上下文长度(Context)迅速拉长至1M甚至10M级别,迫使厂商在推理侧进行结构创新以降低成本、提高稳定性 [18][19] 对行业生态与竞争格局的影响 - **系统能力部分抵消模型差距**:在智能体框架下,通过技能(Skill)和工具组合,次顶级模型也能完成复杂任务,模型之间的能力差距被压缩,用户更关注任务结果而非模型本身指标 [22][23] - **降低参与门槛与激发生态**:构建能力向系统工程倾斜,而不再局限于算法本身,降低了参与门槛 [24]。OpenClaw的“开源”特性有利于社区深入参与,将国内次顶级闭源模型的上限拉高,同时靠技能体系保证了下限 [26]。它点燃了行业想象力,让更多人参与AGI变革,并释放时间去做更有创造性的事 [26] - **推动架构创新**:中国大模型团队在算力受限背景下,通过对模型结构(如Hybrid、Linear Attention、Long Context Efficient设计)的创新来追求高效率与低推理成本的经验,在当前长上下文推理需求下依然重要 [30][31] - **预示未来竞争**:随着推理需求爆发,预计今年可能增长100倍,竞争维度将进一步下探到算力、推理芯片甚至能源层面 [32] 主要参与者的观点摘要 - **智谱CEO张鹏**:将OpenClaw定义为“脚手架”,使普通人能以极低门槛使用顶尖模型完成复杂任务,是重大突破 [25]。GLM Turbo模型的发布旨在优化任务执行所需的高Token消耗过程,近期提价是因任务消耗Token量为简单问答的10-100倍,旨在回归正常商业价值以支持持续优化 [27][28] - **无问芯穹创始人夏立雪**:初期感觉OpenClaw交互慢,后发现其能完成大型任务,这标志着从聊天到完成任务的想象力空间提升,但对系统能力要求增大 [25] - **小米MiMo负责人罗福莉**:认为OpenClaw是革命性事件,在智能体框架设计上领先,其最大价值在于“开源”和激发社区参与 [26]。强调在长上下文下实现低成本、高速度的推理结构创新,是激发高生产力任务和模型自迭代的关键 [30] - **香港大学助理教授黄超**:认为OpenClaw提供了“更有活人感”的体验,证明了构建智能体的框架可以既简单又高效,促使行业重新思考智能体的形态 [27]
三大指数齐涨 小米涨超1.7% B站、快手涨超1%!锂电板块爆发,赣锋锂业涨超9% | 港股收盘
每日经济新闻· 2026-03-27 16:45
港股市场整体表现 - 3月27日港股三大指数集体上涨 恒生指数涨0.38%至24951.88点 恒生科技指数涨0.35% 国企指数涨0.76% [1] 行业及板块表现 - 创新药概念股大涨 石药集团涨超13% [1] - 锂电池板块涨幅居前 赣锋锂业涨超9% [1] - 商业航天板块跌幅居前 钧达股份跌超9% [1] - 科网股涨跌不一 快手 小米涨超1% 哔哩哔哩跌超1% [1] 重点公司股价及成交额 - 小米集团股价33.000港元 上涨1.726% 成交额47.27亿港元 [2] - 腾讯控股股价493.400港元 下跌0.444% 成交额100.2亿港元 [2] - 阿里巴巴股价122.600港元 下跌0.325% 成交额65.64亿港元 [2] - 泡泡玛特股价149.600港元 下跌0.730% 成交额61.01亿港元 [2] - 微博股价67.600港元 上涨1.046% 成交额728.75万港元 [2] - 美团股价85.900港元 下跌0.923% 成交额86.99亿港元 [2] - 比亚迪股份股价106.500港元 上涨3.700% 成交额38.11亿港元 [2] - 赣锋锂业股价74.300港元 上涨9.265% 成交额26.6亿港元 [2] - 石药集团股价9.290港元 上涨13.848% 成交额17.34亿港元 [2] - 长飞光纤光缆股价172.300港元 下跌4.596% 成交额54.99亿港元 [3] - 中国平安股价59.300港元 上涨1.978% 成交额33.54亿港元 [3] 机构后市观点 - 高盛表示国际投资者对中国股票的兴趣可能已攀升至近年高点 仅约10%的受访客户认为中国股市“不可投资” 相比两年前的约40%已大为改观 [4] - 高盛维持对中国股票(A股和港股)的高配建议 并认为短期内来自A股的夏普比率更高 [4] - 海通国际张忆东认为 无论A股还是港股 年初以来的震荡不改变中长期趋势 下半年均有希望创年内新高 [4] - 在配置优先级上 张忆东认为在中东停火前以黄金 能源 资源为首选 停火后 安全资产里建议只保留黄金 其他更多可考虑高科技 硬科技以及先进制造业 [4]
【深度分析】2026年2月份全国新能源乘用车市场深度分析报告
乘联分会· 2026-03-27 16:44
整体总市场产销概况 - 2026年2月整体市场零售1,033,735辆,同比2025年2月下降25.4% [4][6][15] - 2026年1-2月累计零售2,578,345辆,同比2025年同期下降18.9% [6][15] - 2026年2月新能源车零售464,427辆,同比下降32.0%,燃油车零售569,308辆,同比下降18.9% [4][33] - 2026年1-2月新能源车累计零售1,060,304辆,同比下降25.7%,燃油车累计零售1,518,041辆,同比下降13.3% [6][34] 新能源市场渗透率 - 2026年2月新能源车零售渗透率达44.9%,较2025年2月的49.3%有所回落 [16][18] - 2026年1-2月累计新能源车零售渗透率为41.1%,低于2025年同期的47.6% [12][16] - 从季度看,2025年第四季度新能源渗透率高达58.5%,2026年第一季度(1-2月)渗透率回落至41.1% [19] 出口市场表现 - 2026年2月整体出口555,129辆,同比大幅增长56.0% [4][21] - 2026年1-2月累计出口1,135,819辆,同比增长54.6% [6][21] - 新能源车出口增长迅猛,2026年2月出口269,229辆,同比激增124.7% [4][22] - 2026年1-2月新能源车累计出口558,772辆,同比增长114.7% [6][22] - 新能源车在出口市场中的渗透率持续提升,2026年1-2月达到49.2% [9][22][24] 厂商竞争格局 - 2026年2月新能源批发市场,比亚迪以187,782辆位居第一,但同比下滑41.0% [29] - 特斯拉中国2月批发58,599辆,同比大增91.0%,表现亮眼 [29] - 2026年1-2月新能源批发累计,比亚迪、吉利、特斯拉中国位列前三,销量分别为393,300辆、241,740辆、127,728辆 [30] - 2026年2月新能源零售市场,比亚迪、吉利、特斯拉中国位列前三,销量分别为88,697辆、76,636辆、38,206辆 [29] - 2026年1-2月新能源零售累计,比亚迪、吉利、鸿蒙智行位列前三,销量分别为182,873辆、168,771辆、86,127辆 [30][31] 车型大类细分市场 - SUV是新能源车最大细分市场,2026年2月新能源SUV零售270,256辆,占新能源市场58.2% [33][36] - 轿车市场新能源化程度高,2026年2月新能源轿车零售170,716辆,渗透率为40.4%(占轿车总市场) [33][45] - 2026年2月,新能源SUV-C级车型同比大幅增长146.3%至36,585辆,是增长最快的细分市场 [40] - 2026年1-2月,新能源SUV-B级车型同比增长19.7%至331,393辆,是销量最大的高端细分市场 [40] 品牌与国别定位细分市场 - 自主品牌占据市场主导地位,2026年2月零售份额达61.3% [64][69] - 自主品牌新能源渗透率最高,2026年2月达64.2%(自主品牌新能源车占自主品牌总销量) [47][61] - 豪华品牌新能源车增长强劲,2026年2月零售42,099辆,同比增长25.7% [47] - 美系品牌新能源车表现突出,2026年2月零售42,539辆,同比增长40.1%,主要受SUV车型(同比增171.2%)驱动 [64][73] - 德系与日系品牌仍以燃油车为主,2026年2月新能源渗透率分别仅为2.3%和7.4% [64][78] 价格定位细分市场 - 10-20万元价格区间是最大市场,2026年2月零售418,613辆,占整体市场40.5% [80][82] - 40万元以上高端新能源市场增长最快,2026年2月零售25,804辆,同比激增67.1% [80] - 新能源车在20-30万元价格区间的渗透率最高,2026年2月达65.6%(该价位新能源车占该价位总市场) [80] - 10万元以下市场新能源车同比下滑显著,2026年2月零售117,565辆,同比下降52.0% [80]
三大指数齐涨,小米涨超1.7%,B站、快手涨超1%!锂电板块爆发,赣锋锂业涨超9% | 港股收盘
每日经济新闻· 2026-03-27 16:41
港股市场整体表现 - 3月27日港股三大指数集体上涨,恒生指数涨0.38%报24951.88点,恒生科技指数涨0.35%,国企指数涨0.76% [1] 行业及板块表现 - 创新药概念股大涨,石药集团涨幅超过13% [1] - 锂电池板块涨幅居前,赣锋锂业涨幅超过9% [1] - 商业航天板块跌幅居前,钧达股份跌幅超过9% [1] 主要科网股表现 - 科网股涨跌不一,快手、小米集团-W涨幅超过1%,哔哩哔哩跌幅超过1% [1] - 小米集团-W股价33.000港元,上涨1.726%,成交额47.27亿港元 [2] - 腾讯控股股价493.400港元,下跌0.444%,成交额100.2亿港元 [2] - 阿里巴巴-W股价122.600港元,下跌0.325%,成交额65.64亿港元 [2] - 美团-W股价85.900港元,下跌0.923%,成交额86.99亿港元 [2] - 微博-SW股价67.600港元,上涨1.046%,成交额728.75万港元 [2] - 泡泡玛特股价149.600港元,下跌0.730%,成交额61.01亿港元 [2] 其他重点公司表现 - 比亚迪股份股价106.500港元,上涨3.700%,成交额38.11亿港元 [2] - 赣锋锂业股价74.300港元,上涨9.265%,成交额26.6亿港元 [2] - 中芯国际股价52.500港元,下跌1.223%,成交额29.31亿港元 [2] - 石药集团股价9.290港元,上涨13.848%,成交额17.34亿港元 [3] 机构后市观点 - 高盛表示国际投资者对中国股票的兴趣可能已攀升至近年高点,认为中国股市“不可投资”的受访客户比例从两年前的约40%降至约10% [4] - 高盛维持对中国股票(A股和港股)的高配建议,并认为短期内A股的夏普比率更高 [4] - 海通国际张忆东认为,A股和港股年初以来的震荡不改变中长期趋势,下半年均有希望创年内新高 [4] - 在配置优先级上,张忆东建议中东停火前以黄金、能源、资源为首选;停火后,在安全资产中保留黄金,更多考虑高科技、硬科技及先进制造业 [4]
特朗普宣布对伊朗能源打击再延10天、kimi据称考虑赴港IPO、中芯国际发布业绩报告
新财富· 2026-03-27 16:05
地缘政治与能源政策 - 美国总统特朗普宣布将针对伊朗能源设施的打击行动推迟10天至美东时间4月6日晚8时,并称谈判进展顺利,但调解方及美媒表示伊朗未提出推迟请求[2] - 韩国自3月27日零时起全面禁止国产石脑油出口,期限暂定5个月,已签约订单同步暂停执行,此举旨在缓解国内供应紧张,此前韩国11%的国产石脑油用于出口[3] 公司业绩与资本市场动态 - 中芯国际2025年全年实现营业收入673.23亿元,同比增长16.49%,归母净利润50.41亿元,同比增长36.29%,产能利用率增至93.5%,毛利率增至22%[4] - 泡泡玛特在发布业绩后股价两日累计大跌超30%,随后公司宣布回购394万股股份,耗资约5.99亿港元,回购均价152.21港元/股,累计回购金额已超9亿港元[6] - 讯兔科技完成近2亿元A轮融资,由启明创投、红杉中国、高瓴创投共同领投,这是其继2025年10月超亿元Pre-A轮融资后5个月内完成的第二轮大额融资[14] 消费电子与汽车行业 - 苹果确认停产高端专业台式机Mac Pro,该产品已从官网下架,苹果明确暂无推出继任机型的计划,现款Mac Pro为2023年更新的M2 Ultra芯片版本,国行起售价55999元[7] - 大众中国确认旗下斯柯达品牌将于2026年年中退出中国市场,售后服务将由上汽大众接手,2025年斯柯达在华销量已跌至1.5万辆左右,后续业务重心将聚焦印度、东盟等市场[5] 人工智能与前沿科技 - 谷歌为Gemini推出记忆导入功能,支持一键导入ChatGPT、Claude的个人偏好及完整聊天记录,用户可通过上传不超过5GB的ZIP格式聊天记录包在Gemini中延续过往对话[9] - 谷歌研究院推出全新向量量化压缩算法Turbo Quant,可将AI大模型KV Cache压缩至3比特级别,内存占用降至原来的1/6,在英伟达H100 GPU上4比特配置下推理速度提升8倍[12][13] - 小米机器人灵巧手实现重大突破,采用三大核心技术,体积压缩60%,自由度提升50%,全掌触觉传感器覆盖达8200平方毫米,已完成15万次抓握循环可靠性测试,并在小米汽车工厂落地应用[10] - 知情人士透露Kimi母公司月之暗面正初步考虑赴香港进行IPO,计划处于早期探讨阶段,公司已与中金、高盛就上市合作事宜展开磋商,公司目前现金持有量超100亿元[11]
杨植麟、张鹏、罗福莉等齐聚一堂,他们关于OpenClaw的观点值得一听。
数字生命卡兹克· 2026-03-27 14:24
文章核心观点 文章记录了2026年中关村论坛人工智能主题日的一场高信息密度圆桌讨论,核心观点聚焦于人工智能产业,特别是大模型和智能体(Agent)技术,正从“聊天”范式转向“干活”范式,这一转变引发了算力需求爆发、模型架构创新、基础设施重构以及产业生态演变等一系列深刻变革 [3][5][13] 根据相关目录分别进行总结 行业趋势:从聊天到“干活”的范式转变 - 以OpenClaw为代表的智能体框架标志着人工智能应用从简单的对话交互转向能够完成复杂任务的“干活”助手,这极大地拓展了AI的想象力空间和应用价值 [6][8][13] - 范式转变导致对模型能力的要求发生根本变化,模型需要具备长程任务规划、自主循环、多模态信息处理和持续调试等复杂能力 [13] - 应用范式的转变直接驱动了推理阶段token消耗量的急剧增长,无问芯穹公司透露其token用量从一月底开始每两周翻一番,累计已增长十倍,类比于3G时代手机流量的爆发速度 [9] 模型层:架构创新与商业价值回归 - 为适应“干活”需求,模型在长上下文处理和推理效率方面进行重点创新,中国的模型团队在有限算力条件下催生了如细粒度MoE、混合稀疏注意力等高效的模型结构创新 [18] - 长上下文能力是实现高生产力任务和模型自进化的关键前提,其竞争焦点在于如何在百万甚至千万token的上下文长度下实现足够低的推理成本和足够快的速度 [19] - 随着模型任务复杂化,完成一个任务所需的token量可能是简单问答的十倍甚至百倍,智谱公司对其GLM5 Turbo模型进行提价,反映了模型商业价值向真实成本与能力回归的市场信号 [5][13][14] 基础设施层:应对推理时代算力挑战 - 推理时代算力需求爆发式增长,过去一段时间内推理需求已增长近十倍,未来可能达到百倍,算力成为制约行业发展的最朴素且紧迫的问题 [9][20][29] - 无问芯穹作为基础设施厂商,通过软硬件协同,接入国内十几种芯片和几十个算力集群,致力于打造高效的“token工厂”,以优化资源利用和转化效率 [15] - 为充分发挥智能体潜力,基础设施需要从为人类工程师设计转向为AI原生设计(Agentic Infra),以支持智能体秒级甚至毫秒级的任务调度,长远目标是使基础设施本身进化为由智能体管理的自主组织 [16][17] 智能体(Agent)层:技术痛点与生态发展 - 智能体在规划、记忆和工具使用三个维度存在技术痛点:复杂垂直领域规划知识不足、记忆系统面临信息压缩与召回精度挑战及海量上下文管理压力、技能生态存在质量参差不齐和安全风险 [21][22] - 智能体框架通过开源和模块化设计(如技能体系)降低了创建门槛,不仅拉高了国内模型在具体任务上的完成度上限,也激发了社区对Agent层的热情和广泛参与 [11] - 智能体交互模式取得突破,OpenClaw以即时通讯软件式的嵌入方式提供了更强的“活人感”,其轻量级操作系统式的设计通过生态撬动更多工具,与开源生态紧密结合 [12] 未来展望:未来12个月的关键词 - **生态**:智能体要从个人助手转化为真正的“打工人”或协作者,需要整个技术生态的共同努力,推动软件、数据和技术向“Agent Native”模式演进 [24][25] - **自进化**:在强大模型和智能体框架的激活下,模型能够在执行长程任务中持续自我学习和优化,实现对科学研究的指数级加速,这一进程可能在未来一两年内变得更为务实 [25][26][27] - **可持续token**:从基础设施视角,需要确保在资源有限的条件下,能够持续、稳定、大规模地提供token供给,构建从能源、算力到token产出的可持续经济化链路,并探索将中国的优势转化为全球“token工厂”的潜力 [27][28] - **算力**:所有技术进步和效率提升的前提是充足且可负担的算力支持,推理需求的爆发(十倍甚至百倍)使得算力成为未来十二个月行业面临的最大实际问题 [5][29]