AutoGLM 2.0
搜索文档
全球大模型第一股上市了!
搜狐财经· 2026-01-08 14:53
上市概况与市场地位 - 智谱AI于港交所挂牌上市,成为港股“大模型第一股”及“全球大模型第一股”,是首家以通用人工智能(AGI)基座模型为核心业务的上市公司 [3][5] - 本次IPO发行价为每股116.20港元,募资总额超过43亿港元(“绿鞋”前),香港公开发售获1159.46倍认购,国际发售获15.28倍认购 [3] - 公司成立于2019年6月,按收入计是中国最大的独立通用大模型开发商,在包含互联网大厂在内的整体通用大模型厂商中排名第二 [5] - 上市前(2024年5月B6轮融资后)投后估值达到243.77亿元 [8] 财务表现与运营数据 - **收入与亏损**:2022年、2023年、2024年及2025年上半年,收入分别为0.57亿元、1.25亿元、3.12亿元、1.91亿元;同期净利润分别为-1.44亿元、-7.88亿元、-29.58亿元、-23.58亿元 [11] - **累计财务**:三年半(2022年至2025年上半年)累计实现收入6.85亿元,累计净亏损62.47亿元,累计研发投入44.03亿元,经调整后累计净亏损亦超过49亿元 [13] - **研发投入**:研发费用快速攀升,同期分别为0.84亿元、5.29亿元、21.95亿元、15.95亿元 [11] - **近期展望**:根据未经审计管理账目,预计2025年第三季度收入较2024年同期增长60%以上,但全年净亏损可能进一步扩大 [14] - **现金流**:经营活动持续产生现金净流出,2022年至2025年上半年分别为-0.68亿元、-6.48亿元、-22.45亿元、-13.27亿元,公司依赖融资活动补充现金流 [18] 业务模式与收入结构 - **部署模式**:近三年半超过84%的收入来自本地化部署,云端部署收入占比相对较小 [14] - **毛利率**:整体毛利率维持在较高区间,2022年至2025年上半年分别为54.6%、64.6%、56.3%、50.0% [15] - **海外拓展**:自2024年起,大模型本地化部署服务开始产生海外收入,东南亚成为主要海外市场 [16] - **行业分布**:本地化部署收入主要来自互联网与科技、公共服务、电信、传统企业及消费电子等行业 [17] - **客户规模**:截至2025年1-9月,已服务超过12,000家机构客户,客户数量在半年内显著增长 [35] - **客户集中度**:前五大客户收入占比呈下降趋势,2022年、2023年、2024年、2025年上半年分别为55.4%、61.5%、45.5%、40.0% [37] - **使用量指标**:2025年11月,其日均token消耗量达到4.2万亿,累计支持设备数约8000万台 [8] 技术与产品 - **模型体系**:MaaS平台主要提供四类模型:语言模型、多模态模型、智能体模型、代码模型,并配套相关工具 [23] - **核心能力**:围绕“深度思考、认知世界与工具使用”三项通用智能核心能力构建产品,包括反思与沉思模型、多模态模型、智能体模型及代码模型 [27] - **产品迭代**:2025年7月及8月发布旗舰基座模型GLM-4.5、视觉语言基座模型GLM-4.5V及AutoGLM 2.0;9月发布强化编码能力的GLM-4.6 [31][33][34] - **技术对比**:在解官、代码生成、图像生成、视频生成、音频生成、实时视频、推理、文本、GUI智能体、手机网站应用、计算机应用等多个能力维度上,与国内外主要厂商(如OpenAI、谷歌、科大讯飞、阿里巴巴、商汤、百度)进行对标 [7] - **研发团队**:截至2025年6月30日,拥有657名研发人员,占员工总数的74%以上 [20][21] - **技术生态**:开源模型在全球开发者社区累计下载量已超过4500万次 [8] - **学术成果**:科研团队及学术顾问已发表约500篇高影响力论文,累计引用超5.8万次,拥有86项授权专利(其中84项为发明专利) [22] 募资用途与股东结构 - **募资用途**:募集资金净额的70%(约29亿港元)将用于通用AI大模型研发投入,约10%(约4.2亿港元)用于优化MaaS平台 [10] - **基石投资者**:吸引了包括北京核心国资、头部保险资金、大型公募基金等在内的11家基石投资者,合计认购29.8亿港元 [10] - **股东背景**:股东包括美团(通过天津三快持股4.27%)、蚂蚁集团(通过上海云玡及上海飞玡持股)、腾讯(通过腾讯投资持股1.73%)、雷军(通过北京顺赢持股)、联想(通过联想创投持股)等产业资本 [8][53] - **控股股东**:控股股东(北京链湃、刘德兵、唐杰、李涓子等一致行动人士)共同拥有约33.03%的股份权益 [42][48] 公司治理与团队 - **核心团队**:董事会及高管层具有显著的“清华系+科研创业”特征,联合创始人刘德兵、张鹏、李涓子等均有清华大学或顶尖科研机构背景 [21][44][45] - **学术合作**:与清华大学知识工程实验室(KEG)保持长期稳定合作,并与浙江大学、天津大学等多所高校及研究机构开展科研协作 [21] - **技术渊源**:其GLM大模型框架源于2018年KEG团队与唐杰博士等学者的联合开发,是中国大模型技术体系的重要起点 [22]
智谱港股上市成中国版 OpenAI,开盘市值 528 亿港元
是说芯语· 2026-01-08 10:24
上市概况与市场表现 - 智谱于港交所正式挂牌上市,成为全球首家AGI基座模型上市公司,股票代码2513 [1] - 上市首日开盘价为120港元/股,较发行价116.20港元上涨超过3%,市值突破528亿港元 [1] - 当日成交量为612.45万股,成交额为8.13亿港元,换手率为2.84% [2] 融资与投资者阵容 - 本次IPO发行价为116.20港元,募资总额超过43亿港元(绿鞋前)[4] - 香港公开发售获得市场热烈追捧,超额认购倍数高达1159.46倍,国际发售也获得15.28倍认购 [5] - IPO引入了11家基石投资者,包括北京核心国资、泰康人寿、广发基金及JSC International等机构,合计认购29.8亿港元,占发售股份近七成 [8] - 上市前公司已完成8轮融资,累计融资额超过83亿元人民币,投资方包括美团、阿里、腾讯、红杉、高瓴等产业资本、一线VC及地方国资 [9] 技术实力与行业地位 - 公司新一代旗舰模型GLM-4.7在全球多项榜单中表现卓越,在AA智能指数中获开源与国产双料榜首,在Code Arena盲测中力压GPT-5.2成为开源第一,并登上Hugging Face全球趋势榜第一 [12] - 公司原创的GLM架构已适配40余款国产芯片 [14] - AutoGLM 2.0的设备操控能力覆盖8000万台终端,日均调用规模达4.6万亿Token [14] - 包括美国Anysphere(Cursor背后公司)、Cerebras在内的超过50个海外平台已主动将GLM模型作为核心能力接入 [14] 财务表现与商业模式 - 公司营收连续三年翻倍,从2022年的5740万元人民币增长至2024年的3.124亿元人民币,年复合增长率达130% [16] - 2025年上半年收入同比暴涨325%,达到1.91亿元人民币 [16] - 公司自2021年提前布局MaaS(模型即服务)模式,目前国内已有超过270万企业与开发者接入其平台,中国前十大互联网公司中有9家使用其服务 [19] - 其Coding订阅产品在短时间内年度经常性收入(ARR)突破1亿元人民币,在OpenRouter平台上的调用量稳居全球前十,付费收入超过所有国产模型之和 [19] 研发投入与战略规划 - 2022年至2025年上半年,公司累计研发投入超过44亿元人民币 [21] - 2024年单年研发费用高达21.95亿元人民币,是当年营收的7倍 [21] - 公司74%的员工为研发人员,核心团队源自清华大学KEG实验室 [21] - 本次IPO募集资金的70%将用于继续投入大模型研发,10%用于优化MaaS平台,旨在持续构建技术壁垒 [24] 行业意义与展望 - 此次上市标志着中国AGI企业首次以完整商业主体身份进入国际资本市场定价体系 [27] - 作为“全球大模型第一股”,其上市被认为是中国大模型产业从“技术跟跑”迈向“全球竞技”新阶段的重要标志 [27]
刚刚,智谱港交所敲钟!市值528亿港元
新浪财经· 2026-01-08 10:15
来源:量子位 刚刚,全球大模型第一股,终于在港交所敲钟! 被称为中国版OpenAI的智谱正式挂牌上市(股票代码2513)。 不仅拿下全球首家AGI基座模型上市公司头衔,首日开盘涨超3%,报120港元/股,市值突破528亿港 元。 | HK 02513 智谱 | | | | | | | | | --- | --- | --- | --- | --- | --- | --- | --- | | 120.000雅元 +3.800 +3.27% | | | | | | | | | ○ 集合竟价 01-08 09:22:00 北京时间 | | | | | | | | | 今开 | 120.000 | | 最高 | 120.000 | | 成交量 | 612.45万股 | | 昨收 | 116.200 | | 最低 | 120.000 | | 成交额 | 8.13亿 | | 换手率 | 2.84% | | 市盈(TTM) | 亏损 | | 总市值 | 528.28亿 | | 分时 | 五日 | 日K | 图K | 月K | 季K | 年K | 更多v | 这波2026年的重磅开场,直接把AI资本市场的热度拉满了。 全明星 ...
智谱定档大模型第一股,1月8日挂牌上市,IPO预募资43亿港元
量子位· 2025-12-30 11:57
IPO核心信息 - 智谱AI正式启动港股IPO招股,股票代码2513,预计于2026年1月8日在港交所主板挂牌上市[2][8] - 本次IPO全球发售37,419,500股H股,其中香港发售1,871,000股,国际发售35,548,500股[6][10] - 发售价定为每股116.20港元,预计募资总额约43亿港元,上市后市值预计超过511亿港元[3][9][11] - 招股期为2025年12月30日至2026年1月5日[9] 发行与投资者结构 - 本次IPO引入11家基石投资者,包括上海高毅、广发基金、泰康人寿等,合计拟认购约29.8亿港元,占发售股份比例接近七成[14] - 独家保荐人、整体协调人为OCICC FEATE,联席全球协调人包括国泰君安国际、招商证券国际等多家机构[6] - 募资用途方面,约70%的资金将用于研发,约10%将用于优化MaaS平台[16] 公司定位与技术实力 - 智谱AI被誉为“中国版OpenAI”,是中国最早开启大语言模型研发的公司,定位为国内AGI的引领者[7][17] - 公司最新旗舰模型GLM-4.7在权威评测Artificial Analysis Intelligence Index中以68分综合成绩位列开源模型与国产模型双料榜首[18] - 在Code Arena编码评估中,GLM-4.7位列开源第一、国产第一,超过GPT-5.2[19] - 公司已构建覆盖文本、图像、视频、语音的多模态模型矩阵,并更新了支持硬件设备接入的AutoGLM 2.0[20] 商业化与市场表现 - 智谱AI通过MaaS模式实现商业化,是国内少数通过此模式实现内部造血的初创公司[25] - 国内MaaS平台已汇聚超过270万企业与应用开发者,中国前十大互联网公司中已有9家接入其模型[26] - 全球范围内,GLM-4.5和GLM-4.6在OpenRouter上调用量长期位居全球前十,付费API收入超过所有国产模型之和,平台用户规模超过290万[26] - 公司GLM大模型已赋能全球12000家企业客户、超过8000万台终端用户设备及超过4500万名开发者[26] 财务业绩 - 公司营收连续三年翻倍增长,2022年至2024年收入分别为5740万元、1.245亿元和3.124亿元,年复合增长率达130%[27] - 2025年上半年收入进一步提升至1.91亿元,同比增长高达325%[27] - 毛利率表现亮眼,过去三年始终维持在50%以上,高于AI行业约40%的普遍水平,2022年至2024年毛利率分别为54.6%、64.6%和56.3%,2025年上半年为50%[31][32] 研发投入与资本背景 - 公司研发费用高昂且持续攀升,2022年至2024年及2025年上半年分别为8440万元、5.289亿元、21.954亿元和15.947亿元[35] - 最高峰时研发投入达到当期收入的八倍[36] - 公司拥有顶尖的清华技术班底,核心团队源自清华大学计算机系知识工程实验室,CEO张鹏、首席科学家唐杰等均为核心人物[41][46][53] - 成立以来已完成超过8轮融资,累计融资规模超过83亿元人民币,投资方包括美团、蚂蚁、阿里、腾讯、小米、红杉、高瓴等众多明星产业资本与一线机构[12][56] - IPO前最新投后估值已达243.8亿元人民币[57] 行业背景 - 根据弗若斯特沙利文数据,2024年中国大语言模型市场规模已达53亿元人民币,其中机构客户贡献约47亿元,占比近九成[59]
排“第二”的智谱AI,含金量多高?
钛媒体APP· 2025-12-21 10:15
公司概况与市场地位 - 智谱AI是一家专注于大模型研发与服务的“清华系”AI公司,创始团队主要来自清华大学知识工程实验室(KEG),在自然语言处理和知识图谱领域有深厚积累 [6][7] - 公司定位为“中国最大的独立大模型厂商”,商业模式是提供“模型即服务”(MaaS)平台,通过API调用服务企业客户,覆盖从轻量级到千亿参数的基座模型、多模态模型及智能体模型 [10][11] - 根据弗若斯特沙利文报告,按2024年收入计,智谱AI在中国大语言模型开发平台市场中排名第二,收入为3.1亿元人民币,市场份额为6.6%,仅次于科大讯飞(4.4亿元),领先于阿里(3亿元)、商汤(2.9亿元)和百度(2.2亿元) [2][26] - 2024年中国大语言模型开发平台市场规模为53亿元人民币,前五名厂商份额总和为33% [26] - 不同机构的排名存在差异:IDC报告显示,在类似的狭义“平台”市场,2024年份额排名为百度智能云第一、阿里云第二、商汤科技第三、智谱AI第四 [28] 技术研发与产品布局 - 公司技术研发起步较早,2021年启动GLM框架研发,2022年8月推出千亿级大模型GLM-130B,发布时间早于ChatGPT [9] - 2023年推出对话式大模型ChatGLM,是中国最早的同类模型之一;2024年推出GLM-4系列,性能对标GPT-4,并进入国际第一梯队 [9][10] - 产品矩阵包括基座大模型(GLMs系列)、多模态模型(CogVLM、CogView等)、智能体模型(AutoGLM 2.0)以及专用推理模型,形成“模型超市” [11] - 公司通过开源策略吸引开发者,截至2024年9月,其MaaS平台已吸引超过270万开发者,辐射全球1.2万家企业客户 [12] 财务表现与商业模式 - 公司营收增长迅速,从2022年的0.57亿元增长至2024年的3.12亿元,三年增长超过五倍 [15] - 2024年收入结构为:85%来自本地化(私有化)部署,15%来自云端部署(MaaS平台) [17] - 随着云端业务占比提升,公司毛利率从2023年的64.6%下降至2025年上半年的50%,反映商业模式从“高毛利、低规模”向“中等毛利、高规模”转型 [18] - 公司处于高速扩张与持续亏损阶段:2024年经调整净亏损达24.7亿元人民币;2025年上半年营收1.9亿元,经调整净亏损17.5亿元 [6][21] - 2025年上半年研发开支约16亿元,销售费用约2亿元,研发费用与营收比例高达8.4:1,远高于OpenAI(1.56:1)和Anthropic(1.04:1) [21][23] 行业竞争格局 - 中国大模型赛道玩家可分为三类:互联网巨头(阿里、百度、字节、腾讯)、AI独角兽(商汤、科大讯飞)以及大模型原生创业公司(智谱AI、月之暗面、零一万物、MiniMax) [14][15] - 互联网巨头综合实力强,模型是其庞大业务的一部分;AI独角兽有特定领域积累;创业公司则全部投入大模型,缺乏多元业务“输血” [15] - 排名统计口径影响座次:弗若斯特沙利文报告统计的是“能够独立核算的大模型业务收入”,对智谱AI这类纯大模型公司有利,而巨头们通过云服务、解决方案集成的大模型收入可能未被计入 [27] - 2024年公开可查的大模型中标项目总金额达25.2亿元,其中科大讯飞5.4亿元,百度智能云3.4亿元,这些数字超过了弗若斯特沙利文报告中的平台收入统计,显示巨头在非平台业务上收入可观 [30] 资金状况与上市考量 - 截至2025年6月30日,公司账面现金约25.5亿元人民币 [24] - 按2025年上半年经营活动现金流出净额(13.3亿元)计算,现金储备可维持约1.9年;按经调整净亏损(17.5亿元)估算,则可维持约1.5年 [24] - 招股书披露,截至2025年10月31日,现金及现金等价物、短期投资和可动用银行融资合计89.43亿元,但其中现金加短期投资仅28亿元,其余61亿为银行授信额度 [25] - 短期投资在2025年6月30日至10月31日期间从5.49亿元降至2.29亿元,减少约3.2亿元,表明公司可能正在动用短期投资应对现金流压力 [25] - 公司处于快速扩张期,现金消耗速度可能加快,因此上市融资“输血”至关重要 [24][25]
智谱开源可操控手机的智能体模型:AI手机只在一家做是不够的
新浪财经· 2025-12-09 14:53
公司动态:智谱AI开源AutoGLM模型 - 智谱AI于12月9日宣布开源其核心AI Agent模型AutoGLM 旨在让AI真正学会“使用手机” [1] - 开源内容包括训练好的核心模型 Phone Use能力框架与工具链 可直接跑通的Demo 覆盖50+中文App 以及针对Android的适配层与示例工程等 [2] - 公司主动放弃了操作微信等离用户隐私较近的APP 以保障AI不会在不该点的地方胡乱操作 [1] - 通过开源和私有化部署 企业和开发者可以在自己的合规环境中完整掌控数据、日志和权限 技术向生态开放 但数据与隐私留在使用方一侧 [2] 技术进展:AutoGLM模型发展历程与能力 - 2024年10月 智谱发布了首个可在真机上完成一条完整操作链路的AutoGLM 一个月后 AutoGLM发出了由AI完成的手机红包 [1] - 2025年 公司发布了AutoGLM 2.0 并将其置于一台跑在云端的虚拟手机中 每个动作可回放、审计、干预 并可对敏感数据加以隔离 [1] - 展示视频显示 AutoGLM可识别手机屏幕信息 通过模拟真人点击、滑动、输入等动作 完成外卖点单、机票预订、朋友圈点赞、写好评等复杂流程 [4] 公司背景与融资情况 - 智谱AI(北京智谱华章科技股份有限公司)成立于2019年 由清华大学相关技术团队孵化 凭借GLM大模型系列跻身“大模型六小虎”阵营 [4] - 公司已完成超过十轮融资 累计融资规模超过100亿人民币 投资方包括高瓴资本、启明创投、君联资本等 美团、阿里、腾讯、小米等互联网企业也是其重要股东 [5] - 2025年4月 智谱正式向北京证监局提交首次公开发行股票并上市辅导备案 [4] 行业趋势:AI手机发展与生态开放 - 智谱AI认为AI手机已是趋势 但如果“会用手机的AI能力”只掌握在极少数厂商手里 将限制开发者创新空间 并使用户设备越来越像“别人家的入口” [1] - 此次开源AutoGLM 被外界视为智谱抢占AI终端入口的关键布局 [5] - 近期 豆包和中兴旗下努比亚合作开发的AI手机成为大模型技术落地热点 努比亚总裁倪飞表示AI手机发展势不可逆 应以开放姿态打开局面 如iPhone+ChatGPT、三星+Gemini的组合 [5] - 抖音副总裁李亮转发相关文章并称AI带来的变革和用户需求真实存在 豆包和中兴的探索是一个开始 AI一定是未来 [5]
智谱开源“会使用手机的模型”,智能体能否保障个人隐私安全?
中国证券报· 2025-12-09 12:39
公司动态:智谱AI开源AutoGLM模型 - 智谱于12月9日通过微信公众号宣布,开源其核心AI Agent模型AutoGLM [1] - AutoGLM的目标是让AI真正学会“使用手机”,实现从说到做,可在外卖App完成下单、在云手机批量处理通知、在销售客服等场景自动完成重复操作 [1] - AutoGLM于2024年10月25日发布,被业界视为首个具备“Phone Use”(手机操作)能力的AI Agent [1] - 2025年,公司推出AutoGLM 2.0,验证了强化学习的规模扩展定律,并提出MobileRL、ComputerRL和AgentRL算法,通过让模型在上千个虚拟设备环境中同时强化学习,扩展了Agent的准确性和泛化能力 [1] - AutoGLM Phone Agent支持微信、微博、淘宝、京东、美团、抖音、小红书等超50款主流中文应用,可完成启动应用、输入文本、长按、双击等操作,面对登录、输入验证码等敏感操作时会发起人工接管请求 [1] - 智谱为国内头部AI大模型公司,由清华大学团队孵化,致力于打造新一代认知智能大模型 [2] - 公司此前已推出对话模型ChatGLM、开源单卡版模型ChatGLM-6B,并打造了包括智谱清言、CodeGeeX、CogVLM和CogView在内的AIGC产品矩阵 [2] 行业趋势:AI Agent技术发展与应用 - 近期,人工智能技术正向更具实用价值的智能体Agent方向发展,行业希望AI能“长出手脚”,不仅提供建议,还能将建议转为行动 [2] - 豆包于12月1日宣布发布技术预览版豆包手机助手,并与中兴通讯联合推出工程样机nubia M153少量发售,演示中AI助手实现了手机跨App调用,消息引起市场广泛关注,中兴通讯股价当日涨停 [2] - 豆包手机助手在nubia M153上操作手机功能时,被用户发现在部分App出现异常退出甚至无法登录的情况,业内人士认为可能与需要系统级权限相关 [3] - 豆包在后续声明中确认,需要用户主动授权INJECT_EVENTS系统级权限(或类似无障碍权限)才能提供服务,并承诺虽然需要读取屏幕以完成指令,但不会在云端存储用户屏幕内容,且相关内容不会进入模型训练 [3] - 行业人士认为,目前Agent技术仍在探索中,如何平衡使用体验和隐私安全等,需要行业共同努力,开源等方式或有助于加速行业对技术的共同研发 [3] 技术路径与隐私考量 - 由于隐私保护争议和当前手机难以支撑AI Agent模型算力需求,智谱AutoGLM选择不完全部署于手机端,而是在云端运行端侧模型 [3] - 智谱表示,云端运行方案让AI Agent的每一个动作都可以回放、审计、干预,从而将敏感数据隔离 [3] - 在实践中,用户个人隐私保护和网络安全隐忧仍在,以手机智能体为例,将App操作托管给AI需要用户授权屏幕读取权限,引发对个人信息泄露和Agent被灰黑产利用的担忧 [2]
AI动态汇总:DeepSeek线上模型升级至V3.1,字节开源360亿参数Seed-OSS系列模型
中邮证券· 2025-08-26 21:00
量化模型与构建方式 1 **模型名称**:DeepSeek-V3.1混合推理架构[12] **模型构建思路**:通过单一模型支持“思考模式”与“非思考模式”两种推理方式,以适应不同复杂度的任务需求,提升计算资源分配效率[12] **模型具体构建过程**:模型基于Transformer结构进行深度改造,通过动态激活不同的注意力头来实现模式切换,并采用了思维链压缩训练技术以减少推理过程中的冗余token输出[12] 在非思考模式下,模型针对简单任务提供快速响应;在思考模式下,模型启动深度推理机制,适用于代码生成、复杂决策和多步逻辑推理等任务[12] 模型还将上下文长度从64K扩展至128K,采用了“两阶段长上下文扩展方法”,在原始V3模型检查点基础上新增了8400亿tokens的训练数据,其中32K上下文扩展阶段的训练量增加了10倍,128K扩展阶段增加了3.3倍[15] 2 **模型名称**:Seed-OSS-36B[22] **模型构建思路**:以360亿参数规模和原生512K超长上下文窗口为核心,旨在实现参数效率与性能的平衡,特别优化数学推理、代码生成和智能体任务[22] **模型具体构建过程**:采用稠密模型架构,参数分布于64层网络中,隐藏层维度为5120,词汇表扩展至155K以支持多语言与专业术语处理[22] 集成分组查询注意力(GQA)机制,通过80个查询头分组共享键值对,结合旋转位置编码(RoPE)技术原生支持512K上下文窗口[22] 训练阶段采用RMSNorm归一化与SwiGLU激活函数,使用12万亿tokens的训练数据[23] 引入“思考预算”机制,允许用户动态控制模型推理深度,开发者可设定512的整数倍token预算(如512、4K、16K),模型会实时反馈剩余计算资源并调整输出策略[24] 3 **模型名称**:WebWatcher[26] **模型构建思路**:构建一个能够同步解析图像与文本信息,并自主调用多种工具链完成多步骤任务的多模态深度研究智能体[26] **模型具体构建过程**:开发团队设计了一套完整的四阶段训练框架[27] 首先通过CRAWLQA模拟人类浏览权威网站如arXiv和Wiki来构建数据,随后进行轨迹采样以构建网页操作链,接着通过监督微调学习基础工具调用与决策逻辑,最后利用强化学习在动态环境中优化长期推理能力[27] 其关键突破在于E2HQA数据合成技术,通过由简到难的策略自动生成带验证的多步推理问答对[27] 4 **模型名称**:AutoGLM 2.0[32] **模型构建思路**:通过创新的云端架构和“云手机+云电脑”技术范式,构建一个能在手机端运行的通用智能体,实现人工智能从信息交互向行动执行的关键跨越[32] **模型具体构建过程**:其核心架构建立在“终端指令-云端执行-结果反馈”的闭环系统之上,为每位用户配备专属的云端虚拟设备(基于安卓环境的云手机和Ubuntu系统的云电脑),使任务执行与用户本地设备完全解耦[33] 由智谱最新开源模型GLM-4.5与GLM-4.5V协同驱动,GLM-4.5作为“决策大脑”负责任务规划与逻辑推理,GLM-4.5V作为“视觉执行器”通过计算机视觉识别GUI界面元素并精准映射操作动作[34] 两者通过端到端异步强化学习框架协同工作:模型在数千个并行云环境中自主试错,仅依赖最终任务完成的奖励信号优化策略[34] 5 **模型名称**:WeChat-YATT(gCore)[39] **模型构建思路**:专注于强化学习(RL)和多模态模型训练,旨在提供一套易扩展、简洁、高效且可靠的大模型训练解决方案,以应对大尺寸模型、长序列输入以及大规模数据集带来的挑战[39] **模型具体构建过程**:针对大模型分布式训练中的两大核心瓶颈提出解决方案[39] 首先是多模态场景下的可扩展性瓶颈,通过引入并行控制器(Parallel Controller)机制,由多个控制器协同管理数据任务,有效分散系统压力[39] 其次是动态采样与生成式奖励计算下的效率短板,通过部分共存策略(Partial Colocation)和异步交互机制,大幅减轻模型切换损耗和长尾任务的影响[40] 支持两种资源放置模式:全员共存(Full Colocation)与部分共存(Partial Colocation)[43] 全员共存模式采用串行调度机制,Actor Rollouts、生成式奖励模型(GenRM)与训练(Train)依次串行执行,每个角色完成后主动释放计算资源;部分共存模式则适用于Rollouts与GenRM需要高频交互、动态采样的复杂任务场景,Actor Rollouts与GenRM独立部署并通过异步方式进行高效交互[43] 6 **模型名称**:Qwen-Image-Edit[47] **模型构建思路**:基于Qwen-Image基础模型,通过创新的双重编码机制与多模态扩散Transformer架构(MMDiT),实现语义与外观双重编辑能力的深度融合[47] **模型具体构建过程**:采用双路径输入设计,将原始图像同时送入Qwen2.5-VL模型和VAE编码器[47] 前者负责提取高层语义特征,实现对场景、对象关系的理解;后者则专注于保留底层视觉细节如纹理与色彩[47] 引入链式编辑机制,用户可通过多次框选指定区域逐步调整,如修正书法作品[49] 7 **模型名称**:PROMPTQUINE框架[58] **模型构建思路**:提出一种颠覆传统大语言模型提示设计范式的新方法,通过将自然语言提示修剪成看似不连贯的“乱码”来提升模型在多样化任务中的表现[58] **模型具体构建过程**:该框架采用进化搜索算法,仅利用上下文中的token资源,自主发现有效的修剪策略[58] 将提示优化重构为引导式搜索问题,将搜索空间定义为原始提示的所有可能子序列,通过动态调整子序列长度来优化不可微的任务目标函数[59] 设计了基于遗传算法的搜索机制,其中二进制token掩码作为基因型,生成的ICL提示作为表现型,通过位翻转实现变异操作,基于精英选择指导后代生存[59] 模型的回测效果 (报告中未提供相关模型的量化回测性能指标,如年化收益率、夏普比率、信息比率(IR)、最大回撤等,因此此部分省略) 量化因子与构建方式 (报告中未涉及量化因子的构建与测试,因此此部分省略) 因子的回测效果 (报告中未涉及量化因子的构建与测试,因此此部分省略)
美国政府入股英特尔,DeepSeek新一代AI模型专项适配国产芯片
国元证券· 2025-08-25 17:30
行业投资评级 - 推荐|维持 [7] 核心观点 - 美国政府以110亿美元投资英特尔并持股9.9% 强化本土半导体产业与国家安全 [3][32] - DeepSeek-V3.1模型适配国产芯片架构 推动国产算力芯片与开源模型深度协同 [3][33] - 国内AI芯片指数单周上涨18.9% 存储芯片指数上涨9.6% 功率半导体指数上涨5.7% [1][10][15] 市场指数 - 海外AI芯片指数下跌2.23% 主要受美国半导体关税政策预期影响 AMD下跌5.5% Marvell下跌4.2% 博通下跌4.0% [1][10] - 国内AI芯片指数上涨18.9% 中芯国际上涨10.1% 寒武纪上涨34.6% 海光信息上涨20.9% [1][10] - 英伟达映射指数上涨1.0% 兆龙互连上涨13.5% 长芯博创上涨10.7% [1][12] - 服务器ODM指数下跌5.3% Wiwynn下跌13.0% Wistron下跌5.8% 技嘉下跌4.9% Quanta逆势上涨15.2% [1][12] - 存储芯片指数上涨9.6% 兆易创新上涨22.8% 恒烁股份上涨16.7% 普冉股份上涨16.5% [1][15] - 功率半导体指数上涨5.7% 华润微上涨8.3% 士兰微上涨6.9% 芯联集成上涨8.0% [15] - A股果链指数上涨5.4% 港股果链指数上涨0.3% [1][18] 行业数据 - 台湾四大晶圆代工厂Q3合计营收预计351.5亿美元 环比增长7.1% Q4预计回落至321.0亿美元 环比下降8.7% [2][24][25] - 2025年上半年国内XR消费级市场销量26.1万台 环比增长9% 同比下滑21% VR设备销量7.5万台创三年新低 AR设备销量18.6万台 同比增长35% [2][26] - 2025年国内消费级XR销量预计60.6万台 同比增长6.5% [2][26] - 2025年上半年全球智能眼镜出货量同比激增110% Meta市场份额达73% [2][28][31] 重大事件 - 美国政府通过《晶片与科学法案》及安全飞地计划资金 以每股20.47美元购买英特尔4.33亿股 获得9.9%股权及五年期认股权 [3][32] - DeepSeek-V3.1模型采用专用"UE8MO FP8"精度格式 参数规模6850亿 上下文长度128K SWE-bench准确率66% [3][33] - vivo发布首款混合现实头显Vision探索版 强调佩戴舒适性和便捷性 [3][37] - 谷歌发布Pixel 10系列手机 主打AI功能领先iPhone [34] - 海信E8Q Pro电视搭载信芯AI画质芯片H7 支持《黑神话:钟馗》显示优化 黑曜屏Ultra抗反射率降低75% [36] - 智谱AI升级AutoGLM 2.0 支持跨平台操作美团、京东、飞书等应用 [36] - iPhone 17e供应链信息曝光 采用6.1英寸OLED屏及A19平台 主打"最便宜iPhone"定位 [37]
传媒行业周报:可灵Q2营收超2.5亿,DeepSeek-V3.1发布-20250825
国元证券· 2025-08-25 15:20
行业投资评级 - 传媒行业投资评级为"推荐"并维持该评级 [5] 核心观点 - 看好AI应用和文化出海等主题方向 重点关注游戏、IP、短剧、出版等子板块 [4][47] - 可灵AI单季实现营收超2.5亿元 商业化进展超预期 [2][45] - 快手新推出的OneRec端到端推荐大模型有效提升用户时长和留存率 [2][45] - DeepSeek-V3.1发布 在代码修复测评SWE与命令行终端环境下的复杂任务测试中表现有明显提高 [45] 市场表现 - 传媒行业(申万)上涨5.17% 排名行业第6名 同期沪深300涨4.18% 上证指数涨3.49% 深证成指涨4.57% 创业板指涨5.85% 恒生科技指数涨1.89% [1][11] - 细分行业表现:游戏II板块涨6.09% 广告营销涨3.83% 影视院线涨4.76% 数字媒体涨5.87% 出版板块涨4.59% [11] - 个股涨幅前五:果麦文化(+24.79%)、顺网科技(+24.16%)、昆仑万维(+23.48%)、智度股份(+20.49%)、东方明珠(+17.13%) [19][20] AI应用数据 - Deepseek/豆包/夸克/腾讯元宝七麦数据预估ios端下载量分别为34.98/209.57/77.01/85.26万次 环比分别-8.88%/+0.76%/+18.89%/-32.76% [2][23] - 豆包周度下载量相对领先 夸克近一周下载量增幅明显 [2][23] 游戏市场数据 - 2025年7月中国游戏市场规模为290.84亿元 同比增长4.62% [3][25] - 移动游戏7月市场规模为213.6亿元 同比增长0.92% 环比增长6.36% [3][25] - 中国自主研发游戏海外市场实际销售收入为16.93亿美元 环比增长8.2% 同比增长6.76% [28] 电影市场数据 - 本周(8.15-8.21)院线总票房12.52亿元 [3][41] - 《浪浪山小妖怪》周度票房3.63亿元 占比28.9% [41][43] - 《捕风追影》周度票房3.05亿元 占比24.3% [41][43] - 后续(8.25-29)将有16部影片上映 [3][42] 公司业绩表现 - 快手2025年上半年营业收入676.54亿元 同比增长12.0% 经调整利润净额101.98亿元 同比增长12.5% [45] - 美图公司2025年上半年总收入18亿元 同比增长12.3% 经调整后归属于母公司权益持有人净利润4.67亿元 同比增长71.3% [2][45] - 昆仑万维2025年上半年营收37.33亿元 同比增长49.23% [2][46] - 吉比特2025年上半年营业收入25.18亿元 同比增加28.49% 归母净利润6.45亿元 同比增加24.50% [3][45] - 芒果超媒2025年上半年营收59.64亿元 归母净利润7.63亿元 [3][46] - 中文在线2025年上半年营收5.56亿元 归母净亏损2.26亿元 [3][46] 重点产品表现 - 《杖剑传说》表现优秀 上半年流水实现4.24亿元 [3] - 《超自然行动组》在新活动带动下 ios游戏畅销榜排名跃居至第四并持续保持前十 [33] - 腾讯旗下《无畏契约:源能行动》手游上线后保持七麦ios游戏及应用免费榜第一 [33] - 后续新游方面 恺英网络《热血江湖:归来》将于8.27上线 网易《命运:群星》将于8.28上线 [34][35] 技术进展 - DeepSeek-V3.1正式发布 采用混合推理架构 支持思考模式与非思考模式 [45] - 智谱发布AutoGLM 2.0 作为全球首个手机Agent 开创Agent+云手机/云电脑的新技术范式 [45] - 经过思维链压缩训练后 V3.1-Think在输出token数减少20%-50%的情况下 各项任务的平均表现与R1-0528持平 [45]