Token经济
搜索文档
5000家AI企业,都在疯狂试错|一线
吴晓波频道· 2026-02-06 08:30
文章核心观点 - 中国AI创业热潮涌动,企业数量激增,但行业普遍处于快速试错、探索商业化落地的早期阶段,面临真实需求匹配与高昂模型成本两大核心挑战,全球化发展成为普遍选择策略 [6][7][23][24][38] AI创业生态现状与参与者画像 - AI创业活动异常火爆,某全球AI创业社区组织的活动经常爆满,报名人数可达600-800人,远超200-300人的到场容量 [3] - 中国人工智能企业数量快速增长,截至2025年9月已超过5000家,是五年前1454家的3倍多 [7] - 草根创业者:典型代表如Eason,非技术背景连续创业者,采用小团队、多产品、快速验证MVP的模式,追求用户付费而非规模,单款产品月变现2万元以上即可盈利 [11][12][16][17] - 高校背景创业者:典型代表如计算美学,核心团队来自清华、北大、哈佛、耶鲁等名校,已完成近亿元融资,策略是快速试错调整,从C端转向B端实现稳定营收后,再杀回C端市场 [17][18][19] - 大厂背景创业者:普遍存在,但创业过程并不轻松 [17] - 服务商视角:将AI创业者分为两类,一类技术强但产品与商业闭环理解不足,另一类产品与商业能力强但低估AI工程化与成本复杂度 [20] 行业面临的核心挑战 - **需求痛点匹配(“痛不痛”)**:能否抓住真实、有长期需求的用户痛点是首要难题,业内对C端产品落地判断不一,竞争激烈但真正解决问题的产品不多 [25][26][28][29][30] - 当前主流商业模式是为企业提供定制化AI解决方案以降本增效,这是一个具有长期需求的市场 [26] - 智算中心GPU利用率不均,国内总数超280个,但平均利用率不到30% [27] - **模型成本压力(“贵不贵”)**:调用大模型产生的Token成本是创业公司的核心财务压力,催促企业快速商业化 [30][31] - 模型成本通常占AI初创企业总可变成本的40%-70%,对于月营收1万-10万美元的企业,该比例达50%-65% [32][33] - 成本随用户活跃度非线性飙升,例如一款AI Agent产品日活从500-1000升至1万时,月模型成本可能从1000-2000美元跃升至10000-50000美元,但收入并未同步增长10倍 [34] - 大模型厂商仍在提价,例如DeepSeek-V3.1输出定价较V3版上涨50%,OpenAI的GPT-5.2输入价格较GPT-5.1上涨40% [34] 全球化发展战略 - AI创业者普遍主动选择全球化团队布局与市场拓展,例如团队分布在新加坡、上海或北京、杭州、美国等地 [38][39] - **出海动因一:市场成熟度与付费意愿**:海外市场(尤其是美国)因ChatGPT更早教育市场,用户付费决策更直接、订阅意愿更强,商业化程度更高 [40][41] - ChatGPT付费用户占比约5%,OpenAI内部预测到2030年付费订阅用户将至少达2.2亿人 [42] - 相比之下,中国用户更谨慎、价格敏感,付费链路长,许多合作仍是项目制思维 [41] - **出海动因二:投融资环境与退出机会**:海外市场投融资机会多,更擅长造就年轻创业明星,且被大厂收购的可能性更高 [45][46] - 例如,硅谷出现多位20余岁创始人创办高估值AI公司的案例,而国内生态竞争激烈,被收购概率较小 [45][46] - 近期案例显示,Meta曾欲以数十亿美元收购国内AI初创企业Manus [47] - 全球化策略结合了海外高价值市场、投融资便利与国内工程师红利、高效产品迭代优势 [49] - 行业观察认为,中国更容易跑出性价比极致的产品,美国更容易跑出定义范式的公司,成功的团队需同时理解两种环境 [50][51] 行业动态与潜在风险 - 大模型技术快速迭代可能淘汰部分初创企业,例如DeepSeek-R1问世后,导致“百川智能”等公司原有客户转移,被迫进行战略调整 [48] - 行业存在矛盾心态:一方面为技术进展与潜在爆发式增长机会感到兴奋;另一方面又不得不面对现实痛点与成本压力,并因国内外市场差异做两手准备 [52][53][54] - 更深层困境在于AI技术发展速度远超专业用户的接受度和实际使用度,存在“产品多,专业用户少”的现象 [55][56]
Agentic-AI时代的新增长曲线
2026-02-03 10:05
关键要点总结 一、 行业与公司 * 纪要主要涉及**人工智能 Agent 技术**,特别是 **OpenCloud** 这一新兴的 AI Agent 形态,以及其发展对 **数据中心 (IDC)**、**云计算**、**算力**、**网络安全** 和 **物联网 (IoT)** 等产业链的影响 [1][2][4] * 纪要重点分析了 **数据中心行业** 在 **2026 年** 面临的机遇与前景 [9][10][11] 二、 核心观点与论据 1. OpenCloud 的技术特点与优势 * **架构逻辑**:采用“云大脑+本地手脚”的架构,用户通过即时通讯软件(如 WhatsApp 或 Telegram)发送指令,本地网关接收后传给云端大模型解析,再调用本地工具链执行任务并返回结果 [2] * **核心差异**: * **交互入口**:通过即时通讯软件交互,更贴近通讯录端的数字员工,便于事件触发和主动推送 [2] * **技能库**:采用动态加载机制,仅在触发特定场景时加载对应工具说明,优化了 Tokens 使用量以降低成本;其开源技能库能广泛汇集开发者力量 [4] * **私有化部署**:主要在本地硬件上运行,具备高操作权限,可直接操控本地文件和命令行;数据存储在本地,相较于云端部署更具数据主权和操作权限 [4] 2. AI Agent 发展带来的产业链机遇 * **算力与云服务需求激增**: * Agent 为完成复杂指令会进行多次任务拆解、长程搜索和自我修正,比单次对话消耗更多算力,推动基础大模型调用量提升 [5] * 各类云厂商快速推出一秒级部署 OpenCloth 将驱动云厂商 **API、算力及数据服务消费** 增加 [5] * 大模型公司的 API 使用量正在快速上升,例如 Anthropic 将 2026 年收入预测从 140-150 亿美元上调至 180 亿美元以上 [21] * 国内大厂(如字节跳动、阿里巴巴)对 2026 年云计算业务预期实现几倍增长,从卖算力转向输出模型能力 [21] * **基础设施需求变化**: * **端侧设备**:Agent 的 24 小时常驻运行属性提升了对 **迷你主机**(作为网关系统主体)和 **VPS 虚拟私有云主机** 的需求 [5] * **GPU 主机**:本地化推理比例上升,使具备 **大显存带宽的 GPU 主机** 成为私有数据安全及复杂指令集推理的重要物理底座 [5] * **数据中心 (IDC)**:AGI 爆发和 Agent 技术推动 **AI 训练和推理需求** 增加,以及 **Tokens 调用量快速上涨**,促进了一线及环一线核心数据中心资源需求增加 [3][15] * **流量与安全新需求**: * **流量特征变化**:过去是用户访问网页,现在是 Agent 读取文件并反馈给模型,带动了 **边缘高性能网关** 及 **内网负载均衡** 需求 [6] * **网络安全需求增长**:本地网关暴露在公网会增加 **DDOS 风险** 及 **沙箱隔离** 需求,推动网络安全从企业级向边缘节点扩展 [6] * **隐私计算**:自托管模式下的数据存储在本地,即使调用大模型 API 也仅进行推理任务,驱动隐私计算生态发展 [6] 3. 数据中心行业在2026年的机遇 * **业绩兑现支撑**:下游厂商招标到数据中心交付通常需 6-12 个月周期,2025 年是订单交付大年,因此 **2026 年是业绩兑现的重要时间节点** [10] * **产业链边际转好与推理需求起量**:随着 AI 应用普及与复杂度提高,对算力要求不断增加,将进一步推动产业链发展 [10] * **国内数据中心形态演进**:国内数据中心形态逐步向 **G 瓦级** 演进,这一趋势利好龙头厂商拿单,有助于其市场份额扩大 [1][10] * **资本开支有力支撑**: * 下游资本开支对数据中心行业景气度有重要支撑作用 [12] * 例如,阿里巴巴在 2025 年前三季度资本开支分别为 246 亿、387 亿和 314 亿元;腾讯则分别为 275 亿、190 亿和 130 亿元 [12] * 阿里计划未来三年将资本开支从 3,800 亿元提升至 4,800 亿元 [12] * 这些持续上行的资本开支有望推动数据中心板块订单超出预期 [12] * **芯片供应链改善**:受益于国内外芯片供应链边际改善(国产芯片需求增长加速适配,英伟达重启 H200 供应链等),数据中心行业有望获得更稳定的支持,有助于打通下游资本开支向 IDC 下单的传导路径 [13] 4. Agent 市场现状与发展前景 * **市场渗透率极低**:目前全球通用 Agent 用户数估计在千万量级,而传统 Chatbot(如 OpenAI 和 Gemini)月活跃用户已达 15 亿至 20 亿,因此 **Agent 渗透率仅为 0.5% 到 1%** [20] * **增长潜力巨大**:如果 2026 年能将渗透率提升至 2%,将带来显著增长,因为每提升一个百分点意味着 **Tokens 消耗可能翻倍** [20] * **Token 消耗量剧增**:Agent 需要完成更高质量的任务(如制作 PPT 或深度研究),推理链条和工作时长都大幅延长,相比于传统 Chatbot,**Agent 的单用户 Tokens 消耗可能增长几十倍甚至上百倍** [19][25] * **成为关键驱动力**:OpenCloud 有望像去年的 Deepseek 一样扮演鲶鱼角色,加速 Agent 领域发展,倒逼更多公司加码 Agent 投入,使 **2026 年成为 Agent AI 加速渗透的一年** [18] * **多 Agent 系统趋势**:多 Agent 系统的发展趋势越来越明显,将进一步增加 Token 消耗,提高整体应用效率 [3][18] 5. 深远影响与未来趋势 * **企业级 Agent 范式演变**:OpenCloud 模式通过强化沙箱隔离环境、审计日志追溯等措施,有望解决企业部署 Agent 面临的数据主权、权限划分及合规责任归属等阻碍,成为未来企业级 Agent 的一种范式 [7] * **推动物联网 (IoT) 渗透率提升**:Agent 的语义解析能力及 MCP 能力泛化接入,可解决物联网长期以来协议破碎、交互繁琐的问题,促进传统设备向物联网转型,加速全屋智能实现 [7][8] * **AI 与 AI 交互**:未来在完成复杂任务过程中可能形成多层交互网络(人-AI 交互、AI-AI 协作),这将进一步增加 Tokens 消耗,并推动整个推理端 Token 需求曲线的新一轮增长 [23] * **对传统软件行业的影响**:AI Agent 可能成为未来核心入口,侵蚀部分具有入口价值的软件,但垂直领域软件仍能保住入口价值或退居后台提供能力支持;中国软件公司因 SaaS 化不彻底,相较美国公司受到 AI 取代席位的影响较小 [26] 三、 其他重要内容 1. 中美数据中心建设模式差异 * **海外大厂**:倾向于通过高额资本投入自建 **G 瓦级超大规模数据中心**,以锁定能源自主权,例如 XAI 的数据中心 Clusters 一期在 122 天内完成 10 万张 GPU 部署 [16] * **国内大厂**:更偏好与第三方 IDC 厂商合作,利用其地方政府关系、电网协调等经验满足快速交付诉求,同时缓解芯片供应链不确定性带来的资本支出压力 [16] * 预计在 AI 算力驱动下,国内大厂对于 **G 瓦级别单体数据中心** 需求量将增加,有利于龙头厂商获得更多订单份额 [16] 2. 数据中心板块估值与风险 * **估值水平**:当前整个数据中心板块平均估值对应 **18 倍 2026 年的 EV/EBITDA**,处于历史估值水平 75% 分位 [17] * **上行催化**:随着下游资本开支继续上行、上游芯片供应链改善、大模型流量突破,有望推动板块估值中枢上移 [17] * **风险因素**:**下游资本开支、芯片供给情况及流量增长不及预期** 可能会短期影响板块估值波动 [17] 3. 安全与部署考量 * **安全挑战**:个人部署 OpenCloud 不具备成熟沙箱隔离环境,根据 1 月 25 日网络扫描显示,有上千个控制面板处于无保护状态 [6] * **企业部署建议**:企业在采用开源方案时,需要特别关注网络安全和防火墙配置,确保系统稳定和安全运行,尤其是在生产环境中 [24] 4. Token 经济与硬件影响 * **Token 经济增长**:2026 年 Token 数量可能增加几十倍甚至上百倍,其增长速度将超过算力优化速度,可能引发短期通胀 [25] * **硬件需求**:这一趋势将明显拉动整个算力产业链,包括 **存储、CPU** 等配套设施需求 [25];但大部分核心模型推理运算仍在云端完成,本地部署无需高性能硬件,一般消费级电脑即可满足执行需求 [25]
从一杯咖啡里的算力说起
华尔街见闻· 2026-01-27 17:56
行业前景与市场格局 - 中国通用GPU市场规模预计到2029年有望达到7153亿元,未来5年复合增长率高达29.5% [4] - 行业已进入去伪存真的兑现大考阶段,落地困难与生态割裂是现实难题 [5][8] - 多家国产GPU厂商已完成上市,以争夺未来市场 [4] 公司战略与产品路线图 - 公司公布了横跨2025至2027年的四代架构路线图,旨在逐步超越英伟达的Hopper、Blackwell及Rubin架构 [6][15] - 四代架构分别为天数天枢、天数天璇、天数天玑、天数天权 [6] - 第一阶段(2027年前)目标是对标并超越行业标杆,第二阶段将转向创新和定义超级计算芯片架构 [15] - 天数天枢架构的效率较行业平均水平提升60%,在DeepSeek V3场景性能平均比Hopper架构高约20% [13] 产品发布与性能 - 新发布“彤央”系列四款边端AI算力产品,覆盖100T至300T算力区间 [6] - 彤央TY1000在计算机视觉、自然语言处理、DeepSeek 32B大模型等多个场景实测性能全面优于英伟达AGX Orin [33] - 彤央系列产品形态多样,包括标准模组TY1000、集成ARM CPU的TY1100、大显存高性价比的TY1100_NX以及300TOPs算力终端TY1200 [34] 技术理念与算力标准 - 公司提出“回归算力本质”和“做越野车”思维,以应对复杂应用场景 [10][11] - 定义了“高质量算力”三大标准:高效率(优化客户TCO)、可预期(构建“算力仿真驾驶舱”实现所见即所得)、可持续(软件适配过去及未来算法) [12] 生态构建与客户迁移 - 致力于降低客户迁移门槛,承诺客户现有代码几乎一行不用改 [18][19] - 已支持400余种模型,国内新大模型发布当天可跑通,客户仅需1/3开发调优精力即可完成部署 [20] - 生态兼容性是赢得客户认可的关键因素之一 [21] 商业落地与应用案例 - 首次公布各行业应用情况,展示了规模化落地的真实样本 [23] - 在互联网领域实现单机性能翻倍、Token成本减半、人力节省1/3 [23] - 在金融领域研报生成效率提升70%,量化分析响应速度提升30% [23] - 在医疗领域结构化病历生成时间缩短至30秒/份,肠胃镜病灶精准定位能力提升30% [23] - 已累计服务超300家客户,完成超1000次行业部署 [25] 物理AI与边端算力布局 - 物理AI被视为下一场宏大战役,类似于4-5年前的生成式AI爆发前夜 [28] - 公司通过“彤央”系列产品卡位物理AI赛道,解决算力落地“最后一公里”难题 [36] - 边端产品是连接AI与物理世界的关键媒介,旨在为机器人等提供环境感知与交互能力 [29][30] - 已在具身智能、工业智能、商业智能、交通智能四大核心场景展示应用 [36][42] 增长引擎与市场机遇 - 未来两大核心增长引擎是推理侧的“Token经济”与边端侧的放量 [38] - AI计算重心正从训练端加速向推理端拓展,每次Token生成都消耗算力 [40] - 公司在“云+边+端”全方位覆盖,具备增长基础 [40] - 与格蓝若机器人、比依电器、瑞幸咖啡等达成深度合作,并在20个试点城市开展车路云一体化合作 [42] 公司定位与竞争优势 - 公司定位为中国智能社会底层不可替代的赋能者,提供高性能、低门槛、广生态的算力 [43] - 护城河在于基于通用架构的创新设计、七年全栈自研积累、超300家客户的真实使用以及全方位产品覆盖 [40] - 被视为观察中国硬科技从“模仿”走向“定义”的典型样本 [44]
Token消耗藏着财富密码|AI产品榜·网站榜2025年10月榜
36氪· 2025-11-11 21:35
文章核心观点 - Token消耗量是衡量AI产品影响力和商业潜力的关键指标,揭示了AI时代的财富密码[4][8] - 企业服务类AI应用在Token消耗榜中占据主导地位,15个产品占比达到50%[5] - 用户规模大的传统平台(如Canva、Indeed)即使AI功能不彻底,也能产生巨大的Token消耗量[6] - 电商平台通过客服机器人、商品描述自动化等应用成为重要的Token消耗场景[7] 全球AI产品Token消耗榜 - Canva以1185.58万用户规模位居Token消耗榜首位,属于消费级应用类别[9] - Indeed招聘平台以455.91万用户排名第二,是企业服务领域的代表[9] - 拉美电商平台Mercado Libre以288.13万用户位列第三,显示电商AI应用的活跃度[9] - 前10名产品用户规模均超过1000万,Perplexity答案引擎以264.01万用户排名第四[9] - 语言学习平台Duolingo以201.80万用户进入前五,消费级应用表现突出[9] 全球总榜TOP100网站访问量 - ChatGPT以63.7亿月访问量稳居第一,同比增长4.43%[13] - New Bing以13.7亿访问量排名第二,但出现0.27%的小幅下滑[13] - Gemini以12.2亿访问量位列第三,实现11.74%的显著增长[13] - 深度求索(DeepSeek)以3.56亿访问量排名第四,增长7.36%[13] - GitHub Copilot以3.02亿访问量位居第五,作为代码助手增长6.10%[13] 增速表现突出的AI产品 - meta.ai实现105.15%的惊人增长,月访问量达到2305万[15] - Sora视频生成工具增长93.90%,访问量达6858万[15] - Creati视频生成工具增长1475.58%,虽然基数较小但增速惊人[22] - 多个AI视频生成工具表现亮眼,Wan AI增长38.42%,Viggle增长39.48%[24] 国内AI产品表现 - 深度求索以3.56亿访问量位居国内榜首,增长7.36%[18] - 纳米AI搜索以2.60亿访问量排名第二,但出现12.10%的下滑[18] - 豆包(抖音)以8843万访问量排名第四,增长2.77%[18] - 百度AI搜索以4886万访问量进入前五,增长9.65%[18] - 文心一言访问量472万,大幅下滑20.47%,面临较大竞争压力[19] 垂直领域AI应用排名 - AI搜索领域New Bing以13.7亿访问量领先,但Perplexity以29.12%增速追赶[27] - AI聊天机器人ChatGPT绝对领先,Gemini、Grok、Claude等竞争激烈[28] - 图片生成工具SeaArt以3382万访问量领先,但Higgsfield以50.82%增速表现突出[31] - 视频生成领域Sora以6858万访问量和93.90%增速双领先[33] - 音乐生成Suno.com以5993万访问量位居第一,增长25.45%[35] 开发者工具与代码助手 - GitHub Copilot以3.02亿访问量遥遥领先,增长6.10%[13] - 代码助手领域竞争激烈,Hostinger、Airtable、Lovable.dev等产品访问量均超千万[36] - cursor代码助手以1749万访问量实现14.78%的较快增长[36] - 国内云服务商普遍面临访问量下滑,阿里云下滑12.97%,腾讯云下滑14.90%[38]
存力中国行北京站释放信号:AI推理进入存算协同深水区
搜狐财经· 2025-11-11 20:38
AI推理时代的发展趋势与挑战 - AI产业已从模型研发阶段进入规模化应用阶段,推理应用呈现爆发式增长,推动Token调用量呈指数级攀升[3] - 金融风控、医疗辅助诊断、电商推荐、投研分析等场景的深度渗透标志着“Token经济”时代到来[3] - 推理阶段的性能、效率与成本控制成为决定技术落地价值的“最后一公里”[1] AI推理规模化落地的核心痛点 - 数据层面:多模态数据爆发式增长使存储面临PB到EB级容量压力,数据格式异构导致高质量数据集构建成本高昂[3] - 性能层面:KV Cache技术广泛应用对存储的高带宽、低时延提出严苛要求,传统架构难以满足存算协同需求[3] - 成本层面:HBM等高端存储介质价格昂贵,叠加推理负载的潮汐性特征,导致中小企业智能化转型门槛居高不下[3] - 存储系统带宽和IOPS不足导致GPU等昂贵算力资源长时间空闲,阻碍AI应用落地[3] 存储架构的技术创新与突破 - 存储架构正经历从“被动存储”到“智算协同”的根本性转变,核心路径在于构建以KV Cache为中心的推理记忆数据湖[4] - 华为UCM统一缓存管理技术通过HBM-DRAM-SSD三级缓存架构,将非活跃KV Cache从显存动态卸载至高性能SSD[4] - UCM技术实现首Token时延最高降低90%、系统吞吐率提升22倍、上下文窗口扩展10倍以上的突破性效果[4] - UCM已于2025年9月在魔擎社区开源,向全行业开放接口,降低中小企业获取先进推理加速能力的门槛[4] 产业生态协同与标准化发展 - 中国信息通信研究院联合华为、中国移动、浪潮等企业成立“先进存力AI推理工作组”,围绕技术研究、标准制定、方案落地与生态构建四大任务[5] - 芯片厂商的3D堆叠技术、存储厂商的架构创新、云服务商的平台优化形成良性互动,实现软硬件协同增效[5] - 移动云探索以太网协议栈替代RDMA方案,为存量资源复用提供可行路径[5] 中国存力产业发展现状 - 截至2025年6月,全国存力总规模达1680EB,先进存储占比提升至28%[5] - 国产分布式存储产品、AI存储系统多次斩获国际权威测试冠军,232层三维闪存芯片达到业界先进水平[5][6] - 闪存主控芯片实现商用突破,产业链自主可控能力持续增强[5][6] 先进存力的战略价值与未来展望 - 先进存力已从“数据容器”转变为AI智算体系中的“协同中枢”,成为破解AI推理性能、成本与效率瓶颈的关键[7] - 通过破解内存墙、容量墙与成本墙,先进存力推动智能化转型从大企业的“奢侈品”转变为中小企业的“必需品”[7] - AI价值不再仅由参数规模定义,而取决于在真实业务场景中实现“快、准、省”的能力[7]
Token经济时代,AI推理跑不快的瓶颈是“存力”?
钛媒体APP· 2025-11-07 12:08
行业结构性转向 - 大模型产业正经历从算力军备竞赛向推理效率商业竞争的结构性转向 [1] - 决定AI体验、成本和性能的关键因素从GPU集群转向存储能力 [1] - 先进存力从后台工程角色转变为推动AI真正落地的主动力量 [1] 存储市场前景 - 受益于AI需求强劲拉动,2025年第四季度存储价格有望持续看涨 [1] - AI应用对存储提出更高要求,服务器端对高阶DRAM和HBM需求增长挤占了消费级DRAM产能 [1] 推理负载变化 - 长上下文和复杂任务让KVCache容量随输入长度呈指数级增长 [4] - 多模态扩展至图像、音频、视频使简单顺序读写I/O模式无法满足实时推理需求 [4] - 训推一体化趋势要求推理系统在高负载下保持一致性、低延迟和稳定性 [4] 存力瓶颈影响 - GPU利用率下降主因是数据供给不上而非算力不足,经常出现"等数据"现象 [5] - 推理侧每提升20%算力利用率可带来15%—18%整体成本下降 [5] - 算力资源无谓空转直接推高推理成本 [5] 存储技术演进 - 行业通过分层缓存+动态调度提升KVCache管理效率,划分为本地极速层、共享扩展层与冷备层 [6] - 中国移动云推进基于CXL的新型高速互联,将CPU内存、GPU显存及云主机闪存统一池化 [6] - 华为针对AI推理研发UCM推理记忆数据管理技术,通过集中高质数据、提速AI训练、优化推理效能打造解决方案 [7] 优化实践成效 - 华为对万卡集群全栈存力优化后,训练可连续运行22天不间断,算效提升超过50% [9] - 硅基流动AI infra工具链适配100多款开源大模型,通过公有云服务平台提供大模型服务 [9] - 结合UCM技术卸载KVCache释放显存,基于存储的KVCache方案可大幅提升系统吞吐 [9] 未来产业共识 - GPU不再是最稀缺资源,真正稀缺是"喂饱GPU的能力",提高GPU利用率比继续堆卡更具价值 [10] - 多模态数据爆炸让存储从"存放数据"走向"管理数据",成为AI系统主动组件 [10] - 训推一体化使存储系统"实时性"从可选变为必选,存储成为业务链路一部分 [10] - CXL架构将重塑AI基础设施内存与存储边界,构造算力存力一体化可能 [11]
申万宏源研究晨会报告-20250925
申万宏源证券· 2025-09-25 08:43
核心观点 - 康农种业作为育繁推一体化玉米种子企业,凭借品种优势实现快速增长,2022-2024年营收CAGR达30.5%,利润CAGR达42.1%,核心品种康农玉8009推动全国市场扩张,目标市值45亿元对应90%上涨空间 [2][3][5][8][11] - 玉米种子行业供需失衡,24/25年供需比达175%,但高产优质品种仍享有溢价,同质化品种竞争激烈 [11] - 建材行业2025H1营收同比下降4.1%至2775.7亿元,但利润同比增长38.9%至148.2亿元,水泥和玻纤板块表现亮眼 [12][15] - 新版建材行业稳增长工作方案强调盈利提升,水泥产能预计收缩4亿吨以上,玻璃行业淘汰落后产能加速 [16][18] - AI应用商业化加速,2025H1中国大模型Tokens调用量达537万亿,编程、视频、企业软件等细分领域实现亿美元级ARR [17][19][22] - 光伏行业政策转向反内卷和多能综合利用,从单一电力消纳向绿氢制储等方向延伸 [22] 指数表现 - 上证指数收盘3854点,单日涨0.83%,近5日涨0.73%,近1月跌0.59% [1] - 深证综指收盘2506点,单日涨1.56%,近5日涨4.69%,近1月跌0.2% [1] - 中盘指数单日涨1.9%,近1月涨8.66%,近6月涨22.64%,表现优于大盘和小盘指数 [1] - 电子化学品行业涨幅居前,单日涨5.48%,近6月涨46.02% [1] - 游戏Ⅱ行业近6月涨65.53%,表现突出 [1] - 元件Ⅱ行业单日跌2.12%,但近6月仍涨82.01% [1] - 股份制银行Ⅱ行业近1月跌8.6%,近6月跌4.1% [1] 康农种业业务与增长 - 公司主营杂交玉米种子,2017年打通育种、扩繁、推广环节,2021年开拓黄淮海和北方春播新市场 [11] - 短期增长由康农玉8009驱动,该品种为密植小棒型,上市首年销量超300万亩,次年超760万亩,预售火热 [11] - 通过自繁制种降本,以2024年毛利率35.8%为基准,2025年毛利率预计提升1.2-5.0个百分点 [11] - 西南市场通过品种迭代巩固优势,黄淮海市场由8009领航,东北市场预计2027年起规模销售 [11] - 转基因品种储备充足,布局西南领跑、黄淮海跟进、东北提升的格局 [11] 行业供需与价格 - 2025/2026年国内玉米供需紧平衡,价格预计稳定,种植积极性较好 [11] - 种子市场高库存需2-3年改善,高产优质品种享有溢价,同质化品种价格承压 [11] 财务预测与估值 - 预测2025-2027年归母净利润分别为0.96亿元、1.23亿元、1.50亿元 [11] - 最新市值对应PE分别为25倍、19倍、16倍,可比公司2025年PE均值47倍 [11] - 给予2025年47倍PE,目标市值45亿元,较当前有90%涨幅空间 [11] 建材行业表现 - 2025H1样本企业营收2775.7亿元,同比下降4.1%,但降幅较2024年收窄10.7个百分点 [12] - 归母净利润148.2亿元,同比增长38.9% [12] - 水泥行业营收1188亿元,同比下降7.5%,利润54亿元,同比增长1110.5%,受益于价格改善和成本下降 [12][13] - 玻纤行业营收311.0亿元,同比增长20.9%,利润32.9亿元,同比增长127.0%,复价和特种布布局贡献增长 [15] - 消费建材营收687.6亿元,同比下降2.7%,利润43.5亿元,同比下降13.2%,但三棵树、科达制造等个股表现突出 [15] - 玻璃行业营收246亿元,同比下降17.0%,利润10亿元,同比下降60.3%,仍处于周期底部 [15] 政策与行业动向 - 新版建材工作方案重点提升盈利,水泥产能需在2025年底前统一备案与实际产能,预计收缩4亿吨以上 [16] - 玻璃行业依法淘汰落后产能,推动环保绩效低企业退出,加快煤改气 [18] - 政策支持发展先进无机非金属材料,如人工晶体、高性能纤维等,推动"人工智能+建材"行动 [18] AI应用商业化 - 2025H1中国大模型Tokens调用量达537万亿,2024年全年为114万亿 [22] - OpenAI的ARR达120亿美元,AI编程公司Anysphere的ARR达5亿美元 [19] - AI视频、编程、企业软件等领域多家公司迈入1亿美元ARR门槛 [19] - 生成式推荐系统在META、字节、快手等公司落地 [19] - 企业级AI软件在数据分析、ITSM、ERP方向落地周期约6-18个月 [19] 光伏政策导向 - 政策推动从单一电力消纳向多能综合利用转变,重点发展绿氢制储、绿色合成氨等方向 [22] - 2025年1-7月全国光伏发电利用率94.7%,同比下降2.4个百分点 [22] - 行业反内卷政策密集落地,支持技术创新驱动降本增效 [22]
GenAI系列报告之64暨AI应用深度之三:AI应用:Token经济萌芽
申万宏源证券· 2025-09-24 20:04
行业投资评级 - 报告对AI应用行业持积极态度 投资评级为看好 [4] 核心观点 - AI应用Tokens消耗量大幅增长体现落地进展加速 大模型实现大规模商业化且收入向头部集中 OpenAI年化收入达到120亿美元 [4] - AI视频工具已迈入1亿美元ARR台阶 大规模商业化节点即将到来 [4] - AI编程为最热门融资方向 商业模式已跑通并加速兑现收入 Anysphere实现5亿美元ARR [4] - 企业级AI软件商业化偏慢 但具备坚实应用场景的AI法律 招聘 客服等领域已渐次兑现收入 [4] - 互联网巨头通过AI推荐系统升级和AI应用孵化推动商业化 META业绩已体现生成式推荐系统效果 [4] AI应用总览 - 大模型API调用量2025年后增长明显 OpenRouter平台显示谷歌Gemini Anthropic Claude OpenAI GPT等模型竞争格局高波动 [11] - 互联网公司AI Chatbot成为核心算力消耗场景 ChatGPT周活跃用户达8亿 谷歌Gemini月活用户达4.5亿 [14] - 微软Tokens消耗量从2024Q1的20万亿增长至2025年3月的400万亿 谷歌Tokens消耗量从2024年5月的9.7万亿增长至2025年7月的980万亿 [13] - 初创公司商业化进展分化 OpenAI估值3000亿美元 Anthropic拟以1700亿美元估值融资 xAI估值1130亿美元 [16] - AI视频工具Runway ARR达8400万美元 Synthesia ARR达1亿美元 Midjourney年营收预计3亿美元 [16] - AI编程工具Anysphere估值99亿美元 ARR达5亿美元 Replit估值30亿美元 ARR达1.4亿美元 [18] - 垂类AI应用Scale AI年营收预计20亿美元 Surge AI年营收超10亿美元 ElevenLabs ARR达1亿美元 [22] 互联网巨头进展 - 生成式推荐架构正替代传统DLRM模型 META GRs 快手OneREC 字节HLLM等方案推动推荐系统升级 [34] - META生成式推荐系统使Facebook用户使用时长提升7% Instagram提升6% 广告转化率提升5% [42] - 谷歌AI搜索功能AI Overview月活用户超20亿 AI Mode月活达1亿 Gemini月活达4.5亿 [47] - OpenAI年化收入120亿美元 其中C端订阅55亿 B端订阅36亿 API收入29亿 [53] - Anthropic年化收入50亿美元 其中API收入31亿(60%来自编程工具) 编程工具Claude Code ARR达4亿美元 [53] AI编程领域 - AI编程工具ARR总和超30亿美元 GitHub Copilot用户达2000万 Cursor ARR从1亿快速提升至5亿 [61] - 应用层公司仍需完成代码库感知 编辑器整合 UI优化等工作 具备独立竞争壁垒 [65] - Cursor通过VS Code集成 影子工作区验证 多模型智能路由等技术实现出色用户体验 [68] - 长期看AI编程可能演进为UGC应用程序平台 降低开发门槛并丰富应用生态 [73] 企业级AI软件 - 企业级AI部署前期需3-18个月完成数据清洗 工作流结合等工作 大规模落地节点或在2026年后 [80] - 定制化AI平台更适合企业落地 ServiceNow AI ACV订单达2.5亿美元 指引2026年达10亿美元 [77] - 竞争壁垒来自数据获取能力和行业Know-how Palantir Snowflake ServiceNow SAP等公司具优势 [85] - Palantir通过数据层归一化 逻辑层模型结合 行动层人工审核等构建企业AI操作系统 [91] 内容生产工具 - AI视频工具Runway Synthesia ARR接近1亿美元 但文本忠实度等仍有提升空间 [96] - 设计软件市场分化 Adobe面向专业设计者市场 Figma Canva面向传播者市场 [99] - Figma高价值客户数量高速增长 超过1万美元ARR客户达11107家 超过10万美元客户达1031家 [101] - 多邻国Max会员渗透率达8% 定价29.99美元/月 高于Super会员的12.99美元 [109] 国内AI应用 - 2025H1中国大模型公有云服务Tokens调用量达537万亿 2024全年为114万亿 [112] - 互联网公司通过推荐系统升级 AI Chatbot和云业务推动AI落地 [115]
行业观察 | Token市场占据半壁江山,火山引擎在打什么牌?
搜狐财经· 2025-09-22 23:16
中国AI云市场竞争格局 - 2025年中国AI云市场竞争激烈 阿里云 火山引擎 百度智能云均公开宣称自身优势[2] - 火山引擎2024年营收超110亿元 增速超60% 2025年营收目标超200亿元[2] - 火山引擎在IDC五份报告中的四份跻身前列 两份报告位居首位[2] 火山引擎市场地位 - 2025上半年火山引擎在大模型公有云服务市场份额达49.2% 接近半壁江山[3] - 2024年全年火山引擎在大模型公有云服务市场份额为46.4%[3] - 2024年AI基础设施市场份额9%居国内第三 生成式AI基础设施市场份额14.2%居国内第二[3] Token调用量核心指标 - 火山引擎更关注Tokens调用量而非GPU算力规模 认为这更能反映大模型产业落地真实水温[6] - 2024年中国云厂商Token调用收入总和不超过10亿元 但正以10倍以上速度成长[7] - IDC数据显示2024年6-12月中国大模型调用量增长近10倍[7] Token市场增长数据 - 2025上半年中国大模型公有云Tokens调用总量达537万亿次[7] - 火山引擎方舟平台Token调用量同比增长3.98倍[7] - 字节跳动内部产品Tokens消耗量未被统计 若计入市场份额会更大[7] Token经济模式优势 - Token收入可能在未来1-2年增长至百亿元规模 年增速可达3-10倍[8][9] - 相比低价销售GPU资源的"一锤子买卖" Token模式带来经常性收入[9][10] - 按Token计费降低开发门槛 使算力计费更清晰 ROI更易衡量[11] 行业发展趋势 - AI算力消耗从训练转向推理 "卖Token"模式正变得越来越流行[12] - 2024年初中国日均Token消耗量1000亿 2025年6月底突破30万亿 一年半增长300多倍[12] - 2024年7月火山引擎率先降价90% 引发行业跟进 2025年2月DeepSeek模型走红推动爆发[13] 未来增长预测 - 2025年底-2026年初多模态模型和Agent成熟将推动新一轮Token消耗增长[17] - 单次视觉任务消耗算力可能超10万Tokens 是文本对话的成千上万倍[17] - 预计2027年豆包大模型日Tokens消耗量超100万亿 较2024年增长至少100倍[18] 字节跳动生态优势 - 字节跳动内部AI需求领先外部市场约4-5个月[19] - 豆包大模型2025年5月日均Tokens调用量16.4万亿 较2024年5月1200亿增长137倍[29] - 月均Tokens调用量超500万亿 超过谷歌2025年5月的480万亿[23][29] 技术实力表现 - 字节跳动Seedream 4.0图像模型文字转图像能力全球第一 图像分析能力全球第二[30][33] - 豆包App月活跃用户1.41亿 居国内AI原生App第二[34] - 火山引擎AI基础设施吞吐效率更高 每秒Token输出量达其他厂商2.6倍[35] 国际对标与战略目标 - 谷歌Gemini模型2025年7月月处理Tokens达980万亿 带动谷歌云营收增速提升10个百分点[23] - 火山引擎目标在MaaS市场保持份额第一 2030年前成为千亿级云和AI公司[35] - Token模式成为AI时代改变云计算竞争格局的新武器[36]
到2030年全球半导体营收将突破1万亿美元,受“Agentic AI”与“Physical AI”兴起驱动
Counterpoint Research· 2025-08-28 10:02
全球半导体营收预测 - 全球半导体营收预计从2024年到2030年几近翻番 规模超过1万亿美元[4][5] - 主要催化剂是先进AI服务器基础设施建设 受AI应用持续且可能加速的需求驱动[5] - 短中长期大部分需求来自超大规模云服务商 推动多模态GenAI成熟并为物理AI奠定基础[5] AI发展三阶段演进 - 第一阶段基础设施铺设伴随应用从基础文本转向结合文本 图像 音频和视频的多模态GenAI 提升Token消耗[7] - 第二阶段支持Agentic AI的Token生成量呈指数级增长 从复杂对话式AI到全链路多媒体内容生产[7] - 第三阶段支撑物理AI到来 推动人形机器人 工业机器人与车辆等自主机器崛起[7] AI价值分布与演进 - 当前AI价值更多集中在半导体侧 超大规模云厂商 二线云玩家与企业加速建设AI基建[7] - 2024年AI市场以硬件为主 约80%直接营收来自基础设施与端侧的半导体[10] - 长期价值将由AI价值链中的应用与API进一步释放 格局正转向由AI Token经济驱动的新阶段[9][10] 半导体行业驱动因素 - 芯片是AI经济支柱 驱动从云平台 模型与框架到应用的一切 包括GPU 加速器 存储器与光互连[7] - 下一波AI浪潮最大价值在于运营成本显著降低 包括劳动力生产率提升和广泛自动化带来的效率收益[10] - Token正成为新的AI货币 对云与端两端的算力 内存与网络提出巨大需求[7]