Workflow
钛媒体APP
icon
搜索文档
60万亿存款年内到期,A股接得住吗
钛媒体APP· 2026-01-15 00:28
文章核心观点 - 2026年中国将迎来大规模居民定期存款到期潮,预计规模在30万亿至60万亿元之间,但经济环境已变,居民难以通过续存获得满意回报,资金面临重新配置 [1] - 巨额到期存款的流向是影响未来金融市场走向的关键变量,主要可能方向包括银行理财、保险产品等,直接流入股市的比例预计有限,但绝对规模仍可观 [2][8][13] 到期存款规模测算 - 截至2025年11月末,中国金融机构人民币存款余额约327万亿元,其中居民定期存款121万亿元,企业定期存款58万亿元 [3] - 居民部门定期存款增量在2025年为11.03万亿元,创2022年以来新低,较2023年高点减少4万亿元,显示兴趣下降 [3] - 多家券商对2026年到期规模进行预估,中金公司预计总到期约75万亿元,其中中长期存款(2年及以上)约32万亿元 [5] - 华泰证券预计2年及以上到期约50万亿元,国信证券预计全行业到期59-71万亿元(其中六大行中长期约27-32万亿元),中信证券预计中长期到期约45万亿元 [5] - 2026年到期高峰主要源于2023年集中存入的三年期定存,中信证券测算其中38万亿元将在2026年集中释放 [6] - 到期具有季节性,中金预计全年61%的居民长期定存在一季度到期,高于此前三年同期的51%-58% [6] - 2020年后居民与企业定期存款年新增量均在10万亿元以上,22-23年年均新增达20万亿量级,为2026年到期规模大奠定背景 [7] 到期资金潜在流向:银行理财 - 多数观点认为存款到期不等于“存款搬家”,居民风险偏好稳定,银行存款留存率多年保持在90%以上,2025年仍在96%高位 [8] - 存款下降更多是存款与理财之间的结构性转换,整体储蓄(含理财)仍在增加,例如2023年以来从13万亿升至18万亿 [9] - 银行理财市场持续增长,截至2025年三季度余额达32.13万亿元,保持每季度1.5-2万亿元的稳健增长 [9] - 理财产品收益略高于定存,截至2025年12月末近1年平均年化收益率为2.28% [9] - 开源证券测算,2026年理财规模在保守情形下增长3.83万亿元(同比增11.46%),激进情形下增长5.06万亿元 [9] - 中金证券预计2026年固收+理财、股混类理财同比增速有望达到20% [9] 到期资金潜在流向:保险产品 - 保险产品成为定存重要替代品,主流寿险产品保底收益率1.75%加演示利率3.5%-3.75%,虽流动性差但收益高于存款且安全性高 [10] - 银行存款利率已降至历史低位,大行1年/2年/3年/5年期挂牌利率分别为0.95%/1.05%/1.25%/1.30%,中小银行利率优势明显下滑甚至取消5年期产品 [10] - 有分析认为,受债市波动影响,银行理财吸引力边际递减,保险产品凭借稳定预期收益与防御属性,有望成为本轮存款搬家中最大的资金分流点 [10] - 居民在“长钱”无处可去的当下,更愿牺牲灵活性来锁定长期收益 [11] 到期资金潜在流向:股市 - 市场关注存款入市可能性,2025年A股新开户2744万户,同比增长10%,为2022年以来最高,其中12月新开户260万户环比增9% [12] - 2025年下半年以来,以散户为主的小额订单累计净流入规模约4万亿元 [12] - 作为定存替代品的理财、“固收+”、分红险等产品具有一定“含权量”,能为股市带来增量资金 [13] - 中金公司测算,2026年理财机构有望将狭义权益资产(股票+股混基金)仓位提升0.8个百分点至2.3%,2027年有望至3.5%,合计为资本市场带来潜在近1万亿元增量资金 [13] - 但中金也指出,160万亿元居民存款每年用于金融资产配置的比例仅6%左右,且以低风险理财和保险为主,按新增券商保证金估算,入市资金占存款不到1% [13] - 申万宏源认为市场低估了超额储蓄规模,若考虑非存款类储蓄(如理财),测算超额储蓄规模在9.4万亿元以上,大于过往,潜在入市规模或更大 [14] - 申万宏源还认为市场低估了资金入市速度,测算居民证券交易保证金或新增8000亿元以上,高于市场基于“非银存款”推测的4200亿元左右 [14] - 此轮储蓄主要源于购房支出减少,资金集中于中等收入群体,该群体投资经验少,在信心回暖时易受“羊群效应”影响入市 [14] - 国信证券指出,此轮存款增量东部沿海区域贡献更大,意味着高收入群体新增存款规模较大,其投资意愿更高,资产配置弹性更大 [14]
H200批准对华出口,2026年GPU还扛得住吗?
钛媒体APP· 2026-01-14 19:13
美国对华AI芯片出口政策调整 - 美国政府批准英伟达向中国出口其人工智能芯片H200,预计将重启对华出货[1] - 对华销售将由美国商务部负责审批和安全审查,美方将从相关交易中收取约25%的费用[1] - 同样的安排也将适用于其他人工智能芯片公司,如AMD和英特尔[1] - 英伟达CEO黄仁勋表示,中国是一个非常大的人工智能市场,再过两到三年,中国人工智能市场规模可能会达到500亿美元[1] 国产GPU行业迎来上市热潮与技术突破 - 2025年国产GPU公司密集上市:摩尔线程、沐曦股份成功登陆科创板,壁仞科技、天数智芯加速冲刺港股[3] - 摩尔线程上市首日股价大幅上扬468.8%,总市值迅速攀升至3055亿元[3] - 沐曦股份上市首日收盘涨幅高达692.95%[3] - 2025年全球GPU市场规模预计突破3500亿美元,中国占比接近40%[4] - 国产GPU企业取得技术突破:摩尔线程基于MUSA架构推出“花港”架构,算力密度提升50%,效能提升10倍[4];壁仞科技推出性能对标英伟达A100/H100的BR100芯片[4];天数智芯成为国内首家实现7nm GPGPU量产的企业[4] - 商业化层面,国产GPU已切入政务云、智算中心等核心场景[4] 国产GPU面临的生态与系统级挑战 - 国产GPU的突破仍停留在“单点技术达标”层面,尚未形成“全栈生态闭环”的核心竞争力[5] - 与英伟达相比,在高速互连协议、大规模集群调度等关键环节存在明显短板[5] - 英伟达的CUDA生态覆盖了90%以上的AI框架,形成了短期难以撼动的壁垒[5] - 国产GPU厂商各自为战的指令集与软件栈,导致开发者适配成本高昂[5] ASIC芯片对GPU市场的冲击与替代趋势 - 云服务厂商越来越偏爱自研ASIC芯片[8] - 集邦咨询预测,2026年云服务厂商对自研ASIC的需求增速将大幅领先GPU,其中ASIC增长率预计达44.6%,远超GPU的16.1%[9] - 谷歌推出第7代TPU芯片Ironwood,训练和推理性能比第六代TPU提升4倍[9] - 谷歌计划在2026年将TPU芯片产能提升至430万颗,其中新一代V8系列合计占比达65%[9] - 亚马逊推出首款3nm AI芯片Trainium 3,计算能力较Trainium 2大幅提升[10] - Meta与Broadcom共同开发下一代MTIA v2,微软下一代Maia v2的设计也已定案[10] - 国内云服务企业也推出自研ASIC芯片,如阿里巴巴的含光800、百度的昆仑芯、腾讯的紫霄芯片等[10] - 野村证券报告称,目前英伟达GPU在AI服务器市场中占据超过80%的份额,而ASIC仅占约8%-11%[11] - 野村证券预测,到2025年,仅谷歌和亚马逊两家的ASIC出货量就可能达到英伟达GPU出货量的40%至60%[11] - 高盛预测ASIC服务器将在2025至2026年间占据全球AI服务器市场38%至40%的份额[12] 存算一体技术对GPU构成的新挑战 - 存算一体技术旨在解决传统计算架构中数据搬运导致的“冯·诺依曼瓶颈”[13] - 在处理大模型推理时,数据搬运产生的能耗可能占到近50%[15] - 存算一体技术能将数据搬运产生的损耗降低60%以上,在低功耗场景下优势明显[15] - 该技术产业化逻辑是从GPU不擅长的场景突破,与GPU形成“互补竞争”[15] - 自2017年起,英伟达、微软、三星等大厂提出了存算一体原型,同年国内存算一体芯片企业开始涌现[15] - 国内初创企业如知存科技、亿铸科技、九天睿芯等押注不同的存算一体技术路线,分别专注于大算力场景和边缘小算力场景[16] GPU的固有优势与巨头的反击策略 - GPU在大模型训练、复杂科学计算等需要多任务并行处理的场景里,通用性和灵活性是ASIC、存算一体短期内比不了的[18] - 2025年12月24日,英伟达以200亿美元收购推理芯片独角兽Groq的核心技术与团队[19] - Groq的LPU芯片以5-10倍于GPU的速度优势,以及1/10的成本优势,切中了英伟达在推理赛道的核心短板[19] - 此次收购延续了英伟达通过并购补全生态、巩固优势的一贯策略[20] - 未来在大模型训练等通用算力场景,GPU仍将保持核心优势;而在推理、边缘计算等细分领域,其与ASIC、存算一体芯片的“互补共存”将成为主流[20]
张文宏医生拒绝把AI接入病历系统:他真正担心的是什么?
钛媒体APP· 2026-01-14 16:08
文章核心观点 - 资深医生张文宏认为,AI在医疗等高风险领域的应用,其带来的最大变化并非效率提升,而是可能改写专业人员的训练路径和能力形成方式,因此必须审慎划定边界,确保人类监督和责任可追溯[1][3] - 行业围绕AI部署存在三种主要立场:守门(高风险入口前置治理)、治理(建立可审计的风险管理闭环)和能力(在发展中建立规则),其分歧本质在于系统默认值是“AI正确”还是“AI仅为候选”[5][6] - AI能否被负责任地接受,关键在于将风险管控写入系统默认值,通过明确角色、建立错误发现与回放机制、落实责任闭环及监测人的能力变化,将AI用作增强而非替代人类判断力的训练装置[7][9] AI在高风险行业的应用边界与原则 - 在医疗领域,AI可作为个人辅助工具,但不允许直接接入病历系统等核心责任链条,以确保最终判断和责任归于人类专业经验[1] - 划定边界需明确哪些环节必须由人决策,AI仅能作为候选、提示或预审工具,防止AI参与责任分配导致责任稀释[4] - 社会接受AI的前提是防止过度使用,将风险管控在可控范围内,这需要工程化的解决方案而非道德口号[4] AI对专业训练路径与能力形成的潜在影响 - 核心担忧在于AI过早进入一线可能改写医生的成长方式,新人若将AI作为默认答案生成器,可能导致其出现“能做但说不清原因、对答案但不理解边界”的能力退化[3] - 工具越强大,人越容易跳过艰难但必要的内化过程,这可能导致一代人能力形成方式的根本性改变[3] - 一项关于知识工作者的研究显示,对AI越有信心,个体越可能减少批判性思考;而对自身能力更自信者,则更倾向于进行批判性评估与整合[9] 构建可靠AI治理体系的关键要素 - **纠错机制**:高风险行业最危险的是“看起来像对”的错误,系统必须建立复核、抽检、回放与反例库,以持续发现和定位错误,而非依赖资深个人兜底[4] - **责任闭环**:必须明确谁启用、谁审批、谁签字、谁对输出负责,确保责任可追溯、可问责,防止责任被稀释归因于“系统建议”[4][7] - **治理框架**:可参考如美国NIST的AI风险管理框架(AIRMF1.0),将可信AI拆分为治理、映射、度量、管理等可落地环节,实现可审计的风险控制闭环[5] 将AI转化为训练装置的可执行路径 - 可采用“AI作为第一读者,而非最终裁判”的方法,例如让AI先看病例,但最终由人做判断[1][9] - 具体路径包括:先自行完成推理链,再让AI挑错;让AI生成相互冲突的路径由人裁决并解释;用AI进行交叉质询,追问依据与边界条件,使人始终处于“解释与审查”的位置[9] - 行业应监测如复核率、纠错率、独立完成率、异常处置时长等反映人的能力变化的指标,并将其视为与模型指标同等重要的治理指标[7] 行业部署AI的三种主要立场与分歧 - **守门立场**:以世界卫生组织在医疗AI治理中的原则为例,强调高风险场景必须将安全与治理前置,先守住入口再谈规模化[5] - **治理立场**:侧重于将风险转化为流程和指标,建立可落地的风险管理结构,确保AI应用进入可审计的闭环[5] - **能力立场**:如企业界代表所表达,承认AI的竞争性与不可逆,主张尽快应用但同时必须建立规则,例如需要设立AI“裁判/监管者”以避免失控[5] - 三种立场的根本分歧在于系统默认值的设定:是默认AI正确,还是默认AI仅为候选[6]
库克退休在即,苹果迈入“诺基亚时刻”前夜
钛媒体APP· 2026-01-14 16:08
苹果公司现状与市场反应 - iPhone 4近期突然爆火,国内回收价格上涨60倍,2025年谷歌上“购买iPhone 4”相关搜索量增长979% [1][2] - 这被视为消费者对乔布斯时代情怀的怀念,与对库克时代创新乏力的拷打 [3][4] 库克时代的经营策略与成果 - 库克2011年接任CEO,其专长在供应链管理,将库存期从30天缩短至6天,追求渐进式创新与成本控制 [6] - 在其治下,公司成为全球首个市值破万亿美元的公司,营收从2011财年的1082亿美元增长至2025财年的4162亿美元 [7] - 公司策略强调供应链可靠与产品品控,宁肯牺牲外观与创新速度也要保证质量,iOS生态与设计遗产为产品溢价护航多年 [6][7][8] 创新能力的削弱与设计边缘化 - 2016年,传奇设计师乔纳森·艾维离职,标志着公司内部工业设计话语权被削弱 [7] - 库克时代创新被边缘化且谨慎,例如快充技术落后于安卓阵营,折叠屏手机规划迟至2026年 [7] - 公司基本逻辑是保证产品质量过关,但消费者更在意能否做出“很酷”的产品 [7][8] AI战略的滞后与内部冲突 - 公司早期在AI布局上有先发优势,iPhone 4S引入了Siri,但后续更新缓慢,功能落后于竞争对手 [11] - 2018年引入谷歌AI主管约翰·詹南德雷亚,但其倡导的开放研究、增加投入的路线与公司封闭、保密的文化及重视用户隐私的核心理念相悖 [11][12] - 技术路线上,公司强调数据不离开设备端或私有云,限制了端侧AI的能力发展,且AI团队长期缺乏足够的资金与算力支持 [12] - 2023年ChatGPT引发AI军备竞赛时,公司已远远落后 [14] AI项目推进受阻与团队动荡 - 2024年发布的Apple Intelligence多次延期,原随iOS 18发布的功能延期至iOS 18.1,部分Siri新功能推迟到2026年 [17] - 项目管理层洗牌,詹南德雷亚被边缘化,Vision Pro操盘手Mike Rockwell接手Siri并向软件负责人汇报,AI基础研究团队被边缘化 [17] - 2025年AI团队出现离职潮,包括基础模型负责人、Siri与搜索负责人等多名高管离职,詹南德雷亚也宣布将于2026年春季退休 [18] - 分析师批评公司AI战略是一场灾难,公司愿意花费7000亿美元回购股份,却大幅削减购买英伟达GPU的预算 [18] 与谷歌的合作及市场影响 - 公司已选定谷歌作为AI合作伙伴,下一代基础模型将基于Google的Gemini模型和云技术构建 [19] - 合作引发对谷歌权力集中的担忧,2025年1月13日,谷歌股价上涨0.9%,苹果股价下跌0.5%,双方市值差距扩大至2500亿美元 [20][22] - 此次合作被视作公司已无法独自守住其闭环生态帝国的标志 [20] 领导层更迭与未来展望 - 公司正经历十多年来最大规模人事变动,COO、AI团队高管、环保政策副总裁、总法律顾问等多位高管宣布离职或已离任 [22][23] - 多方消息显示库克最早可能于明年卸任,硬件工程高级副总裁约翰·特努斯是头号热门继任人选 [4][23] - 特努斯自2001年加入,参与了主要硬件工程设计,性格温和沉稳,更擅长维护现有产品,其风格与公司当前成本控制、供应链管理、渐进式创新的思路契合 [23][24] - 选择特努斯及与谷歌的合作,基本为苹果定下了继续保守的战略基调 [24]
关于2026年科技行业的12个关键问答:AI、自动驾驶、机器人、世界模型、美股......
钛媒体APP· 2026-01-14 16:08
AI行业趋势与范式转变 - 2025年行业认知从“是否使用AI”转向“如何使用及投入多少预算”,企业关注点从追求最贵最好的模型转向更实际的小语言模型和本地化微调,以实现垂直行业部署 [2] - 2025年“DeepSeek Moment”标志着大模型开发不再被五大科技巨头垄断,新兴实验室可能实现从0到1的突破,行业呈现去中心化趋势 [3][4] - 2026年AI竞争焦点将从“单纯堆数据”转向“系统级Scaling”,涉及数据策展、系统优化与产品反馈闭环,谷歌因其系统中心型优势而表现突出 [3][6] Scaling Law与模型发展路径 - Scaling Law依然强劲,增长瓶颈不在于数据耗尽,而在于数据精心挑选、清洗与配比,算力集群的细节优化(如连接、容错、带宽)仍有10倍提升空间 [5] - 2026年模型竞争路径分化,纯模型公司面临更大成本压力,行业将对过去“无脑堆数据”的方式进行修正 [6] - 模型“保鲜期”短暂,领先优势可能仅维持6个月,这引发了对大公司是应自研模型还是优先发展应用的战略辩论 [7][9] 科技巨头的AI战略分歧 - Meta面临战略困境,其Llama 4模型表现不及预期,内部在死磕底层模型技术以确保长期独立性,与优先发展应用产品之间存在路线之争 [6][7] - 一种观点认为,像Meta这样体量的公司必须掌控AI底层技术(“电力”),以防像过去被苹果隐私政策制约那样,在AI时代被卡脖子 [7][8][9] - 另一种观点认为,大厂应发挥应用层优势,可通过购买API或等待市场成熟后再布局模型能力,错过一年不会构成生存威胁 [7][9] AI应用落地与投资机会 - 2026年AI应用爆发将主要集中于B端(企业级),特别是在医疗、金融、保险等垂直领域,AI Agent将带来营收级增长,企业采纳速度远超传统SaaS时代 [10] - 摩根大通一家银行的AI预算,超过全球排名前十的其余九家银行的总和,推动其与初创公司的POC验证周期缩短至几周,商业订单签署仅需数月 [10] - 当前明确的AI生产力应用是AI原生编程(Vibe Coding)和AI浏览器,但ChatGPT的“足够好”挤压了利基市场空间,未来杀手级应用需跳出对话框形态,深度融入工作流或硬件 [11] 自动驾驶技术路线与竞争格局 - 旧金山停电事件成为技术分水岭,特斯拉的端到端方案能基于学习人类博弈行为通过无信号路口,而Waymo基于规则的系统则陷入瘫痪,凸显了处理极端情况的能力差异 [12][13] - 特斯拉的算法领先源于其问题驱动的团队文化、放弃激光雷达“置之死地而后生”的勇气,以及软硬件协同设计能力,这些因素共同构成了竞争壁垒 [14][15][21] - Waymo的每英里运营成本为1.43美元,特斯拉约为0.81美元,Waymo成本虽可能下降,但其基于规则的系统及车队维护(如机械激光雷达折旧、人工充电)使其难以达到特斯拉的成本水平,且不具备规模经济效应 [24][25][26] 芯片与算力格局演变 - 投资逻辑正从“纯GPU信仰”转向关注“ASIC效率”及算力集群的瓶颈环节,如带宽,光通讯公司(如博通)的边际变化显著 [3][30][31] - 谷歌凭借TPU的垂直整合优势,在证明其模型能力与更低推理成本后,估值从14倍快速提升至近30倍,与英伟达GPU阵营形成分化 [29][30] - 特斯拉专注于推理芯片的软硬件协同设计,其第四代芯片为规则系统设计,第五代则考虑了端到端和大语言模型需求,而训练芯片项目Dojo因复杂度高及存在英伟达替代选项而失败 [19][20][21][22][23] 美股市场动态与资本逻辑 - 2025年8月17日后市场因子发生剧烈切换,资金从高估值、高质量AI龙头股流向高波动性的周期性行业资产,反映了资金流动逻辑的微妙变化 [28] - AI行业泡沫是否破裂不取决于烧钱规模,而取决于“模型智力每三个月翻倍”的信仰是否持续,只要信仰存在且信贷周期支持,资金流就不会中断 [3][32][33] - 2026年OpenAI的IPO将是关键市场试金石,其能否证明具备系统级入口地位和强商业闭环,将极大影响整个AI板块的估值 [3][33] 宏观风险与投资关注点 - 主要宏观黑天鹅风险可能来自金融条件的突然紧缩,例如日本央行激进加息抽走全球日元流动性,或美国激进财政政策引发债务担忧 [34] - 特朗普提出的约900亿美元返税政策可能刺激消费并重新推高通胀,导致复杂多变的宏观周期,需密切关注PMI和就业市场的边际变化 [34] - 投资应遵循“不要对抗美联储,也不要对抗技术进步的信仰”的原则,在智能密度提升的逻辑中寻找非共识红利 [35]
速度与成本的双重考验,AI算力“大考”已至丨ToB产业观察
钛媒体APP· 2026-01-14 14:10
企业级AI部署的挑战与“规模悖论” - 生成式AI从“可选创新”变为企业“生存必需”,但部署面临挑战,37%已部署企业中超60%反馈实时交互应用响应延迟超预期,高昂算力成本导致“部署即亏损”困境[2] - 智能体产业化核心三要素是能力、速度和成本,其中token交互速度决定商业价值,token成本决定盈利能力,根基在于算力基础设施革新[2] - 企业级AI应用场景升级导致算力需求爆炸式增长与成本失控,形成“不规模化则无价值,一规模化则亏成本”的行业“规模悖论”[2] AI算力需求与市场增长 - 企业级AI系统对算力需求年均增长达200%,远超硬件技术迭代速度[3] - 2024年全球AI服务器市场规模达1251亿美元,预计2025年增至1587亿美元,2028年有望突破2227亿美元,其中生成式AI服务器占比将从2025年29.6%提升至2028年37.7%[3] - 智能体复杂任务处理对算力提出高要求,如金融量化交易需毫秒级决策,制造业质检需实时处理高清图像流,零售智能导购需同步响应多用户[3] 延迟问题对商业的影响 - 以电商虚拟试衣间为例,用户上传图像后AI推理延迟常达2-3秒,导致转化率较预期下降40%[4] - 智能体时代交互是智能体间高频博弈与协作,任何延迟都可能导致决策失效或机会错失,token吞吐速度是AI应用的“隐形计时器”[5] - 金融场景如股票交易、风险监测对延时要求需小于10ms,而目前绝大多数AI Agent服务延时在15ms以上,响应过长可能造成资产损失[5] Token消耗量激增与成本压力 - 截至2025年12月,字节跳动豆包大模型日均token使用量突破50万亿,较2024年同期增长超10倍,较2024年5月推出时增长达417倍[6] - 2025年10月谷歌各平台每月处理token用量达1300万亿(日均43.3万亿),一年前月均仅为9.7万亿[6] - 全球88%企业已布局AI应用,但仅39%实现实质性财务回报,成本高昂是核心原因,企业AI辅助编程每月token消耗量相比1年前平均增长约50倍,达1000万到5亿token量级[6] 高昂的综合成本构成 - 2026年AI数据中心单机柜功率密度将升至240kW,2028年达1MW,能源消耗随算力密度同步攀升[7] - 某制造企业AI质检项目初始硬件投入800万元,加上每年200万元运维与能源成本,投资回报周期长达5年[7] - 以输出百万token为例,Claude、Grok等海外模型价格普遍10-15美元,国内大模型多在10元以上,OpenAI GPT-5输入token成本为每百万1.25美元,输出为每百万10.00美元[7] - AI推理致企业带宽成本激增3-5倍,部分制造企业AI算力集群年能耗成本占IT总支出25%以上[7] 算力架构失衡与资源错配 - 企业级AI算力成本高企背后是底层算力架构与推理需求严重错配,导致“高配低效”、“资源闲置”等结构性问题[8] - 80%以上token成本来自算力支出,核心矛盾在于推理负载与训练负载本质差异被忽视,沿用传统训练架构承载推理任务导致效率瓶颈[8] - 训练阶段算力利用率(MFU)可达50%以上,而推理阶段由于token自回归解码特性,实际MFU往往仅为5%-10%[8][9] - 某头部制造企业AI质检系统采用传统算力架构,其GPU集群平均MFU仅为7%,大量算力资源在等待数据传输中被浪费[9] “存储墙”与网络通信瓶颈 - 大模型推理中,随着上下文长度增加,KV Cache呈指数级增长,占用大量显存,传统“存算分离”模式导致高数据迁移功耗与延迟[10] - 配备HBM的GPU单价较普通GPU高出2-3倍,KV Cache占用显存空间可达模型本身30%-50%,超长上下文推理场景中比例甚至超70%[10] - 跨节点通信成为性能瓶颈,传统网络延迟高,通信开销可能占据总推理时间30%以上,推高总拥有成本(TCO)[11] - 在千卡级以上大规模算力集群中,网络设备采购成本占整体硬件支出20%-30%[11] - 网络通信延迟是导致国内大模型token生成速度普遍高于30毫秒的核心原因之一,而全球主要大模型API服务商速度基本维持在10-20毫秒[11] 软硬协同与行业差异化需求 - 多数企业AI部署采用“通用硬件+通用软件”组合,未针对特定模型计算特征与行业场景深度优化,导致算力资源无法充分释放[12] - 不同行业AI模型计算特征差异显著:金融风控模型对CPU算力需求高,制造业质检模型对GPU并行计算能力要求高,零售推荐模型需异构算力协同调度[12] - 软件框架与硬件架构适配不足影响算力效率,部分开源框架未针对本土AI芯片优化,导致芯片核心性能无法充分发挥[12] 算力破局方向与架构革新 - 破局关键在于通过算力架构根本性革新,实现“算力效率数量级提升”与“成本规模化降低”,而非盲目增加算力投入[13] - Gartner预测到2028年,超40%领先企业将采用融合CPU、GPU、AI ASIC、神经形态计算等多种范式的混合计算架构[13] - 需推动算力架构从“集中式”向“分布式协同”转型,通过存算一体、算力网络、边缘计算等技术破解“存储墙”、“网络墙”瓶颈[13] - 天翼云“端网协同负载均衡方案”通过自研集合通信库CTCCL,将AllReduce峰值带宽提升40%,大模型训练效率提升7%[14] - 目前国内一流水平已将每百万token成本降低到1元,但未来token成本需在现有基础上实现数量级跨越,成为“生存入场券”[14] 架构重构与未来发展趋势 - 架构重构核心逻辑是“按需拆分、精准适配”,将推理流程细化解耦,支持PD分离、AF分离、KV并行、细粒度专家拆分等策略,实现“卡时成本”最低、“卡时产出”最高[15] - 在架构重构基础上进行软硬协同优化,软件层面精准适配以充分释放硬件潜力[15] - 未来企业级AI算力成本优化将朝“专用化、极致化、协同化”方向发展:针对不同行业场景开发定制化解决方案;通过多重手段持续提升算力效率;构建完善产业生态实现深度协同[16]
日活破亿的豆包,正悄然成为字节的“流量副中心”
钛媒体APP· 2026-01-14 12:38
豆包APP的战略升级与功能整合 - 豆包在聊天主界面新增“来点音乐”和“豆包爱学”标签,直接内嵌字节系服务,用户无需跳转APP即可使用汽水音乐播放、查看歌词歌单,或通过文字、语音、拍照获得豆包爱学的题目解答 [1] - 豆包爱学前身为字节大力教育旗下的“河马爱学”,于2024年9月更名,此次在豆包开辟专门入口旨在为其注入更多流量和用户 [1] 豆包的角色转变:从流量受益者到分发者 - 豆包在过去一年多的崛起中,主要依赖抖音等字节系产品的流量红利,并借此反超DeepSeek,成为国内用户最多的AI APP [2] - 豆包已成为字节旗下第三款日活过亿的APP,其绝对增速超过抖音,正从流量受益者转变为流量分发者,展现出成为字节第二大流量引擎的架势 [2] - 早在2023年10月,豆包已开始为字节其他业务导流,例如接入抖音商城,用户询问购物问题后可点击链接跳转购买 [2] 构建AI时代超级入口的战略路径 - 豆包的核心战略目标是成为AI时代的超级入口,通过接入字节系业务来预演和构建Agent生态,以快速拓宽能力象限,满足用户多场景需求 [4] - 由于自身功能开发速度慢、成本高,豆包选择将其他产品变为“工具包”,方式包括利用GUI模拟点击技术开发“豆包手机助手”,但此举曾遭其他巨头阻击 [5] - 豆包快速搭建功能矩阵更依赖字节自家产品,其接入服务的方式正在深化:从早期仅提供抖音电商跳转链接,到如今将汽水音乐、豆包爱学直接内化为Agent,提供无需离开对话框的流畅体验,并为此提供了输入框上方的黄金流量位 [6] - 豆包正在摸索的Agent生态,被类比为AI时代的小程序生态,其发展路径与当年微信通过“九宫格”为京东、美团等引流以打造小程序生态标杆案例相似 [6][7] 首批受益业务:汽水音乐与豆包爱学的现状与挑战 - 汽水音乐是豆包选中的首批“幸运儿”之一,截至2025年9月,其月活跃用户已超1.2亿,在在线音乐APP中排名第四,同比增速高达91% [7] - 汽水音乐面临增长瓶颈,主要挑战在于版权曲库相对腾讯、网易较为薄弱,难以吸引核心音乐用户 [7] - 豆包爱学主打拍题答疑,面临小猿AI等教育APP及夸克、千问等AI APP的跨界竞争,2025年上半年其在苹果App Store免费总榜排名徘徊在200名开外,在教育分榜多在5-10名徘徊,未展现统治力 [8][9] - 与抖音、豆包相比,汽水音乐和豆包爱学在字节内部的战略地位相对较低,因此获得豆包的AI流量注入显得尤为珍贵 [10] 豆包作为“流量副中心”的潜力与影响 - 与日活突破6亿后增速放缓的抖音相比,豆包的流量池增长潜力更大,参考ChatGPT在2024年12月日活高达3.92亿,豆包即便达到其一半也还有一倍提升空间 [13] - 豆包聚拢的AI流量属性比抖音的内容流量更丰富,涵盖娱乐、信息、学习、办公、编程、购物等多方面需求,有利于将流量精准导入不同业务场景 [13] - 豆包的导流路径效率更高,能将第三方服务“嵌入”聊天中,用户无需跳转页面,而抖音的导流往往需要多次跳转 [13] - 豆包的流量分发模式更直接,它省去了用户选择过程,让用户直达目标服务,这使得流量传输效率更极致,但也让第三方服务的“插件化”特征更明显 [14] 未来生态演进与潜在格局变化 - 随着超级AI APP向与手机底层系统完全打通的超级Agent演进,可能成为吸走几乎所有流量的“黑洞”,届时如汽水音乐等第三方服务存在被彻底“插件化”的风险,可能拖累其独立商业价值 [11] - 豆包成为字节新流量枢纽,预示着下一代超级入口正从分散赋能转向聚焦,字节的流量格局和战略布局可能因此迎来新一轮博弈与重整 [15] - 在“AI流量该往何处去”的问题上,豆包的竞争对手如DeepSeek、元宝、千问等尚未真正提上议程,动作比豆包慢得多 [10]
德邦安能双双退市,快运再无独立巨头
钛媒体APP· 2026-01-14 11:38
行业格局与时代变迁 - 中国快运行业标志性企业德邦股份与安能物流相继启动私有化退市进程,一个直营模式标杆,一个加盟模式霸主,在不到五年内同时选择退出二级市场 [1] - 两家公司的退市标志着依靠创始人精神、草莽式扩张、独立融资驱动的快运创业时代彻底谢幕,行业进入巨头收编、资本重组和产业深耕的新纪元 [1] 德邦股份发展历程与战略转折 - 德邦在2010年已是中国快运领域标杆,凭借标准化与高质量服务建立“高端快运”护城河,并打破行业“25亿营收魔咒”,其毛利率曾达到23.3% [2] - 2013年,德邦为追求更快增长决定从零担转型快递业务,到2016年快递收入超40亿元,但导致公司整体毛利率从巅峰时期的17.77%滑落至13.41% [4] - 德邦后期将战略重心转向“大件快递”,但快递业务毛利长期低于7%,整体毛利率持续下滑逼近10%,最终增长乏力、利润微薄,于2022年初被京东物流并购 [6][7] 安能物流发展历程与战略转折 - 安能物流2010年成立时营收仅2亿元,后通过首创“中心直营+网点加盟”的轻资产模式快速扩张,三年实现货量和收入10倍增长,并于2016年底零担货量超越德邦 [2][3] - 在零担货量超越德邦后,安能跟随布局快递业务,但由于底子薄、现金流不足,陷入巨额亏损,仅2018年一年整体亏损就高达16.1亿元,前两年每年亏损也不低于10亿元,几年累计烧掉近40亿元 [5] - 2019年,安能创始人秦兴华决断砍掉快递业务,回归快运主业,使公司业绩触底回升,但未能回到最鼎盛时期 [6] 德邦退市后的战略定位与展望 - 京东物流对德邦股份采取渐进式回购,持股比例从71.92%提升至79%,意图将其完全融合 [10] - 德邦退市后将从独立上市公司转变为京东生态内的“功能器官”,专注于补齐京东物流的干线网络和重货能力,成为其“仓配+干线”版图的基石 [11] - 业内观点认为,京东物流将德邦私有化可能是为了未来以“新京东物流”身份回归A股,以获得更高估值和数百亿级融资空间 [11] 安能物流退市后的战略定位与展望 - 安能物流被大钲资本领衔的财团私有化,标志着其进入“资本掌舵”时代,将进行深度产业改造 [12] - 退市后安能将从“规模为王”转向“效率为王”,可能关停低效亏损的分拨中心和线路,将资源聚焦于华东、华南等高利润区域 [12] - 大钲资本计划推动安能从单纯快运公司向产业互联网平台转型,通过数字化手段深入制造业供应链,尝试在快运赛道复制“瑞幸奇迹” [13] 核心战略失误与行业启示 - 德邦与安能共同的战略失误是对“快递”业务的盲目迷恋,试图冲破零担快运天花板却在快递红海中遭遇重创 [3][7] - 德邦在战略调整上犹豫不决,用盈利的快运业务补贴亏损的快递业务,导致快运主业优势被顺丰快运、壹米滴答、中通快运等对手蚕食 [6] - 集体性的战略迷失耗尽了德邦与安能作为独立巨头的元气,为其后来依附于巨头或资本的命运埋下伏笔 [7]
入住率跌至45.8%,客房不足8000间,绿地酒店怎么了?
钛媒体APP· 2026-01-14 11:36
绿地酒店2025年经营表现 - 2025年酒店客房数量为7,176间,入住率为45.81%,平均每间客房每天收入为335元,全年经营收入为8.77亿元 [1] - 酒店客房数量持续缩水,从2021年的12,554间降至2025年的7,176间 [6] - 入住率持续下滑,从2021年的52.4%降至2025年的45.81% [9] - 平均每间客房每天收入在2025年降至335元,创近五年新低,甚至低于2022年的343元 [12][14] 公司战略与目标执行情况 - 公司2025年初设定的轻资产拓展目标是新签15个全服务酒店项目,但实际签约转化率偏低,与年初目标存在差异 [17][18] - 管理层在2025年三季度总结中指出,酒店板块经营业绩两极分化,低效与亏损酒店数量偏多,未能满足投资回报要求 [1][17] - 公司曾提出打造年收入两百亿以上酒店业务为核心的宏大蓝图,但结合当下发展情况,该蓝图显然没有落地 [15][16] - 公司轻资产已签约项目数量累计近百家,客房数2.2万余间,但暂未大批量转化成开业门店 [18] 业主型酒店集团的行业困境 - 业主型酒店集团普遍面临经营和扩张困局,其母公司(如地产公司)普遍出现资金流动性问题 [20][23] - 许多自持酒店项目最初是作为地产项目配套角色出现,缺乏市场化论证,在失去地产主业输血后缺乏自主造血能力,单独核算后多处于亏损状态 [25][26] - 业主型酒店集团的轻资产输出能力偏弱,品牌力、产品力、运营力的塑造需要时间和投入 [27][28] - 业主型酒店集团的轻资产输出聚焦在全服务和精选服务酒店品牌,但在这些领域面临国际酒店集团和本土专业公司的激烈竞争,生存空间受限 [31] 行业发展趋势与潜在出路 - 专业的酒店品牌管理集团(如华住、锦江、首旅)在规模化、标准化、连锁化浪潮下,依然是行业发展主流,将保持快速扩张 [33] - 业主型酒店集团的潜在出路之一是加码资产管理,利用在综合体、文旅项目建设方面的经验,探索“酒店+”多元发展模式及多元化物业资产管理 [35][36] - 业主型酒店集团可通过结合在地文化谋求个性化,尤其是在度假市场打造主题体验产品,并需在精细化运营上做足功夫 [37] - 业主型酒店集团可独立于母公司但借助其资源进行生态化布局,例如利用母公司的文旅、会展资源打造生态概念 [38]
核聚变大会?我这辈子能用上“人造太阳”发的电吗?
钛媒体APP· 2026-01-14 11:32
2026核聚变能科技与产业大会 - 大会全称为“2026核聚变能科技与产业大会”,主题为“聚核之力,创见未来”,关键词是“科技”和“产业”,标志着可控核聚变正从实验室研究迈向产业化阶段 [1] - 大会举办地选在合肥庐阳区的聚变堆主机关键系统综合研究设施园区,旨在现场展示科研“硬货”,并汇聚科学家、工程师、企业家和投资人共同商讨产业化路径 [2][3] 中国核聚变技术进展与里程碑 - 全超导托卡马克装置“东方超环”(EAST)在2025年实现1亿摄氏度高温下等离子体稳定运行1066秒(即“亿度千秒”),这是未来聚变能发电的重要条件,被视为从科学研究转向工程应用的关键拐点 [3][4] - “中国环流三号”(HL-3)在2025年首次实现原子核温度和电子温度均超过1亿摄氏度的“双亿度”等离子体运行,标志着中国聚变研究进入“燃烧实验”阶段 [8] - 2026年1月,中国团队在EAST装置上实验证实了理论预测的“密度自由区”存在,突破了传统“密度极限”认知,为未来提升聚变反应堆能量输出效率提供了新思路 [12][13][14][15][17] 中国核聚变发展战略与项目布局 - 中国核聚变发展遵循清晰的“三步走”战略:从EAST的科学实验,到紧凑型聚变能实验装置(BEST)的发电演示,再到聚变堆主机关键系统综合研究设施(CRAFT,即“夸父”)的工程支撑 [10] - 下一代“人造太阳”BEST计划于2027年建成,力争在2030年实现全球首次聚变能发电演示,时间上早于国际合作的ITER项目 [10][26][27] - 中国计划在2035年左右建成首个工程实验堆,并力争在2040年至2045年间建成首个商用示范堆,让人类用上聚变能源 [28][29][30] 合肥作为聚变产业中心的优势 - 合肥科学岛和未来大科学城已形成国内独一无二的核聚变大科学装置集群,包括EAST、CRAFT和BEST,吸引了全球科学家和工程师 [17] - 合肥区域的聚变相关专利数量占全国总量的37%,显示出极高的创新密度 [18] - 合肥通过整合“政、产、学、研、金、服、用”资源,形成了强大的创新生态系统,将科研优势转化为产业优势,并正在形成一条完整的聚变产业链 [20][22] 全球核聚变产业化竞赛与产业生态 - 全球已进入“能源登月竞赛”,美国Helion Energy的商用聚变电厂已动工,英国Tokamak Energy计划2034年建成试验工厂,国际ITER计划预计2035年开始氘氚聚变实验 [30] - 根据同花顺数据,A股“可控核聚变”概念上市公司有47家,分布在15个省份,形成了以合肥、上海为核心的“江浙沪徽产业圈”和以成都、西安为核心的“装备产业圈” [23] - 这些企业不仅为国内EAST、BEST等项目供货,也是国际ITER计划的核心供应商 [23] 商业化挑战与前景展望 - 商业化面临三大挑战:1)需要能承受上亿度高温和强烈中子辐照的“超级材料”,以及实现燃料“氚”的自给自足;2)工程集成复杂度极高;3)建站成本预计达千亿级别,且产业链与监管法规尚不成熟 [31] - 尽管挑战巨大,但2025年的密集突破表明行业已告别黑暗摸索,中国力争2040-2045年建成商用堆的时间表,使得当代人极有可能见证并使用聚变能源 [29][30][32][33]