TurboQuant算法
搜索文档
半导体行业双周报(2026、03、13-2026、03、26):存储价格持续上涨压制消费类电子需求-20260327
东莞证券· 2026-03-27 15:55
行业投资评级 * 报告未明确给出对半导体行业的整体投资评级 [5][7][32] 报告核心观点 * 报告核心观点认为,存储芯片正处于超级景气周期,价格持续上涨,但同时对下游消费电子需求产生了显著的压制作用 [4][5][21][32] * 一方面,AI 算力需求与国产替代驱动存储行业高度景气,相关公司业绩受益显著 [21][36] * 另一方面,存储价格上涨已导致智能手机等消费电子产品出货量下滑,并引发产业链涨价,若价格持续高位,消费电子产业链公司业绩将继续承压 [13][21][25][32] * 技术创新方面,谷歌发布的 TurboQuant 算法可能通过大幅降低 AI 模型内存占用,对存储需求产生潜在影响,并已引发部分海外存储企业股价回调 [5][32] 半导体行业行情回顾 * 截至 2026 年 3 月 26 日,申万半导体行业指数近两周累计下跌 5.51%,跑输沪深 300 指数 1.03 个百分点 [5][12] * 2026 年以来,该指数累计上涨 2.17%,跑赢沪深 300 指数 5.46 个百分点 [5][12] 半导体产业新闻与动态 * **存储芯片价格与影响**:存储芯片自 2025 年 9 月以来价格持续上涨,速度和力度超出预期,涨价潮已从手机蔓延至 PC、云服务等全消费电子产业链 [13][21] * **产业链应对**:多家手机厂商(如 OPPO、vivo)已宣布上调部分机型售价,调价幅度在 300 元至 500 元,部分机型综合价格变化近 1000 元 [13] * **公司动态**:小米表示内存涨价是巨大挑战,高端化战略有助于应对,不排除未来涨价可能,并认为此轮涨价将加剧产业格局重塑 [21][22] * **AI 与算力进展**:英伟达 CEO 黄仁勋称 AGI 时代已经到来 [15];字节跳动豆包大模型日均调用量已超过 100 万亿 Tokens [18] * **政策支持**:深圳发布行动计划,支持国产 GPU、NPU、CPU、DPU 等核心芯片加快应用迭代,并加快存储芯片先进封装技术攻关,重点发展企业级 SSD、内存模组等高端存储产品 [19][20] * **新兴市场**:2025 年中国智能眼镜市场出货量达 246.0 万台,同比增长 87.1% [14] * **设备进展**:北方华创发布新一代 12 英寸高端 ICP 刻蚀设备 NMC612H [24] 半导体产业数据更新 * **智能手机出货**:2026 年 2 月国内智能手机出货量为 1625.80 万台,同比下降 12.60%,环比下降 21.44% [25] * **新能源汽车销售**:2026 年 2 月国内新能源汽车销量为 76.5 万辆,同比下降 14.2%,占汽车总销量比重为 42.38% [27] * **半导体销售额**:2026 年 1 月,全球半导体销售额为 825.4 亿美元,同比增长 46.1%,环比增长 3.7%;中国半导体销售额为 228.2 亿美元,同比增长 47.0%,环比增长 5.8% [29] 投资建议与关注标的 * 报告列出了多个细分领域的建议关注标的 [35] * **半导体设备与材料**:包括北方华创、中微公司、华海清科、拓荆科技、长川科技、精智达、鼎龙股份、江丰电子 [35] * **存储芯片**:包括兆易创新、澜起科技、佰维存储、德明利 [35] * **模拟芯片**:包括圣邦股份、思瑞浦 [35] * **先进封装与测试**:包括长电科技、通富微电、伟测科技 [35] * **SoC**:包括乐鑫科技、恒玄科技、瑞芯微 [35] * **算力芯片**:海光信息 [35] * **晶圆代工**:中芯国际 [35] * 报告提供了部分关注标的最新业绩摘要,例如: * 佰维存储预计 2025 年归母净利润同比增长 427.19% 至 520.22%,并签订了 15 亿美元的存储晶圆采购合同 [23][36] * 澜起科技预计 2025 年归母净利润同比增长 52.29% 至 66.46%,受益于 AI 产业趋势 [36] * 中微公司预计 2025 年归母净利润同比增长约 28.74% 至 34.93% [34] * 拓荆科技 2025 年前三季度归母净利润同比增长 105.14% [36]
谷歌发布AI内存压缩算法,公募规模首次突破38万亿 | 财经日日评
吴晓波频道· 2026-03-27 08:30
公积金政策优化 - 今年以来各地优化公积金贷款政策已超50条,包括广州、福建南平、成都、武汉等地[2] - 广州落地全国首个住房公积金跨境人民币结算服务,便利港澳居民提取[2] - 成都将最高贷款额度提升至120万元,并放宽贷款次数限制和首套房认定标准[2] - 武汉放宽异地贷款条件,取消户籍要求,只需在武汉市外连续缴存公积金满6个月[2] - 政策优化方向包括提高贷款额度、放宽提取条件、拓宽使用场景,以激活住房需求[3] 美联储运营亏损 - 美联储2025年录得187亿美元运营亏损,2023年亏损1143亿美元,2024年亏损776亿美元,三年累计运营亏损达2106亿美元[4] - 亏损主要源于向商业银行存放在美联储的准备金支付的利息(目前对约3万亿美元准备金支付3.65%利率)超过了其持有的国债和抵押贷款支持证券的利息收入[4] - 美联储创设了“递延资产”机制来记录历史亏损,该资产已从2024年的2160亿美元增至2025年的2435亿美元[4] - 运营亏损意味着未来几年无法向美国财政部上缴利润,可能成为政客挑战美联储独立性的借口[4] - 长期亏损可能引发政治压力,要求美联储预算开支需经国会批准,从而间接干预货币政策[5] 谷歌AI内存压缩算法 - 谷歌发布超高效AI内存压缩算法TurboQuant,声称可在不损失准确性的前提下,将大型语言模型运行时的缓存内存占用至少减少6倍,性能提升8倍[6] - 该算法无需预处理或特定校准数据,计划在ICLR 2026会议上展示[6] - 技术本质是通过效率提升增加单GPU吞吐量,使相同硬件可支持4至8倍更长的上下文,或显著提升批处理规模[6] - 该技术旨在降低AI大模型在推理过程中的内存占用和使用成本[6] - AI大模型能力提升进入瓶颈期,运营成本攀升,降低使用成本成为科技公司探索方向[7] 本田与索尼电动汽车合资项目终止 - 索尼集团与本田汽车联合声明,终止合资公司旗下Afeela系列电动汽车的全部开发与上市计划[8] - 首款车型Afeela 1已启动预生产,原计划于2026年年中在日本和美国加州交付,起售价为10.29万美元[8] - 本田2025财年业绩预告显示自1957年上市以来首次年度净亏损,部分源于电动化转型的沉没成本[8] - 双方合资始于2022年,成立索尼本田移动公司,注册资本10亿日元,双方各持股50%[8] - 项目叫停避免了量产造成的更大损失,反映了外资车企在激烈市场竞争和纯电市场增速不及预期下的挑战[8] Meta和谷歌社交媒体成瘾赔偿案 - 美国洛杉矶陪审团裁定Meta和谷歌对一名20岁女性的社交媒体成瘾及心理健康损害承担责任,需分别支付至少210万美元和90万美元赔偿[10] - 陪审团认为两家公司在平台设计和运营方面存在过失,且未就产品对未成年人的风险提供足够警告[10] - 原告称其焦虑、抑郁等问题归咎于从童年开始使用YouTube和照片墙(Instagram)[10] - 此案可能开启先例,未来或有更多类似诉讼[10] - 社交媒体平台的推荐机制和内容创作者的偏激言论是问题根源之一,多国正推动对未成年用户实施更严格保护[11] 中国公募基金规模 - 截至2月底,中国公募基金总规模达38.61万亿元,首次突破38万亿元,并已连续11个月创历史新高[12] - 2月份货币基金规模增长5795.11亿元,贡献最大规模增量;债券基金增长2167.34亿元,混合基金增长933.41亿元;股票型基金规模下降790.35亿元[12] - 货币基金近7日年化收益率平均值约为1.14%,天弘余额宝近7日年化收益为1.001%[12] - 规模增长背后是增速放缓和结构分化,货币基金成为增长主力,但收益率下行削弱配置意愿[12] - 市场震荡下,股票型基金规模下降趋势可能延续,产品同质化严重和缺乏超额收益能力是行业挑战[13] 快手2025年业绩 - 快手2025年全年总收入同比增长12.5%至1428亿元,经调整净利润增长16.5%至206亿元,营收和净利润均创历史新高[14] - 第四季度收入同比增长11.8%至396亿元,经调整净利润达55亿元,同比增长16.2%[14] - 2025年全年,快手应用平均日活跃用户(DAU)达4.102亿,同比增加约1000万;平均月活跃用户(MAU)达7.246亿,同比增加约1500万[14] - 视频生成模型可灵AI在2025年12月单月收入突破2000万美元,折合年化收入运行率(ARR)达2.4亿美元[14] - 海外业务经营亏损由2024年的9.34亿元大幅收窄至7600万元,同比改善幅度达91.9%[14] - AI业务成为新增长看点,但公司面临整体增长动能放缓的压力[14][15] A股市场表现 - 3月26日,A股市场震荡调整,沪指跌1.09%报3889.08点,深成指跌1.41%,创业板指跌1.34%[16] - 沪深两市成交额跌破2万亿元,较上一交易日缩量2362亿元[16] - 全市场超4400只个股下跌,电力板块和锂电材料股表现活跃,电网设备、光纤概念走弱[16] - 市场反弹势能暂缓,内生动能不足,缺乏具有持续性的投资主线[16] - 市场进入“青黄不接”阶段,资源类板块反复震荡,科技板块缺乏新变化,消费板块缺乏基本面支撑[17]
腾讯研究院AI速递 20260327
腾讯研究院· 2026-03-27 00:06
生成式AI算法与模型优化 - 谷歌发布TurboQuant压缩算法,通过极坐标变换与1-bit误差校验,将KV缓存压缩至3-bit,使内存占用降低6倍,推理速度提升8倍,无需重训或校准数据,在长上下文基准测试中性能接近全精度模型[1] - 英伟达提出智能体式变异算子AVO,用自主编码智能体替代传统进化搜索,在Blackwell B200 GPU上连续自主运行7天,其生成的注意力内核在BF16精度下达1668 TFLOPS,性能超越英伟达官方cuDNN最高3.5%,超越FlashAttention-4最高10.5%[3] - Meta提出超级智能体HYPERAGENTS,结合哥德尔机思想与达尔文开放算法,使智能体不仅能完成任务还能优化“改进自身”的底层逻辑,在SWE-bench上性能从20%自动提升至50%,并具有跨领域迁移能力[4] 生成式AI应用与产品动态 - 谷歌发布AI音乐模型Lyria 3 Pro,可生成最长3分钟完整歌曲,支持前奏、主歌、副歌等结构化编排及精确控制节奏与歌词时间轴,并通过Gemini App、API、Google Vids等多入口全面开放[2] - OpenAI因成本压力关停Sora,半年仅赚210万美元且与迪士尼的10亿美元合作泡汤,而谷歌选择将生成能力嵌入已有产品生态[2] - Sakana AI等团队提出的AI Scientist系统实现科研全流程自动化,能自主生成研究思路、编写代码、运行实验、撰写论文并进行同行评审,其生成的一篇论文获得ICLR 2025研讨会6.33分评审成绩[7] AI行业趋势与竞争格局 - AI工程方法正经历从Prompt Engineering到Context Engineering再到Harness Engineering的演进,Harness包含记忆管理、工具技能等六大组件,核心原则是精准信息披露、工具精简和上下文利用率控制在60%以下[9] - 智能体时代的竞争优势正从RL算法转向环境质量、训练推理紧耦合和harness工程能力,reward hacking被视为最大技术挑战[8] - 模型公司与应用公司的竞争已从模型层转向“模型+harness”整体,下一代范式可能是多智能体协调工程[9] 地缘政治与市场影响 - NeurIPS新增条款禁止美国OFAC制裁名单上的机构投稿和参与审稿,涉及华为、商汤、中芯国际、海康威视等873条中国相关名单条目,引发中国学界抵制[5][6] - 中国学者已成NeurIPS核心力量,清华大学以390篇论文位列NeurIPS 2025全球第一,此举被批评为将学术交流政治化[6] - 谷歌TurboQuant算法消息引发存储芯片板块集体重挫,美光、西数等巨头股价全线下跌,但业界认为杰文斯悖论可能使实际内存需求不降反升[1] 中国市场与基础设施预测 - Gartner预测到2030年中国80%本地AI基础设施将采用国产AI芯片,目前仅为20%,出口限制推动了自主研发进程和本土市场保护[10] - 到2028年跨区域合规与AI偏见问题将占AI数据管理量的50%,企业需通过数据属地化等方式应对多区域模型混用带来的合规风险[10] - 到2029年70%的中国企业将落地正式AI安全测试,AI智能体将承担大型企业超40%的IT运营任务,“智能体化企业”是下一阶段方向[11]