混合架构 - 财报，业绩电话会，研报，新闻

混合架构

搜索文档

阿尔法工场研究院· 2025-06-24 18:14

固态电池技术进展与市场前景 - 比亚迪、国轩高科、一汽集团等已成功下线60Ah车规级电芯，能量密度达350-400Wh/kg，充电倍率1C，循环寿命1000次，比预期提前半年 [1] - 预计2025年下半年至2026年上半年固态电池中试阶段将迎来关键节点，技术成熟度大幅提升 [1] - 硫化物电解质生产突破千米级大卷，加压条件降至1-2Mpa，预计2026年价格将降至250万/吨，长期可能降至几十万/吨 [1] - 固态电池在低空飞行器、动力系统及机器人领域应用前景广阔，预计2030年市场规模突破100GWh [1] 先导智能订单与技术布局 - 宁德时代与先导智能扩大合作，承诺将50%新电芯段核心设备投资优先给先导 [1] - 2025年一季度订单量预计回升至2022-2023年水平，全年订单有望增长20%-30%达240-260亿元 [1] - 干法电极设备技术突破，中道环节采用片机替代卷绕设备提升效率，后道布局等静压和化成分容设备 [2] - 已与多家车企及日韩固态电池企业建立战略合作，提供量产解决方案 [2] VMware商业模式变革 - 博通收购VMware后改为VCF订阅制套件，取消永久授权模式，用户反映授权费用暴涨8-15倍 [2] - 博通称改革旨在帮助用户解锁VCF的全面配置管理、安全防护等价值 [2] - 53%企业将私有云部署列为优先IT任务，69%评估将工作负载从公有云迁回本地 [2] - 60%企业优先选择本地IT系统运行核心负载，仅2%选择全公有云化 [2] 科技股驱动因素与特斯拉供应链 - 伊朗以色列停火协议改善市场情绪，美联储表态支持降息推动流动性 [3] - 特斯拉推出首批10辆Robotaxi服务，商业化进程加速 [3] - 联创电子预计2025年成为特斯拉镜头第一供应商 [3] - 拓普集团提供底盘系统等零部件并配套机器人项目 [3] - 旭升股份持续供应电池和传动系统零部件 [3] - 三花智控提供热管理零部件并深入机器人合作 [3] - 江苏雷利通过鼎智科技提供执行器和电机 [3] Robotaxi市场竞争格局 - 小马智行称竞争对手在规模化和无人化方面落后两年半，文远知行反驳并强调落地进展 [4] - 全球Robotaxi市场规模预计从2024年19.5亿美元增至2030年437.6亿美元（天风证券预测8349亿元） [4] - 小马智行采用多传感器融合方案，计划2025年车队规模扩至千台，车费收入同比增800% [4] - 文远知行2024年纳斯达克上市，首日市值44.91亿美元 [4] - 小马智行2022-2024年研发投入累计5.17亿美元，文远知行29.08亿元 [4] - 文远知行专利921项显著领先小马智行93项 [4] - 文远知行营收从2022年5.28亿元下滑至2024年2.50亿元 [4]

搜狐财经· 2025-06-06 19:38

大模型架构创新研究核心观点 - Transformer架构目前仍占据行业绝对主导地位，但面临二次计算复杂度高、长序列处理效率低、端侧部署受限等局限性 [1][9][16] - 行业正从两条路径突破：Transformer架构改进（Attention机制、FFN层优化）和非Transformer架构探索（新型RNN/CNN） [1][7][18] - 技术发展呈现混合架构趋势，如Mamba+MoE等组合，兼顾性能与效率 [2][9][18] - 2023年后进入架构创新密集期，学术界聚焦理论突破，工业界加速工程验证 [2][14] Transformer架构现状与挑战 - 当前占据大模型架构90%以上市场份额，通用性和可扩展性优势明显 [9][10] - 核心问题：计算复杂度O(n²)导致算力消耗激增，GPT-4推理成本达GPT-3的7倍 [16] - 长序列处理效率低下，KV缓存内存占用限制端侧部署 [16] - 预训练+微调范式见顶，效果提升边际递减（Grok3资源增10倍效果仅提升2%） [16] Transformer架构改进路径 Attention机制优化 - 稀疏注意力：采用局部窗口/块状计算降低复杂度至O(n log n)，代表技术有Sliding Window、MoBA [24][25][26] - 动态注意力：NSA等新技术实现可学习动态路径，替代预定义结构 [27][28][32] - 线性注意力：将点积计算线性化降为O(n)复杂度 [24] FFN层改进 - 从Dense结构演进为MoE混合专家系统，提升稀疏连接效率 [1][21] - 持续探索动态化、稀疏化下一代技术 [21][23] 其他改进 - 位置编码优化：LongRoPE增强长序列建模 [1] - 归一化层与残差连接改进 [22] 非Transformer架构探索 - 新型RNN：RWKV通过广义Delta Rule优化状态演化，Mamba利用状态空间模型提升训练效率 [1][14] - 新型CNN：Hyena Hierarchy等架构尝试 [1] - 混合架构：2025年MiniMax-01实现456B参数工业级落地，采用Transformer+Mamba组合 [9][14] 行业发展趋势 - 混合架构成为主流选择，字节跳动、阿里等企业加速布局 [2][10] - 研究方向聚焦：算力适配（FP8混合精度）、多模态融合、端侧部署能力 [2][18] - 参数规模持续突破，2025年出现万亿级非Transformer架构 [9][14] - 训练范式革新：从预训练转向多阶段训练、RL优化等后训练技术 [16][18]

Z Research｜我们距离Agent的DeepSeek时刻还有多远（AI Agent 系列二）

Z Potentials· 2025-06-06 10:44

AI Agent技术架构分析 - 拆解AI Agent运作流程为感知层(LLM/RAG)、决策层(Memory/Planning)、执行层(Tools)三层架构 [14][15] - 感知层负责信息收集处理，决策层进行任务拆解和推理，执行层完成实际操作 [14][15] - 当前技术痛点包括预训练收敛、检索效率瓶颈、隐私风险、工具兼容性等问题 [10] - 未来趋势包括RL强化、多源动态检索、记忆压缩技术、因果推理强化等方向 [10] 市场形态分类 - 提出AI Agent九宫格分类法，从形式和内容两个维度划分市场形态 [17][18] - 形式维度分为纯粹LLM自主、人类定义workflow、人工与AI结合三类 [17][18] - 内容维度分为通用Agent、垂类Agent和自定义平台三类 [17][18] - 需辨别真正有潜力公司与概念炒作者 [19] 技术路线之争 - OpenAI坚持"纯粹Agent"路线，强调LLM动态驱动决策 [23][24] - LangChain采用"混合架构"路线，主张Workflow与Agent结合 [25][26] - 两种路线在系统设计、开发门槛、可靠性等方面存在显著差异 [28] - OpenAI路线适合开放域任务，LangChain路线更适合企业级应用 [28] 模型能力进化 - SOTA模型已将工具调用能力内化，Agentic能力内化成为必然 [30] - OpenAI o4-mini与Claude 4代表两种技术路线："隐形智能"与"可编程智能" [38][39] - 未来竞争将是"体验普惠"与"深度可靠"两条路线的角力 [40] - 工程整合对模型能力的贡献开始增加 [31] Multi-Agent系统 - Single-Agent存在内存、工具调用、React框架等局限性 [80] - Multi-Agent在复杂性、鲁棒性和扩展性上具有根本优势 [82] - 核心架构模式包括单智能体、网络架构、监督者架构等六种 [102][124] - 当前框架处于割据状态，主流玩家各自推出解决方案 [125] 行业应用现状 - 当前AI Agent存在技术同质化和"套壳"现象普遍的问题 [129] - 短期差异化来自数据工程和系统集成等"苦活累活" [130][131] - 长期看这些工作有被自动化重构的风险 [132] - 未来12-24个月内有望看到显著进展 [138]