神经网络模型
搜索文档
能看懂|讲清楚为什么刘延说特斯拉FSD是近200个小场景模型的组合
理想TOP2· 2026-01-21 16:10
文章核心观点 - 文章基于技术分析,论证特斯拉FSD V13版本由大量小型专用神经网络模型组成,而非单一大型端到端模型,其系统设计更偏向工程优化与模块化,而非纯粹的模型能力突破 [1][5][9] FSD V13模型架构分析 - 若认可技术分析师green的逆向工程发现为真,则FSD V13版本包含189个独立的神经网络模型 [1][5] - 模型分布在两个节点上:节点A包含189个神经网络,节点B包含110个神经网络,其中61个为两个节点所共享 [1][4] - 在HW4硬件平台的V13版本中,节点B的模型大小从V12.x版本的总计2.3GB大幅增至7.5GB,节点A大小则为2.3GB [1][2] - 作为对比,HW3硬件平台在V12.6版本中,节点A大小为1.2GB,节点B大小为3.1GB [1][2] - HW3与HW4平台在当前发布的版本中,有135个神经网络是共享的 [1][4] 模型专业化与模块化设计 - 系统包含针对特定场景的专用端到端网络组,例如“工厂内无人驾驶功能”拥有包含9个子网络的专用E2E网络组 [6] - 此外还存在针对高速公路、城市街道和接近目的地等场景的其他E2E模块,且这些模块大多有“常速”和“低速”两种形态 [6] - 部分网络被拆分成多个子网络,这些子网络有时独立运行,有时像流水线一样相互交互 [6][7] - 分析认为FSD的智能模式更接近人体器官,各模块高度专业化(如肺只负责呼吸),而非像LLM Agent那样具备通用推理和工具调用能力 [8] 硬件限制与工程实现 - HW3硬件平台的理论算力限制了模型规模,其68 GB/s的显存带宽若要实现36赫兹的处理频率,单帧处理时间须小于27.7毫秒,理论可容纳的模型最大上限约为1.88GB [9] - 实际HW3的模型大小(节点A 1.2GB,节点B 3.1GB)与硬件限制相匹配,印证了其由多个小模型组成的架构 [9] - 分析指出,特斯拉FSD的流畅体验并非完全源于算力与模型,很大程度上得益于公司重写了车控操作系统,显著降低了从控制到执行的延迟 [9] 信息源与技术背景 - 关键信息来源于技术分析师green,其通过逆向工程深入分析特斯拉固件与硬件,数出了独立的神经网络文件数量 [5][6] - green与特斯拉存在微妙关系,既通过漏洞赏金计划合作,其信息挖掘也可能打乱公司节奏,但其发现使V13包含189个模型成为几乎无可辩驳的事实 [6]
【固收】基于堆叠LSTM模型的十年期国债收益率预测——量化学习笔记之一(张旭)
光大证券研究· 2025-12-16 07:07
金融时序预测模型发展 - 金融时间序列预测经历了从传统计量模型、传统机器学习模型到深度学习模型三个主要发展阶段[4] - 深度学习模型能较好适应金融时间序列的非平稳、非线性、高噪声和长记忆性等复杂特征,是当前主流方法之一[4] 神经网络模型在金融时序中的应用 - 神经网络是模仿人脑神经元连接结构设计的机器学习模型,也是深度学习的基础结构[4] - 循环神经网络及其变种如长短期记忆神经网络专为处理序列数据设计,具备记忆性和参数共享优势[4] - LSTM模型通过引入“门控机制”和记忆单元,有效缓解了传统RNN的梯度消失/爆炸问题,并能过滤序列噪声,增强对不规则数据的鲁棒性[4] - LSTM的优势使其能够有效处理长时期时间序列,过滤噪声,精准捕捉如债券收益率等金融数据的动态变化规律[4] 基于堆叠LSTM的国债收益率预测模型 - 报告采用三层堆叠LSTM加Dropout正则化的经典稳健架构构建十年期国债收益率预测模型[5] - 模型数据标的为2021年初至2025年12月12日的十年期国债收益率,以过去60个交易日的收益率一阶差分作为输入特征,未来一周的收益率一阶差分作为预测目标[5] - 最终构建的模型包含约13万个可调参数,于第27轮训练迭代出最优模型,针对测试集预测的平均绝对误差为1.43BP[5] - 最优模型预测2025年12月15日至19日当周十年期国债收益率整体呈下行趋势,2025年12月19日的预测值为1.8330%,相比2025年12月12日的1.8396%有小幅下降[5] 模型后续优化方向 - 模型设计优化:针对时间窗口、数据处理、网络架构和训练策略等相关设计进行调整优化[6] - 输入多维度变量:将输入变量从单一的收益率序列扩展至宏观、市场、情绪等多维度变量,使模型预测更符合经济逻辑,捕捉信息更全面[6] - 构建混合模型:将LSTM模型与传统计量模型或其他机器学习模型相结合,构建如ARIMAX-LSTM、CNN-LSTM-ATT等混合模型,以发挥不同模型优势,弥补单一LSTM模型缺陷,提升预测精度[7] - 引入滚动回测机制:采用滚动时间窗口回测机制,固定样本时间窗口并随时间推移实现模型的动态更新和持续预测,使模型能更好适应市场变化,提升其稳健性[7]
马斯克官宣特斯拉FSD V14即将推送:分三步走,号称史上第二大更新
凤凰网· 2025-09-29 16:11
FSD V14版本推送计划 - 特斯拉计划下周启动FSD V14首个版本的部署,随后依次推出V14.1和V14.2版本,以阶梯式更新方式交付 [1] - 首个版本为“早期广泛发布”,但主要面向内部员工、早期测试计划成员及部分有影响力的行业人士,普通车主预计需等待后续更稳定的版本如V14.2 [2] - V14.1版本计划在初版发布约两周后推出,重点修复初期错误,并有望成为首个面向大众车主推送的版本,V14.2版本时间表未明确但被评价将带来体验质变 [4] FSD V14技术架构与核心改进 - V14被定义为一次堪比V12的根本性架构升级,是FSD历史上第二大更新,而非V13式的小幅迭代 [4] - 新版本采用规模和性能远超以往的神经网络模型,其参数量实现了10倍的惊人增长 [4] - 系统将降低视频数据压缩率,使车辆感知更清晰以做出更精准判断,这些改进有助于减少对驾驶员的监控频率 [4] - 此前在V13.2.9版本中列为“即将推出”的功能,如利用音频输入识别紧急车辆、优化“幽灵刹车”问题,有望在V14系列更新中实装 [5] FSD V14功能预期与目标 - 新架构核心目标是赋予车辆更接近人类的驾驶直觉,以解决更多极端复杂的道路场景 [5] - 用户呼声极高的“目的地自动泊车”功能在此次预告中未被提及,可能不会出现在V14初始版本中 [5] - 公司已将FSD违规记录的消除时间从7天缩短至3.5天 [4]