Workflow
LLM(Large Language Model)
icon
搜索文档
VLM还是VLA?从现有工作看自动驾驶多模态大模型的发展趋势~
自动驾驶之心· 2025-08-21 07:33
基于LLM的自动驾驶决策方法 - 利用大语言模型的推理能力描述自动驾驶场景,处于自动驾驶与大模型结合的早期阶段 [4] - Distilling Multi-modal Large Language Models for Autonomous Driving 论文发表于arXiv [4] - LearningFlow 提出自动化策略学习工作流用于城市驾驶场景 [4] - CoT-Drive 使用思维链提示技术实现高效运动预测 [4] - PADriver 探索个性化自动驾驶解决方案 [4] - LanguageMPC 将大语言模型作为自动驾驶决策者 [6] - Driving with LLMs 融合对象级矢量模态实现可解释自动驾驶 [5] - A Language Agent for Autonomous Driving 项目主页位于USC-GVL实验室 [7] 基于VLM的自动驾驶决策方法 - 视觉语言模型成为当前主流范式,视觉是自动驾驶最依赖的传感器类型 [8] - Drive-R1 通过强化学习桥接VLM中的推理与规划能力 [8] - FutureSightDrive 使用时空调维思维链实现轨迹规划可视化 [8] - Generative Planning 利用3D视觉语言预训练进行端到端自动驾驶 [9] - ORION 通过视觉语言指令生成实现整体端到端自动驾驶框架 [12] - DriveVLM 实现自动驾驶与大视觉语言模型的融合 [12] - DriveGPT4 通过大语言模型实现可解释的端到端自动驾驶 [12] - LightEMMA 是轻量级端到端多模态自动驾驶模型 [12] 基于VLA的自动驾驶决策方法 - AutoVLA 结合自适应推理和强化微调的视觉-语言-动作模型 [17] - DiffVLA 使用视觉语言引导扩散规划进行自动驾驶 [18] - Impromptu VLA 提供开放权重和开放数据的驾驶视觉-语言-动作模型 [20] - DriveMoE 为端到端自动驾驶设计专家混合模型 [21] - OpenDriveVLA 致力于基于大视觉语言动作模型的端到端自动驾驶 [21] - AlphaDrive 通过强化学习和推理释放VLM在自动驾驶中的潜力 [17] - X-Driver 使用视觉语言模型实现可解释自动驾驶 [17] 研究机构与会议分布 - 多数研究以arXiv预印本形式发布,部分发表于ICLR 2024、ECCV 2024、NeurIPS 2024等顶级会议 [7][13][15] - 项目代码多开源在GitHub平台,包括PJLab-ADG、wayveai、USC-GVL等实验室仓库 [7][13][18] - 研究机构包括密歇根交通实验室、清华大学Mars实验室、上海交通大学ThinkLab等知名院校 [12][15][21]
中金 | 大模型系列(2):LLM在个股投研的应用初探
中金点睛· 2025-05-09 07:33
LLM在个股投研的应用 - 核心观点:大语言模型(LLM)技术可构建智能化个股复盘框架和基本面因子生成框架,提升投研效率[1][7] - 应用场景:主观逻辑因子化和个股复盘是LLM在个股投研中较好的应用方向[1] - 优势:LLM处理非结构化数据能力较强,可提炼关键信息并给出定量化结论[7] 基于LLM的基本面因子挖掘框架 - 关键点:Prompt设计是引导因子创造方向的核心,明确选股逻辑方向可提高生成高IC因子概率[2][16] - 成果:LLM挖掘的因子IC_IR可达0.78,如链税研协同效能因子(TRI_RDEFF)[3][20] - 优势:生成因子可理解性强,可运用创新算子优化原有因子,如盈利现金双因子(EPCF)[20][22] LLM因子挖掘效果分析 - 质量类prompt生成因子IC均值较高,如盈利能力稳定且财务风险低的上市公司因子[17] - 创新性prompt生成因子与已有因子相关性低,如HR_ASSET_RESO因子相关性低于30%[20] - 问题:部分因子逻辑与计算过程匹配度较低,如EIM_1因子[19] 基于LLM的个股复盘体系 - 方法:运用RAG方法构建每日复盘体系,处理公告、研报等非结构化数据[4][27] - 优势:与现有数据库无缝衔接,提炼信息真实性好,逻辑自洽性较好[4][47] - 效果:贵州茅台案例显示模型复盘观点对长期股价表现有一定预测能力[30][35] 个股复盘实证结果 - 长期综合评分变化与未来20-60日股价表现弱相关,相关系数达0.274[37] - 多头择时策略可改善最大回撤,把握主升浪机会,年化收益率提升[38][47] - 问题:信息提炼深度有限,需在prompt中明确核心影响因素[32][34] 技术限制与优化方向 - 限制:响应速度不足、上下文长度限制、结果随机性[8] - 优化:筛选高质量研报作为输入,针对特定个股定制prompt[34] - 应用范围:建议在核心股票池范围内构建LLM因子[10]