Delphi - 财报，业绩电话会，研报，新闻

Delphi

搜索文档

程序员的那些事· 2026-01-12 08:48

文章核心观点 - 基于43年编程经验的行业观察，认为AI（特别是LLM）不会取代程序员，软件开发的未来仍掌握在开发者手中 [1][3][19] - 编程的本质是将模糊的人类思维转化为精准的计算思维，这一核心能力是AI难以替代的 [12][17] - 历史上多次“程序员将被取代”的预言均未成真，反而导致了程序与程序员数量的增加，体现了“杰文斯悖论” [6][9] 历史循环：“程序员将被取代”的预言从未成真 - 在过去43年中，多次技术革新（如Visual Basic、Delphi、无代码平台、4GL/5GL）都被预言为程序员的终结，但均未实现 [4][5][6] - 最终结果并非程序员减少，而是程序与程序员越来越多，形成了每年规模达1.5万亿美元的“杰文斯悖论”典型例证 [9] LLM与过往技术的本质差异 - 当前LLM浪潮的规模和关注度远超以往（如Visual Basic、可执行UML），并受到整个经济体的押注 [11] - 与过去能稳定可靠提升效率的技术不同，LLM对大多数团队而言拖慢了开发速度，并降低了软件的可靠性与可维护性，形成双输局面 [11] 编程的本质：从模糊思维到精准计算的转化 - 编程的真正难点在于将人类模糊、矛盾、充满歧义的想法，转化为逻辑严谨、精准明确的计算思维 [12] - 这一核心挑战从打孔卡片时代至今从未改变，未来很多年可能依然如此 [13][14][15][16][17] - 自然语言因语义模糊和不确定性，无法用于精准编程，市场上对既热爱又擅长计算思维的人才需求将长期供不应求 [17] AI在编程中的局限性 - 目前没有可靠证据表明AI正在大规模取代软件开发者，就业市场变化主因是疫情过度招聘、借贷成本上升及数据中心建设分流资金 [17] - AI短期内无法进化到胜任人类程序员的核心工作（理解、推理和学习），通用人工智能（AGI）仍遥不可及 [18] - AI生成的代码几乎必然存在问题，需要真正的程序员去识别和修复，且企业宣扬AI生成代码比例后常伴随重大系统故障 [18] - 构建大型模型的成本极高且承受亏损，其长期前景存疑，可能被证明得不偿失 [19] 软件开发的未来展望 - 软件开发可预见的未来是AI以更朴素的形式辅助工作，例如生成原型代码或自动补全 [19] - 在关键核心环节，方向盘前永远会坐着一名软件开发者 [19] - 建议雇主应提前招聘程序员，以应对未来可能出现的抢人大战 [20] 网友讨论精选 - 有观点指出，当前对大模型的使用依赖外部投资补贴，其真实的高昂隐性成本被忽视或淡化 [23] - 有经验认为，智能体大模型在解决底层库复杂问题、寻找非明显bug或理解嵌套抽象逻辑方面完全无用，但能高效处理简单、重复的样板代码任务 [24][26] - 有从业者感到担忧，认为AI工具在设计、代码评审、找bug、项目规划及决策方面可能已超越人类，程序员角色可能转变为流程协调者 [27][28]

快速结构化深度了解理想AI/自动驾驶/VLA手册

理想TOP2· 2025-10-10 19:19

公司战略转型与愿景 - 创办理想汽车的动机是寻求比汽车之家大十倍以上的行业机会，基于对自动驾驶实现的信念和行业变革期的判断[1] - 公司于2022年9月内部明确、2023年1月28日通过全员信正式将自身定义为人工智能公司[2] - 公司核心驱动力是参与OpenAI定义的AI五阶段发展，最终目标是AI超越人类组织能力，自动驾驶成为中短期重点，中长期业务可能变化[1] 关键战略判断 - 坚信人工智能将实现知识、认知和能力的平权，AI对公司的意义是全部[2] - 判断基座模型是人工智能时代的操作系统+编程语言，是新一代入口，无论多难公司一定要做[2] - 当前所有行动都是为了获得AGI的L3和自动驾驶L4的门票[2] - 判断大语言模型与自动驾驶将合二为一变为VLA，公司必须保证其大语言模型基座模型是中国前三[3] - 目标三年内推出摘掉方向盘的车，需要VLA基座模型、顶级人才和足够算力支持[3] 技术发展路径与里程碑 - 2024年3月GTC大会分享双系统架构，输入传感器信息输出轨迹，算力储备为1.4eFlops[3] - 2024年6月李想定义L3为有监督自动驾驶、L4为无监督自动驾驶，给出三季度内测、1000万Clips最早2024年底最晚2025年初全量推送预期，L4三年内一定实现[3] - 2025年3月GTC分享VLA，明确VLM由端到端+VLM两个模型组成，VLA是一个模型具备快慢思考能力，输出action token[4] - VLA快慢思考均输出action token，通过diffusion进一步优化轨迹，用户可直接与模型对话下达指令[4] VLA基座模型核心技术 - 从零开始设计训练适合VLA的基座模型，因开源模型缺乏良好3D空间理解能力[6] - 采用MoE架构和Sparse Attention实现稀疏化，在参数量扩容时不大幅增加推理负担[7] - 训练中加入大量3D数据和自动驾驶图文数据，减少文史类数据比例，并加入未来帧预测和稠密深度预测等任务[7][8] - 训练模型学习人类思考过程并自主切换快慢思考，快思考直接输出action token，慢思考经过固定简短CoT模板输出action token[8] - 采用小词表和投机推理提升CoT效率，对action token创新使用并行解码[8] 轨迹生成与系统优化 - 利用diffusion将action token解码成最终驾驶轨迹，预测自车及他车行人轨迹，提升复杂交通博弈能力[10] - 使用多层Dit实现“开快点”等指令功能，采用ode采样器使diffusion在2~3步内生成稳定轨迹，解决效率问题[10] - 通过端到端可训VLA模型和3D重建联合优化解决强化学习两大限制，让系统超越人类驾驶水平[11] - 3D高斯具备出色多尺度3D几何表达能力和丰富语义，通过图片RGB自监督训练充分利用真实数据[5] 技术研发与论文成果 - 2024年2月提出DriveVLM，2024年6月提出Delphi端到端自动驾驶视频生成方法[11][12] - 2024年10月提出MVGS实现最先进渲染性能，提出首个基于Dit的生成长时间高一致性视频框架[12] - 2024年12月提出GaussianAD，探索以视觉为中心的端到端自动驾驶显式稀疏点架构[13] - 2025年4月发布MCAF多模态粗到细注意力聚焦框架，解决长视频理解关键瓶颈[13] - 2025年6月发布DriveAction基准测试集，包含2610个驾驶场景中生成的16185对问答数据[13]