Workflow
Delphi
icon
搜索文档
从业 43 年的程序员直言:AI 不会取代程序员,软件开发的核心从未改变
程序员的那些事· 2026-01-12 08:48
文章核心观点 - 基于43年编程经验的行业观察,认为AI(特别是LLM)不会取代程序员,软件开发的未来仍掌握在开发者手中 [1][3][19] - 编程的本质是将模糊的人类思维转化为精准的计算思维,这一核心能力是AI难以替代的 [12][17] - 历史上多次“程序员将被取代”的预言均未成真,反而导致了程序与程序员数量的增加,体现了“杰文斯悖论” [6][9] 历史循环:“程序员将被取代”的预言从未成真 - 在过去43年中,多次技术革新(如Visual Basic、Delphi、无代码平台、4GL/5GL)都被预言为程序员的终结,但均未实现 [4][5][6] - 最终结果并非程序员减少,而是程序与程序员越来越多,形成了每年规模达1.5万亿美元的“杰文斯悖论”典型例证 [9] LLM与过往技术的本质差异 - 当前LLM浪潮的规模和关注度远超以往(如Visual Basic、可执行UML),并受到整个经济体的押注 [11] - 与过去能稳定可靠提升效率的技术不同,LLM对大多数团队而言拖慢了开发速度,并降低了软件的可靠性与可维护性,形成双输局面 [11] 编程的本质:从模糊思维到精准计算的转化 - 编程的真正难点在于将人类模糊、矛盾、充满歧义的想法,转化为逻辑严谨、精准明确的计算思维 [12] - 这一核心挑战从打孔卡片时代至今从未改变,未来很多年可能依然如此 [13][14][15][16][17] - 自然语言因语义模糊和不确定性,无法用于精准编程,市场上对既热爱又擅长计算思维的人才需求将长期供不应求 [17] AI在编程中的局限性 - 目前没有可靠证据表明AI正在大规模取代软件开发者,就业市场变化主因是疫情过度招聘、借贷成本上升及数据中心建设分流资金 [17] - AI短期内无法进化到胜任人类程序员的核心工作(理解、推理和学习),通用人工智能(AGI)仍遥不可及 [18] - AI生成的代码几乎必然存在问题,需要真正的程序员去识别和修复,且企业宣扬AI生成代码比例后常伴随重大系统故障 [18] - 构建大型模型的成本极高且承受亏损,其长期前景存疑,可能被证明得不偿失 [19] 软件开发的未来展望 - 软件开发可预见的未来是AI以更朴素的形式辅助工作,例如生成原型代码或自动补全 [19] - 在关键核心环节,方向盘前永远会坐着一名软件开发者 [19] - 建议雇主应提前招聘程序员,以应对未来可能出现的抢人大战 [20] 网友讨论精选 - 有观点指出,当前对大模型的使用依赖外部投资补贴,其真实的高昂隐性成本被忽视或淡化 [23] - 有经验认为,智能体大模型在解决底层库复杂问题、寻找非明显bug或理解嵌套抽象逻辑方面完全无用,但能高效处理简单、重复的样板代码任务 [24][26] - 有从业者感到担忧,认为AI工具在设计、代码评审、找bug、项目规划及决策方面可能已超越人类,程序员角色可能转变为流程协调者 [27][28]
快速结构化深度了解理想AI/自动驾驶/VLA手册
理想TOP2· 2025-10-10 19:19
公司战略转型与愿景 - 创办理想汽车的动机是寻求比汽车之家大十倍以上的行业机会,基于对自动驾驶实现的信念和行业变革期的判断[1] - 公司于2022年9月内部明确、2023年1月28日通过全员信正式将自身定义为人工智能公司[2] - 公司核心驱动力是参与OpenAI定义的AI五阶段发展,最终目标是AI超越人类组织能力,自动驾驶成为中短期重点,中长期业务可能变化[1] 关键战略判断 - 坚信人工智能将实现知识、认知和能力的平权,AI对公司的意义是全部[2] - 判断基座模型是人工智能时代的操作系统+编程语言,是新一代入口,无论多难公司一定要做[2] - 当前所有行动都是为了获得AGI的L3和自动驾驶L4的门票[2] - 判断大语言模型与自动驾驶将合二为一变为VLA,公司必须保证其大语言模型基座模型是中国前三[3] - 目标三年内推出摘掉方向盘的车,需要VLA基座模型、顶级人才和足够算力支持[3] 技术发展路径与里程碑 - 2024年3月GTC大会分享双系统架构,输入传感器信息输出轨迹,算力储备为1.4eFlops[3] - 2024年6月李想定义L3为有监督自动驾驶、L4为无监督自动驾驶,给出三季度内测、1000万Clips最早2024年底最晚2025年初全量推送预期,L4三年内一定实现[3] - 2025年3月GTC分享VLA,明确VLM由端到端+VLM两个模型组成,VLA是一个模型具备快慢思考能力,输出action token[4] - VLA快慢思考均输出action token,通过diffusion进一步优化轨迹,用户可直接与模型对话下达指令[4] VLA基座模型核心技术 - 从零开始设计训练适合VLA的基座模型,因开源模型缺乏良好3D空间理解能力[6] - 采用MoE架构和Sparse Attention实现稀疏化,在参数量扩容时不大幅增加推理负担[7] - 训练中加入大量3D数据和自动驾驶图文数据,减少文史类数据比例,并加入未来帧预测和稠密深度预测等任务[7][8] - 训练模型学习人类思考过程并自主切换快慢思考,快思考直接输出action token,慢思考经过固定简短CoT模板输出action token[8] - 采用小词表和投机推理提升CoT效率,对action token创新使用并行解码[8] 轨迹生成与系统优化 - 利用diffusion将action token解码成最终驾驶轨迹,预测自车及他车行人轨迹,提升复杂交通博弈能力[10] - 使用多层Dit实现“开快点”等指令功能,采用ode采样器使diffusion在2~3步内生成稳定轨迹,解决效率问题[10] - 通过端到端可训VLA模型和3D重建联合优化解决强化学习两大限制,让系统超越人类驾驶水平[11] - 3D高斯具备出色多尺度3D几何表达能力和丰富语义,通过图片RGB自监督训练充分利用真实数据[5] 技术研发与论文成果 - 2024年2月提出DriveVLM,2024年6月提出Delphi端到端自动驾驶视频生成方法[11][12] - 2024年10月提出MVGS实现最先进渲染性能,提出首个基于Dit的生成长时间高一致性视频框架[12] - 2024年12月提出GaussianAD,探索以视觉为中心的端到端自动驾驶显式稀疏点架构[13] - 2025年4月发布MCAF多模态粗到细注意力聚焦框架,解决长视频理解关键瓶颈[13] - 2025年6月发布DriveAction基准测试集,包含2610个驾驶场景中生成的16185对问答数据[13]