Workflow
AI 辅助编程
icon
搜索文档
杰瑞米·霍华德最新对话:Vibe Coding 就像在拉老虎机,AI 正在剥夺人类获得“直觉”的权利
AI科技大本营· 2026-03-09 16:35
文章核心观点 - 深度学习先驱Jeremy Howard严厉批评当前流行的AI辅助编程(Vibe Coding),认为其本质是提供“控制的幻觉”的“老虎机”,会侵蚀开发者的深层知识构建能力,阻碍人类成长,是“反人类”的[4][12][23][49] - AI大模型(如Claude)不具备真正的理解与创造力,只是在训练数据分布内进行“插值”和“角色扮演”,一旦超出分布就会表现糟糕[12][34][36] - 过度依赖AI自动化编程任务,会剥夺开发者通过“适当的困难”建立心智模型的机会,长期将导致行业丧失能架构复杂系统的资深工程师[12][40][44][48] - 真正的AI风险并非机器觉醒,而是科技寡头与政府利用“AI末日论”制造恐慌,建立监管壁垒以垄断技术,导致权力集中与开源社区的消亡[12][56][57][60] AI辅助编程(Vibe Coding)的批判 - Vibe Coding被比喻为“老虎机”,开发者撰写提示词并生成代码,但最终得到的是一堆无人能真正理解的复杂代码,丧失了修复能力[1][12][25][26] - 这过程产生了“控制的幻觉”,开发者如同赌徒,但真正的赢家是AI模型提供商[25][27] - 即使生成的代码能运行,其可靠性与可维护性存疑,公司不应将产品押注在无人理解其运作的代码上[29] - 近期研究显示,资深开发者使用AI辅助处理复杂编程任务时,耗时反而增加19%,因纠正AI错误和理解“代码黑盒”比从头架构更耗心力[40][42] 大模型的能力本质与局限 - 大语言模型没有真正的理解或创造力,它们是在“角色扮演”理解,通过高维统计相关性匹配来回答问题[34][35] - 其能力核心是在训练数据分布内进行“插值”,例如Anthropic宣称的AI编写C编译器,实为对现有LLVM代码进行“风格迁移”,而非从零创造[12][30][32][33] - 模型在训练分布内表现优异,但一旦超出分布边界,其表现会瞬间崩溃,犯下“比白痴还蠢”的错误[12][36][40] - 知识是具身化、网络化且依赖视角的,而将认知任务外包给AI会侵蚀组织内部的知识积累[37][38][39] 对人类学习与工程师成长的危害 - “适当的困难”是人类学习和建立深层直觉的关键,记忆与知识结构需要通过努力回忆和克服挑战来形成[12][45] - 若将初级、繁琐的编程任务全部自动化,开发者将失去在“充满摩擦力”的底层代码中挣扎的机会,无法建立必要的“心智模型”[12][44][48] - 长期影响是,行业将在10年后失去能够理解和架构宏大软件系统的资深工程师[48][49] - 正确的工具应拉近人类与系统内部状态的距离(如Jupyter Notebook提供的交互式探索),而非在人与系统间砌起高墙[50][51][53] 对AI行业风险与垄断的警告 - 当前需要担心的并非“AI觉醒毁灭人类”的科幻场景,而是更现实的、由人类自身引发的风险[54][56] - 科技寡头与政府可能利用对AI风险的恐慌,推动建立极高的监管壁垒,旨在将颠覆性技术垄断在少数实体手中[12][57] - 这种权力集中是最大的威胁,因为它使得控制权易于被少数渴望权力者接管,导致开源社区死亡、初创公司无法生存[57][58][59][60] - 应对之道是坚持开源、研发可在端侧运行的小模型,并维护人类编写代码和理解系统的能力,防止人类在自动化中集体失去思考能力[61][62]
广发证券晨会精选-20260127
广发证券· 2026-01-27 09:29
核心观点 - 报告对计算机和汽车行业进行了分析,核心观点认为国产AI大模型性能提升有望推动AI应用商业化落地,并对2026年国内汽车行业提出“价升量稳”的判断 [3] 计算机行业 - 国产AI大模型性能的提升有望推动AI应用的商业化落地 [3] - 以Cursor、GitHub Copilot为代表的AI辅助编程工具已体现出较好的商业化落地效果 [3] - 在DeepSeek等国产AI大模型持续提升代码生成能力的驱使下,SnapDevelop、EasyDevelop等国产AI辅助编程工具商业化落地也呈现出较好的前景 [3] - 若DeepSeek V4在模型能力提升、算力成本下降方面有较好进展,有望加速包括AI辅助编程工具在内的AI大模型相关应用商业化落地的节奏 [3] 汽车行业 - 2025年11-12月乘用车观望需求约150万辆 [3] - 2025年12月乘用车渠道库存小幅去化 [3] - 报告以“走出通缩”作为2025年年度策略主题,认为行业“量稳价缓”的判断总体正确,其背后逻辑是“监管思路变化+龙头公司战略调整” [3] - 展望2026年,报告对国内汽车行业的判断是“价升量稳”,这与市场一致预期不同 [3] - 得出该结论的逻辑依据是:监管思路变化、对2026年三种场景预判下的风险收益评估、以及政策韧性对销量的支撑 [3]
AI动态汇总:苹果推出Xcode26Beta7,英伟达开源Jet-Nemotron高性能语言模型
中邮证券· 2025-09-03 21:03
量化模型与构建方式 1 模型名称:PostNAS框架与JetBlock模块 **模型构建思路**:通过后神经架构搜索方法对预训练Transformer模型进行深度优化,结合新型线性注意力模块,实现高性能与高效率的语言模型架构[15][16] **模型具体构建过程**: 1. 从预训练的全注意力模型出发,继承并冻结其多层感知机权重 2. 训练"一次性"超级网络自动确定全注意力层的最佳放置位置 3. 评估多种线性注意力模块,选定Gated DeltaNet为基础 4. 设计JetBlock模块,引入动态因果卷积核,其卷积核生成器根据输入内容动态调整特征提取模式,同时移除查询和键上的冗余静态卷积 5. 执行硬件感知架构搜索,将KV缓存大小固定后对关键维度进行网格搜索[16] 2 模型名称:Gemini 2.5 Flash Image **模型构建思路**:采用稀疏混合专家架构与改进的扩散模型,实现高质量图像生成与编辑[23][25] **模型具体构建过程**: 1. 采用稀疏混合专家架构,将模型参数划分为多个专家模块,每个输入token仅激活少量专家 2. 将文本、图像、音频等输入映射到统一的嵌入空间,通过跨模态注意力机制实现信息融合 3. 采用改进的扩散模型,在低维潜空间进行去噪 4. 内置物理引擎级渲染模块理解光影投射、物体遮挡等物理规律 5. 通过特征锚定机制提取人物面部、体态等关键特征,并在生成过程中持续锚定,确保多场景下角色外观一致[25][26] 3 模型名称:MAI-1-preview **模型构建思路**:采用混合专家架构(MoE),专注于指令遵循与响应效率的平衡[36] **模型具体构建过程**: 1. 使用约1.5万张NVIDIA H100 GPU进行预训练与后训练 2. 采用混合专家架构(MoE)[36] 4 模型名称:RLCF(基于检查表的强化学习反馈) **模型构建思路**:通过动态生成指令特定的检查表来评估模型响应,替代传统奖励模型[48][49] **模型具体构建过程**: 1. 定义检查表核心特征:每个检查项必须是可验证的是非问题,响应需满足所有检查项才合格 2. 开发两种检查表生成方法: - 直接法:通过简单提示语言模型从指令中提取检查项 - 候选法:通过分析不同质量响应样本的失败模式生成更全面的检查表 3. RLCF方法包含四个关键步骤: - 从基础策略中采样候选响应对 - 结合AI评判员和验证程序对每个检查项进行评分 - 计算加权平均得分并筛选差异显著的响应对 - 使用这些偏好对进行直接偏好优化训练[48][49] --- 量化因子与构建方式 (本报告中未涉及量化因子的相关内容) --- 模型的回测效果 1 Jet-Nemotron模型 - 提供2B和4B两种参数规模的版本[17] - 在H100 GPU上生成吞吐量最高提升53.6倍,预填充阶段速度提升6.1倍[17] - Jet-Nemotron-2B在MMLU、MMLU-Pro和BBH基准上相比Qwen3-1.7B-Base吞吐量提高47倍,缓存大小缩小至原来的四十七分之一[19] - 在数学任务中平均准确率49.6,超出Qwen3-1.7B-Base达6.3个点[19] - 在常识推理任务中平均准确率62.0,超越所有基线模型[19] - 在检索和编码任务中表现优于多数同类模型[19] - Jet-Nemotron-4B在所有编码任务中均实现更高准确率,在长上下文任务中性能媲美配备更多全注意力层的领先模型[19] 2 Gemini 2.5 Flash Image模型 - 在LMArena基准测试的文生图与图像编辑两个场景中均获得全球第一的评价[27] - 在用户综合喜好度、人物、创造力、信息图、物体和环境的生成上领先于GPT-4o图像生成、Flux.1 Kontext等模型[27] - 定价为每百万输出token 30美元,每张图像消耗约1290 token,约合0.039美元每张图像[28] 3 MAI-1-preview模型 - 在LMArena文本任务榜单中排名第13位[36] 4 RLCF模型 - 在IFEval上相对提升2.8-3.0%[51] - 在FollowBench上约束满足水平提升8.2%[51] - 在InFoBench上总体要求遵循率提升6.9%[51] - 在"内容"类约束上的平均硬满足率比基线高出6.4个百分点[51] --- 因子的回测效果 (本报告中未涉及量化因子的回测效果)
Ruby on Rails 之父 DHH 预言:未来“写代码”会变成不合时宜的念头!
AI科技大本营· 2025-05-14 17:31
氛围编程(Vibe Coding)概念 - 前OpenAI研究员Andrej Karpathy提出"氛围编程"概念,展示即使不会Swift也能靠AI在一小时内开发iOS应用[1] - AI辅助编程已成趋势,开发者工具Cursor正挑战VS Code地位[3] - 腾讯推出AI编程助手CodeBuddy,是中国首个支持MCP协议的代码助手[3] 氛围编程的商业化案例 - 开发者利用氛围编程在30天内打造AI产品,实现$7,000月收入(MRR)[5][7] - 项目开发仅用AI工具完成全流程:Cursor构建+AI冷启动邮件投放+ChatGPT/Gemini获取市场洞察[7] - 策略核心为AI全流程闭环,单人即可完成创业流程[8] 行业争议与观点 - Ruby on Rails创始人DHH认为AI应作为辅助工具而非完全外包,强调编程本身应具有乐趣[11][13][15] - 开发者反驳称AI能处理重复代码,让人专注核心逻辑;现实工作中技术债问题使AI成为必要工具[18][21] - 市场压力迫使开发者使用AI提升效率,否则可能失去竞争力[23] - AI降低编程门槛,使非程序员也能参与创作,实现"人人都是开发者"[24] 技术哲学视角 - 编程语言本质是抽象层,AI只是抽象过程的延续[22] - 资深工程师认为AI可作为合作者,但人类仍需掌握主导权[25] 行业动态 - 腾讯入局AI编程领域,CodeBuddy具备Agent智能体和MCP协议支持[3] - 开发者社区涌现AI工具组合创业案例,验证氛围编程的商业可行性[4][7]