Workflow
软件
icon
搜索文档
AI编码工具双雄也开始商业互捧了?Cursor × Claude 最新对谈:两年后,几乎100%代码都将由AI生成!
AI前线· 2025-06-21 11:38
公司发展里程碑 - 成立不到两年即实现年经常性收入1亿美元,达到大多数SaaS公司需十年才能完成的里程碑 [1] - 公司成立一年半总融资达95亿美元,四位创始人年龄均为25岁 [5] - 4个月内ARR从1亿增至3亿美元,团队规模不足50人 [5] - 每日编写代码量达10亿行,工程师人均处理2万笔交易/秒 [3][7] 产品技术突破 - 通过Claude 3.5 Sonnet实现跨文件编辑能力跃升,推动产品大规模普及 [15][16] - 后台Agent功能支持异步任务处理,可完成90%工作后由开发者完善剩余部分 [23] - 采用"用Cursor构建Cursor"的递归开发模式,通过内部使用驱动产品迭代 [20][21] - 代码生成工具在用户中渗透率超90%,Tab功能完成70%手动编码内容 [39] 行业范式变革 - 开发者效率提升10倍,正在重构软件开发范式 [12] - 代码编写将遵循"AI生成+人类审核"模式,预计2027年AI参与度近100% [38][39] - 软件验证成为下一瓶颈,需解决代码审查与隐性知识获取难题 [24][27] - 代码结构趋向扁平化,API设计显性适配模型处理需求 [32] 核心竞争优势 - 专注开发者生产力工具赛道,拒绝盲目扩张保持小团队高效运作 [6] - 获得OpenAI领投的800万美元种子轮融资,形成战略联盟 [6] - 产品技术深度整合Claude系列模型,持续优化代理编码能力 [34][35] - 通过严格限制团队规模(<50人)维持极高人均产出效率 [5][7] 未来发展方向 - 重点突破大型代码库理解能力,解决数百万文件级别的复杂场景 [27][28] - 探索软件自适应进化,实现系统根据用户交互实时调整功能 [41] - 深化非技术因素整合,如销售端需求与代码决策的关联 [30] - 持续优化模型在工具链集成、环境迁移等方面的工程实践 [26]
亚马逊CEO:AI应用将导致员工减少
财富FORTUNE· 2025-06-20 21:02
亚马逊AI战略与员工影响 - 亚马逊CEO安迪·贾西预计未来几年公司员工总数将因AI广泛应用而下降 生成式AI和AI驱动软件将改变工作方式 部分岗位需求减少而其他类型岗位需求增加 [1][2] - 亚马逊正大力投资AI项目 包括Alexa+语音软件 购物助手 AWS开发者工具 内部已应用AI于库存管理 客户服务 产品上架等环节 [3][4] - 亚马逊是美国第二大私营雇主 截至3月底拥有156万名员工 其中35万从事总部工作 大部分员工在仓库工作 [5] 行业AI应用趋势 - 多家科技公司调整人力结构应对AI变革 Shopify要求新增岗位需说明AI不可替代性 Duolingo逐步停用AI可替代的承包商 微软裁员涉及软件开发岗位 [2] - Anthropic CEO预警AI可能在未来五年淘汰50%初级白领岗位 导致失业率升至20% [3] 亚马逊内部AI推广 - 公司鼓励员工尽可能多尝试使用AI工具 但承认长期净效应尚难精确预测 [4][5]
AI大神Karpathy演讲刷屏:软件3.0时代已来,提示词就是新代码
36氪· 2025-06-20 20:18
LLM技术演进 - LLM发展经历了三个阶段:软件1.0时代、以数据为核心的2.0时代、通过自然语言指令控制模型的3.0时代[3] - 语言正在演变为控制系统,每个个体都拥有语言接口的一部分[3] - LLM技术分支发展迅速,类似芯片制造业需要巨额资本支出[4] LLM生态系统定位 - LLM更接近操作系统而非公共事业商品,形成日益复杂的软件生态[6] - 闭源LLM提供商类比Windows/Mac OS,开源Llama生态类似Linux[6] - 技术架构上:模型本体相当于CPU,上下文窗口相当于内存,工作流如同操作系统调度资源[6][8] 人机交互优化方向 - 纯文本交互将进化,GUI可视化界面能加速AI工作成果的验证环节(如Cursor的代码高亮功能)[11][13] - 有效自动化需满足三要素:感知(获取信息)、行动(执行操作)、监督(人工介入机制)[15][17] - 当前软件界面设计阻碍AI自动化,需改造为LLM可访问的形式[16] AI代理发展路径 - AI代理发展应是十年周期而非短期爆发,从演示级到工业级需跨越可靠性鸿沟[21] - 现实场景复杂度远超预期,特斯拉经验显示需谨慎对待agent技术[19] LLM特性与局限 - LLM具有类人心理特征,既拥有百科全书式知识又存在幻觉、记忆缺陷等问题[27][29] - 训练数据导致其同时具备超能力与认知缺陷,类似《雨人》角色特征[27] 技术扩散模式创新 - LLM颠覆传统技术扩散路径:先消费级应用普及,后政企采用(如ChatGPT烹饪问答)[31] - 当前是行业进入良机,因技术扩散方向与历史模式完全相反[31] 教育领域应用 - 开放式指令易导致AI教学失控,需结构化课程设计(教师-AI协作制定大纲)[23][24] - 过度反应的代理会产生无效输出,需限制在人类可验证的产出框架内[24]
从SDV到SDE:软件定义系统如何重塑工程逻辑?
半导体芯闻· 2025-06-20 18:02
软件定义产品(SDP)的崛起趋势 - 软件定义从单一行业概念发展为跨领域系统性重构,涵盖汽车、工业、医疗、航空航天、能源、家电等多个领域 [2][4] - 行业案例:德国工业设备厂商KRONES通过数字孪生+仿真实现生产线测试与部署,医疗机器人手术系统Corindus和航空飞控系统也依赖软件定义能力 [6] - 软件定义赋能任何嵌入式系统执行功能与算法的行业 [7] SDP的三大核心价值 - 客户期望演进:从功能交付转向体验交付,强调可持续性、安全性与数字连续性 [10] - 技术平台升级:支持电气化、自动驾驶、车载互联等功能的模块化更新 [10] - 商业模式重塑:按需付费、功能订阅、应用商店式服务成为新营收增长点 [10] 企业转型的三大障碍 - 专业割裂:系统工程、软件工程、电气设计等团队孤立工作,缺乏协同平台 [11] - 软硬件协同复杂化:边缘智能环境中MCU、MPU、FPGA等异构架构增加部署难度 [11] - 开发流程碎片化:从需求定义到OTA更新缺乏统一工具支撑 [11] 模型驱动开发(MBD)的解决方案 - MBD构建全流程协同框架,覆盖需求建模、算法开发、代码生成、系统仿真,支持MCU、DSP、FPGA等多种硬件自动适配 [14] - 与英伟达、意法半导体等合作建立芯片模型库,实现"模型即代码、模型即沟通"的并行协作机制 [16][17] - 案例:AWS自动驾驶项目中实现软硬解耦开发,开发流程从线性串行转为可并行迭代的敏捷体系 [18] AI在工程开发中的应用 - 生成式AI辅助编写MATLAB脚本、设计滤波器,并自动生成Simulink模块模板 [20] - 强调"系统内可验证的AI功能",如预测性维护模型需通过虚拟环境仿真验证安全性与可靠性 [20] - 提供行业专属工具包(如DO Qualification Kit、医疗合规包),兼顾平台统一性与行业个性化需求 [20] 软件定义的未来方向 - 云端作为"第二大脑":支持5G/云实时数据汇聚、并行仿真、DevOps高效化,构建"云原生工程中台" [22] - 产品生命周期闭环:通过OTA更新实现"交付只是开始",提升客户粘性与资源效率 [24] - "设计左移"与"验证右伸"理念:早期发现潜在问题,后期持续优化性能 [24] 工程思维的深度重塑 - MATLAB和Simulink作为"工程平台的操作系统",连接算法与硬件、数据与模型,实现全生命周期闭环 [26] - 软件定义不仅是工具升级,更是从功能构建到价值释放的工程范式转变 [27]
Andrej Karpathy:警惕"Agent之年"炒作,主动为AI改造数字infra | Jinqiu Select
锦秋集· 2025-06-20 17:08
软件演进三阶段理论 - 软件1 0时代由人类编写明确指令代码 代表为GitHub托管代码库 [8] - 软件2 0时代核心是神经网络权重 通过数据集训练生成 代表平台包括Hugging Face和Model Atlas [10] - 软件3 0时代以自然语言为编程接口 提示(Prompts)成为新程序形式 大语言模型(LLM)演变为可编程通用计算机 [10][11] LLM作为操作系统 - LLM类比为新型操作系统 模型本身充当"CPU"负责推理 上下文窗口相当于"内存" [15] - 市场格局类似早期操作系统 闭源商业提供商(如OpenAI)与开源替代方案(Llama生态系统)并存 [15] - 服务模式类似公共设施 研发实验室投入巨额Capex训练基础模型 通过API按token计量收费 [12] LLM能力与缺陷 - 超能力包括百科全书式知识记忆 信息处理量远超人类个体 [17] - 认知缺陷涵盖幻觉(编造事实) 锯齿状智能(能力不均衡) 顺行性遗忘症(无法自动巩固新知识)及安全脆弱性 [19][20] 人机协作新范式 - 部分自治应用(如Cursor)特征:自动管理上下文 编排多LLM调用 提供可视化GUI及自治程度滑块 [22] - 未来软件将普遍部分自治 需设计让LLM接触用户可操作界面并建立监督机制 [23] 软件开发民主化 - Vibe Coding现象:自然语言编程接口使非专业开发者能快速实现功能原型 [24] - 创新瓶颈从编码转向部署 手动处理认证 支付 部署等DevOps任务占90%耗时 [25][26] AI基础设施重构 - 需为第三类用户(AI智能体)设计专属交互方式 而非仅适配人类GUI或程序API [27] - 具体方案包括创建AI友好Markdown说明书 重写可执行命令文档 开发人类-AI信息转换工具 [28][29] 行业发展现实展望 - 自动驾驶案例显示技术演示与产品化存在十年级鸿沟 需警惕"2025智能体之年"类炒作 [31] - 短期应聚焦"钢铁侠战衣"式增强工具 通过人机协同设计规避LLM缺陷 [32][34] - LLM技术首次 democratized 全球数十亿普通人可直接参与范式变革 [35]
日产披露第3代LEAF,变为SUV、续航超600km
日经中文网· 2025-06-20 15:30
产品更新与定位 - 第3代LEAF更新为小型SUV车型 续航距离比原来增加3成 达到600公里以上 属于世界最高水平 [1][2] - 新款LEAF最快可在35分钟内完成日常使用所需的充电 在北美首次采用特斯拉NACS充电标准 [3] - 公司将其定位为标准车 与轻型车"樱花"和高档车"ARIYA"形成产品矩阵 [2] 技术性能与竞争优势 - 通过空气动力学设计延长续航 美国版最大续航303英里(约490公里) 日欧版超600公里 较美国现款(210英里)大幅提升 [2] - 续航表现超越竞品比亚迪ATTO3和大众ID3(均不足600公里) [2] - 引入软件定义车辆(SDV)技术 支持上市后通过系统更新提升性能 [3] 市场战略与规划 - 2025年秋季从美国开始销售 2025年内进入日本市场 2026年登陆欧洲 [2] - 作为经营重建核心战略车型 被赋予"全球战略车"地位 加入畅销要素 [2] - 瞄准SUV热门细分市场 跨界车型设计提升消费者吸引力 [2] 行业竞争与挑战 - 第一代LEAF曾引领EV市场 但当前在价格和性能上落后于比亚迪、特斯拉及欧洲车企 [4] - 中国市场合资车型N7上市首月订单超预期 显示复苏迹象 [4] - 放弃日本本土电池工厂建设计划 失去低成本电池量产能力 [4] 定价与盈利策略 - 新款LEAF价格尚未公布 公司承诺保持竞品对标定价 [4] - 计划通过提高销售价格确保利润 具体定价策略受市场关注 [4]
2025必看!大神Karpathy封神演讲:AI创业不造钢铁侠,而是造钢铁侠的战衣
量子位· 2025-06-20 13:53
软件3.0时代 - 软件在过去70年基本没变 但最近几年连续经历两次根本性变革 从传统编程到神经网络再到自然语言编程大模型 [2][5] - 大模型是可编程的 提示词就是程序 用自然语言编写 标志着软件3.0时代的到来 [4][5][6] - 软件1.0是传统代码编程 软件2.0是神经网络权重参数调整 软件3.0是自然语言编程大模型 [11][31] 大模型三重属性 - 工具属性:类似电力网络 前期高资本投入建设基础设施 后期按API使用量收费 需求特征为低延迟、高稳定性、质量一致 [8] - 工厂属性:训练需巨额资本 技术路线复杂 研发集中在少数公司 软件可复制性使护城河不如硬件牢固 [9] - 操作系统属性:形成复杂软件生态系统 闭源巨头与开源社区并存 当前类似计算的1960年代 模型集中在云端 [12][13] 大模型能力与局限 - 拥有百科全书般记忆 能记住Git提交哈希值等人类难以记忆的内容 [15] - 存在认知缺陷 产生幻觉、缺乏自我认知、犯低级错误如9.11大于9.9 数错字母数量 [16] - 患顺行性失忆症 上下文窗口即工作记忆 每天被清空 无法持续学习巩固知识 [16] AI应用机遇 - 最大机遇在构建半自主化产品 提供自主性滑块 控制权始终在人类手上 如Cursor的代码重构层级选择 Perplexity的搜索深度选择 [17][21][22] - Vibe coding兴起 大模型理解自然语言使人人可编程 但部署环节仍依赖传统人工操作 [24][25] - 需为AI agent重建基础设施 当前软件为人类设计 需转向大模型友好格式 如Markdown文档替代点击指令 [25][26] 行业发展趋势 - 需重写海量代码 专业程序员与vibe coder共同参与 未来十年自主性滑块将逐步右移 [28] - 中期大模型渗透企业级工作流 代码、文档、数据分析全面智能化 [29] - 长期普及类贾维斯智能助手 但人类始终是闭环决策者 [30] - 从业者需同时掌握Software 1.0代码、2.0模型训练、3.0提示词工程 [31]
Andrej Karpathy最新演讲刷屏:软件 3.0 时代已经到来!
AI科技大本营· 2025-06-20 13:49
软件范式变革 - 过去70年软件底层范式几乎未变,但近几年连续经历两次剧烈跃迁,进入Software 3.0时代 [6][7][21] - Software 1.0:人类用Python、C++等语言明确编写代码,主导过去70年 [16] - Software 2.0:以神经网络权重为核心,通过数据集和优化算法自动生成程序,典型代表如Hugging Face托管模型 [15][16][17] - Software 3.0:以自然语言提示词编程大型语言模型(LLM),实现更灵活的组合与编排 [25][26] LLM的生态定位 - LLM具备公共事业属性,服务中断会导致全球性"智能停电",依赖度将持续增长 [39][43][44][45] - 训练LLM类似建造芯片工厂,需巨额资本投入(CAPEX)和尖端技术,通过API按量计费(OPEX) [46][47] - LLM是新时代操作系统,生态演化路径与计算机历史相似:闭源提供商(如OpenAI)与开源替代品(如Llama)并存 [50][55][58] 技术扩散路径反转 - LLM颠覆传统技术扩散路径,直接进入消费市场解决日常问题,而非优先服务军事/政府需求 [73][74] - 公司需追赶消费者使用步伐,应用起点与演化路径将不同于以往技术 [74] LLM的认知特性与局限 - LLM具有"人类灵魂"特质:百科全书式记忆但存在幻觉、智能不均衡、顺行性遗忘等认知缺陷 [75][76] - 安全风险突出,易受提示词注入攻击,需设计机制规避风险 [77] 应用开发范式迁移 - 特斯拉案例显示:Autopilot中Software 2.0神经网络逐步替代传统C++代码(Software 1.0) [30][31][33][34] - 自然语言编程降低门槛,实现"人人可编程",但产品化涉及支付/认证等非代码环节仍是痛点 [99][104][106] - 未来需构建LLM友好型基础设施,如上下文构建器(Gitingest)、协议标准(MCP)等 [109][110][111] 人机协作发展方向 - 短期应聚焦"部分自治应用",通过图形界面和"自治滑块"实现可控自主 [83][84][95] - 长期需平衡增强与自主,类似钢铁侠战衣的人机融合模式 [93][94][115]
开放的、软件定义的自动化赋能,施耐德电气塑造智慧物流“新范式”
在北京亦庄,一座由多层穿梭车立体库、全自动输送线和机械臂构成的现代化物流基地巍然矗立。踏入 这座高大宽敞的物流中心,映入眼帘的是一派忙而不乱、井然有序的景象。在"智慧大脑"的精准调度 下,一箱箱货物在高耸的货架间灵活穿梭,时而跃上高速运转的输送带,时而登上往来穿梭的无人搬运 车,以灵动而敏捷的节奏,演绎出工业脉搏的智慧律动。 这座规模宏大且运作繁忙的物流基地,正是施耐德电气在亚太地区的重要物流枢纽之一——施耐德电气 北京物流中心(以下简称"北京物流中心")。如今,借助开放的、软件定义的自动化技术以及数字孪生 等前沿科技,这座经过全面升级的物流中心正逐渐成为智慧物流"新范式"的标杆典范。 主动升级应对多维需求和挑战 制造业物流的技术创新与升级,始终与制造端和销售端的需求变化紧密相连。在制造端,随着产品类别 日益细分和定制化需求的增加,原材料的物流供应链必须更加灵活和高效,以满足不断增长的精益化、 柔性化生产需求。而在销售端,客户对产品质量和交付周期的高要求,使得物流的效率、精准性和可追 溯性变得尤为重要。 不仅如此,随着"双碳"目标的持续推进,仓储物流环节也需要在能源管理等方面主动优化,通过节能降 耗减碳,实现 ...
天工不止造物,也能修bug:Skywork-SWE给代码智能体补上软件工程课
机器之心· 2025-06-20 10:22
核心观点 - Skywork-SWE 是昆仑万维推出的自主代码智能体基座模型,专注于修复开源软件工程中的 bug,具备多轮交互、长上下文理解与逻辑推理能力 [2][7] - 该模型参数量达 32B,是目前同规模下最强的开源软件工程智能体之一,在 SWE-bench Verified 基准上取得 47% 的准确度,超越多个主流闭源模型 [7][25][33] - 其核心突破在于构建了业内最大规模、可验证的 SWE 数据集(10,169 个真实代码问题 + 8,209 条多轮交互轨迹),首次系统性验证了数据 Scaling Law 在复杂工程任务中的适用性 [11][13][40] 技术实现 数据集构建 - 从 15 万个 GitHub 仓库筛选出 10,169 个真实代码问题和 8,209 条多轮交互轨迹,覆盖 2,531 个仓库,远超同类数据集(如 SWE-Gym Lite 仅 230 个实例)[13][16][21] - 采用三阶段九步骤流程:数据采集与预筛选(阶段 A)、环境设置与执行验证(阶段 B)、智能体轨迹生成(阶段 C),确保每条样本可复现并通过单元测试 [12][16][17] - 数据复杂度显著更高:平均每个补丁涉及 2.3 个函数修改、6 个代码块、74 行代码变更,更贴近真实开发场景 [20][21] 模型性能 - 在 SWE-bench Verified 基准上,Skywork-SWE-32B 以 47% 准确度超越 DeepSeek-V3-0324(671B 参数)和 Claude 3.5(46%),并实现 38.0% pass@1 准确度刷新开源记录 [25][27][33] - 实验显示模型性能随数据规模呈指数级提升且未饱和,验证了数据 Scaling Law 的有效性 [27][29] - 采用测试时扩展(TTS)技术后,Best of 8 测试下准确率提升至 47% [30] 行业意义 - 填补了高质量 SWE 训练数据的空白,其数据集被类比为软件工程智能体的「ImageNet」[40] - 开创了「数据+系统+执行力」的智能体开发范式,未来将扩展至更多编程语言并支持在线强化学习探索 [41][42] - 是昆仑万维 Skywork 系列的重要落地成果,与其多模态推理模型、音乐模型、短剧创作模型等形成全链条布局 [42]