Software Engineering

搜索文档
比 996 还狠!让面试者8小时复刻出自家Devin,创始人直言:受不了高强度就别来
AI前线· 2025-08-28 15:31
公司文化与招聘策略 - Cognition采用极端面试流程,要求候选人在6-8小时内从零构建端到端AI代理(类似Devin或Windsurf),并完成数据库连接、依赖修复和测试验证[2] - 公司文化强调高强度工作模式,每周工作6天且工时超过80小时,明确拒绝工作生活平衡理念[2] - 团队高度精英化,初期35名成员中有21位曾为创业者,招聘标准侧重高层次决策能力、技术深度和产品直觉而非语法细节记忆[3][54][60] 核心产品与技术定位 - 主打产品Devin定位为AI软件工程师,采用异步任务处理模式,通过Slack/Linear等平台接收指令并独立完成完整开发任务(如功能开发、迁移重构)[26][27] - 当前Devin能力相当于初级工程师,在部分领域(如知识检索)表现卓越但决策能力仍存缺陷,客户覆盖从高盛/花旗等大银行至小型创业公司[28][30] - 关键业务指标为合并PR占比,在成功部署团队中Devin完成30%-40%的合并请求,企业级迁移场景实测效率提升8-15倍[31][36] 行业竞争与战略观点 - AI编码工具领域存在两种范式:同步IDE辅助(如GitHub Copilot)和异步智能代理(如Devin),预计两种模式将长期共存并逐步融合[33][80] - 认为即使模型能力冻结,产品层仍有十年发展空间,强调现实场景复杂性(如Angular迁移、Datadog调试)需要特定领域数据而非纯通用智能[38][66] - 收购Windsurf仅用3天完成,主要获取其企业工程/基础设施/交付团队,形成产品互补(同步IDE+异步代理)并快速发布整合功能Wave 11[72][78][81] 技术演进与生产力影响 - 软件工程复杂性分为本质复杂性(架构决策)和偶然复杂性(重复实现),当前工程师80%-90%时间耗费于后者,而AI代理可释放人类聚焦高价值决策[34] - IDE工具生产力常被低估(如周均238次Tab补全使用),但智能代理因端到端任务完成能力使量化提升更显著(如迁移任务从人日投入变为5分钟PR审查)[37] - 未来编程界面将不再是代码,而是架构级指令交互,但计算机科学教育重要性反而提升,因需理解计算机模型和决策逻辑[62] 行业发展与生态格局 - AI产值为各层(硬件/模型/应用)均存在发展机会,因差异化显著且相互依赖(如NVIDIA与台积电关系),否定过度纵向整合趋势[44][45][46] - AI经济模式正从按席位收费转向按使用量收费,因代理劳动量和GPU算力消耗更适配用量计费,未来可能形成代理经济生态[48][58] - 行业呈现两极分化趋势,超大规模玩家与出局者并存,新型交易结构(如49%授权式收购)可能持续出现以规避监管风险[83]
Redis 之父:哪怕被喷我也得说,AI 远远落后于人类程序员!开发者跟评:用大模型气得我自己写代码都有劲儿了
AI前线· 2025-05-30 21:48
Redis创始人Antirez对AI与人类程序员能力的观点 - 人类程序员在创造性解决问题方面仍显著优于大模型,能够提出奇特但高效的解决方案,而大模型在这方面极其困难[1][3] - Antirez通过实际开发案例证明,在处理复杂bug时人类能提出更优方案(如使用128位寄存器异或运算检测链接互换性),而Gemini 2.5 PRO仅能提供常规排序建议[4][5][6][7][8] - 大模型可作为"智能副手"辅助验证思路,但最终创新方案仍依赖人类创造力[9] 开发者社区对大模型的实际使用反馈 - 部分开发者将大模型视为"智能橡皮鸭",用于交流思路和异议讨论,但需警惕其过度自信导致的误导[10][12] - 大模型生成的代码表面质量高但可能功能错误,初级开发者更难辨别,而经验丰富者能快速判断有效性[13] - 开发者指出过度依赖大模型可能削弱编程关键技能培养,如问题解决能力和批判性思维[13] 行业领袖对AI编程未来的预测 - NVIDIA CEO黄仁勋认为编程重要性下降,科技从业者无需优先学习编程[15] - Anthropic CEO预测未来3-6个月内AI可能编写90%代码,12个月内接近全部代码[15] - 微软CTO预计2030年95%代码由AI生成,但人类角色将转向AI指令引导而非直接编码[15] AI对软件开发模式的变革 - AI工具(如GitHub Copilot)正成为开发者标配,用于代码生成、bug修复和性能优化[16] - 当前AI缺乏创造力与人类直觉,无法完全替代工程师,但显著改变工作流程[16] - 行业焦点转向"工程师如何适应AI进化",而非是否被取代[16]
突袭Cursor,Windsurf抢发自研大模型!性能比肩Claude 3.5、但成本更低,网友好评:响应快、不废话
AI前线· 2025-05-16 23:39
Windsurf推出SWE-1模型家族 - 公司推出首个针对完整软件工程流程优化的AI模型家族SWE-1 包含三款具体模型:SWE-1、SWE-1-lite和SWE-1-mini [1][6] - 此举标志着公司从应用开发向底层模型研发的战略扩展 距离被OpenAI收购30亿美元后首次技术产品发布 [2] - SWE-1工具调用推理能力接近Claude 3.5 Sonnet 但服务成本更低 付费用户均可使用 [6] 模型技术特点 - SWE-1-lite取代原有Cascade Base模型 质量更优 面向所有用户无限次使用 [6] - SWE-1-mini强调响应速度 为Windsurf Tab被动体验提供支持 [6] - 模型采用"流程感知"训练方法 通过共享时间线实现人机无缝协作 [29][30] 产品性能表现 - 开发者实测显示模型响应迅速高效 但存在规则不明确时产生幻觉的问题 [5][7] - 在对话式SWE任务基准测试中 采用10分制评估人机交互编码能力 [15] - 端到端SWE任务基准测试显示 模型独立解决问题能力达到前沿水平 [18][20] 公司战略方向 - 目标是将软件开发速度提升99% 超越单纯编码功能 覆盖测试/用户反馈等全流程 [9][12] - 通过生产实验盲测验证 模型每日贡献代码行数等指标接近行业领先水平 [21][22] - 将持续投入SWE模型研发 计划超越现有前沿模型性能 [27][33] 编辑器技术赋能 - 编辑器整合终端输出/剪贴板内容/IDE搜索等多元感知能力 [31][32] - 共享时间线设计使模型能持续学习用户行为模式 形成数据飞轮 [30] - 当前已实现文本编辑器感知/终端感知/浏览器基础感知等多维度协作 [31]