Workflow
AI编程
icon
搜索文档
OpenAI发布GPT-5-Codex:独立编码7小时,能动态调整资源,token消耗更少
Founder Park· 2025-09-16 11:24
文章转载自「新智元」,内容有调整。 今天,OpenAI 发布了专用于编程任务的新模型 GPT-5-Codex。 此次发布的 GPT-5-Codex 属于 GPT-5 的一个特殊版本,专为智能体编程( agentic coding) 重新设计。 GPT-5-Codex 将具备全面的「 双模」特长 : 简单说就是,GPT-5-Codex不仅快&而且更加可靠。 GPT-5-Codex的交互响应更灵敏,小任务几乎即时,大任务可持续执行数小时。 OpenAI内部测试可连续7小时完成大规模重构。 博客链接: https://openai.com/index/introducing-upgrades-to-codex/ 超 13000 人的「AI 产品市集」社群!不错过每一款有价值的 AI 应用。 邀请从业者、开发人员和创业者,飞书扫码加群: 即时协作 : 与开发者实时配合,快速回答问题、修复小bug。 独立执行 : 能长时间自主推进复杂任务(如大规模重构、跨文件调试)。 进群后,你有机会得到: 01 根据不同任务动态调整资源, 能独立完成冗长复杂任务 首先,在SWE-bench验证和代码重构任务上,GPT-5-Codex ...
GPT-5编程专用版发布,独立连续编程7小时,简单任务提速10倍,VS Code就能用
36氪· 2025-09-16 10:01
OpenAI Codex编程智能体大升级: 在测试中,OpenAI团队见证了GPT-5-Codex为了完成复杂任务,独立工作超过7小时,期间不断迭代实现、修复测试失败,最终成功交付。 早期测试用户Dan Shipper表示体验好多了,现在可以进行连续对话,像"我们在哪个目录?"这样简单的问题可以立即得到结果,而不是每轮对话都要等AI 思考几分钟。 推出GPT-5-Codex特化版模型,支持独立连续编程7个小时。 还有IDE插件版,在VS Code、Cursor中都可以使用Codex了。 与GPT-5任务一开始就决定用多少算力的"路由机制"不同,GPT-5-Codex能在执行任务的过程中实时调整,可能在处理一个问题5分钟后,AI突然意识到还 需要再花一个小时。 GPT-5编程专用版 首先来看变成专用版模型GPT-5-Codex。 它针对复杂的实际工程任务进行训练,包括从头构建完整项目、添加功能和测试、调试、执行大规模重构。 在SWE-bench Verified上的表现略优于原版GPT-5,在代码重构任务的成功率直接提升近20%。 新模型最牛的地方在于"真·动态思考"能力。 新的动态思考能力体现在数据上更加直观 ...
Anthropic断供中国,腾讯推出AI时代“开发者操作系统”
硬AI· 2025-09-11 16:58
腾讯CodeBuddy产品矩阵发布 - 腾讯于9月9日发布AI编程工具CodeBuddy的全形态矩阵 包括独立IDE、CLI工具及IDE插件 覆盖三种主流开发形态[8][9] - 产品在发布前已内部大规模应用 超90%腾讯工程师使用 编码时间缩短40%以上 AI生成代码占比超50% 综合研发提效约16%[9] 产品架构与功能特性 - 插件形态集成VS Code、JetBrains等主流IDE 提供实时代码补全与智能重构[12] - 独立IDE形态支持"对话即编程" 通过自然语言驱动从产品构想到部署的全流程 深度集成腾讯云CloudBase和EdgeOne Pages服务[13][14] - CLI工具通过npm命令安装 支持终端环境自然语言交互 与CI/CD流水线无缝集成 具备代码库上下文理解能力[16][18][21] 技术实现与工程理念 - 采用三层控制框架:规则(Rules)设定硬性约束 计划模式(Plan Mode)拆解复杂任务 规格驱动(Spec-driven)确保业务需求对齐[25] - 通过检查点机制划分人机边界 高风险操作需人工确认 低风险任务可自动执行[26] - 底层模型采用国产DeepSeekV3.1 在国际aider编程基准测试获71.6%分数 较ClaudeOpus4高1个百分点且成本低68倍[30] 市场表现与商业潜力 - 外部试点案例显示效率提升30-40% 软件缺陷率降低20-30% 新员工上手周期缩短约40%[29] - 用户结构中约25%为非技术用户 企业客户占比达40% 显示B端变现潜力[29] - 采用分层商业模式 未来规划订阅制和企业套餐 提供成本管控能力[26][27] 行业竞争格局影响 - Anthropic禁令事件催生本土解决方案需求 创造从"产品替代"到"平台迁移"的窗口期[5][30] - 与腾讯云生态整合形成高转换成本 构筑平台级护城河[30] - 代表国产AI编程体系向自主可控、工程理性化方向演进 超越单纯替代逻辑[9][31]
腾讯版“Claude Code”来了!AI编程L4时代is coming
量子位· 2025-09-10 16:01
腾讯CodeBuddy产品发布 - 腾讯于9月9日发布AI CLI工具CodeBuddy Code并开启CodeBuddy IDE公测 国内版无限制免费使用 国际版测试期间赠送Pro模型体验额度 [1][2] - CodeBuddy产品矩阵包含IDE、CLI及插件三种形态 成为业内首个同时支持三种形态的AI编程工具 [3][8] - CLI工具基于npm安装 定位专业工程师使用 支持自然语言驱动开发运维全生命周期 [3][23] 产品定位与市场竞争 - 产品被视为"腾讯版Claude Code" 在Claude近期事件导致开发者弃用背景下适时推出 [4][6] - 国内版集成DeepSeek免费使用 可满足多数运维场景需求 [6] - 演示案例显示工具能自主完成需求理解、分支创建、编程及提交全流程无需人工编码 [7] AI编程行业发展趋势 - 行业正经历范式级变革 从单文件补全发展到项目级开发与多智能体协作 [9][10] - AI编程能力划分为五个层次:L1文档补全至L5多智能体团队协作 当前向L4级AI软件工程师演进 [11][13][16] - CLI形态成为下一代AI编程底层基础设施 深度嵌入企业开发流程 [11][14][19] 企业级应用价值 - CLI模式特别适合企业级团队 支持多模块自动化及CI/CD集成 覆盖软件全生命周期 [19][26] - 腾讯内部超90%工程师使用CodeBuddy 编码时间缩短40%以上 AI生成代码占比超50% [20] - AI代码生成占比从35%提升至50% 代码评审贡献从12%增至35% 预计未来将超90% [20][21] 技术特性与创新 - 采用文档驱动开发模式 通过CodeBuddy.md文件实现可追踪的智能工作空间 [24][27] - 具备语义化上下文压缩与长期记忆能力 支持项目记忆、用户记忆和全局记忆三级体系 [28][29] - 通过MCP协议扩展外部知识源 例如Context7可获取最新软件文档 [31][32] 工作流与实战应用 - 典型工作流包含项目初始化、智能架构设计、MCP配置、性能优化及安全部署 [35][36] - 支持自然语言指令触发多智能体协作 例如电商订单系统开发 [26][27] - 未来将集成沙盒运行、权限控制及审计机制确保企业级安全 [36] 行业意义与发展方向 - 代表企业级AI编程新方向:CLI驱动、多智能体协作及文档化上下文管理 [37][39] - 推动开发者角色从代码执行者向AI协作架构师升级 [37] - 不仅是工具迭代 更是软件工程思维的范式级变革 [38]
Claude不让我们用,国产平替能顶上吗?
36氪· 2025-09-08 07:41
全球AI代码生成竞争格局变化 - Anthropic市场地位动摇 因OpenAI GPT-5系列模型代码能力超越Claude Code且获Karpathy推荐 同时Anthropic承认模型降智并限制中国等服务区域[1] 国产大模型技术突破 - 月之暗面Kimi-K2-0905版本上下文长度扩展至256k 针对前端开发优化 长代码生成正确性/稳定性/逻辑一致性提升 完全兼容Anthropic API[2] - 阿里发布超万亿参数Qwen3-Max-Preview 提升通用知识/数学推理/编程等多任务表现[2] - Kimi-K2-0905采用MoE架构 总参数1万亿 推理激活参数320亿 注意力头64个 专家数384个 词表尺寸TEOK[5][6] - 在SWE-bench Verified测试中部分场景(多语言环境/命令行交互)超越Claude Sonnet 4[7] 实际应用性能验证 - 生成微信打飞机网页游戏代码 实现星空背景/移动拖影/回血道具/爆炸效果/连击加分等复杂功能[9][10] - 前端水平显著提升 在超千行代码的"鞭炮连锁爆炸测试"中表现优秀[11] - 近30天Hugging Face下载量超39万次[2] 商业化定价策略 - Kimi-K2-0905 API定价维持不变:缓存未命中每百万输入tokens/4元 缓存命中每百万输入tokens/1元 每百万输出tokens/16元[12] - 美元计价接近国内价格:输入缓存命中$0.15 未命中$0.60 输出$2.50[13] - 较Anthropic定价具明显优势 成为开源Claude平替[13] 行业生态整合 - 腾讯/字节等厂商聚焦产品侧更新 如Trae Solo版本/CodeBuddy IDE 试图超越Cursor竞争力[15] - 主流工具Cursor/Windsurf/Trae/Cline及第三方Agent产品flowith/Genspark主动接入国产大模型[17] - 国产模型在性能参数和开发体验上获认可 正反馈循环有望加速开发者生态建设[17]
全球第四大独角兽出现,创业公司要退场吗?
虎嗅· 2025-09-07 16:35
行业格局变化 - AI编程领域正从分散创业公司向巨头整合转变 强者恒强趋势明显[2] - Anthropic完成130亿美元F轮融资 估值达1830亿美元 成为全球第四大独角兽[2] - 2024年AI编程工具市场规模达150亿美元 预计2030年将增长至260亿美元 年增长率近30%[5] 头部企业表现 - Claude Code产品创造超5亿美元运营收入 过去三个月使用量增长10倍以上[2] - Cursor完成9亿美元C轮融资 估值达99亿美元 ARR超5亿美元 被超半数财富500强企业使用[5] - Lovable以35人团队在8个月内创造1亿美元年收入 成为史上增长最快软件公司[6] 技术演进路径 - 行业经历两次PMF:2023年代码补全工具验证价值 2024年Claude 3.5实现完整功能模块生成[4] - Windsurf采用"代理式编程"理念 拥有80万开发者用户和1000家企业客户 年收入超1亿美元[7][8] - Lovable Agent将错误率降低91% Bolt.new实现浏览器标签页运行完整开发环境[11] 商业模式挑战 - AI编程产品严重依赖基础模型 API成本占收入比重高达25%[9] - 行业普遍面临利润率困境 可变成本占比在10%-15%之间[9] - 部分企业通过转嫁成本或收购退出应对挑战 Windsurf以24亿美元被Google收购核心团队[7][9] 细分机会领域 - 面向非技术用户的"平权化编程"市场存在机会 Lovable通过语言描述生成全栈应用[11] - Bolt.new专注C端市场 4周ARR达400万美元 5个月收入4000万美元 注册用户超300万[11] - 在垂直细分场景深度打磨仍存在突围机会 但新创业窗口已基本关闭[3]
Claude不让我们用!国产平替能顶上吗?
机器之心· 2025-09-07 16:21
全球AI代码生成竞争格局变化 - Anthropic市场地位受到挑战 因OpenAI GPT-5系列模型在代码能力方面表现强势 且Anthropic自身出现模型降智和地区服务限制问题[1] 国产大模型技术突破 - 月之暗面Kimi-K2-0905版本将上下文长度扩展到256k 针对前端开发等编程任务优化 提升长代码生成正确性、稳定性和逻辑一致性[2] - 阿里发布超万亿参数Qwen3-Max-Preview模型 提升通用知识、数学推理和编程等多任务表现[2] - Kimi-K2-0905采用MoE架构 总参数1万亿 推理时激活参数320亿 在SWE-bench Verified等编程基准测试中部分表现超过Claude Sonnet 4[6][7] 国产大模型实际应用表现 - Kimi-K2-0905在Hugging Face平台近30天下载量超过39万次[3] - 模型工具调用格式正确率达100% 完全兼容Anthropic API 支持WebSearch Tool实时信息检索[2] - 在"鞭炮连锁爆炸测试"中能生成超一千行代码 前端水平显著提升[15] - 成功生成完整网页游戏代码 实现星空背景、移动拖影、回血道具和爆炸效果等复杂功能[11][13] 国产大模型价格优势 - Kimi-K2-0905 API定价为缓存未命中时每百万输入tokens/4元 缓存命中时每百万输入tokens/1元 每百万输出tokens/16元[17] - 美元计价分别为输入缓存命中0.15美元 缓存未命中0.60美元 输出2.50美元每百万tokens[18] - 相比Anthropic定价更具竞争力 成为Claude Code平替方案[18] 国产AI发展路径分化 - 腾讯和字节等厂商聚焦产品侧更新 如发布CodeBuddy IDE和Trae Solo版本[21] - 月之暗面等AI新势力专注技术创新 通过扩展上下文窗口和优化工具调用等功能提升核心模型能力[22] - 国内模型已接入Cursor、Windsurf等主流AI编程工具 深度融入开发生态[23]
英伟达老黄收购了一家AI编程公司
36氪· 2025-09-05 11:19
收购事件概述 - 英伟达收购AI编程初创公司Solver 专注于开发用于软件编程的AI Agent[1][6] - 收购金额未披露 但符合英伟达构建软件生态层的整体战略[11] - 此次收购标志着英伟达业务版图从芯片扩展到AI智能体领域[14] 被收购公司详情 - Solver成立于2022年 前身为Laredo Labs 由Mark Gabel和Daniel Lord联合创立[8] - 创始人背景显赫:Gabel曾任Viv Labs首席科学家(后被三星收购) Lord是苹果Siri联合创始人[8] - 公司曾获得Radical Ventures等机构800万美元投资[9] - 技术特点:智能体能管理整个代码库 而不仅限于代码片段补全 超越GitHub Copilot等工具[9] 战略布局分析 - 近两年英伟达持续收购AI相关初创公司 包括:2025年3月收购合成数据公司Gretel 2024年12月以7亿美元收购以色列AI工作负载编排公司Run:ai 2024年9月以约2.5亿美元收购生成式AI工具公司OctoAI 2024年7月收购AI模型部署平台Brev 2025年3月收购贾扬清创立的Lepton AI[12] - 收购目标集中在降低芯片使用成本和提供AI支持的领域[3][12] - 通过收购构建围绕AI硬件的软件生态系统[3][11] 技术影响评估 - Solver的AI Agent技术能直接参与代码库构建、测试与管理 超越传统自动补全功能[9][14] - 技术整合将缩短基于英伟达平台的企业开发周期[11] - 预示AI智能体正逼近软件开发核心环节[14] 行业趋势判断 - AI编程领域近期关注度显著提升[11] - 英伟达通过收购加入AI编程市场竞争[11] - 收购行为被业界评价为生态系统构建战略[3]
英伟达老黄收购了一家AI编程公司
量子位· 2025-09-05 09:49
核心观点 - 英伟达近期收购AI编程初创公司Solver 专注于AI Agent方向 体现公司围绕AI硬件构建软件生态层的战略意图[1][2][4] - 此次收购标志着公司从芯片、数据工具向AI智能体领域的业务版图扩张[23] 收购事件详情 - 收购标的:AI coding公司Solver(前身为Laredo Labs)成立于2022年 专注开发软件编程AI Agent[8][10] - 创始团队:马克·加贝尔(Viv Labs前首席科学家)和丹尼尔·洛德(Siri联合创始人)均具备消费级AI产品开发经验[11] - 技术特点:智能体能管理整个代码库 超越GitHub Copilot等工具的自动补全功能[12][13] - 融资背景:曾获得Radical Ventures等机构800万美元投资[12] 战略布局分析 - 生态构建:通过收购降低芯片使用成本或提供AI支持的初创公司 形成硬件+软件的完整生态[4][5] - 协同效应:整合Solver技术可缩短基于英伟达平台的企业开发周期 开辟AI软件市场新战略支点[17] - 技术演进:AI协作者将从代码补全升级至参与代码库构建、测试与管理的全流程[23] 历史收购案例 - Run:ai:2024年12月以7亿美元收购以色列AI工作负载编排软件提供商[20] - OctoAI:2024年9月以约2.5亿美元收购生成式AI工具公司[20] - Brev:2024年7月收购AI模型构建与部署平台 优化云端GPU访问体验[20] - Lepton AI:2025年3月收购由英伟达芯片驱动服务器租赁公司(阿里前VP贾扬清创立)[18][19] - Gretel:2025年3月收购合成数据初创公司 满足AI训练数据需求[20]
Vibe Coding,一场幻觉和焦虑催生的行业狂欢
36氪· 2025-09-04 19:38
Vibe Coding技术现状 - Vibe Coding允许通过自然语言描述生成代码原型 实现从0到1的快速搭建[1] - 该技术无法独立完成完整软件开发闭环 包括路由配置 数据库连接 增删功能 端侧部署和异常处理等工程化环节[4] - 在复杂企业级应用中存在显著局限性 无法处理行业逻辑理解 用户权限管理 数据流转 并发处理和第三方支付接口等需求[9] 技术债务与质量问题 - AI生成代码存在上下文腐烂问题 随着对话轮次增加低质量信息和错误输出累积[5] - 代码量呈现指数级膨胀 AI工具会主动添加非必要备用方案导致冗余[5] - 45%开发人员在调试AI生成代码时感到挫挫败 修正难度和维护成本较高[5] - 100%由Agent生成的代码需人工全程指导修正 带来额外工作量[5] 行业应用与市场影响 - 简单应用如俄罗斯方块 贪吃蛇可成功生成但商业价值有限[9] - 东南亚出现大量日抛型应用 通过用户订阅费盈利后即放弃维护[7] - 2025年72%开发人员未进行Vibe Coding 52%开发者不使用或仅用简单AI工具[15] - Builder.ai通过预录Demo和虚构AI助手等手段骗取软银 微软等投资16亿美元[13] 开发者生态变化 - 初级程序员岗位受冲击 Meta 微软等巨头裁员中70%为初级程序员[17] - SDE 1岗位要求从"能写好代码"升级为"与AI协作解决复杂问题"[12] - 开发者需同时具备使用AI工具 人工编码 业务理解 需求描述 代码审查和系统架构能力[12] - 程序员对AI好感度从2023年77%降至2024年72% 2025年仅60%[17] 宣传泡沫与认知偏差 - AI编程平台通过高月费模式(如Cursor ChatGPT Plus)扩大用户基数[13] - "一句话开发"宣传口号掩盖技术债务风险 造成大量烂尾工程[3][18] - 媒体和KOL聚焦超前技术概念 形成"不用即落后"的群体压力[17] - 实际技术落地与宣传存在显著时差 多数案例为预设模板套壳[9][15]