CodeX
搜索文档
OpenAI 推桌面版 CodeX,多智能体并行,硬刚 Claude Code
36氪· 2026-02-03 12:14
公司产品发布与核心功能 - OpenAI于2月2日正式推出专为macOS设计的Codex桌面应用程序,定位为“构建智能体的指挥中心” [1][2] - 该应用支持多智能体并行工作,用户可在不同“线程”中开启多个AI Agent同时处理不同任务,如重构数据库和编写单元测试,且任务间互不干扰 [2][4] - 应用具备“工作树”功能,每个Agent在隔离的本地副本中工作,其代码变更需经用户确认才会合并至主分支,以保护本地仓库 [5] - 应用集成了“技能系统”,用户可预设包含特定指令、API脚本或工作流的“技能包”,例如创建自动部署代码到生产环境的技能 [5][6] - 应用支持“自动化”设定,例如可安排定时任务,让AI在每天上午9点自动扫描GitHub Issue并尝试提供修复方案 [5][7] - 应用内置“沙箱模式”,允许用户精确控制AI权限,如设定可读文件夹、是否允许联网下载依赖、以及文件写入是否需要人工确认 [7] - Codex采用CLI、IDE插件和macOS桌面应用“三位一体”的互通架构,用户可在桌面应用开始任务,并切换到VS Code中继续 [7] 公司市场策略与用户权益 - 在发布初期两个月内,OpenAI为所有付费计划用户临时加倍速率限制,并首次向ChatGPT免费版和Go订阅用户开放Codex访问权限,展现强烈推广意图 [1][3] - 目前Codex桌面版处于大规模灰度测试阶段,ChatGPT Plus及以上用户拥有优先下载权,免费版和Go计划用户可限时试用 [3] - OpenAI联合创始人表示,使用Codex应用后再回到终端感觉“像回到了过去”,旨在建立新的高效开发习惯,让开发者产生深度依赖 [13] - 此次发布是OpenAI对抗竞争对手(特别是Anthropic的Claude Code)的关键举措,通过提升产品力与降低使用门槛的组合拳,旨在快速收复失地并扩大市场份额 [14] 产品性能与用户反馈 - 用户反馈GPT-5.2-Codex版本在“查错”和“逻辑严密性”上表现突出,尤其在处理大型工程项目时,相比之前版本更不易“失忆” [8] - 用户体验显示,Codex版更注重“执行效率”和“严谨性”,适合大规模代码重构;而普通GPT-5.2版更擅长“规划” [8] - 用户可同时运行3-5个Agent并行工作,并在侧边栏清晰查看每个任务的进度条 [8] - 当处理上下文极其庞大的任务时,Codex偶尔会陷入“自循环”,不断重复制定和推翻计划,从而消耗大量Token [10] - 该应用对非专业程序员用户不友好,若指令不够专业,AI会表现“死板”甚至“罢工” [10] - 部分用户认为Codex作为“外挂式”工具,需与VS Code来回切换,不如竞争对手Cursor那种集成在编辑器内的“行间自动补全”体验直观 [11] - 部分M1/M2基础版Mac用户反馈应用开启后风扇狂转,内存占用较高 [11] 行业趋势与战略意义 - OpenAI此次行动是对未来软件生产方式及“开发者入口”的激烈争夺,远不止发布一个新应用那么简单 [12] - 行业正经历从提供API到定义工作范式的转变,Codex通过“工作树”、“技能”、“多智能体协作”等概念,正在定义一套基于AI智能体进行软件开发的新方法论 [15] - OpenAI旨在通过推广这套方法论,成为新时代软件工程事实标准的制定者之一,让开发者习惯在“指挥中心”管理AI智能体,以建立远超普通代码补全工具的粘性 [15] - 对开发者个体而言,价值评估标准正在变化,纯编码速度的重要性可能部分让位于“任务分解”、“智能体调度”和“提示工程”的能力 [16] - 资深工程师的角色可能向技术总监或系统架构师进化,更专注于高层设计、审查和集成,以有效指挥多个AI智能体协同完成复杂系统 [16] - Codex桌面应用的普及,可能加速AI智能体从“偶尔使用的辅助”转变为“常态化、并行化的生产力单元” [17]
史上最强编程模型 Claude 5泄露,最慌的是黄仁勋?
36氪· 2026-02-02 19:30
Anthropic即将发布Claude Sonnet 5模型 - 模型代号为"Fennec",可能在近期正式发布,其模型ID `claude-sonnet-5@20260203` 被发现存在于Google Vertex AI基础设施中 [1][2] - 新模型性能预计将超越当前旗舰模型Claude Opus 4.5,但价格便宜一半,因其在Google TPU上训练和优化,推理成本大幅降低 [2] - 模型保留了100万tokens的上下文窗口,且运行速度提升,便于处理大型代码库或长文档 [3] Claude Sonnet 5的核心性能与功能 - 在编程能力测试SWE-Bench上得分超过80.9%,意味着能独立完成大部分软件工程师日常问题 [2] - 引入"Dev Team"模式,可根据需求简报自动生成多个负责后端开发、质量保证等角色的子代理,并行协作模拟完整软件开发流程 [3] - 发布时机与OpenAI的Codex发布月重合,Codex是能独立完成长达24小时任务的自主软件工程agent,Anthropic此举意在正面竞争 [5] Anthropic的市场地位与财务表现 - 公司在2025年Q4占据企业LLM支出的40%,超过OpenAI的27%和谷歌的21% [5] - 公司85%的收入来自企业客户,结构健康稳定 [6] - 过去三年收入每年10倍增长:2023年1亿美元,2024年10亿美元,2025年预计在80到100亿美元之间 [6] - 开发者工具Claude Code开放半年后,其年化收入突破10亿美元 [6] Anthropic的融资、成本与未来规划 - 1月底完成一轮超过100亿美元的融资,估值达3500亿美元,融资规模最终可能达到200亿美元 [5] - 公司将实现正现金流的时间从2027年推迟至2028年 [7] - 预计2026年将花费约120亿美元用于模型训练,另70亿美元用于运行这些模型 [7] - 将2025年的毛利率预期从50%下调至40% [8] - 预计2026年收入达180亿美元,2027年达550亿美元 [8] - 计划自建约100万颗谷歌TPU v7芯片,表明其与谷歌阵营的深度合作 [9] 行业竞争与相关动态 - OpenAI同期发布了Codex以及为科学研究设计的AI工作空间Prism,后者将GPT-5.2嵌入LaTeX编辑环境 [5] - Anthropic的效率被认为快于OpenAI,后者预计要到2029年或更晚才能盈利 [9] - Anthropic已聘请律师事务所Wilson Sonsini为IPO做准备,时间定在2026年下半年 [9]
穿越生死线:Sam Altman 谈 AI 创业的护城河、GTM 瓶颈与 2026 路线图|Jinqiu Select
锦秋集· 2026-01-28 19:36
文章核心观点 - 人工智能技术的进步正引发“智力通缩”,使“智力”成为一种廉价、按需调用的公共设施,这将彻底重构软件工程、经济形态和创业逻辑 [4][5][6] - 在AI能力快速提升、成本急剧下降的“丰饶时代”,创业的瓶颈从“构建产品”转移到了“市场进入策略”和获取用户注意力,传统的商业成功规则依然有效 [11][12][18][31] - 未来的软件形态将向高度个性化、持续演化的“私人软件”转变,而人类在AI辅助下的创造力、协作和特定软技能将变得比以往任何时候都更重要 [17][30][47][65] 软件工程与经济的重构 - **杰文斯悖论在软件工程中的体现**:AI使代码生成更快、更便宜,但全球对软件的需求并未下降,反而可能激增,导致更高比例的全球GDP通过软件创造与消费 [5][17] - **工程师角色的重新定义**:工程师将不再专注于手动输入/调试代码,而是让计算机自主行事或执行他人指令,以创造更多价值,职业形态将发生巨大改变 [17] - **软件形态的演变**:未来软件将不再是通用型产品,而是仅为个人或极小群体定制、持续自行演化的“私人软件”,使用电脑和操作系统的方式将因此改变 [5][17][30] - **智力成本与速度的变革**:OpenAI内部预测,到2027年底,提供GPT-5.2x级别智力的成本将比现在降低**100倍以上**,同时,即使价格更高,响应速度若能提升**100倍**,市场也愿意为此买单 [6][8][9][28] - **AI带来的通缩压力**:AI将带来大规模的通缩,使经济中许多东西迅速变得非常便宜,个体赋权程度将因此上升,能以极低成本创造新事物 [22][24] 创业、护城河与市场策略 - **GTM成为核心瓶颈**:在构建应用门槛被AI大幅降低后,真正的难点变成了市场进入策略,即如何把产品卖到对的用户手里,创业者的最大痛苦从“做不出产品”变为“没人关心你的产品” [11][18] - **注意力是终极稀缺资源**:在产品爆炸的时代,稀缺的不是技术,而是用户的注意力,流量成本可能因同质化竞争而飙升,人类注意力将成为最后的商品 [12][18] - **创业护城河的构建**:打造成功创业公司的基本规则并未改变,仍需解决获取用户、提供粘性价值、建立网络效应或竞争优势等护城河问题 [31] - **应对模型迭代风险的策略**:创业者应构建那些“迫切希望模型变得更好”的业务,若下一次模型升级让公司感到恐惧,则需重新思考方向 [15][32] - **独立开发者的生存空间**:多智能体入口的未来形态尚不明确,可能趋向多元化,构建帮助人们更好使用强大模型的工具是一个非常好的创业方向 [20][21] AI能力发展、应用与挑战 - **模型能力与人类挖掘能力的落差**:当前模型所具备的能力与大多数人实际能够挖掘出的能力之间,存在巨大且仍在扩大的落差,这中间蕴藏着巨大的商业机会 [14][21] - **通用模型与专业化的取舍**:未来主要需要非常优秀的通用模型,OpenAI承认在GPT-5.2的开发中过于侧重代码和推理能力而牺牲了写作能力,但目标是补齐所有维度的短板 [27] - **智能体的长链路能力发展**:智能体何时能运行长链路工作流取决于任务类型,关键在于如何拓宽自治的边界,建议将任务拆分为智能体可自我验证的子问题 [34][35] - **AI在科研中的角色**:距离模型在大多数领域完成闭环式自主研究还有相当长的路要走,目前模型在创造力、直觉与判断力方面还遥不可及,但人机协作能极大提升科研效率 [40][41] - **技术栈的演进与锁定**:未来模型将非常擅长使用新事物,目标是在面对全新环境、工具或技术时,只需一次解释就能极其可靠地正确使用 [39] 社会、教育与人机协作 - **AI对经济平等的影响**:AI可能成为社会的平等化力量,赋能个体,但也可能导致权力和财富极度集中,政策应防止后者发生 [25] - **教育模式的变革**:教学方法需要改变以适应AI工具,学生需要学会的是思考能力,而非被禁止使用工具,未来约**10%**的极端自学者已表现出色 [45][46][47] - **人机与人人协作的价值**:在充满AI的世界里,人类之间的连接将变得更有价值,人们会更加重视聚在一起共同工作,AI将以前所未有的方式促进团队协作 [47] - **人类创作者与AI的关系**:人们在乎人远胜于在乎机器,完全由AI生成的艺术作品可能不被接受,创作者的个人经历、生平故事及在创作过程中的付出将变得极其重要 [61][62] - **AI时代最重要的个人能力**:相比于具体技术,培养高主观能动性、善于提出新想法、强大的韧性以及对快速变化世界的适应能力更为关键 [65] 安全、隐私与治理 - **生物安全与韧性策略**:AI在生物安全领域带来严峻挑战,世界需要将思路从封堵访问权限转向建设“韧性”基础设施,AI本身也是构建这种韧性的工具 [42][43] - **宏观安全基础设施的缺失**:AI能力强大且使用便利,但缺乏宏观的安全基础设施,一旦发生罕见失效可能是灾难性的,构建此类基础设施的公司将极具价值 [49] - **信息共享与隐私的平衡**:AI掌握大量个人隐私信息,在实现跨平台信息共享时,需要解决细粒度的控制问题,确保安全与隐私 [56][57][63] - **低龄儿童与AI的接触**:在摸清科技对低龄儿童发育的影响之前,不主张在幼儿园普遍使用AI或计算机,儿童应更多进行实体互动 [51] 组织与人才 - **软件工程师招聘的变革**:企业相信更少的人能完成更多工作,招聘策略应是放慢增速但持续招人,面试流程需要改革以考察候选人在新工作方式下的高效产出能力 [58] - **企业拥抱AI的紧迫性**:未来,积极拥抱AI、招聘能高效使用AI人才的公司将胜出,不这么做的企业将被纯AI公司淘汰,这要求企业必须尽快大规模采用AI [59]
火爆全网的Skills,终于有了最简单的打开方式。
数字生命卡兹克· 2026-01-20 10:18
扣子2.0版本核心更新 - 产品更新至2.0版本,并更换了logo [1] - 本次更新引入了两个被作者认为非常实用且及时的核心功能:Skills(技能)和长期计划 [4] Skills(技能)功能详解 - Skills被视为继2024年Prompt工程、2025年上下文工程之后,2026年可能兴起的“Skills工程” [4] - 此前Skills功能主要集成在如OpenCode、CodeX、Antigravity等编程工具中,对普通用户门槛较高 [4] - 扣子作为一款Agent产品,集成Skills功能顺理成章,大幅降低了普通用户使用和创建Skills的门槛 [4] - 用户可通过在对话框输入“@”键来调用已拥有的技能 [4] - 官方内置了大量开箱即用的技能,涵盖写作、制作PPT、设计、视频处理等领域 [6] - 用户也可以使用他人创建并上架到技能商店的技能 [7] Skills的创建与抽象化价值 - 作者强调,未来个人的核心竞争力在于能否将重复性需求抽象成Skills并集成到主Agent中 [7] - 任何需要重复3次及以上的非沟通类任务,都应该被Skill化 [7] - 扣子平台的核心价值之一是帮助用户以极低成本将个人经验Skill化 [7] - 平台提供了两种创建技能的方式,分别面向普通用户和专业用户 [7] 面向普通用户的“口喷式”Skills开发 - 这是扣子上主流的技能构建方式,用户通过自然语言描述即可创建技能 [8] - 例如,用户可以将著名的开源多媒体处理工具FFmpeg的GitHub链接发给AI,要求其打包成一个用于视频格式转换、分辨率修改等功能的Skill [9][10][13] - 构建过程约需一两分钟,部署后即可在对话中调用 [14][15][19] - 实际测试中,调用该技能将一段视频转换为小于10MB的GIF,耗时仅几十秒,效果符合要求 [21][23] - 用户还可以将多个相关开源项目(如FFmpeg和ImageMagick)合并,创建一个能同时处理视频和图片的复合型Skill [24][25][27] - 此类复合技能可处理复杂连续任务,例如按要求将图片转为指定格式并调整视频分辨率,全程自动化处理仅需约2分钟 [29] - 创建好的技能可以上架到技能商店供所有用户使用 [30][32] 面向专业用户的Skills迁移 - 对于已通过Claude Code或OpenCode等工具创建了大量Skills的专业用户,扣子支持直接上传技能文件包(.zip或.skill格式)进行迁移 [33] - 系统会自动识别并创建技能,实现从其他平台到扣子的无缝平移 [33][37] - 目前部分迁移技能的运行成功率尚有优化空间 [38] Skills功能的当前局限与展望 - 目前扣子2.0上的技能只能单独使用,尚不支持多个Skill之间的互相结合与调用,这在一定程度上限制了其能力 [40] - 该更新对于降低Skills使用门槛、推动其普及具有重要作用 [39] - 补齐技能联动等关键短板后,AI助手的能力将得到质的飞跃 [58][60] 长期计划功能详解 - 长期计划功能允许用户为AI设定一个长期目标,AI会将其分解为可执行的步骤,用户只需按计划执行 [42][43] - 例如,用户可以创建一个“2026年全年健康执行路径规划”,AI会先了解用户当前身体状况,然后生成详细的阶段性规划书 [50][54] - 规划书内容系统,包含整体目标、阶段划分、关键里程碑和量化追踪指标体系等 [54] - AI会自动将计划任务添加到日程中,并在设定时间通过网页端弹窗提醒用户 [55] - 在计划执行过程中,用户可以通过与AI对话来不断调整和优化计划 [55] 长期计划功能的当前局限 - 目前计划提醒仅支持网页端,扣子的APP端尚未支持该功能的通知 [55] - 在移动端使用长期计划被认为是刚需,预计APP端支持会很快更新 [57]
Vibe Coding成AI主战场:22个明星玩家值得关注
量子位· 2025-10-25 14:23
AI编程产品发展趋势 - AI产品进入下半场,氛围编程成为赛道重要发展方向[2] - 国外厂商如Anthropic推出网页版和iOS版Claude Code,OpenAI CodeX嵌入Agent功能至企业工作流[2] - 国内厂商在专业开发者领域推出具备任务规划、工具调用能力的Agent产品,并深度集成至IDE[3] - 低代码/无代码领域着力发展对话式AI原生开发平台,追求多模态交互能力,通过多智能体协作降低应用开发门槛[3] 2025Q3 AI 100榜单产品分析 - 旗舰100榜单中10个产品有9个增强Agent功能[4] - 创新100榜单中12个产品有5个新增或增强Agent功能,其余产品注重优化从需求描述到应用交付的完整开发流程[4] 旗舰100代表产品核心功能 - 字节跳动扣子开发平台提供提示词设计、工作流编排到知识库管理的全栈开发能力,支持零代码构建智能体[6] - 阿里巴巴阿里云百炼支持通义系列及第三方大模型,具备API调用、流程编排功能,几分钟内可完成应用开发[7] - 百度文心智能体平台集成知识库管理与插件扩展能力,通过百度搜索、文心一言等渠道进行流量分发[9][10] - 语灵科技Dify通过可视化AI工作流与RAG引擎优化应用构建,支持基于MCP协议的工具扩展[12] - 腾讯元器件提供提示词配置、插件扩展等四大核心模块,支持32k token上下文长度[13] - 阿里巴巴Qoder具备智能代码库搜索、代码补全功能,CLI界面支持自然语言驱动开发[15] - 字节跳动Trae中国版内置DeepSeek-V3.1-Terminus免费使用,国际版新增GPT-5等模型[17] - 腾讯CodeBuddy支持自主完成多文件代码生成和改写,国内版免费调用DeepSeek等模型[18] - 百度文心快码3.5S版本增强多智能体协同能力,支持通过自然语言端到端完成编程任务[20] - 阿里巴巴魔搭社区提供超过2万个数据集与预训练模型资源,支持免费GPU训练[22] 创新100代表产品特色 - 美团NoCode平台通过自然语言对话生成网站与小程序,实现全流程可视化开发[23] - 跨赴科技码上飞提供自然语言到应用的端到端开发,支持生成小程序、APP及H5网页[24] - 蓝湖Readdy通过自然语言或参考图片生成Figma级设计稿,支持主流框架代码导出[25] - 极简未来Link.AI支持零代码搭建知识库、数据库,面向智能硬件场景提供即插即用模组[26] - 青颖飞帆UXbot支持通过文字描述或截图生成多页面交互界面,提供主流UI风格[27] - Trickle通过视觉化画布实现智能体实时协作编程,所有视觉调整实时同步至代码层[28] - 至简天成ClackyAI通过L3智能体驱动云端开发环境,实现从需求分析到代码提交的全流程自动化[29] - 即时设计Wegic支持60秒内生成定制化网站并一键发布,具备AI自动更新功能[29] - 百度秒哒集成27款能力插件,支持微信支付集成与多类型文件存储[31] - 网易CodeWave基于自研全栈编程语言NASL,提供四大可视化设计器实现前后端统一开发[33] - 阿里巴巴通义灵码具备自主决策、工具调用能力,支持端到端完成编码任务[34] - IDEA研究院MoonBit Pilot集成在MoonBit语言中,实现数分钟内完成上百次代码修复[36] 行业技术演进方向 - 产品向多体协同、垂直赛道和行业核心业务方向发展[38] - 多模态输入成为标配,角逐一站式生成能力[38] - 通用型产品增长停滞,垂直赛道成为市场新解法[38]
奥特曼给ChatGPT空降高管,11亿美元收购独角兽创始人加入OpenAI…这剧情好熟悉啊
量子位· 2025-09-03 09:42
收购与整合 - OpenAI以11亿美元全股票收购Statsig公司[2] - Statsig成立于2021年 总融资额达1.53亿美元 C轮融资1亿美元 估值11亿美元[8] - 收购后Statsig团队将保持独立运营 继续服务现有客户[17] 高管团队重组 - Statsig创始人Vijaye Raji加入OpenAI担任应用业务CTO 负责ChatGPT和CodeX产品工程[16] - Fidji Simo担任应用部门CEO 统管ChatGPT和CodeX产品线[21] - 原首席产品官Kevin Weil转岗至研究部门 负责AI for Science新业务[6][24] 组织架构调整 - 成立独立应用部门Application 专注ChatGPT和CodeX等产品开发运营[5] - 工程主管Srinivas Narayanan转任B2B应用CTO 加强企业客户业务拓展[28][29] - 新成立OpenAI for Science部门 同步开启AI加速科学探索方向招聘[24][25] 战略重心转移 - 公司战略重心进一步向应用程序业务倾斜[4] - 通过收购整合Statsig实验平台加速产品开发进程[16] - 此次调整标志着ChatGPT等明星AI应用进入重要转折点[7]
深度|AI销售独角兽Sierra AI 创始人:Agent可使生产力曲线重变陡峭,未来一定会出现大量长尾型Agent公司
Z Potentials· 2025-08-17 11:49
Bret Taylor的职业经历与产品思维 - 联合创建Google Maps并推动其从Google Local的失败中转型 通过将地图作为主画布整合本地搜索、驾驶路线等功能 重新定义行业标准 产品上线首日即获1000万用户 卫星图像功能上线后用户暴涨至9000万[4][5][7][8] - 作为Facebook CTO期间经历管理转型 从专注技术产品转向思考"今天能做的最有影响力的事" 管理团队从几人扩展到上千人[12][13] - 联合创办FriendFeed并发明"Like"按钮 但因过于专注产品打磨而忽视名人运营策略 最终在社交网络竞争中失利[16][17][18] - 创办协作工具Quip并以7.5亿美元售予Salesforce 同时担任Salesforce联席CEO[3] AI行业发展趋势与创业机会 - AI市场将分为三大领域:基础模型市场(需巨额资本投入)、AI工具链市场(面临大厂竞争)、应用型AI市场(最具潜力)[32][33][34] - Agent将成为主流软件形态 专注于解决具体业务问题而非技术细节 未来会像SaaS一样出现大量长尾型Agent公司[34][35] - AI将推动生产力曲线陡峭化 从"提升人效"转向"自主完成工作" 基于成果的定价模式将成为主流[36][37] - Sierra案例显示AI Agent在客户服务领域可实现50%-90%自动化 客户满意度达4.6分(满分5分)[38][44] 技术演进与编程未来 - 编程方式将从代码编写转向"操作代码生成机器" 计算机科学基础理论比编程技能更重要[21][22] - 未来可能出现专为LLM设计的新型编程系统 强调编译时安全检查(如Rust)和AI监督AI机制[24][25] - 当前AI编程工具如Cursor存在准确率问题 需通过"AI监督AI"和上下文工程提升可靠性[41][42][43] 产品与创业方法论 - 产品设计需区分"用户为什么开始用"和"长期价值是什么" 卫星图像功能虽非核心但带来病毒传播[8][9] - 创始人需避免"讲错故事"陷阱 应建立全面能力结构并寻求诚实反馈[14][15][18] - 市场进入策略需匹配产品类型:开发者导向型(如Stripe)、产品导向型(如Shopify)或直销模式[45][46] 教育与AI应用 - AI将重塑教育体系 需要像"允许计算器"一样进行结构性调整 实现个性化学习[26][27][28][29] - ChatGPT类工具应被视为学习辅助而非娱乐设备 与手机有本质区别[30][31] - 判断建议质量的关键是理解其底层逻辑而非表面结论 需培养独立判断力[19]
腾讯研究院AI速递 20250605
腾讯研究院· 2025-06-04 22:24
OpenAI产品更新 - 免费版ChatGPT新增轻量级记忆功能,支持短期对话连续性和基础用户偏好记忆,适用于写作、金融分析、医疗跟踪等领域 [1] - ChatGPT Plus会员开放Codex编程工具,新增联网访问(70个安全白名单网站)、PR更新及语音输入功能,两周内已更新三次 [1] 行业并购与竞争动态 - OpenAI拟以30亿美元收购AI编程平台Windsurf,随后Anthropic切断Claude模型供应,Windsurf采取应急方案包括降价Gemini模型并停止免费用户访问Claude [2] - 业内认为断供源于OpenAI收购引发的竞争关系变化,Anthropic转型IDE和插件业务与Windsurf直接竞争 [2] 视频生成技术突破 - Manus上线智能视频生成功能,通过拼接5秒片段突破时长限制,支持分阶段规划、参考图生成及剪辑,会员专属功能消耗166积分/5秒视频 [3][4] 语音合成技术进展 - 开源模型MoonCast实现中英双语自然播客生成,利用LLM提炼摘要并添加口语化细节,采用25亿参数模型及三阶段训练支持10分钟以上音频生成 [5] AI安全与治理 - 图灵奖得主Bengio创立非营利机构LawZero,融资3000万美元开发非自主型"Scientist AI"系统,专注防止AI欺骗行为 [6] - 深度学习三巨头均下场应对AI风险:Hinton离职谷歌警示风险,LeCun批评LLM路径局限性 [6] AI与数学研究协作 - AlphaEvolve联合数学家一个月内三度破解18年未解的和差集指数θ难题(1.14465→1.173077),陶哲轩评价为AI与人类"共舞"新范式 [7] 医疗AI应用创新 - 华人科学家研发AI诊断笔,通过磁弹性笔尖和铁磁流体墨水检测帕金森病手写特征,准确率超95%,成本低且适用于资源有限地区 [9] 企业AI战略展望 - Altman预测18个月内AI将从工具转变为"执行者",企业需立即实践积累数据闭环优势,OpenAI内部Codex已展示多步骤任务执行能力 [10]
ChatGPT普通会员能用编程神器Codex了!支持联网,奥特曼:更多更新在路上
量子位· 2025-06-04 08:17
ChatGPT功能更新 - CodeX使用权限扩展至Plus用户 此前仅限Pro、Enterprise和Team用户 [2][3] - CodeX新增互联网访问功能 需手动开启并支持70个白名单域名 [10][12][14][15] - CodeX支持更新现有PR和语音输入功能 [17] - CodeX两周内完成三次更新 本次为重大版本升级 [21][22] 记忆功能调整 - 免费用户开放轻量版记忆功能 仅参考近期对话内容 [23][26] - Plus/Pro用户保留完整记忆功能 支持长期个性化回复 [27] - 用户可随时关闭记忆引用或使用临时聊天 [27] 未来计划 - OpenAI CEO暗示更多更新即将发布 [30][31]