AI科技大本营

搜索文档
两年内打造AI软件工程师!OpenAI Codex 作者解密人机结对编程新模式
AI科技大本营· 2025-05-26 18:14
AI 如何自主编码、测试、优化? 从独立思考、到访问终端、最后改写未来! 编译 | Eric Harrington 出品丨AI 科技大本营(ID:rgznai100) 代码世界的下一个浪潮将由谁掀起?当 AI 不再仅仅是辅助工具,而是化身为能够独立思考、访问终 端、甚至拥有"专属电脑"的智能体软件工程师,软件开发的未来图景正被彻底改写。从去年最早的 Devin 号称"首个 AI 程序员",GitHub Copilot 逐渐成为全球程序员的主流工具,今年 Cursor 的爆 火,再到前几日 OpenAI 发布 Coding Agent 产品 Codex,这些幻想正在逐渐变为现实。 今日分享一篇知名 AI 工程师播客 Latent Space 的最新深度访谈,主持人邀请到了 Codex 团队的核 心成员 Josh Ma 与 Alexander Embiricos。 他们分享了 Codex 项目的缘起——从赋予模型访问终端权限带来的"AGI 曙光乍现"时刻,到构建"智 能体软件工程师"的宏伟蓝图。这场对话不仅揭示了 Codex 背后的技术思考与产品哲学,更探讨了人 与 AI 结对编程的全新范式,以及开发者如何在这个 ...
GitHub Copilot新代理把「自家人」逼疯了!
AI科技大本营· 2025-05-26 18:14
如果你上周有关注 微软的 Build 2025 大会 ,想必都听说其发布了一个最新的智能体—— GitHub Copilot Coding Agent 。官方给它的定位,是让 Copilot 从 "对话式编程助手"升级为真正的"协作 开发搭子",开发者可以将 GitHub Issue 直接分配给 Copilot,由 其尝试自动解 决,自己负责审核 即可,像是手底下多了一名"实习生"。 目前这个智能体已经进入公测阶段,甚至有网友发现它已经开始在 GitHub 上"实战演练"了,比如跑 到微软自家的 .NET runtime 仓库里帮忙。不过,真用起来大家发现……情况有点一言难尽。 在 Reddit 上, 一篇题为《我的新爱好:看 AI 把微软员工逼疯》 的帖子迅速引发热议。不少网友调 侃:"微软到底是想提升开发效率,还是想给自己人添堵?" 更开发者直言:"说实话,我还真有点替 那些被分配来审这些 PR 的员工感到难过。但如果这就是我们行业的未来,那我可能不想坐这趟车 了。" Coding Agent 是什么? 时下, GitHub Copilot Agent 已正式面向 iOS 和 Android 上的 Git ...
ACL 2025 高分接收|高感情语音技术:逻辑智能小语种TTS破局之道
AI科技大本营· 2025-05-26 11:27
还在听着机器人味儿的小语种语音?泰语 TTS 迎来"真人"突破! 长期以来,小语种语音合成(TTS)技术因资源匮乏而发展缓慢,冰冷的机器音让人难以 忍受。现在,逻辑智能团队提出了一种数据优化驱动的声学建模框架,成功打造了接近真人水平的泰语 TTS,不仅音质逼真,还能实现零样本声音克隆! 语音合成(TTS)技术近十年来突飞猛进,从早期的拼接式合成和统计参数模型,发展到如今的深度神经网络与扩散、GAN 等先进架构,实现了接近 真人的自然度与情感表达,广泛赋能智能助手、无障碍阅读、沉浸式娱乐等场景。 然而,这一繁荣几乎局限于英语、普通话等资源充沛的大语种。全球一千多种小语种由于语料稀缺、文字无空格或多音调等复杂语言学特性,在数据收 集、文本前端处理和声学建模上都面临巨大挑战,导致高质量 TTS 迟迟无法落地。破解"小语种困境"既是学术前沿课题,也是实现数字包容与多语文 化传播的关键。 面对这一挑战,逻辑智能团队提出了一种针对低资源语言 TTS 的解决方案并应用于泰语 TTS 合成,该工作已经被 ACL 2025 Industry track 正式接 收! 这项工作提出了一种数据优化驱动的声学建模框架的创新方案,通过 ...
地表最强AI编码模型Claude 4来了!上线前竟试图勒索工程师,Windsurf 成最大受害者?
AI科技大本营· 2025-05-23 17:36
整理 | 屠敏 出品 | CSDN(ID:CSDNnews) 今天凌晨,OpenAI 的劲敌 Anthropic 正式发布下一代 Claude 模型——Claude 4。 这次更新主要带来了两款模型:Claude Opus 4 与 Claude Sonnet 4。据官方介绍,这两款模型在代码生成、高级推理能力以及智能体任务执行方面 设立了新的性能标杆。 其中,Claude Opus 4 被称之为"全球最强的编程模型",专为复杂、长时间运行的 任务而设计,可自主运行数小时。另一款升级版本 Claude Sonnet 4 相较于其前作 Son net 3.7 实现了大幅提升,在编程和推理方面更加精准响应用户指令。 殊不知,这波 Claude 4 的发布引发了与 OpenAI 之间竞争的升级,还因上线前测试中出现"自主逃逸"等行为引发热议。 连续 7 小时重构代码,最强编码模型来了! 根据官方透露,全新的 Claude Opus 4 与 Claude Sonnet 4 不仅在性能上有了大幅提升,还可以处理之前版本无法搞定的很多任务。譬如, Claude Opus 4 能在玩《宝可梦》的同时连续运行重构代码任务长达 ...
CSDN智研社欧洲首聚,共话技术范式转换下的创新与合作
AI科技大本营· 2025-05-23 17:36
随着以大模型为代表的第四次技术革命迈入关键阶段,科技发展正经历一场前所未有的范式转换,"AGI 新纪元"的浪潮汹涌澎湃。如何立足于这一变革 的关键节点,重塑对新一轮技术浪潮的认知,凝聚共识、深化交流,成为每一位技术从业者高度关注的核心议题。 作为中文技术社区的领军者,CSDN 以前瞻性的视野,倾力打造了聚焦全球技术创新高地的系列活动——「智研社-The Intelliger」。旨在汇聚全球技 术翘楚与行业精英,深刻洞察技术发展趋势,积极推动技术革新与战略思维的碰撞。 关于「智研社-The Intelliger」 「智研社-The Intelliger」由 CSDN 发起创立,前身为 CTO 俱乐部,自 2009 年创办以来,一直是极具影响力的高端技术管理者分享与交流平台。随 着大模型技术的迅猛发展,人工智能将成为未来 10 年最有影响力的技术力量。「智研社-The Intelliger」将继续发挥平台作用,连接技术领袖,推动 行业发展,共同开创 AGI 新纪元。 图1 CSDN 创始人&董事长 蒋涛 图2 「CSDN和它的朋友们」现场分享 本次"CSDN 与 TA 的朋友们巴黎见面会"的圆满举办,标志着CSD ...
大模型之后,AI 开始“自己动手”了
AI科技大本营· 2025-05-23 14:14
采访 | 唐小引 整理 | 张红月 出品丨AI 科技大本营(ID:rgznai100) 从生成式 AI 到 Agentic AI ,互联网正在从"信息获取"转向"任务完成"。 强化学习带来的整个推理范式使得智能体的规划能力大大提升,让大模型具备了更强的自主规划与工具调用能力,尤其是在推理链构建、任务分解、多 Agent 协作等方面,能力提升显著。 这一趋势正在引发全球范围的智能体竞赛。 全球科技巨头抢滩智能体 放眼全球,科技巨头纷纷加速 AI Agent 布局: 国内市场同样热潮涌动,比如在 2025 腾讯云 AI 产业应用峰 会上, 腾讯集团高级执行副总裁、云与智慧产业事业群 CEO 汤道生宣布腾讯各项业务全 面拥抱 AI,以大模型、智能体、知识库和基础设施"四个加速"助力 AI 打造普惠生产力。其中,在智能体方面,腾讯云全新升级 了 智能体开发平台 (TCADP), 旨在融合自身在知识管理、工作流编排以及 AI 能力上的优势,助力企业构建更高效、更智能的 Agent 应用,而大家所熟知的腾讯多项 C 端与 B 端应用,如 QQ 浏览器、腾讯健康、 腾讯云代码助手 CodeBuddy、腾讯企点营销云等都加入 ...
能空翻≠能干活!我们离通用机器人还有多远? | 万有引力
AI科技大本营· 2025-05-22 10:47
出品 | CSDN(ID:CSDNnews) 以下文章来源于CSDN ,作者新程序员编辑部 CSDN . 成就一亿技术人 作者 | 新程序员编辑部 具身智能,作为近年来人工智能领域的热点之一,成为产业界和学术界重点关注的方向。特别是在人形机器人这个载体上,它所承载的感知、运动、决 策等能力,让具身智能从概念逐渐走向落地。但与此同时,也有不少值得深入探讨的问题浮出水面:为什么具身智能的发展似乎格外偏爱"人形"?是否 只有模仿人类形态,才是实现智能的最佳路径?在面对数据、算力、模型架构等现实挑战时,我们究竟处于怎样的阶段?距离真正的通用机器人,还有 多少"里程"要走? 基于此,CSDN《万有引力》栏目特别策划了一期以"十问具身智能:我们离通用机器人还有多远?"为主题的深度对话,邀请了 北京邮电大学人工智能 学院副教授陈光@爱可可-爱生活、深圳市人工智能与机器人研究院副研究员夏轩、Roboraction.AI 首席执行官黄浴 ,在栏目主理人 CSDN &《新程序 员》执行总编唐小引主持下, 三位专家将从技术演进、研究现状、产业应用等多个角度切 入,带大家一同拆解具身智能面临的"关键问题",看清这条通 往未来机器人的 ...
智元机器人发布并开源世界模型EVAC与评测基准EWMBench,助力具身世界模型加速进化!
AI科技大本营· 2025-05-22 10:47
近日,智元机器人重磅发布具身智能领域双重里程碑式突破:全球首个基于机器人动作序列驱动的具身世界模型EVAC (EnerVerse-AC),以及具身世 界模型评测基准EWMBench。这两大创新成果现已全面开源,旨在构建"低成本模拟 - 标准化评测 - 高效迭代"的全新开发范式,持续赋能全球具身智 能研究,加速技术落地与产业发展。 直面行业瓶颈,破解具身智能研发的"双重枷锁" 当前具身智能演进面临两大关键制约:在测试阶段,真机验证代价大、风险高,仿真系统又受制于虚实偏差;在数据层面,海量真机数据尚未构建基于 轨迹扩增的高效利用机制,限制了多样性生成与泛化训练。为打破困局,智元机器人依托深厚的技术积累,精准洞察行业痛点,在去年发布的世界模型 架构EnerVerse基础上推出创新成果:基于动作序列驱动的世界模型 EVAC与具身世界模型评测榜单 EWMBench,构建从训练到评测全链路技术闭 环,重新定义具身世界模型研发范式。 技术突破:EVAC—— 全球首个机器人动作序列驱动的世界模型 EVAC 是一个能够动态复现机器人与环境复杂交互的世界模型,标志着从传统仿真到生成式模拟的跃迁。 核心能力:从 "物理执行" 到" ...
2025 全球产品经理大会正式官宣,聚焦 AI 产品实战,全景呈现未来产品图谱!
AI科技大本营· 2025-05-21 14:10
大会核心主题 - 聚焦AI时代产品设计理念,强调"用户体验至上"的乔布斯式原则,探讨如何将技术转化为可感知的用户价值[1] - 提出AI重塑的不仅是技术栈,更是产品构建方法论,需重构体验流与用户心智[36][14] 大会专题架构 - 12大专题覆盖AI产品全生命周期,包括: - **技术实现层**:生成式AI全链路构建(1-5专题)[4][6] - **行业应用层**:金融/教育/制造等垂类场景落地(4专题)[6] - **全球化维度**:中国企业出海策略与挑战(6专题)[7] - **商业闭环**:可持续商业模式设计(11专题)[10][15] 嘉宾阵容亮点 - **技术专家**: - 李建忠提出"范式转换立方体"理论,专注大语言模型软件应用[16] - 胡腾宇拥有12年全栈产品架构经验,主导AWE智能引擎获奖项目[28] - **产品实践者**: - 王保平(玉伯)曾打造语雀/Ant Design等亿级产品,现专注AI创作应用[20] - 杨一溪实现快手DAU增长117PP,美团B端半年拓客500万[21][22] - **跨界创新者**: - 芦良超整合游戏与AI产品经验,主导腾讯gameloop产品[29][30] - 隋哲深耕人机交互领域,拥有游戏/O2O电商多赛道经验[31][32] 内容价值定位 - 强调实战方法论:要求嘉宾分享从0到1及1到N的真实路径[37][40] - 覆盖关键增长环节:包括冷启动策略(9专题)、规模化运营(10专题)、用户价值发现机制(12专题)[9][15] - 突出数据驱动:如支付宝体验度量体系(31)、合成数据算法应用(34)[31][34] 行业趋势洞察 - 技术融合方向:具身智能硬件强调感知-动作闭环部署能力(5专题)[6] - 企业级需求:工具型/平台型AI构建路径受重点关注(3专题)[6] - 生态协作模式:开放品牌合作与内容共创机制[39][40]
AI若解决一切,我们为何而活?对话《未来之地》《超级智能》作者 Bostrom | AGI 技术 50 人
AI科技大本营· 2025-05-21 09:06
在人工智能的世界,有一群人正深耕于推动通用人工智能(AGI)从科幻走向现实。CSDN、《新程序员》特别策划 " AGI 技术 50 人 "访谈栏目 ,挖掘 AI 背后的思考,激荡 AGI 的智慧,走近那些在 AI 领域不断探索、勇于创新的思想领袖和技术先锋们的心路历程。 年初 DeepSeek 爆火,引起 X、谷歌、OpenAI、Anthropic 的顶级模型大战,随后又有 Manus 通用 Agent 问世、全世界的程序员拜入 Cursor 门下……在 2025 的 AI 炮火中,有一个名字总在提醒我们,需要时不时地从日常的喧嚣中抬起头,去思考一些更长远、也更根本的问题。 作者 | 王启隆 出品丨 《 新程序员 》编辑部 Nick Bostrom ,一位出生于瑞典,后来在牛津大学开启其重要学术生涯的哲学家。他生于 1973 年,早年似乎并不安于传统学校教育的束缚,甚至有 资料显示他高中最后一年是在家完成学业的。但这反而让他得以广泛涉猎人类学、艺术、文学乃至科学等多个领域,在伦敦求学期间还曾尝试过单口喜 剧。 2005年,Nick Bostrom 在牛津大学创办了人类未来研究所(Future of Human ...