AGI
搜索文档
AI编程界炸出新黑马!吊打Cursor、叫板Claude Code,工程师曝:逆袭全靠AI自己死磕
AI前线· 2025-08-02 13:33
AI编程工具AmpCode的崛起 - AmpCode与Claude Code并列S级,成为AI编程领域的顶级产品,而Cursor仅位列A级[2] - 该产品由Sourcegraph推出,研发时间早于Claude Code发布[4] - 核心设计理念强调"代理性",能深度参与开发流程并具备高度自治能力[4] 产品差异化设计 - 采用"放权"架构,赋予模型完整的对话记录、工具访问和文件系统权限[5] - 与Cursor等产品相比,交互更直接,消除了抽象隔层[22] - 通过VS Code插件等多平台支持降低使用门槛,无需更换开发环境[25] 技术实现突破 - 基于Claude 3.7和Sonnet 3.7模型构建,仅需300行代码即可实现基础代理功能[7] - 模型展现出自主解决问题的能力,如通过echo命令修改未授权文件[7] - 采用透明可控的工具调用机制,模型按预设协议格式发出操作信号[9] 开发者体验变革 - 测试套件90%可自动生成,UI组件状态预览等重复工作实现自动化[66] - 开发效率提升显著,例如20秒完成组件功能同步等机械性工作[67] - 使构建调试工具等辅助程序的门槛大幅降低,促进工程实践创新[70] 行业影响与趋势 - 代码价值结构改变,90%机械性工作价值下降,10%设计决策价值倍增[57] - 初级和资深工程师获益最大,中间层面临技能转型挑战[33][34] - 开源生态面临重构,标准化库的价值被即时生成能力削弱[75][77] 产品定位与商业模式 - 采用高价策略,不限制token用量以释放模型全部潜力[21] - 面向企业提供团队协作功能,如对话记录共享和使用统计[25] - 保持架构灵活性,准备随时整合更强大的模型能力[26][30]
Z Tech|独家解读Meta朱泽园开源新基线,用10%算力跑赢Llama3-8B,科学方法引领新范式,语言模型物理学迈入新时代
Z Potentials· 2025-08-02 10:19
物理学式的 AI 科学革命 - 顶尖大模型仍会在简单推理和常识问题上犯错 引发对算法极限和训练范式的质疑 [1] - Meta FAIR研究院朱泽园发起《Physics of Language Models》项目 旨在用物理学范式研究AI 其背景包括LoRA技术合作者 优化算法发明者等 [1] 用物理学方法追寻智能的普适规律 - 主张AI研究应像物理学一样追求可复现 可归纳 可解释的普适规律 类似牛顿和开普勒的观测归纳方法 [6] - 需建立"理想实验田" 为后续模型设计奠定理论基础 [6] 开源理论走向实证 算力门槛降低 - 首次将理论体系落地到实际大模型 使用42,000 GPU小时(不到Llama3-8B的10%)训练出超越同量级开源模型和Llama3-8B的模型 [11] - 全链路开源数据 代码 权重和实验 确保可复现性 [11] 两大关键策略:理论+实践深度结合 策略一:多样重写+QA混合预训练 - 2023年论文揭示知识提取极限 预训练阶段需引入多样化重写和QA混合数据 该理论已被Nvidia团队实现为Nemotron-CC开源数据 [13] 策略二:Canon层横向信息流革命 - Canon层通过横向残差连接提升Transformer推理深度2-4倍 增强推理广度和结构学习能力 成本极低且易集成主流架构 [14][16] - 实验显示Canon层使线性注意力(GLA)达到Mamba2水平 横向连接优于专用SSM设计 [17] 开创性工作意义 - 定义"理想实验田":用合成数据拆解智能 放大不同架构极限差异 [18] - 建立客观评测范式:极小实验体量揭示大模型架构未来 节省行业算力 [18] - 全开源成果:数据 代码 权重和实验曲线详实对比 确保重现性 [18] 科学价值与行业影响 - 以物理学客观性推动AI从"刷榜"进入可验证 可解释 可积累的科学新阶段 [19] - 合成预训练实验揭示大模型结构极限 可能成为领域发展的分水岭 [17][19]
Manus还活着,还上新了
虎嗅APP· 2025-08-01 18:26
Manus新功能Wide Research发布 - 公司推出新功能Wide Research(广度研究),目前仅对Pro用户开放,未来将向Basic和Plus用户开放,暂无免费用户开放计划 [3] - 该功能是公司内部耗时最长的开发项目,耗时超两个月 [6] - 功能定位为"广度研究",与OpenAI的"深度研究"形成差异化竞争,直接挑战行业巨头 [6] 技术特点与性能对比 - Wide Research采用并行计算技术,可将任务拆分为批量子任务处理,计算能力扩展100倍,但算力消耗显著增加 [9] - 实际测试显示,Wide Research能完成全球前100MBA学校列表等广度任务,而ChatGPT Agent仅能处理10所学校 [7] - 功能演示显示可同时比较100双运动鞋或生成50张风格海报,展现横向扩展优势 [9] 用户成本与行业竞争格局 - 单个Wide Research任务预计消耗1000积分(子任务约10积分/个),远超免费用户每日300积分限额 [10] - 行业存在技术路线分化:Wide Research强在并行效率,Deep Research长于复杂逻辑推理,两者结果可靠性均需提升 [10] - AI Agent领域陷入同质化竞争,公司通过Wide Research实现差异化创新,突破行业"深度研究"内卷现状 [12] 战略意义与行业影响 - 新功能发布被视为公司技术实力的重要证明,回应市场对其发展状况的质疑 [5] - 从产品推出到功能迭代仅用5个月,展现快速创新能力 [5][6] - 行业面临AGI技术瓶颈,公司尝试通过计算范式创新开辟新竞争维度 [12]
2025款林肯冒险家SUV车型上市:可选2.0T燃油/1.5T混动;比亚迪公布自动充电及充气机器人专利丨汽车交通日报
创业邦· 2025-08-01 18:20
1. 【比亚迪公布自动充电及充气机器人专利】天眼查App显示,8月1日,比亚迪股份有限公司申请 的"一种机器人"专利公布。该机器人无需车端改造,集成充电与充气功能,通过智能判断、精准对接 及闭环控制,实现自动充电、胎压监测与充气,提升智能化体验,确保安全,降低使用成本。(腾讯 网) 2. 【奇瑞汽车公布全固态电池专利】天眼查App显示,近日,奇瑞汽车股份有限公司申请的"全固态 电池及其制备方法、电池包和车辆"专利公布。摘要显示,本公开属于电池技术领域。全固态电池包 括多个料区极组、多个第一集流体和多个第二集流体,料区极组包括依次压制在一起的正极料区、固 态电解质和负极料区,其中,第一集流体与料区极组的正极料区贴合,第二集流体与料区极组的负极 料区贴合。本公开的全固态电池及其制备方法、电池包和车辆能够减小采用等静压技术压制全固态电 池时集流体受到的损伤。(网易) 车辆提供2.0T燃油和1.5T混动两种动力,其中2.0T发动机最大功率192千瓦,峰值扭矩395牛・米, 匹配8挡自动变速箱,并提供四驱系统。1.5T混动版发动机最大功率142千瓦,峰值扭矩226千瓦; 驱动电机最大功率96千瓦,峰值扭矩235牛・米; ...
Manus还活着,还上新了
虎嗅· 2025-08-01 17:36
产品发布 - Manus于8月1日发布新功能Wide Research(广度研究) 目前仅对Pro用户开放 未来将逐步向Basic和Plus用户开放 但暂无免费用户开放计划 [1] - 该功能开发耗时超两个月 是公司内部开发时间最长的功能 [6] - Wide Research功能不会以独立产品或页面形式呈现 而是根据用户任务需求自动触发 [9] 技术特性 - Wide Research采用并行计算技术 可将用户任务拆分为批量子任务处理 计算能力提升100倍 [9] - 该技术强调横向扩展和并行处理 但需承担高昂算力消耗和Token剧增成本 [9] - 在测试中成功完成"列出全球前100的MBA学校"任务 而ChatGPT Agent仅能列出10所 [6] - 支持同时比较100双运动鞋和生成50张风格各异的海报等广度任务 [9] 商业模式 - 免费用户每日积分限额为300 credits Wide Research单任务预计消耗1000 credits 相当于每个子任务消耗10 credits [10] - Basic套餐定价为19美元/月 包含每日300 refresh credits和基础功能权限 [4][5] - Pro套餐提供高级模式访问权限 支持2个并发任务和2个图像生成任务等增值服务 [5] 行业竞争 - OpenAI于上月推出ChatGPT Agent 其"Deep Research"功能主打深度信息整合和复杂问题推理 [6][10] - Wide Research被定位为对Deep Research的精准反击 形成"广度"与"深度"的技术路线对决 [6] - 行业陷入同质化竞争 根本制约因素在于AGI(通用人工智能)技术进步速度 [10] - AGI发展遭遇瓶颈期 企业通过细节优化争夺用户 但难以实现颠覆性突破 [11] 市场定位 - Manus自2025年3月进入市场后 持续通过创新功能打破行业固有格局 [11] - 在AI Agent领域普遍聚焦"Deep Research"的背景下 公司率先推出广度研究功能实现差异化竞争 [11] - 行业资深人士指出 两种技术各具优势:Wide Research在广度任务效率占优 Deep Research在复杂逻辑推理更具深度 [10]
GPT-5发布倒计时?全网泄露来了:微软Copilot憋大招,GPT-5上线最后冲刺
36氪· 2025-08-01 10:05
GPT-5技术进展 - GPT-5-Alpha已由Cursor团队内部测试,表现惊艳,几乎能一次性完成任何任务[1][3] - 在macOS ChatGPT应用中发现了GPT-5-Auto和GPT-5-Reasoning模型,路径为`~/Library/Caches/com.openai.chat/fsCachedData`[5][7][8] - GPT-5可能包含o系列模型,网友从"reasoning"字眼推测其已具备高级推理能力[9] 合作伙伴准备情况 - Perplexity已完成网站上的GPT-5发布准备工作,Pro用户将能立即使用[10] - 微软工程师正在为Copilot集成GPT-5做准备,包括消费者版和企业版[12][17][19] - Windows 11 Copilot将推出基于GPT-5的智能模式,可根据查询自动切换推理/非推理模式[17][22] 技术特性与行业影响 - GPT-5将采用智能路由技术,可能已开始逐步推出[15] - 微软计划在AI套件中全面部署GPT-5,覆盖Copilot、Microsoft 365 Copilot和Azure三大平台[17][18] - OpenAI研究员认为GPT-5的压缩能力(文本理解与总结)已达到智能标准,展示了理解力和创造力[31][38][46] 商业模式创新 - GPT-5将打破付费墙限制,Windows 11 Copilot免费版也将搭载其智能模式[17] - AI产品已形成自我改进循环,ChatGPT每日数亿用户、数百万付费用户为AGI研究提供持续资金[55] - 技术商业化路径明确,通过微软生态(消费者/企业/API)实现大规模落地[17][22]
VLA-OS:NUS邵林团队探究机器人VLA做任务推理的秘密
机器之心· 2025-07-31 13:11
机器人VLA模型研究突破 - 新加坡国立大学邵林团队发表突破性研究VLA-OS,首次系统解构和分析机器人VLA模型的任务规划与推理能力 [3] - 研究通过控制变量实验方法,专注于任务规划的"范式"和"表征"两大方面,统一其他因素 [19] - 研究提出五大核心问题,包括规划表征选择、范式选择、性能瓶颈、scaling law和规划带来的提升 [21] VLA-OS实验平台设计 - 构建架构统一、参数递增的VLM模型家族,选取Qwen 2.5 LLM的0.5B/1.5B/3B/7B四个模型作为基座 [23] - 设计可组合的VLA-OS模型家族,实现ActionOnly-VLA、Integrated-VLA和Hierarchical-VLA三大范式的公平对比 [25][26] - 收集整理六类数据集共约10,000条轨迹,覆盖多种视觉模态、操作环境和执行器种类 [28][29] 关键研究发现 - 视觉规划表征和目标图像表征相比语言表征具有更优性能、更快推理速度和更低训练成本 [46][47] - Hierarchical-VLA范式展现出最强泛化能力和规划能力,优于Integrated-VLA [49][57][63] - 所有VLA范式性能随数据量增加而提升,但模型规模超过3B时性能下降 [72][75] - 含任务规划的VLA范式前向迁移能力更强但遗忘速度更快 [76][79] 设计指南与未来方向 - 首选视觉表征和目标图像规划,语言规划仅作为辅助 [81] - 资源充足选Hierarchical-VLA,资源有限选Integrated-VLA [81] - 未来方向包括探索空间表征神经机制、设计解耦训练机制、开发高效VLM信息蒸馏架构和构建万亿级规划数据集 [86]
直击CJ|AI赋能下的高效工作模式!三七互娱王传鹏:让思考者做选择,让梦想家去创造
新浪科技· 2025-07-31 12:52
公司AI战略 - AI战略涵盖文化 组织 人才 能力 投资六个方面 [1] - 自研游戏行业大模型"小七大模型"对数字化能力进行重构 [3] - AGI发展路径包含自然语言 视觉语言 编程语言三个技术方向 [3] 行业应用前景 - AI可打通游戏开发全流程包括方案策划 创意来源 创意制作 版权检测 [3] - 实现AI全流程覆盖赋能行业高效工作模式 [3] - 技术应用目标为思考者做选择 梦想家去创造的工作范式 [3] 行业活动 - 第二十二届ChinaJoy于8月1日至4日在上海新国际博览中心举办 [1] - 公司技术中心数据副总裁在CDEC高峰论坛发表AI战略演讲 [1]
扎克伯格:个人超级智能很快降临,眼镜是AI理想终端
虎嗅· 2025-07-31 10:03
借势超出市场预期的强劲季报,加上巨资刚刚组建的AI"梦之队",扎克伯格高调宣布了Meta最新的AI 战略:个人超级智能。 扎克伯格坚持AI眼镜至少与手机同样重要。他在分析师会上表示:"我仍然认为,眼镜基本上是人工智 能的理想形态,因为你可以让人工智能看到你一整天看到的东西,听到你听到的东西,并与你对 话,"他认为,一旦在眼镜上装上显示器,可以全天与人工智能系统互动。 他在视频中说:"在过去的几个月里,我们开始隐约看到一个重大转折的端倪——我们的AI系统,已经 在尝试改进自身。这种进步尚属初级,速度也不快,但其趋势已无法否认。超级智能的诞生,如今已近 在眼前。" 扎克伯格的讲话,传出三个最重要的信息: 首先,Meta将对开源做出重大调整。扎克伯格称这是出于缓解超级智能风险的考虑,将会"非常小心选 择开源的范围"。 其次,超级智能将拥有超级个人终端,即AI眼镜或者头显,它们甚至将像手机一样,成为个人计算主 平台。 最后,他公开反对奥特曼等人的AGI主张,未来的社会将是由掌握了超级智能的个人组成,而不是像 OpenAI所主张的那样,AGI凌驾于社会,然后向个人发放"全民基本工资"的福利。 个人超级智能将贯穿于Met ...
丰田上半年销量超过554万辆,时隔3年再创新高;零跑B01车型第1万台整车量产下线丨汽车交通日报
创业邦· 2025-07-30 18:10
德国车企业绩下滑 - 梅赛德斯-奔驰2025年上半年销售收入726亿欧元同比减少8.6% 税后净利润27亿欧元同比大幅降低55.8% [1] - 奥迪2025年上半年税后利润13.46亿欧元同比下降37.5% 美国关税导致损失约6亿欧元 全球汽车交付量同比下降约6% [2] - 美国关税政策导致德国三家主要汽车制造商今年现金流或将减少100亿欧元 [2] 中国新能源汽车发展 - 零跑B01纯电轿车第10000台整车量产下线 该车型售价8.98万至11.98万元 [3] 日本车企表现 - 丰田汽车2025年上半年全球销量5,544,880辆同比增长7.4% 预计将超过大众的441万辆 连续6年位居全球首位 [4]