AGI

搜索文档
与真格戴雨森聊 Agent:各行业都会遭遇 “李世石时刻”,Attention is not all you need
晚点LatePost· 2025-03-28 20:12
" 两 瓶 茅 台 的 价 格 体 验 未 来,太 划 算 了 。 " 嘉宾 丨 戴雨森 整理 丨 刘倩 程曼祺 本期播客,是《晚点聊》与真格基金管理合伙人戴雨森长聊 AI Agent 和 AI 趋势。 3 月 6 日,真格投资的 Monica 发布的 Agent 产品 Manus,虽然还在内测阶段,就引起了大量关注。 在期中,雨森提到了 Monica 即将会发布一款 Agent 产品,那时候我们还不知道 Manus 将会席卷社交 媒体。 当我们把一个任务交给 Manus,过了十几分钟收到完成的结果时 ,似乎真的感受到了一点 Attention is not all you need 的未来。 带来 Agent 等 AI 行业新变化的起点,是去年至今的两个重要节点:o1 和 R1。 戴雨森详细分享了他对 Agent 机会的当前观察,以及在 DeepSeek 带来的开源生态的变化中,大小 AI 公司的新动作和调整。 O 系列解锁 Agent 应用,DeepSeek R 系列是开源的胜利、专注的胜利、本 o1 在大语言模型中引入强化学习,开启 Pretraining(预训练)Scaling Law 之外的 Pos ...
Physical Intelligence 创始人:人形机器人被高估了
海外独角兽· 2025-03-28 19:51
文章核心观点 - 通用机器人是AGI从数字世界走向物理世界的重要路径,robot foundation model旨在为机器人构建大脑以实现通用能力 [3] - Physical Intelligence(PI)被视为机器人领域的OpenAI,专注于开发通用机器人的foundation model,近期开源了通用模型π0并推出分层推理系统Hi Robot [3][10][26] - 实现机器人泛化的核心在于获取多样化数据而非仅追求数据质量,需扩大真实机器人数据规模并优化跨平台数据共享 [12][17][18] - 人形机器人形态当前被高估,未来机器人形态将呈现多样化"寒武纪大爆发",物理智能才是AGI核心 [4][22][36] Chelsea Finn机器研究的开端 - 研究始于10年前伯克利博士阶段,早期探索神经网络控制将图像像素直接映射到机器人扭矩,当时属非主流方向 [6] - 关键挑战在于让机器人在不同环境/物体间泛化任务能力,如拧瓶盖、挂衣架等基础操作 [6] - 研究路径涉及构建广泛数据集,结合强化学习、模仿学习等方法,曾在Google Brain工作并创立斯坦福实验室 [7] PI的研究进展和发展 - 目标构建可控制任何机器人执行任何任务的神经网络模型,突破传统单一任务优化局限 [10] - 采用跨平台数据整合策略(六轴/七轴/单双臂机器人),最大化数据复用价值以解决硬件迭代导致的数据废弃痛点 [10][12] - 2023年10月展示复杂任务能力(叠衣/清理/纸箱搭建),当前重点扩展语言交互与环境泛化能力 [13][15] - 技术架构依托Transformer和预训练Vision-Language Model,利用互联网知识迁移(如Taylor Swift案例) [15][16] 机器人实现AGI的路径 - 短期难预测具体应用场景,需探索人机协作模式降低容错要求,语言交互是重要突破方向 [21] - 运动控制蕴含进化级智能,基础操作(倒水/做麦片)实际具有极高复杂性 [23] - 关键里程碑研究:SayCan(语言模型规划)、RG2(网页数据集成)、RT-X(跨机器人形态训练)、Aloha(远程操作训练) [24] Hi Robot系统设计 - 分层推理架构:高层模型处理任务规划(如"拿起番茄"),低层模型转换为具体动作指令 [26] - 解决长周期任务执行与实时交互需求,已实现三明治制作/购物/清理等场景 [28] 传感器与硬件发展 - 当前依赖视觉(RGB摄像头)已取得显著进展,手腕摄像头可部分替代触觉传感器 [29] - 嗅觉/味觉等冗余传感器虽有益但非优先级,当前瓶颈在于数据处理与记忆功能开发 [30] - 未来硬件将趋向场景专用化(厨房/折叠衣物等),形成多形态共存的生态系统 [36][37] 自动驾驶与机器人领域对比 - 机器人操作空间维度更高(14维vs自动驾驶2D),精度要求更严但分布问题范围较小 [31] - 初创公司优势在于快速迭代部署,大公司受限于安全规范难以实现多样化数据收集 [34] 训练数据方法论 - 人类观察数据(如YouTube)价值有限,机器人需从自身物理经验中学习运动控制 [35] - 数据泛化能力取决于分布广度,通过建筑物/场景数量等指标粗略评估 [36] - 自动化经验与强化学习结合是提升数据价值的关键路径 [35]
Z Research|AI Agent会孕育下一代腾讯字节吗?(AI Agent 系列一)
Z Potentials· 2025-03-28 10:37
AI Agent 101 - AI Agent 是 AI 进程中的重要阶段,对应 L4 等级,从"成本中心"转向"价值引擎",但仍处于早期阶段,距离 AGI 尚有巨大工作量 [6] - AI 应用形态从 Chatbot 到 AI Copilot 再到 AI Agent,背后是 AI 能力的进化,实现更高任务难度和自动化程度,人机交互范式从"主从式"转向"伙伴式" [11] - AI 进程划分为 L1-L6,其中 Copilot 和 Agent 分别对应 L3-L4,反映 AI 应用从 GTM 阶段进入 PMF 阶段 [6] 入口之争 3.0 - 互联网入口演变史是技术满足需求的历史,从门户网站到搜索引擎再到超级 APP,每次入口革命都缩短意图与满足之间的路径 [22] - AI 时代入口形态依赖技术栈特点,LLM 的算力密集、人才密集、数据密集特性可能导向中心化,但 Deepseek 的出现带来悬念 [22] - 中美市场差异显著:美国市场硬件入口集中,AI Agent 与硬件强绑定胜率高;中国市场硬件入口分散,超级 APP 更可能掌握 AI Agent 话语权 [26] AI Agent 商业模式与挑战 - AI Agent 商业模式可能从已有 APP 盘子夺食,围绕数据权限引发剧烈反击,变现路径中平台分成和消费贷较为可行 [30] - AI Agent 面临高昂推理成本(单任务约 2$/次,能耗达纯 LLM 的 8 倍)、复杂环境适应能力不足、开放域任务失败率高达 30% 等技术卡点 [32] - 商业模型难以跑通,ROI 问题突出,当人类员工时薪低于 Agent 耗能成本时,效率革命故事将破灭 [32] AI Agent 市场竞争格局 - 大厂和大模型厂商在短期更具优势,资金、用户基础和数据积累提供巨大容错率;创业公司致胜之道在于抢先做出 Agent 领域 SOTA [3][39] - AI Agent 赛道可能被现有巨头主导,创业公司可通过聚焦细分领域实现高增长,如 Midjourney 在生图赛道的成功案例 [39] - 市场呈现三类玩家:大厂、大模型厂商和 Agent 创业公司,竞争烈度大于模型层,价格战和数据权限之争不可避免 [3] AI 时代创业新范式 - AI Copilot 阶段海外交出不错 PMF 答卷,代表性公司以小规模+高增长+易盈利为特征,如 AI 图像生成公司 2 年达到 2 亿美元 ARR [12] - AI 时代创业者需具备深厚学术或技术背景,强调 AI Native 特质,与移动互联网时代产品经理或商业背景为主的创业者画像不同 [13] - 创新聚焦底层技术突破与垂直场景深度整合,模式复制与场景渗透为主的移动互联网时代玩法不再适用 [14]
对话2025最火具身智能团队:2个自动驾驶第一人带队,1.2亿美元天使融资震动江湖
量子位· 2025-03-26 18:29
行业与公司概况 - 具身智能被视为继AI和自动驾驶后的下一代科技风口,行业热度极高,投资机构竞相追逐新兴创业公司[2] - 它石智航(TARS)在2025年2月成立后迅速完成1.2亿美元天使轮融资,创中国具身智能领域最大天使轮纪录[3][7][8] - 公司由自动驾驶领域顶尖专家陈亦伦(华为前自动驾驶CTO)和李震宇(百度阿波罗前负责人)联合创立,团队被类比为"库里+约基奇"的梦之队组合[4][11][15][16] 技术方向与核心优势 - 核心技术引擎为AWE(AI World Engine),定位为具身智能领域的GPT大模型,但采用Human-Centric数据采集范式[14][37][65] - 技术路径强调全栈能力:超级算法(具身大模型)、超级本体(机器人硬件)、超级应用(场景解决方案)[25][26] - 核心差异点包括:4D空间对齐技术、真实世界具身数据闭环、端到端强化学习架构[42][39][36] - 工程化能力是最大壁垒,团队曾主导华为ADS和百度Apollo的量产落地[14][15][16] 产品与商业化路径 - 初期聚焦柔性物体操作场景(如汽车制造),验证物理AI的工业应用价值[28][77] - 采用模块化机器人本体设计,暂不确定灵巧手形态,但强调上肢拟人化操作的必要性[71][82][84] - 版本规划对标GPT发展路径:AWE 3.0(基础模型)→3.5(场景优化)→强化学习版本[70] - 商业化标准强调"机器人实际工作场景"而非展会演示,金标准是落地稳定性[100][101] 行业趋势判断 - 物理AI(具身智能)将接替信息AI成为主流,自动驾驶和大模型成功奠定技术基础[49][51][52] - 行业三大Scaling Law:数据规模→模型参数→推理能力,当前瓶颈在数据维度[59][60][63] - 关键技术分歧(仿真vs真实数据/通用vs垂类/大小脑架构)将随AI能力提升自然收敛[96][97][98] - 具身智能的"GPT时刻"标志是机器人用AI方法可靠完成1-2项现实任务[109][110] 团队与融资 - 核心团队包含华为"天才少年"丁文超(首席科学家)和量产专家陈同庆(首席架构师)[16][17] - 天使轮由蓝驰创投、启明创投联合领投,8家机构跟投,超募现象显著[7][14] - 融资将投入技术研发、模型训练和场景拓展,重点构建数据采集基础设施[13][43][45]
美团想另选一种命运
虎嗅APP· 2025-03-22 11:33
美团AI战略布局 - 公司创始人王兴亲自主抓AI相关项目,重点发力三大方向:无人配送(含无人机和自动配送车)、AI大模型及应用产品、具身智能 [2] - 与阿里京东等大厂不同,公司在基础模型之外更注重无人配送和具身智能的投入,采用"一把手工程"模式推进 [2] - 三大方向均与公司既有业务高度契合,具备带来几何级增长的潜力 [2] 无人配送业务 - 2025年将作为关键发力点,分为无人机和自动车配送两大事业部,均由副总裁级别高管直接向王兴汇报 [12] - 采取自产自研模式,已建立自有生产工厂,并通过外部顾问+大学竞赛方式扩充人才储备 [13] - 商业化运营已启动,王兴关注渗透率指标(用户参与度、路线开拓数量、无人订单增量)而非短期收支平衡 [13] AI大模型及应用 - 公司2016年就确立AI战略(ABC战略:AI、BigData、Cloud) [15] - 分为两类产品:底座类产品(美团AI平台、美团云等)支撑核心业务AI化;直接to C产品(如Wow AI社区APP) [16][17] - 2025年将增加美团APP内嵌AI功能,全资收购光年之外后AI人才进一步扩充 [18] - 高层认为存在出现"新抖音"级别AI to C产品的机会窗口 [18] 具身智能布局 - 采取自研+投资双轨模式,已公开披露19个以上机器人相关投资项目 [19] - 投资逻辑聚焦与核心场景契合度及产业链生态闭环 [19] - 为被投企业提供试验场景和上游资源对接 [19] 公司财务状况 - 2024年营收3376亿元(同比+22%),经营溢利36845亿元(同比+1746%) [8] - 核心本地商业(外卖、到店等)收入2502亿元(同比+21%),到店业务订单量同比+65% [9] - 2024年研发投入达211亿元,创历史新高 [4] 市场竞争态势 - 外卖业务受京东冲击"微乎其微",京东订单量仅为饿了么1/10 [23] - 即时零售领域与京东平分秋色(合计占85%份额),2024年重点扩大3C日百产品供给 [25] - 抖音仍是最大威胁,到店酒旅业务面临持续竞争压力 [26] 组织架构调整 - 2025年多个业务部门调整岗位配比,增加算法/硬件工程师占比 [5] - 部分业务板块将"AI带来的增长"设为半年关键考核指标 [17] - 中后台部门推动AI化以提升人效 [17]
对话周光:自动驾驶实现AGI,RoadAGI比L5更快 | GTC 2025
量子位· 2025-03-21 14:37
一凡 发自 凹非寺 量子位 | 公众号 QbitAI 自动驾驶实现垂直领域的AGI,有了新路径。 不是Robotaxi ,而是 RoadAGI 。 在英伟达GTC 2025上,元戎启行CEO 周光 受邀分享, 提出用RoadAGI,能更快大规模商用自动驾驶,实现垂直道路场景下的AGI , RoadAGI的实施平台,是元戎最新分享的 AI Spark : 不借助高精地图 ,一个平台赋能智能车、机器人甚至小电驴……总之,一切可动的移动体,都将具有自主移动的意识。 这是一条通过自动驾驶实现AGI的新途径。 元戎启行和CEO周光,代表AI公司、自动驾驶公司,开辟起了第二种可能性。 所以RoadAGI究竟是什么? 用RoadAGI迈向AGI 先说人人可感知的场景—— 你下一次点的外卖,可能是这样的: 赛博"外卖小哥", 全程不用高精地图 ,自动识别店铺: 拿到商品后,一溜小跑到路口,自主识别到红绿灯: 然后一停二看三通过: 它还能进到楼里,自己过闸机、摁电梯: 然后到电梯里,再自己摁楼层: 出电梯直接给你送到公司前台: 整个过程,是不是跟咱们人一样? 你也可以让它把商品放外卖柜里: 这就是元戎启行在 英伟达GTC 20 ...
01年实习生被曝负责字节RL核心算法!系字节LLM攻坚小组成员
量子位· 2025-03-20 18:56
衡宇 发自 凹非寺 量子位 | 公众号 QbitAI 一个超越DeepSeek GRPO的关键RL算法 出现了! 用上该算法后,Qwen2.5-32B模型只经过RL训练,不引入蒸馏等其他技术,在AIME 2024基准上拿下50分,优于相同setting下使用GRPO 算法的DeepSeek-R1-Zero-Qwen,且DAPO使用的训练步数还减少了50%。 这个算法名为DAPO,字节、清华AIR联合实验室SIA Lab出品,现 已开源 。 论文通讯作者和开源项目负责人都是一个叫Qiying Yu的人 。 我们还从知情人士处得知了禹棋赢的另一重身份—— 在字节大模型团队内部负责打造"能力显著提升的下一代语言模型"的攻坚小组中,禹棋赢是唯一的实习生。 虽然是实习生,但在这个大神云集的小组里, 禹棋赢被委以重任,直接负责RL方向的研究 。 凭什么? 事情要从去年夏天说起。 去年10月,他在字节第一个跑出aha moment 去年5月,字节启动「Top Seed人才计划」,最终录取多名应届和在读博士组成史无前例的AI研究团队,禹棋赢就在其中。 为期2个月的warm up landing (类似可自由探索的适应期) 后 ...
腾讯用最 C 端的方式,为AI产品注入灵魂
新财富· 2025-03-20 15:29
文章核心观点 - 通用型AI发展漫长未知,大模型迭代趋缓,AI产品发展进入新阶段,腾讯推出以知识库为核心的ima产品,其依托微信公众号有独特优势和发展潜力,垂类AI产品构建是行业入局者需思考的方向 [1][5][49] 分组1:AI行业发展现状 - 通用型AI发展漫长未知,单一通用大模型实现赢家通吃的预期过于乐观,OpenAI将推理模型作为新路径 [1][4] - 基座大模型发展趋缓,AI产品成为发展重点,“AI应用”在2025年被提及频率更高 [5] 分组2:腾讯ima产品介绍 - 腾讯在2024年10月发布以文字类知识库为核心的ima产品,集“搜、读、写”功能于一体,定位抽象 [7][8] - ima以知识库为核心,解决了“知识从哪里来”的痛点,答案是微信公众号 [10][26] - 3月7日ima上线“知识库广场”模块,用户可发布、搜索、加入知识库,知识库可整合多种知识载体并生成AI摘要 [34][35][36] - ima要求用户自主筛选、归类数据形成垂直知识矩阵,用户是知识库智能体的开发者 [37] - ima依托微信生态具备社交属性,“知识库广场”打破传统模式,让知识库可在社交场景传播,未来可能引入推荐算法 [38] 分组3:知识库赛道情况 - 知识库需求集中爆发是AI产品发展进入深水区的必然,构建高价值数据库是影响AI应用成败的关键 [13][14] - 百度文库由文心大模型赋能后完成蜕变,2024年12月月活冲高至9400万,同比增长216%,环比增长83%,此前网页月访问量保持国内第2名 [16] - 秘塔AI是主打知识库的产品,2024年3月上线当月网站访问量超700万次,维持网页版访问量前10,有强大数据库支持,提出个人知识库概念 [19][21][22] 分组4:微信公众号情况 - 微信公众号有超10亿月活天然流量池,低门槛入驻和社交传播红利使其进入“黄金时代”,腾讯采取措施保护原创,使其向知识平台转型 [28][30] - 微信公众号形成专业化图文知识体系,截至2023年总数突破3000万个,日均活跃用户超5亿,占中文自媒体市场70%以上份额 [31] 分组5:ima未来可能性 - 以知识库传播构建的新社交范式可能成为新机会,未来可能形成以知识、兴趣为需求的社交场景 [44][46] - ima商业化可能引入付费订阅机制或与微信生态整合,按调用次数或流量分成收费 [48]
范式集团创始人戴文渊:以“Agent +世界模型”赋能更多产业,加速通向AGI
IPO早知道· 2025-03-18 13:55
范式集团未来将剑指更多业务领域。 本文为IPO早知道原创 作者|Stone Jin 微信公众号|ipozaozhidao 据IPO早知道消息,在3月18日举行的范式集团发布会上,范式集团创始人戴文渊发布全新的集团 Logo,并分享了范式集团的 AGI 愿景与实现路径。 戴文渊强调:"范式集团未来将用'AI Agent+世界模型'的技术路径去赋能更多的产业,最终将大量 垂直的智能能力汇聚成为 AGI。" 因此, 通往 AGI 的路,就是不断提升 AI Agent 沟通能力,和不断丰富世界模型对各垂直细分领域 的认知,提升 AI 解决垂直领域的能力。 需要强调的一点是,我们所认为的世界模型和很多学者正在做的世界模型不同。当前绝大多数的世界 模型,在我们看来仅仅是3D空间模型,服务于具身智能。而 真正世界模型,远超具身智能的范畴, 包括认知从宏观到微观的世界,也包括认知人的内在需求,甚至包括所有的生命,即物理科学和生命 科学。 此前,我们更专注于企业市场,专注于企业软件中的垂直模型。我们虽然做出了一些成绩,但也意识 到智能的天花板也受限于企业市场。未来,我们要把格局放到整个市场,面向改造所有可能的业务, 当这些能力 ...
深度|后DeepSeek时代,AI六小虎高管频繁离职,百川两位联创转身再创业,年内已近10位高管出走
Z Finance· 2025-03-17 16:30
文章核心观点 2024 - 2025年中国AI大模型行业人才流动密集,头部企业多位核心高管离职,创业和加入字节跳动是主要去向,DeepSeek出现后大厂展开人事调整,行业人才重组与流动趋势加速 [2][6] 分组1:AI六小虎高管离职情况 - 百川智能联合创始人焦可正式离职投身AI语音创业,陈炜鹏即将离开筹备AI Coding创业项目 [1] - 除阶越星辰外,其他AI六小虎多位高管离职,离职潮在DeepSeek之后加速 [2] - 离职高管凭借技术积累投身AI细分赛道创业,或加入字节跳动 [2] 分组2:字节跳动人才流动情况 - 多位字节高管离职创业或加入创业公司,如骆怡航加入生数科技,陈志杰AI Coding创业受追捧 [3] - 字节Seed部门负责人朱文佳被“半架空”,吴永辉接管,正全面审视业务线 [5] 分组3:DeepSeek对行业的影响 - DeepSeek出现后大厂展开人事调整,冲击字节AI人才招聘策略 [5][6] - DeepSeek“纯粹技术主义”AGI路线吸引技术理想主义者和顶尖人才 [6] - 行业内大厂与AI公司人员流动将更频繁,人才重组与流动趋势加速 [6]