AGI
搜索文档
速递|前OpenAI团队操刀,Nova Act浏览器AI助手,测试得分超竞品OpenAI
Z Potentials· 2025-04-01 11:49
亚马逊Nova Act AI Agent发布 - 亚马逊发布通用AI Agent技术Nova Act 旨在与OpenAI Operator和Anthropic Computer Use竞争 通过控制网页浏览器执行简单操作提升AI聊天机器人实用性 [1] - Nova Act由亚马逊AGI实验室开发 将集成至Alexa+升级版本 目前提供研究预览版 开发者可通过nova.amazon.com访问SDK工具包构建原型 [2] - 功能覆盖自动订餐、网页浏览、表单填写等基础操作 亚马逊称其内部测试表现优于OpenAI CUA(88%)和Anthropic Claude 3.7 Sonnet(90%) 在ScreenSpot Web Text测试中得分94% [3][4] 技术细节与团队背景 - Nova Act未采用WebVoyager等常见AI Agent评估标准 但通过SDK允许开发者定义工作流中的人类干预节点 以提高应用可靠性 [5][6] - 开发团队由前OpenAI研究员David Luan和Pieter Abbeel领导 二人曾创立Adept与Covariant 被亚马逊挖角后主导AI Agent项目 目标为实现"计算机上人类可完成的任何任务" [6] 市场竞争与行业意义 - 亚马逊凭借Alexa+的广泛用户基础 可能实现AI Agent技术最大覆盖范围 但需解决早期竞品(如OpenAI/谷歌/Anthropic)存在的响应延迟、操作失误等问题 [7] - Nova Act作为AGI实验室首款公开产品 被视为亚马逊AI战略关键 其表现将影响长期延迟的Alexa+市场反响 [7] (注:文档id 8-13为无关招聘信息 已跳过)
字节 AI 再创业:独立组织、全链条的饱和出击
晚点LatePost· 2025-03-31 19:58
字节跳动AI战略布局 - 公司面对AI机遇采取饱和式投入策略,至少5个团队同时开发不同智能体产品,包括对内工具[3] - 2023年年中决定自主开发AI后,公司在算力芯片层、云计算层、模型研发层、应用层实现全链条布局[3] - 产品矩阵覆盖聊天机器人、AI搜索、AI浏览器、Agent平台、AI陪伴社交、AI教育等主流方向,主力产品豆包在2024年底成为中国日活最多AI应用[4] - 2025年设定三大目标:探索智能上限、探索新UI交互形式、加强规模效应,由Flow/Seed/Stone三大板块近2500人团队支撑[17] 技术研发进展 - 模型迭代速度显著提升,2023年8月至2025年5月共发布12个版本,涵盖对话/视频生成/音乐/视觉理解等多领域[10] - 2025年1月发布豆包大模型1.5 Pro版本,多模态与推理能力全面提升[10] - 组建独立模型研发团队Seed,整合原有AI Lab资源,40%研究人员为近两年新增[15] - 引入Google Fellow吴永辉等顶尖人才,设立Seed Edge前沿研究计划瞄准AGI探索[21] 市场竞争态势 - 主力产品豆包被腾讯接入DeepSeek的元宝快速追赶,后者用十分之一时间达到豆包20%用户规模[5] - 错过中国ChatGPT时刻,因内部对复现OpenAI o1模型存在时间误判[10] - 面临DeepSeek开源模型冲击,该团队不足200人却实现技术突破[4][13] - 豆包2025年DAU目标超5000万,季度增长目标从30%调高至150%[22] 组织架构创新 - 建立独立AI组织Flow/Seed,与抖音/TikTok等业务平级,直接向创始人汇报[15] - 打破原有薪酬考核体系,为AI团队提供百万年薪及5年长周期评估机制[15] - 创始人张一鸣深度参与技术研究,每月召集核心团队复盘进展[16] - 采用"能力中台"模式,将模型能力模块化供产品团队调用[21] 资源投入规模 - 2023年GPU储备超10万张,上半年英伟达订单超10亿美元[22] - 2025年AI算力采购预算达900亿元人民币,优先保障大模型研发[22] - 通过收购补充技术能力,包括Oladance耳机品牌及存算一体硬件公司[15] - 调动全集团资源支持,曾阶段性限制非AI产品在抖音体系的广告投放[22]
智谱发布AutoGLM沉思版,背后推理模型媲美DeepSeek-R1:推动AI Agent进入「边想边干」阶段
IPO早知道· 2025-03-31 12:07
核心观点 - 智谱正式发布全球首个集深度研究与实际操作能力于一体的AI Agent AutoGLM沉思,推动AI进入"边想边干"阶段 [3][5][6] - AutoGLM沉思融合深度思考、感知世界和工具使用三大能力,突破传统AI局限,实现长程推理和任务执行 [7][8][9] - 智谱在AI Agent领域持续创新,从Function Call到智能体编排再到设备操控智能体,保持技术领先 [6] - 公司自主研发全栈大模型技术,包括基座模型、推理模型和沉思模型,将于4月14日开源 [13][14][28] 技术演进 - 技术路径:GLM-4基座模型→GLM-Z1推理模型→GLM-Z1-Rumination沉思模型→AutoGLM模型 [3] - 新版基座模型GLM-4-Air-0414:320亿参数,优化智能体任务能力,32B参数量比肩更大模型 [15] - 新版推理模型GLM-Z1-Air:深度优化通用能力,推理速度提升8倍,成本降低至1/30,可在消费级显卡运行 [17][19][21] - 沉思模型GLM-Z1-Rumination:通过强化学习提升长程推理能力,结合实时搜索、工具调用和深度分析 [24][26] 性能表现 - AutoGLM系列在AgentBench评测中取得SOTA成绩,Phone Use任务成功率提升超20%,Browser Use超越GPT-4o和Claude-3.5-Sonnet [10] - 自研模型GLM-PC(CogAgent)仅9B参数即超越GPT-4o + UGround等更大规模模型 [12] - GLM-Z1-Air在AIME 24/25、LiveCodeBench等基准测试展现强大数理推理能力 [17] 生态布局 - 战略聚焦Agentic GLM研发,推动智能体技术发展,搭建Agentic LLM平台助力生态合作伙伴 [31] - 已携手金融、教育、医疗、政务等领域合作伙伴推进Agentic LLM落地应用 [33][34] - 与多个城市达成合作,推动当地大模型应用生态建设 [34] - 推动中国AI解决方案出海,帮助"一带一路"国家构建自主大模型,发起"自主大模型国际共建联盟" [35]
世界怎么就「东升西落」了?聊聊二级市场与 DeepSeek+Manus 的热潮 | 42章经
42章经· 2025-03-30 22:25
东升西落叙事 - 美国市场从24年开始因AI领先和美元强势吸引全球投资,但Trump上台后政策调整引发宏观不确定性,导致股市剧烈震荡[2][3] - 中国市场24年股价开始回升,今年因DeepSeek发布彻底引爆,反映此前对科技行业预期过低的价值回归[5][6] - 中美AI发展路径差异显著:美国专注scaling law和AGI,中国聚焦应用落地和成本优化[8][9] 中美AI发展差异 - 美国AI发展路径依赖高成本投入(算力/数据),但模型能力提升不及预期[9] - DeepSeek通过工程优化大幅降低成本,实现更好性能输出,打破高成本叙事[9] - 中国AI应用注重覆盖更广泛用户群体,如Manus团队专注让未接触AI人群使用产品[10][11] 标志性产品分析 - DeepSeek开源模型使腾讯等公司跳过模型军备竞赛阶段,直接进入应用开发[26] - Manus采用脉冲式增长策略,通过Prosumer群体快速传播,但被误读为OpenAI对标对象[12][15] - Cursor等产品以极低市场成本实现高ARR收入,展示中国AI商业化路径优势[12] 二级市场表现 - 美国市场因前期AGI预期过高,当前面临预期调整;中国市场预期正从0开始填平[19][20] - 阿里云宣布增加AI Capex后股价上涨,反映市场对国内AI预期转向乐观[23] - 国内互联网公司从价值股重新获得成长股属性,AI推动估值逻辑变化[24] 产业趋势分析 - 推理芯片领域国内呈现"百卡齐放"局面,寒武纪等公司股价表现亮眼[28] - 专精特新企业通过技术突破和出海确立行业领先地位,如宁德时代[34] - AI推动产业趋势明确,但对中国资产重要性仍低于美国,需关注消费等宏观指标[35] 市场波动特征 - 板块轮动速度加快,信息传播和处理效率提升导致市场共识形成更快[37] - 高波动环境下企业经营策略可能转向蹭热点和讲故事[38] - 从业者对产业判断更精准,如云厂商CXO提前布局光模块投资[44] 投资机会展望 - 模型产业链价值、原生应用发展和垂直行业应用构成三大关注方向[43] - 生物医药、航空航天等非AI领域同样存在结构性机会[43] - 二级市场投资技巧可学习,但全职炒股可能导致认知密度下降[46]
具身智能并不万能,人类的护城河在哪里 | 周末读书
虎嗅APP· 2025-03-29 17:59
具身智能行业现状与趋势 - 金沙江创投朱啸虎近期批量退出人形机器人公司投资 与当前该领域投融资火爆现象形成逆向操作 引发市场对具身智能赛道前景的争议 [1] - 短期视角下具身智能面临商业化落地难题 需等待范式革命突破 长期视角则被普遍看好 可能引发社会全方位变革 [1] - 具身智能被认为是实现AGI(通用人工智能)的关键路径 其潜在影响力远超当前生成式AI 可能彻底重塑人类社会的生产模式和价值体系 [1][5] 技术发展路径与瓶颈 - 人工智能发展存在"离身智能"与"具身智能"两大范式 前者如ChatGPT缺乏物理身体 后者通过身体与环境互动实现进化 [4][5] - 具身智能的核心优势在于通过物理身体获取环境反馈 形成类似人类的感知与常识 当前AI系统因缺乏身体导致泛化能力不足 例如需海量数据训练特定任务 [5][6] - 技术瓶颈体现在意识形成机制 现有AI在情感 直觉和协调性方面甚至不及人类儿童 商业化应用仍面临巨大挑战 [8][9] 行业应用前景 - 制造业 医疗诊断 法律咨询和金融交易等领域将优先实现机器人替代 但情感伦理 创新探索等领域仍将保持人类优势 [9] - 美国农业机械化历史表明 技术替代可能创造新职业形态 而非单纯消灭工作岗位 未来劳动分配方案可能向按需分配演进 [8][9] - 当前人形机器人行业面临客户需求不明确的商业化困境 投资人开始重新评估短期回报预期 [8] 技术发展历史 - 人工智能思想源头可追溯至1950年图灵提出的"机器思考"命题 具身智能概念由其首次系统阐述 [4] - 从离身智能到具身智能的范式演进是AI发展主线 身体介入成为突破现有AI局限性的关键变量 [4][5] - 人类通过数百万年进化形成的身体互动机制 是当前AI难以快速复制的核心壁垒 [6]
与真格戴雨森聊 Agent:各行业都会遭遇 “李世石时刻”,Attention is not all you need
晚点LatePost· 2025-03-28 20:12
AI技术突破与行业影响 - OpenAI的o1系列模型通过强化学习大幅提升模型推理能力,o3在GPQA测试中达到70多分,超越人类博士生水平[5][6] - DeepSeek R1开源模型以极低成本实现推理能力突破,引发全民讨论,其技术报告揭示强化学习路径的有效性[5][6] - o4-mini推理时间达数小时级别,模型能力提升呈现指数增长趋势[6] 开源生态与竞争格局 - DeepSeek开源策略促使腾讯元宝、百度文心等大厂接入其模型,微信搜索接入后DAU实现两位数增长[27][28] - 开源模型降低行业门槛,Monica等创业公司基于开源模型开发Agent产品Manus[3][20] - 闭源与开源路线并存,Kimi选择闭源但专注技术前沿,DeepSeek通过开源中立性获得生态合作优势[29][30] Agent产品形态演进 - 推理能力突破解锁Agent产品形态,包括只读型(如Deep Research)和读写型(如Operator)[9][17] - Agent核心能力包括推理、编程和工具使用,o3在SWE-Bench测试中达到70-80分,可处理70%-80%人类编程任务[10][12] - Manus展示自主工具使用能力,如调用邮件客户端与政府机构交互[18] 算力需求与芯片格局 - Agent普及将推动推理算力需求增长100-1000倍,当前ChatGPT Pro月费200美元仍亏损[33] - 英伟达GPU仍占90%以上市场份额,但国产芯片(如华为昇腾)开始针对特定模型优化[33][34] - 专用芯片(ASIC)发展取决于模型架构稳定性,若架构固化则ASIC效率优势将显现[35] 行业变革与社会影响 - AI能力超越人类的"李世石时刻"密集出现,如编程能力已超越99%人类[37] - Agent推动"Attention is not all you need"范式,实现资金向生产力的Scaling Law[13] - 技术普惠阶段尚未到来,当前仍处于精英为精英开发工具的阶段[38] 公司战略与技术路线 - DeepSeek专注模型基础能力,未跟风多模态或C端产品,团队以本土人才为主[7] - Kimi通过长文本处理与搜索结合实现差异化,近期砍掉视频生成等非核心业务[30][31] - 多模态技术当前对智能提升有限,语言仍是最高效的智能载体[22][39] 成本与商业化进展 - GPT-4 API成本较发布下降超90%,2025年预计再降90%[28] - Devin定价6-8美元/小时,低于美国加州16美元最低时薪,企业服务付费习惯促进商业化[25] - DeepSeek通过技术突破获得自然流量,数千万DAU零广告投入[7] 技术发展前沿 - 下一阶段突破需解决记忆机制(Memory)和持续学习(Online Learning)问题[18][19] - 科学发现成为新焦点,AI需具备假设生成与实验验证能力[26] - 语言模型可能超越人类语言形式,进化出更高效沟通方式[39]
Physical Intelligence 创始人:人形机器人被高估了
海外独角兽· 2025-03-28 19:51
文章核心观点 - 通用机器人是AGI从数字世界走向物理世界的重要路径,robot foundation model旨在为机器人构建大脑以实现通用能力 [3] - Physical Intelligence(PI)被视为机器人领域的OpenAI,专注于开发通用机器人的foundation model,近期开源了通用模型π0并推出分层推理系统Hi Robot [3][10][26] - 实现机器人泛化的核心在于获取多样化数据而非仅追求数据质量,需扩大真实机器人数据规模并优化跨平台数据共享 [12][17][18] - 人形机器人形态当前被高估,未来机器人形态将呈现多样化"寒武纪大爆发",物理智能才是AGI核心 [4][22][36] Chelsea Finn机器研究的开端 - 研究始于10年前伯克利博士阶段,早期探索神经网络控制将图像像素直接映射到机器人扭矩,当时属非主流方向 [6] - 关键挑战在于让机器人在不同环境/物体间泛化任务能力,如拧瓶盖、挂衣架等基础操作 [6] - 研究路径涉及构建广泛数据集,结合强化学习、模仿学习等方法,曾在Google Brain工作并创立斯坦福实验室 [7] PI的研究进展和发展 - 目标构建可控制任何机器人执行任何任务的神经网络模型,突破传统单一任务优化局限 [10] - 采用跨平台数据整合策略(六轴/七轴/单双臂机器人),最大化数据复用价值以解决硬件迭代导致的数据废弃痛点 [10][12] - 2023年10月展示复杂任务能力(叠衣/清理/纸箱搭建),当前重点扩展语言交互与环境泛化能力 [13][15] - 技术架构依托Transformer和预训练Vision-Language Model,利用互联网知识迁移(如Taylor Swift案例) [15][16] 机器人实现AGI的路径 - 短期难预测具体应用场景,需探索人机协作模式降低容错要求,语言交互是重要突破方向 [21] - 运动控制蕴含进化级智能,基础操作(倒水/做麦片)实际具有极高复杂性 [23] - 关键里程碑研究:SayCan(语言模型规划)、RG2(网页数据集成)、RT-X(跨机器人形态训练)、Aloha(远程操作训练) [24] Hi Robot系统设计 - 分层推理架构:高层模型处理任务规划(如"拿起番茄"),低层模型转换为具体动作指令 [26] - 解决长周期任务执行与实时交互需求,已实现三明治制作/购物/清理等场景 [28] 传感器与硬件发展 - 当前依赖视觉(RGB摄像头)已取得显著进展,手腕摄像头可部分替代触觉传感器 [29] - 嗅觉/味觉等冗余传感器虽有益但非优先级,当前瓶颈在于数据处理与记忆功能开发 [30] - 未来硬件将趋向场景专用化(厨房/折叠衣物等),形成多形态共存的生态系统 [36][37] 自动驾驶与机器人领域对比 - 机器人操作空间维度更高(14维vs自动驾驶2D),精度要求更严但分布问题范围较小 [31] - 初创公司优势在于快速迭代部署,大公司受限于安全规范难以实现多样化数据收集 [34] 训练数据方法论 - 人类观察数据(如YouTube)价值有限,机器人需从自身物理经验中学习运动控制 [35] - 数据泛化能力取决于分布广度,通过建筑物/场景数量等指标粗略评估 [36] - 自动化经验与强化学习结合是提升数据价值的关键路径 [35]
Z Research|AI Agent会孕育下一代腾讯字节吗?(AI Agent 系列一)
Z Potentials· 2025-03-28 10:37
AI Agent 101 - AI Agent 是 AI 进程中的重要阶段,对应 L4 等级,从"成本中心"转向"价值引擎",但仍处于早期阶段,距离 AGI 尚有巨大工作量 [6] - AI 应用形态从 Chatbot 到 AI Copilot 再到 AI Agent,背后是 AI 能力的进化,实现更高任务难度和自动化程度,人机交互范式从"主从式"转向"伙伴式" [11] - AI 进程划分为 L1-L6,其中 Copilot 和 Agent 分别对应 L3-L4,反映 AI 应用从 GTM 阶段进入 PMF 阶段 [6] 入口之争 3.0 - 互联网入口演变史是技术满足需求的历史,从门户网站到搜索引擎再到超级 APP,每次入口革命都缩短意图与满足之间的路径 [22] - AI 时代入口形态依赖技术栈特点,LLM 的算力密集、人才密集、数据密集特性可能导向中心化,但 Deepseek 的出现带来悬念 [22] - 中美市场差异显著:美国市场硬件入口集中,AI Agent 与硬件强绑定胜率高;中国市场硬件入口分散,超级 APP 更可能掌握 AI Agent 话语权 [26] AI Agent 商业模式与挑战 - AI Agent 商业模式可能从已有 APP 盘子夺食,围绕数据权限引发剧烈反击,变现路径中平台分成和消费贷较为可行 [30] - AI Agent 面临高昂推理成本(单任务约 2$/次,能耗达纯 LLM 的 8 倍)、复杂环境适应能力不足、开放域任务失败率高达 30% 等技术卡点 [32] - 商业模型难以跑通,ROI 问题突出,当人类员工时薪低于 Agent 耗能成本时,效率革命故事将破灭 [32] AI Agent 市场竞争格局 - 大厂和大模型厂商在短期更具优势,资金、用户基础和数据积累提供巨大容错率;创业公司致胜之道在于抢先做出 Agent 领域 SOTA [3][39] - AI Agent 赛道可能被现有巨头主导,创业公司可通过聚焦细分领域实现高增长,如 Midjourney 在生图赛道的成功案例 [39] - 市场呈现三类玩家:大厂、大模型厂商和 Agent 创业公司,竞争烈度大于模型层,价格战和数据权限之争不可避免 [3] AI 时代创业新范式 - AI Copilot 阶段海外交出不错 PMF 答卷,代表性公司以小规模+高增长+易盈利为特征,如 AI 图像生成公司 2 年达到 2 亿美元 ARR [12] - AI 时代创业者需具备深厚学术或技术背景,强调 AI Native 特质,与移动互联网时代产品经理或商业背景为主的创业者画像不同 [13] - 创新聚焦底层技术突破与垂直场景深度整合,模式复制与场景渗透为主的移动互联网时代玩法不再适用 [14]
对话2025最火具身智能团队:2个自动驾驶第一人带队,1.2亿美元天使融资震动江湖
量子位· 2025-03-26 18:29
行业与公司概况 - 具身智能被视为继AI和自动驾驶后的下一代科技风口,行业热度极高,投资机构竞相追逐新兴创业公司[2] - 它石智航(TARS)在2025年2月成立后迅速完成1.2亿美元天使轮融资,创中国具身智能领域最大天使轮纪录[3][7][8] - 公司由自动驾驶领域顶尖专家陈亦伦(华为前自动驾驶CTO)和李震宇(百度阿波罗前负责人)联合创立,团队被类比为"库里+约基奇"的梦之队组合[4][11][15][16] 技术方向与核心优势 - 核心技术引擎为AWE(AI World Engine),定位为具身智能领域的GPT大模型,但采用Human-Centric数据采集范式[14][37][65] - 技术路径强调全栈能力:超级算法(具身大模型)、超级本体(机器人硬件)、超级应用(场景解决方案)[25][26] - 核心差异点包括:4D空间对齐技术、真实世界具身数据闭环、端到端强化学习架构[42][39][36] - 工程化能力是最大壁垒,团队曾主导华为ADS和百度Apollo的量产落地[14][15][16] 产品与商业化路径 - 初期聚焦柔性物体操作场景(如汽车制造),验证物理AI的工业应用价值[28][77] - 采用模块化机器人本体设计,暂不确定灵巧手形态,但强调上肢拟人化操作的必要性[71][82][84] - 版本规划对标GPT发展路径:AWE 3.0(基础模型)→3.5(场景优化)→强化学习版本[70] - 商业化标准强调"机器人实际工作场景"而非展会演示,金标准是落地稳定性[100][101] 行业趋势判断 - 物理AI(具身智能)将接替信息AI成为主流,自动驾驶和大模型成功奠定技术基础[49][51][52] - 行业三大Scaling Law:数据规模→模型参数→推理能力,当前瓶颈在数据维度[59][60][63] - 关键技术分歧(仿真vs真实数据/通用vs垂类/大小脑架构)将随AI能力提升自然收敛[96][97][98] - 具身智能的"GPT时刻"标志是机器人用AI方法可靠完成1-2项现实任务[109][110] 团队与融资 - 核心团队包含华为"天才少年"丁文超(首席科学家)和量产专家陈同庆(首席架构师)[16][17] - 天使轮由蓝驰创投、启明创投联合领投,8家机构跟投,超募现象显著[7][14] - 融资将投入技术研发、模型训练和场景拓展,重点构建数据采集基础设施[13][43][45]
中国银河证券:推理算力重要性提升 光模块等算力细分赛道发展再加速
智通财经· 2025-03-24 16:58
文章核心观点 中国银河证券认为英伟达GTC 2025大会后硬件发展带动软件及大模型高景气,推理应用发展刺激算力需求,算力相关板块有较大投资价值,建议关注运营商、光模块、光芯片及AIDC相关等细分子板块 [1][4] 推理算力增长情况 - 英伟达CEO称通往AGI、具身智能机器人、构建Omniverse与世界模型及虚拟“平行宇宙”均需算力,2024 - 2025年美国前四云厂采购GPU芯片数量成倍数增长 [1] - Semianalysis数据显示如今模型处理token数量是之前20倍,计算量是150倍,Blackwell性能比Hopper提高68倍,成本降87%,Rubin计划性能提升至Hopper 900倍,成本降99.97% [2] 英伟达软硬件发展情况 硬件方面 - 发布基于Blackwell架构的升级版Blackwell Ultra,强调推理端重大进展,可为数据中心提供50倍增收机会 [3] - 明确26 - 27年及更远期发展规划,硬件性能加速提升 [3] - 展示基于1.6T硅光引擎的CPO交换机系列,硬件端性能将持续高质量全方位提升 [3] 软件方面 - 发布专注简化推理部署和扩展的开放AI引擎栈Nvidia Dynamo,或开创推理软硬件效率新范式 [3] - 发布Nvidia Llama Nemotron,望以其推理模型为基础,通过NVIDIA AIQ架构探索相关方向形成生态闭环 [3] 投资建议 - 推理应用发展刺激算力需求,当前市场认为推理应用增长挤压算力板块成长空间的判断或偏离实际 [4] - 建议关注运营商如中国移动、中国联通、中国电信等;光模块如中际旭创、新易国盛等;光芯片如源杰科技、仕佳光子等;AIDC相关如光环新网、数据港等 [4]