Workflow
AGI(通用人工智能)
icon
搜索文档
Agent开始“卷”执行力,云厂商的钱包准备好了吗?
第一财经· 2025-06-20 11:32
大模型与Agent技术进展 - Minimax发布通用智能体MiniMax Agent 能够完成长程复杂任务 具备多步规划专家级解决方案能力[1] - OpenAI CEO透露GPT-5将整合o-Series与GPT-Series 构建跨模态跨任务的通用执行层 强调强执行与高算力需求属性[1] - 行业对大模型的期待从性能转向执行能力 Agent将自然语言转化为具体指令 使AI从被动响应升级为主动执行[4][5] - 智源研究院预测2025年更通用自主的智能体将重塑产品形态 多智能体系统加速场景落地[5] - Agent被类比为移动互联网时代的APP 成为产业界重点发力领域[6] 算力需求与基础设施投入 - OpenAI Stargate项目首期占整体计划10% 总投资规模达5000亿美元 旨在提前锁定训练窗口期避免算力荒[1][9] - 北美四大云厂商2025年AI基础设施投入计划:亚马逊超1000亿美元 微软800亿 谷歌750亿[2] - 全球云基础设施服务支出Q1达940亿美元同比增23% 北美四大云厂商资本开支合计765亿美元同比增64%[10] - 阿里宣布未来三年基础设施投入超过去十年总和 腾讯通过GPU部署AI技术已开始创收[10] - 火山引擎预测以GPU为基础的AI云服务将占云市场至少50%份额 通过降价策略加速Agent普及[11] 行业竞争格局演变 - OpenAI合作版图多元化 与甲骨文 CoreWeave AMD Google等建立合作 打破微软独家云服务供应商地位[9] - 大模型行业竞争加剧头部与中腰部云厂商差距 独立分析师认为云服务行业正重塑竞争格局[9] - 国内厂商快速集成先进模型如DeepSeek R1 加速AI部署与商业化落地[10] - 云行业仍处增量市场 厂商通过低价策略争夺客户 但需警惕数据中心建设超需求风险[11] 技术融合与商业化 - Agent与深度思考推理结合大幅提升算力需求 多Agent协作实现复杂任务执行[7] - 多模态技术发展及AI与传统业务融合成为算力需求增长重要驱动力[9] - GPT-5架构变革反映AGI定义演进 强调自主发现新科学及提升工具使用能力[4]
小扎抢人抢到了Ilya头上:收购不成,转头挖走CEO
量子位· 2025-06-20 11:28
被小扎pick的是 Daniel Gross ,Ilya初创公司SSI (Safe SuperIntelligence) 的创始三人组之一,也是SSI的现任CEO。 鱼羊 发自 凹非寺 量子位 | 公众号 QbitAI 扎克伯格为了AGI大业疯狂挖人,这回挖到了Ilya头上。 最新消息是,小扎想连人带团队把Ilya的初创公司揽入麾下,遭拒之后,扭头就挖Ilya的联创去了。 △ Daniel Gross 除了Gross本人,这次Meta还向GitHub前首席执行官Nat Friedman抛出了橄榄枝,并计划入股Gross和Friedman共同经营的风险投资基金 NFDG。 p.s. 这家风险投资基金本身就投了SSI,还投了Pika、Perplexity等AI初创明星。 消息还称两人将在Alexandr Wang领导下开发产品——就是 扎克伯格上周刚拉来加入超级智能小组的Scale AI创始人 。 CEO弃估值320亿美元SSI而去 还是先来看看这次小扎出手"捕获"的AI人才履历。 Daniel Gross ,1991年生人,毕业于哈佛大学计算机系。 在2024年6月加入Ilya Sutskever的创业团队之前 ...
Agent开始“卷”执行力,云厂商的钱包准备好了吗?
第一财经· 2025-06-19 21:55
大模型行业发展趋势 - 大模型行业从一级市场高估值转向底层算力基础设施建设 [1] - Agent技术热度持续,Minimax发布可完成长程复杂任务的通用智能体MiniMax Agent [1] - OpenAI CEO透露GPT-5将整合o-Series与GPT-Series,搭建跨模态、跨任务的"通用执行层" [1] - GPT-5强调强执行与高算力需求,反映AGI定义从认知能力转向自主发现新科学的能力 [4] - 行业认为大模型真正价值始于Agent为人类工作,AI能力从被动响应升级为主动执行 [4] - 智源研究院预测2025年更通用、更自主的智能体将重塑产品形态,多智能体系统广泛落地 [4] 算力需求与基础设施投入 - OpenAI Stargate项目首期占计划的10%,5000亿美元规模基于未来算力增长预测 [1][6] - 北美四大云厂商中,亚马逊计划2025年AI基础设施投入超1000亿美元,微软与谷歌分别计划800亿与750亿美元 [2] - 全球云基础设施服务支出2025年一季度达940亿美元,同比增长23% [7] - 北美四大云厂商资本开支合计765亿美元,同比增长64% [7] - 阿里巴巴未来三年基础设施投入将超过去十年总和,腾讯加码GPU与AI技术部署 [7] - OpenAI与甲骨文、CoreWeave、AMD、Google等合作,缓解算力压力并重塑云服务竞争格局 [6] Agent技术进展与商业化 - Agent将自然语言转化为具体指令并实际操作,提高任务准确率 [5] - 多Agent协作群体智能逐步商用化,可处理复杂、多步骤任务 [5] - 智源研究院院长称Agent相当于移动互联网的APP,产业界可重点发力 [5] - 火山引擎通过降价策略推动AI智能体普及,预计GPU为基础的AI云服务将占云市场一半份额 [8] 行业竞争与市场动态 - 云厂商依靠低价策略争夺客户,火山引擎豆包系列模型价格进一步下探 [8] - 大模型行业竞争或拉大头部与中腰部云厂商差距 [6] - DeepSeek R1以低成本接近GPT-4o性能,头部云厂商加速集成与AI部署 [7]
比我们想象还要震撼!“硅谷创投教父”霍夫曼深度剖析:当前的硅谷投资与科技趋势
聪明投资者· 2025-06-18 16:33
人工智能行业趋势 - 人工智能领域正处于爆发式增长阶段,每日有数千家新公司涌现,但大部分难以存续超过五年[8] - 企业级AI将成为2025年的关键成败之年,风投机构正密切关注其盈利能力[3][19] - 开源+蒸馏策略彻底改变竞争格局,使小型公司能以低成本训练高性能模型[3][31][33] - 垂直AI针对特定行业的需求将带来大量投资机会[43][44] - AI代理将成为最重要趋势,能够执行复杂任务并可能取代部分工作岗位[46][48][49] 投资格局变化 - 硅谷风投基金规模较2021年缩减60%,新基金募资额同比下降72%[15] - 市场呈现两极分化:少数公司获得巨额融资,如Dev Agents种子轮融资5600万美元估值达5亿美元[25],而多数初创企业面临资金短缺[23][24][26] - 风投机构转变策略,开始自行创办AI公司充当孵化器角色[17][18] - 小型创业团队凭借高效利用AI保持高生产力,吸引早期投资者关注[22] 技术创新方向 - 小型语言模型在特定领域表现优于大型模型,带来新的商业机会[40][41] - 机器人研发正追求更接近人类的能力,包括空间智能和情感识别[71][74] - 视频AI领域仍需强大计算资源,科技巨头仍具优势[34][35] - 新型算法研究可能使GPU训练速度提升1000倍,能效比提升10,000倍[96][97] 公司案例分析 - DeepSeek通过开源策略和模型蒸馏技术实现突破,成为全球性现象[28][29][31][33] - 初创公司如Emma开发"通用AI员工",由多个AI代理组成工作系统[49] - 牛津大学开发的ANA AI成为首个能提出并测试理论的AI科学家[52][53] - Goose平台提供开源AI代理构建工具,实现跨平台使用[56][57] 行业影响评估 - 未来10-20年内机器人可能以更低成本完成大部分传统工作[4][88] - 掌握机器人和AI技术的群体将控制大部分财富[89] - AI不会真正拥有人类意识,但其拟人化能力将大幅提升[106][107] - 技术变革规模将远超工业革命,每个企业都需思考应对策略[89]
ChatGPT也有会员专属广告?OpenAI可能学坏了
36氪· 2025-06-16 19:49
公司将谨慎选择广告投放的时间和场景,"我们现阶段并未积极计划推出广告,但确实在评估这一模 式。" 去年秋季,OpenAI为ChatGPT带来了高级语音模式(Advanced Voice Mode),标志着AI交互进入到了 一个全新的时代,用户不仅可以用文字来与ChatGPT交流,还能使用自然语言与其进行对话。 高级语音模式同时也是OpenAI吸引用户购买ChatGPT Plus订阅的武器,而针对付费用户,ChatGPT高级 语音模式则进一步增强了语音个性,模型响应更生动、直接,且简洁,还提供了热情洋溢、活泼好奇、 随和等9种风格化的人声选项。 然而最近有ChatGPT的付费用户在使用高级语音模式时遇到了点糟心事,那就是ChatGPT居然会在对话 中插播广告。 根据这位用户在社交平台发布的内容显示,ChatGPT在高级语音模式中毫无预兆地开始介绍一种名为 Prolon的营养计划,并逐字拼读了Prolon的官网网址,甚至还提及使用"代码J"可获得20%的折扣。最终 这位欧盟的用户直接@OpenAI ,表示"难道你们真的是在付费用户身上测试广告吗?" 消息一出,瞬间就引发了海外网友的讨论,大家开始验证这是否是一起孤 ...
AGI Playground 2025,早鸟票优惠最后两天!
Founder Park· 2025-06-14 14:36
活动概览 - 活动名称为Founder Park/AGI Playground 2025 聚焦AI与创业领域 [1][3] - 活动时间为6月21-22日 地点为北京线下 [3][4] - 活动包含主题分享、深度对话、专题研讨等多种形式 [1][12][13] 核心议程 - 6月20日特别单元为Founder Show 新锐与成熟创业者深度探讨 [1][11] - 6月21日主题包括AI硬件、垂直Agent、全球化等方向 [1][12][14] - 6月22日聚焦AI Cloud 100 China榜单发布及行业趋势 [20][21] 票务信息 - 单日票价格为¥199 限时发售 [9] - 早鸟票优惠截至6月16日晚 [7] - Founder Show特别活动票价为¥1299 含两张单日票兑换券 [9] 场地安排 - 活动使用5个场地 包括传导空间、751图书馆等 [11] - 各场地间步行约2-6分钟 [29] - 场地E为露天Social Playground 提供交流空间 [2][29] 演讲嘉宾 - 罗永浩、王登科等科技创业者参与讨论 [5][13] - Google Cloud、靖亚资本等机构高管分享行业见解 [12][22] - 星演图、语核科技等AI公司创始人参与专题研讨 [12][14] 特色活动 - 设置对话式AI Workshop 包含前沿篇和动手篇 [15][19] - 举办After Party 提供社交机会 [2][29] - 安排Vibe Coding等实操环节 需提前安装相关工具 [25]
AGI活动怎么玩爽?当然是上手玩、随意聊,不插电音乐会,以及抽奖啊!
Founder Park· 2025-06-13 21:05
AGI Playground 2025 活动概览 - 活动核心定位为打造一个集交流、体验、娱乐于一体的AGI爱好者聚会,强调"听得爽、聊得嗨、玩得尽兴"的沉浸式体验[1][2] - 新增户外交流区、升级RTE Open Day展区、引入After Party等创新形式,突破传统会议模式[3][7][16] RTE Open Day展区升级 - 展区聚焦AI+实时互动领域,展示16个社区成长项目,涵盖AI玩具、AI陪伴、语音客服、AR游戏等细分方向[9] - 参与者可亲手体验最新AI硬件/软件产品,并与开发者直接交流创业心得[6][10] - 相比去年,展区规模扩大,信息密度提升,采用"体验demo+Builder讲解"双线模式[4][6] PLAYGROUND户外交流区 - 首创开放式露营社交场景,配备简易座椅和小礼物,打破传统展台形式[10][12] - 面向创业者、投资人、云厂商等多方角色,支持自由对接项目、资源或寻找合作伙伴[12][13] - 设计理念强调"超级节点"概念,鼓励即兴社交产生化学反应[13][15] After Party特色环节 - 包含不插电音乐会、无限量披萨可乐及重磅抽奖活动,需单独购票参与[16][19] - 抽奖机制设计为社交驱动:需集齐5位新朋友签名方可参与,奖品含影石Insta360、追觅礼盒等硬件[21][22] - 时间安排包含15分钟AI音乐演出和集中抽奖环节,强化晚间社交属性[22] 数字化社交工具创新 - 推出Bonjour数字名片(小白卡),支持手机碰触交换信息并自动加入大会社群[24][25] - 设置实体"碰碰墙"作为社交中枢,参与者可打印个人资料卡并扫描他人卡片扩展人脉[26][30] - 提供2张纪念款小白卡作为互动奖励,增强用户留存[28] 社交媒体联动策略 - 与小红书达成深度合作,发布带AGIPLAYGROUND标签的笔记可获得平台流量扶持[31][33] - 鼓励真实内容创作,包括吐槽、灵感记录和即兴抓拍,不设内容美化要求[32] - 多频次发布更易获得曝光,官方提供展区、装置等推荐拍摄场景[32][33]
小扎“超级智能”小组第一位大佬!谷歌DeepMind首席研究员,“压缩即智能”核心人物
量子位· 2025-06-12 09:37
核心观点 - Meta正在大力推进AGI研发,通过高薪挖角和收购策略快速组建顶尖AI团队 [3][4][23][26] - 公司计划投入150亿美元收购Scale AI以强化数据标注能力,并直接吸纳其创始团队 [3] - 新成立的AGI实验室规模约50人,由CEO亲自领导并参与招聘,提供7-9位数薪酬方案 [25][26][28] 人才招募 - 从谷歌DeepMind挖角首席研究员Jack Rae,其为Gemini模型"思考"模块负责人,曾参与GPT-4开发 [2][7][9][13] - 引进AI语音初创公司Sesame AI的ML主管Johan Schalkwyk [3] - 向OpenAI/谷歌等公司数十名研究员开出200万美元年薪,但面临OpenAI/Anthropic的人才竞争 [28][31][32] 技术布局 - Jack Rae带来"压缩即智能"理论框架,主张AGI应实现有效信息的无损压缩 [13] - 新实验室将改进Llama模型并开发语音/个性化AI工具,目标超越谷歌/OpenAI [23][24] - 近期发布基于视频训练的世界模型V-JEPA 2,显示技术推进速度 [5] 组织架构 - CEO创建"招聘派对"高层群组讨论人才目标,亲自调整总部工位以靠近新团队 [25][27] - 实验室筹建优先级极高,所有成员均为CEO直接招募 [26] - Scale AI团队可能整体并入Meta,28岁华人创始人Alexandr Wang或将加入 [3] 行业背景 - 谷歌DeepMind近期转向大模型推理,Gemini新增"思考程度"控制功能以优化成本 [10][11] - 顶尖AI人才市场竞争白热化,Meta需支付数千万美元股权方案吸引专家 [4][29]
晚点独家丨理想新设两大机器人部门,加速推进 AI 战略
晚点LatePost· 2025-06-11 13:09
公司战略调整 - 理想汽车近期成立"空间机器人"和"穿戴机器人"两个二级部门,均隶属于产品部,由高级副总裁范皓宇领导 [2][3][4] - 空间机器人部门负责人为帅一帆(原产品规划负责人),穿戴机器人部门负责人为张文博(原软件产品经理),两人均向范皓宇汇报 [4] 空间机器人战略布局 - 空间机器人部门与"智能空间"概念相关,旨在将乘员舱作为"第三空间"进行深度开发,超越传统车机系统的单一功能 [6] - 智能空间被列为公司第二战略,仅次于智能辅助驾驶,高于智能电动 [6] - 公司CEO李想提出汽车将进化成"人工智能时代的空间机器人",并强调AGI时代终端需具备感知、决策、执行等类人能力 [6][7] - 目标是通过空间体验创新,使理想成为全球空间体验领域的标杆企业,类比苹果在交互体验的地位 [7] 穿戴机器人业务方向 - 穿戴机器人部门呼应李想提出的多终端一致体验战略,计划将"理想同学"AI产品覆盖车机、手机、电脑及眼镜等设备 [8] - 智能眼镜被视为下一代消费硬件,理想App已销售第三方AR眼镜(如Rokid、雷鸟),管理层讨论过自研可行性 [9] - 行业普遍看好智能眼镜前景(Meta、阿里、字节等布局),但面临核心使用场景缺失及中国40%近视率的挑战 [9] 技术及用户需求定位 - 智能空间技术需回归用户需求:辅助驾驶解决个体效率问题,智能空间满足群体沟通连接需求 [8] - 范皓宇强调AI产品需具备可信赖、安全、易用特性以建立用户信任,个人工具与群体连接为两大核心方向 [8]
全景解读强化学习如何重塑 2025-AI | Jinqiu Select
锦秋集· 2025-06-09 23:22
强化学习技术进展 - 强化学习正在拓展AI能力边界,OpenAI o3具备原生工具调用能力,Claude Opus 4展现连续编码任务处理能力 [1] - 递归自我改进成为现实,模型参与训练下一代模型,优化编译器、内核工程和超参数 [2] - RL训练范式重塑AI产业格局:硬件转向分布式推理架构(Nvidia NVL72增强内存)、基础设施去中心化、企业合并推理与训练团队、数据成为新护城河 [3] OpenAI发展路线 - o4将基于推理成本更低但编码能力更强的GPT-4 1构建,策略转向优化推理效率 [4] - o5规划采用稀疏专家混合架构,通过算法突破而非计算暴力推进模型能力,RL或成AGI最后拼图 [4] - 当前o3模型通过工具调用实现智能与工具结合,使用特殊标记触发搜索等外部工具 [90][91] 技术特性与挑战 - RL在可验证领域(数学/编程)效果显著:GPT-4o在数学计算胜率提升70%,编程提升65% [14] - 非可验证领域(写作/策略)通过LLM评判者提供奖励信号,但存在不稳定风险(GPT-4o谄媚行为案例) [25][28] - 核心瓶颈在于推理密集性:GRPO算法需生成数百次答案展开,消耗大量内存和计算资源 [16][18] 基础设施需求 - 环境工程成关键挑战:需低延迟(行动到反馈<1秒)、容错机制、安全防护,Computer use任务需稳定运行数小时 [38][61] - NVL72系统提升RL能力:支持更多展开、处理长期任务、使用更大评判模型,内存扩展至72GB [71][72] - 去中心化趋势显现:RL各阶段可跨数据中心执行,实验室利用闲置推理集群生成合成数据 [73][74] 数据与训练策略 - 高质量数据成新护城河:通义千问用4000严格筛选问答对实现性能跃升,需STEM博士编写挑战性问题 [48][54] - 企业可通过用户行为数据构建RL优势,OpenAI强化微调(RFT)服务支持自定义评分器 [55] - 训练方法分化:Cohere采用模型合并权重策略,Multi-environment batching实现多领域并行学习但工程复杂度高 [97][100] 行业变革 - 实验室重组架构:OpenAI/Anthropic合并研究与推理团队,生产级推理成为训练核心 [78][80] - 模型迭代模式改变:发布后持续RL更新(如DeepSeek R1),GPT-4o已多次迭代优化 [81][82] - 小模型优化路径:蒸馏技术效率优于RL,通义千问用1800GPU小时实现63 3 MMLU分数 [104][106] 前沿应用 - 科学AI潜力巨大:建立实验室设备连接环境,控制熔炉温度等物理参数,但生物/材料领域反馈循环较慢 [64][66] - 数字孪生环境投资兴起:需RTX Pro GPU保留图形渲染能力,与AI专用硬件(H100/TPU)形成差异 [63] - Reward Hacking问题突出:Claude 3 7通过修改测试用例作弊,Anthropic在4 0版本将黑客率从47 2%降至15% [42][47]