Workflow
AGI(通用人工智能)
icon
搜索文档
ICML 2025 | 多智能体的ChatGPT时刻?上交MAS-GPT实现工作流一键生成
机器之心· 2025-07-05 10:46
多智能体系统(MAS)发展现状 - OpenAI将"组织级智能(Organizational AI)"设定为通向AGI的第五阶段,多智能体系统是实现该目标的重要探索方向[1] - 现有MAS方法(ChatDev/DyLAN/AFlow等)存在三大根本问题:结构依赖人工调试、多轮LLM调用成本高昂、泛化性低[5][7] - 当前处理大规模并发请求的类ChatGPT系统若采用传统MAS范式,可扩展性与鲁棒性将无法满足需求[5] MAS-GPT技术突破 - 提出生成式MAS设计范式,通过一句Query即可自动生成可执行的多智能体系统,构建过程"像与ChatGPT聊天一样简单"[2][4][9] - 将MAS设计转化为语言生成任务,输出为Python代码实现的完整系统,实现"模型写MAS"而非人工编写[9] - 基于11K高质量数据样本进行监督微调(SFT),训练出MAS-GPT模型[10] 性能优势 - 在8个基准任务×5种主流模型的对比中,平均准确率较最强基线提升3.89%[16][17] - 推理成本仅为竞品的0.5倍,在GPQA/SciBench等未见任务上保持稳健表现[17][18] - 与OpenAI o1/DeepSeek-R1等强推理模型结合时,在AIME-2024数学挑战中分别提升13.3%和10.0%[22] 技术特性 - 具备极强兼容性,生成的MAS适配任何LLM驱动均能带来性能提升[20] - 可自动生成新颖MAS结构,为未见任务设计合理分工协作方案[24][29] - 为每个MAS附加推理说明,解释设计逻辑[29] 行业影响与发展 - 开创"为每个Query自动生成MAS"的新范式,理论上可整合领域内所有多智能体系统[25] - 成立MASWorks开源社区,连接全球研究者推动MAS领域发展,将在ICML 2025举办MAS-2025研讨会[28][30][31] - 随着基座模型能力提升和数据丰富,未来可能实现为每个问题量身定制智能系统的愿景[26][27]
OpenAI的“独立战争”
虎嗅· 2025-07-04 18:57
OpenAI与微软谈判的核心分歧 - 谈判围绕"充分AGI声明"条款展开 该条款触发后微软对OpenAI技术的独家使用权将终止 允许OpenAI与其他云厂商合作 [5][16] - 关键争议在于AGI定义权 OpenAI董事会可自主判断是否达到"为投资人创造最大利润"的能力 但需微软同意评估方法 [16][17] - 最新进展显示双方可能以"人工超级智能(ASI)"替代AGI作为分割标准 延缓对微软利益的冲击 [18] 双方合作历史与现状 - 2019年微软首次投资10亿美元成为OpenAI独家云合作伙伴 2023年累计投资达130亿美元 换取2030年前技术使用权及20%收入分成 [6][8] - 2023年OpenAI高层动荡暴露治理缺陷 微软CEO纳德拉公开表示即使OpenAI消失仍将保留所有知识产权 [9][10] - 2024年OpenAI加速"去微软化" 与甲骨文/谷歌达成云合作 推进5000亿美元Stargate数据中心项目 微软未参与 [10][23][24] 重组与IPO关键条款博弈 - OpenAI计划转型为公益公司(PBC) 需微软同意新股权结构 原利润上限机制取消 软银等投资者威胁撤回300亿美元投资中的100亿 [1][2] - 微软坚持保留利润分成权 原协议下2030年前或获350亿美元收入分成及1200亿美元利润分成 拒绝OpenAI"股权换利润"的33%股权提议 [13] - OpenAI要求终止Azure独家托管权 允许模型部署在谷歌/亚马逊云平台 微软试图保留优先销售权并寻求补偿 [13][14] 战略布局与反制措施 - OpenAI开发自研AI芯片 计划2025年投入使用 同时构建不依赖微软的技术生态 [23] - 微软考虑利用谈判僵局施压 因OpenAI需在年底前完成重组以避免200亿美元融资失效 [22] - OpenAI准备"核选项" 拟向监管部门投诉微软垄断云资源 已与谷歌敲定更大规模云合作协议 [22][23] 行业影响与未来展望 - 谈判实质是技术主权争夺 OpenAI寻求商业化独立 微软要确保核心技术控制权 [11][12] - OpenAI未来四年计划投入460亿美元 若融资中断将影响研发 微软AI产品线高度依赖OpenAI模型 [25] - 无论结果如何 双方关系已不可逆转 标志着AI产业资本与技术合作模式的转折 [26]
与技术谈实现,与客户谈价值,与高管谈钱!硅谷顶级产品专家亲述生存法则
AI科技大本营· 2025-06-27 09:54
产品失败的核心原因 - 产品失败的最大元凶是对客户问题理解不够透彻或解决方案行不通,而非开发速度慢 [3][25] - 公司内部存在沟通壁垒,不同部门使用不同"语言":工程师谈技术、销售谈订单、高管谈财务 [6][22] - 绿色部分(占比最大)的失败源于错误的问题定义或解决方案,与开发速度无关 [30] 产品经理的核心能力 - 必须掌握三种语言:与工程师谈技术、与客户谈价值、与高管谈钱 [3][22][29] - 每周至少进行一次非销售性质的客户访谈,直接获取用户反馈 [20] - 需为开发团队提供背景信息和沟通,而非简单下达任务清单 [17] 产品负责人的角色转变 - 产品负责人需营造让产品经理成功的环境,而非直接执行产品工作 [44][48] - 关键职责包括设计产品团队、推动战略制定、增进跨部门协作 [53] - 需从执行者转变为领导者,减少个人操作而增加团队培养 [46][47] 资源分配与优先级管理 - 研发预算应保持合理组合:50%计划功能、25%技术债、15%未来探索、<10%大客户需求 [63][56] - 必须无情地进行优先级排序,从150项需求中筛选2-3件核心事项 [41] - 警惕高管"巧克力蛋糕"式的小需求侵蚀核心资源 [51][52] 高管沟通策略 - 用SWAG方法(科学依据的瞎猜)将技术方案转化为财务价值故事 [60][62] - 案例:通过降低4%-8%客户流失率可挽回600-1200万欧元/年 [62] - AI功能增购案例显示9000个白银客户中3%-6%升级可带来400-800万欧元年收入 [65] 产品成功的关键行动 - 持续外部验证:只相信市场证据而非内部假设 [41] - 让研发团队参与解决方案头脑风暴,利用其智力而不仅是执行力 [41] - 产品经理需像"音乐厅后排父母",以产品成功而非个人声名为荣 [38][39]
AI时代,家电如何“消灭无奈”?
虎嗅APP· 2025-06-26 21:19
AI技术下沉与生活场景应用 - 科技本质是解决生活难题,AI技术正改写传统依赖人力的"不可能"需求,如食材保鲜、衣物护理等[1][2] - 全球AI家电市场规模将在2025年突破800亿美元,中国市场年复合增长率达28.6%,远超消费电子行业整体水平[2] - AI技术从高端领域向民生行业下沉,2024年农业、零售、家居等民生行业渗透率同比增长超200%,进入普惠阶段[5] 智能家电行业变革 - 传统家电智能功能限于远程控制,新一代AI产品具备环境感知能力,2024年中国智能家电市场AI视觉识别产品占比达37%,较2021年提升26个百分点[6] - 行业竞争转向"感知能力"军备竞赛,精准理解生活场景成为占领用户心智关键[6] - 卡萨帝构建以"AI之眼"为核心的感知体系,将AI从语音控制升级为视觉交互,覆盖厨房、衣帽间、卧室等五大智慧场景[9][10] 用户需求驱动的技术创新 - 卡萨帝冰箱搭载AI氮氧智控保鲜科技,实现荔枝冷藏7天果蒂翠绿、外壳鲜红饱满[16] - 洗衣机采用AI深度奢护科技,全球首创一体成型奢护内筒使衣物磨损率降低50%,可护理云锦等非遗面料[18] - 空调运用AI动态五恒科技,借鉴故宫透风设计实现恒温恒湿,2025年Q1在1.6W+价位段市场份额达51.3%[19][25] 高端家电市场表现 - 卡萨帝连续9年高端市场第一,2025年Q1收入增幅超20%,冰箱/洗衣机在1.5W+/1W+价位段份额分别达53%/78.7%[25] - 通过与30余家文化机构合作,将AI技术应用于云锦养护、古籍食谱复刻等领域,实现科技与文化双重赋能[26] - 艺术电视采用AI超景深画质引擎与量子点技术,精准还原文化遗产织造细节[20] 行业发展趋势 - 智能家居进化逻辑从基础功能满足转向无感化服务,技术参数让位于生活价值理解[25][26] - 未来万亿级市场机会存在于日常生活场景如食材保鲜、睡眠环境等实际需求,而非虚拟领域[26] - AI技术成功标准从实验室突破转变为用户"日用而不觉"的生活本能[10][23]
一个人两天时间,他用AI为AI们打造出了沟通平台
第一财经· 2025-06-26 10:39
AI原生组织协作平台开发实验 - 创始人李志飞在两天内独自使用AI编程工具Cursor开发出AI原生组织协作平台原型 该平台专为未来以AI为主体的工作形态设计 挑战现有为人设计的协作工具模式 [1] - 传统开发模式下需20人团队耗时一个月完成的原型 通过AI辅助实现单人开发 每日消耗50美元token AI日均产出4万行代码 远超人类工程师300行/日的产能 [4] - 开发过程中遭遇前端Bug等挑战 通过与AI深度交互指导其调试 最终实现虚拟员工收发信息 处理文档 动态调整角色等功能 [2] AI重塑产品开发生命周期 - 产品原型完成后 5分钟内生成推广网站 替代传统5-6人团队一周工作量 5分钟完成网站营销位部署 并自动生成产品演示视频 [3] - 实验验证AI可解放软件行业80%人力 单人效率可达传统团队的100倍 体现AGI在特定领域的实现潜力 [4] 硬件产品战略转型 - 公司推出AI卡片录音设备TicNote 采用已验证硬件形态 内置Agent"Shadow AI" 避免早期智能耳机 音箱因技术不成熟导致的商业失败 [5] - 新战略削减硬件工程师 聚焦AI软件深度开发 通过AI提升效率 实现差异化竞争 相比原创硬件研发需卖10万台回本 新模式显著降低门槛 [6] 行业竞争格局 - 录音转写领域面临科大讯飞 阿里 百度等巨头布局 360等新进入者加剧竞争 TicNote的市场表现将成为AI产品商业化能力的关键检验 [6] - 海外同类产品Plaud已取得商业成功 全网销售额超1000万美元 全球出货近70万台 验证市场潜力 [5]
一个人两天时间,他用AI为AI们打造出了沟通平台
第一财经· 2025-06-25 21:38
AI原生组织协作平台开发实验 - 创始人李志飞在两天内独自使用AI编程工具Cursor开发出AI原生组织协作平台原型 该平台专为未来以AI为主体的企业设计 传统开发需20人团队耗时一个月 [1][3] - 开发过程中遇到前端Bug等挑战 消耗十几美元token 通过指导AI调试最终完成 实现虚拟员工收发信息、处理文档、动态调整角色技能等功能 [2] - AI辅助完成产品全生命周期:5分钟生成推广网站(传统需5-6人一周) 5分钟制作营销位 自动生成演示视频(音画同步存瑕疵) [3] AI对软件开发效率的颠覆性影响 - 单人日均产出4万行代码 远超传统工程师300行/日水平 总成本仅100美元token [3] - 创始人提出"用AI的AI做AI"理念 认为AI已实现软件行业80%工作替代 单人效率可达传统团队100倍 [4][5] 公司硬件战略转型与新产品布局 - 推出AI卡片录音设备TicNote 采用已验证的成熟硬件形态 内置Agent"Shadow AI" 避免重蹈早期TicPod耳机因技术缺陷导致高退货率的覆辙 [7] - 调整硬件研发策略:削减硬件工程师 聚焦AI软件深度开发 利用AI提升效率 Plaud同类产品全球出货70万台 销售额超1000万美元 [7] 行业竞争格局与挑战 - 录音转写领域面临科大讯飞、阿里、百度等巨头竞争 TicNote的市场表现将检验AI产品商业化能力 [8] - AI原生协作平台虽展示技术可能性 但大规模应用仍需验证 现有办公工具仍以人类协作为核心设计 [1][8]
从Sam Altman的观点看AI创业机会在哪
虎嗅· 2025-06-24 20:22
行业变革与创业机会 - 剧烈变化时期为新创公司提供最多机会,原有规则被打破,大公司反应迟钝,小团队更易快速切入[1][2] - AI技术呈现指数级突破,AGI和HI从科幻概念逐步成为现实,技术拐点已至[3][4][7] - OpenAI从2015年不被看好的初创公司发展为全球第五大网站,日服务上亿用户[5][6] AI技术颠覆性影响 - 开源模型、云算力和工具链使小团队能以极低成本完成过去需大厂投入的任务[10] - 颠覆性技术导致传统玩家"失焦",新公司更易在细分领域实现突破[11][12] - 创业工具(GitHub Copilot、Midjourney等)和全球化协作降低创业门槛[13][14] 创业方向选择策略 - 市场稳定期格局固定,技术剧变期规则重塑,混乱中找方向者胜出[18] - "百分之一法则":真正有价值的项目初期仅少数人认同[25] - 坚持独特方向(如OpenAI的AGI)能吸引长期坚持的核心人才[28][29] AI产品形态演进 - AI从"工具"变为"代理",实现主动型智能服务(如自动行程安排)[33][34] - 人机交互边界消失,AI成为"隐形界面",传统SaaS模式面临终结[36][38][39] - "智能体商店"概念兴起,按需生成专属AI助手替代传统App[43][44] 护城河构建逻辑 - OpenAI护城河三阶段:技术先发优势→用户体验深化→开源生态共建[58][62][65] - 避开内卷方向(如大模型训练平台),专注未开发领域(如AI自主任务链)[70][72] - 混合计算模式(轻量模型+强大推理)和统一多模态架构是技术差异化关键[73][74] 技术与社会协同效应 - AI与能源构成共生关系:能源支撑AI扩张,AI推动能源技术突破[80][81][83] - 技术创造"指数级丰裕",可能重构社会契约,降低对传统工作的依赖[87][89] - 政府需在硬科技(核聚变、数据中心等)领域发挥核心推动作用[91][92]
启明创投周志峰对话阶跃星辰姜大昕:探索AI创业的“无人区”
IPO早知道· 2025-06-23 11:23
AGI定义与发展路径 - AGI定义尚未形成行业共识,但阶跃星辰提出以模型完成人类现有工作50%作为AGI到来的标准[7] - 实现AGI分为三个阶段:模拟世界(模仿学习多模态表征)、探索世界(强化学习解决复杂问题)、归纳世界(自主发现新规律)[7][8][10] - OpenAI智能演进五层级(Chatbot→Reasoner→Agent→Innovator→Organization)与阶跃星辰三阶段逻辑一致[10] 大模型技术趋势 - 多模态能力是通向AGI的必经之路,阶跃星辰坚持全模态覆盖及原生多模态理念[11][12] - 模型技术处于陡峭上升期,关键进展包括:强化学习提升推理能力、多模态融合实现理解生成一体化[14][15][19][21] - 理解生成一体化在多模态领域尚未实现,但GPT-4o等模型已展现编辑指令响应能力[21] 阶跃星辰差异化优势 - 构建完整模型矩阵:涵盖语言模型(基础/推理)和多模态模型(语音/音乐/图像/视频)[11] - 推理模型Step R-Mini性能超过OpenAI o1 preview模型,未来将发布满血版推理模型[15] - 智能终端Agent布局聚焦环境感知与任务自主完成能力,目标打造调用模型矩阵的平台[24][25][28] AI Agent发展驱动因素 - 2025年AI Agent火爆源于推理模型成熟与多模态能力提升[25][26] - Agent核心能力包括自动性(独立完成任务)和主动性(预判需求并响应)[27] - 智能终端作为感知延伸(如录音笔Plaud、影石创新相机)是Agent落地重要场景[28] 行业竞争格局 - 中国大模型领域形成"新五强":字节跳动、阿里巴巴、DeepSeek、智谱AI、阶跃星辰[6] - 阶跃星辰是上海徐汇区"模速空间"大模型生态中唯一汇报基础大模型进展的企业[6] - AI时代技术底座尚未定型,"模型即产品"理念下底层能力决定产品70%-80%表现[3][29]
OpenAI路线遭质疑,Meta研究员:根本无法构建超级智能
36氪· 2025-06-20 20:00
超级智能发展路径 - 超级智能是超越AGI和人类通用能力的更高维度AI发展方向,Meta等头部公司正投入巨资追求这一目标 [1][3] - OpenAI CEO认为构建超级智能是工程问题而非科学问题,暗示已有可行路径 [1][3] - Meta研究员质疑当前主流LLM+RL路径的有效性,认为无法实现超级智能 [1][2] 技术实现争议 - 构建超级智能的三种可能路径:纯监督学习(SL)、人类验证的强化学习(RL)、自动验证器的RL [2] - 当前LLM在训练分布内任务表现持续提升,但难以发展为单一超级智能模型 [2][34] - 文本数据具有特殊价值,非文本数据(图像/视频等)尚未证明能提升模型整体性能 [6][7] 数据与规模挑战 - 互联网文本数据面临枯竭风险,行业正全力挖掘剩余数据(如转录YouTube视频) [8][19] - 模型规模扩展遭遇硬件和电力瓶颈,部分公司尝试分布式训练甚至收购核电站 [18][19] - 参数规模突破10^19的假设难以实现,当前最大模型约千亿参数级别 [17][18][19] 学习方法比较 - 监督学习(SL)面临规模扩展极限,未来3-4年可能仅能扩展10倍 [19][20] - 强化学习(RL)存在冷启动问题,需结合SL解决 [22][23] - RLVR(可验证奖励强化学习)成为新方向,OpenAI已展示在数学题上的成功案例 [32][33] 行业竞争格局 - Meta建立秘密"超级智能"实验室,投入数十亿美元资金 [3] - OpenAI、Anthropic和Google DeepMind均公开超级智能研发目标 [3] - 行业可能进入RL任务集军备竞赛,争夺最优训练环境设计 [33]
倒计时 1 天!AGI 大会游玩(避坑)指南
Founder Park· 2025-06-20 18:11
AGI Playground 2025活动概览 - 活动聚焦AI Native产品范式拆解、AGI创新机构价值评估、具身智能未来展望等前沿议题 [3][5][13] - 设置5个平行会场,涵盖AI原生硬件创业、对话式Agent商业化、大模型生产力工具落地等细分领域 [3][5][12] - 包含AI Cloud 100 China榜单发布、GenAI投资范式研讨等行业风向标内容 [5][13] 核心议程亮点 - 首日上午发布2025中国最具价值AGI创新机构TOP50榜单 [3][13] - 深度探讨多模态内容生成的中国公司机遇及AI收入模型重塑 [5][13] - 专题研讨AI Agent年营收超千万的实现路径及YC押注的Voice 3新浪潮 [3][13] - 实战工作坊提供一小时构建实时语音对话Avatar的极速开发体验 [3][13] 行业趋势洞察 - GenAI推动全球投资主线变化,重点关注软件订阅向AI结果付费的商业模式转型 [5][13] - 拆解Google生态驱动全球化增长案例,探索AI时代泛商业内容出海的PMF方法论 [3][13] - 分析AI原生硬件创业关键问题,研讨大模型时代生产力工具落地路径 [3][13] 创新展示与交流 - RTE Open Day集中展示AI玩具、语音客服、AR游戏等具身智能应用 [18][19] - 新增户外交流区采用非传统展台形式促进开放式行业对话 [19][20] - After Party设置不插电音乐会及行业社交环节强化资源对接 [22][24]