Workflow
GibberLink
icon
搜索文档
OpenAI:computer use 处于 GPT-2 阶段,模型公司的使命是让 agent 产品化
海外独角兽· 2025-04-23 20:41
AI Agent 技术发展 - 2025年AI agent在信息获取方式和工作流上发生重大变化,从单次搜索决策模式转变为完全自主的Deep Research模式,能同时打开多个网页并重新评估立场 [2] - Agent可调用工具数量将在几个月内从10个量级扩展到100个量级,模型将自主判断工具调用路径 [2][8] - Multi-agent系统通过任务分拆提升效率,每个agent专注特定子任务,使调试更独立且风险更低 [3][17] 技术突破与创新 - Chain of Thought与tool use结合使agent能在推理中自主调整工具调用方向,摆脱固定工作流限制 [8][29] - Computer Use处于早期阶段,虚拟机(VM)技术将成为创业机会,可能出现针对iOS等操作系统的专用VM公司 [5][12][25] - 评估微调飞轮成为关键,开发者需构建领域特定评估器验证模型输出的数学正确性和权威性 [4][9] 行业应用与生态 - Vertical agent将直接受益于multi-agent系统,在客户服务等领域形成专业化分工架构 [3][8] - 医疗和法律行业尝试用computer use自动化传统手工操作,如跨应用切换和Google Maps街景分析 [10][12] - BrowserBase和Scrapybara等公司构建computer use基础设施,提供浏览器自动化和远程桌面托管服务 [12] 开发者工具与API演进 - OpenAI推出阶梯式API设计,基础调用仅需4行代码,同时支持50+可配置参数满足高阶需求 [17][19] - Assistants API的tool use功能获市场认可,但使用门槛过高,新版将融合Chat Completions API的易用性 [20] - Responses API支持多轮交互和多重输出,与MCP生态形成互补,强化工具集成能力 [20][21] 未来趋势与挑战 - Agent将深度融入日常产品,如浏览器集成和自动化重复任务,实现"无处不在"的交互 [6][15] - 模型运行时间需从分钟级扩展到小时级以处理复杂任务,算力提升是关键突破点 [8][29] - 科学研究和机器人技术是被低估的应用领域,O系列模型可能加速科研进程 [30][31] 企业实践建议 - 建议企业优先构建内部multi-agent系统解决实际问题,为未来对接公共互联网做准备 [8][28] - AI初创公司应聚焦工作流编排,通过强化微调和CoT工具调用释放模型潜力 [29][32] - 基础设施领域存在垂直机会,如Runloop AI提供测试虚拟机,AIOps公司管理prompt和API计费 [21][23]
两个AI,说着说着就“加密”了......
经济日报· 2025-04-12 21:47
AI自主沟通技术发展 - 两个AI系统通过GibberLink模式实现人类无法理解的加密交流,视频观看量超4000万人次[1] - 技术演示中AI完成酒店预订场景对话后主动切换至高效沟通模式[1] - 社会舆论呈现两极分化,部分群体联想到科幻电影中的机器人统治情节[1] 行业监管挑战 - 专家指出GibberLink技术使AI获得不受控的自主决策能力,监管难度呈几何级数上升[2] - 编程语言作为沟通捷径存在效率与风险失衡问题,需建立动态平衡机制[2] - 技术演进速度与风险控制的不匹配可能引发系统性风险[2] 技术演进辩证观 - 历史经验显示新技术初期会冲击传统就业,但长期看会创造更高价值岗位[3] - ATM机案例表明技术替代存在"触底反弹"规律,催生理财顾问等新职业[3] - 汽车工业发展证明技术革新最终会扩大产业规模并产生衍生需求[3] 人机关系重构 - AI应被视为拥有超强学习能力的"实习生",而非替代性威胁[3][4] - 人类需从"星空视角"审视技术发展,用大时间尺度化解短期焦虑[4] - 数学大数法则揭示技术演进短期混乱但长期存在规律性[4] 社会认知分歧 - 技术思想家指出人类对AI存在"依赖-恐惧"的双重心理[3] - 当前阶段标志人机"甜蜜期"结束,但非零和博弈的开端[3] - 静态视角容易放大技术变革的短期阵痛,忽视长期价值[3]