超级人工智能(ASI)

搜索文档
奥特曼和量子计算奠基人讨论GPT-8
36氪· 2025-09-28 12:41
对话核心观点 - 奥特曼与戴维・多伊奇就AI能否发展为具备意识的超级智能展开讨论,奥特曼以假设的GPT-8为例,认为其若能解决量子引力问题并解释其思考过程,则应被视为具备高级智能 [1][14] - 戴维・多伊奇最初认为AI无法发展为超级智能,但被ChatGPT的对话能力所改变观点,并指出判断智能的关键在于能否提供“过程故事”,并最终认同奥特曼的GPT-8假设场景 [7][14] - 双方讨论凸显AGI定义标准模糊且目标不断变化,缺乏明确的衡量基准 [3][9][10] 奥特曼的观点 - 奥特曼高度评价戴维・多伊奇的著作《无穷的开始》,认为其乐观阐述了在AI世界中人类依然有无限价值与探索空间 [5] - 奥特曼认为AI有可能发展成具备意识的超级智能,并以GPT-8假设案例进行论证:若GPT-8能解决量子引力问题并讲述其思考过程,则应被认可 [1][14] 戴维・多伊奇的观点 - 戴维・多伊奇曾认为AI无法发展为超级智能,但ChatGPT的出现改变其观点,承认其在广泛主题下进行开放式对话的能力 [7][8] - 他强调现有AI系统缺乏“解释性创造力”,真正的通用智能需具备主动选择动机的能力,而非机械响应提示 [10][11] - 他指出图灵测试并非AGI基准,判断智能的关键在于能否提供如爱因斯坦发现相对论般的“过程故事” [9][13][14] 行业技术讨论 - 对话触及AGI衡量标准的核心难题,即缺乏测试基准来区分机器输出与真正的创造性智能 [9][10][12] - 戴维・多伊奇作为量子计算奠基人,其理论框架为量子计算机发展奠定数学基础,并证明量子算法的指数级加速效应 [15][17]
阿里吴泳铭勾勒ASI演进路线 全栈自研卡位全球竞争
环球网· 2025-09-28 10:25
阿里云人工智能战略定位 - 公司首次系统阐释通往超级人工智能的三阶段演进路径 明确阿里云作为全栈人工智能服务商战略定位 [1] - 通用人工智能已是确定性事件但仅是起点 终极目标是实现能自我迭代全面超越人类的超级人工智能 [1] - 愿景背后是阿里云在模型平台基础设施三层架构的全面发力 [1] 三阶段技术演进路径 - 第一阶段智能涌现特征为学习人 大模型通过理解人类知识全集涌现泛化智能与推理能力 [3] - 通义千问Qwen3-Max在AIME 25数学测试中获满分 印证智能涌现成熟度 [3] - 第二阶段自主行动核心为辅助人 是当前行业所处阶段 AI通过工具调用和编程能力与物理世界交互 [4] - 自然语言是AI时代源代码 用户用母语描述需求即可实现自主编写逻辑调用工具操作设备 [4] - 第三阶段自我迭代目标为超越人 AI需直接获取物理世界原始数据并通过自主学习实现模型架构自我优化 [4] - 该阶段需突破数据获取算法架构与能源支撑等多重瓶颈 [4] 全栈人工智能服务能力 - 模型层通过通义家族实现全模态全尺寸覆盖 Qwen3-Max在多项评测中超越GPT-5跻身全球前三 [5] - 通义万相2.5实现音画同步视频生成 通义百聆语音模型下载量超5.6亿次 [5] - 通义模型矩阵已衍生超17万个模型 总下载量突破6亿次 [5] - 平台层通过百炼平台提供模型定制与Agent开发服务 支持企业快速部署智能体 [5] - 夸克推出AI创作平台造点 集成通义万相与Midjourney V7降低视频创作门槛 [5] - 基础设施层提出超级AI云是下一代计算机 未来全球仅会有5-6个超级云计算平台 [6] - 公司凭借自研芯片存储系统与网络架构 成为中国唯一具备全栈自研能力的云厂商 [6] 资源投入与基础设施规划 - 为支撑超级人工智能算力需求 计划至2032年将数据中心能耗规模提升10倍 相当于新增数千亿级算力投入 [6] - 通过3800亿AI基础设施投入及10倍算力扩容为超级人工智能奠基 [4] 行业竞争格局与市场地位 - 全球仅阿里与谷歌同时具备大模型云计算与芯片三层能力 [6] - 优势在于全栈自研与联合创新 在模型即服务领域提前布局实现模型与云平台深度耦合 [6] - 中国500强企业中约70%已采用生成式AI 其中53%使用阿里云服务 [6] - 计入开源私有部署数据后实际渗透率更高 [6] 技术挑战与发展瓶颈 - 当前AI在工具调用与复杂推理上已有突破 但距自我迭代仍需解决原始数据获取多模态记忆自主反馈等难题 [7] - 网络延迟能源效率等基础设施挑战将制约AI规模化落地 [7] 产业生态与开发者战略 - 开源策略使公司成为全球开发者生态最活跃的AI平台之一 [5] - 开源策略成为争夺全球开发者关键 [6] 应用场景与合作伙伴 - 与英伟达合作推进具身智能落地 逐步实现从数字世界向物理世界渗透 [4] - 通过Vibe Working模式使AI成为超级助手 未来每个个体可能调度上百个Agent实现十倍百倍产出杠杆 [8]
当AI有了大脑和身体,世界将如何改变?| 品牌新事
吴晓波频道· 2025-09-28 08:31
9月24日, 一年一度的 杭州云栖大会 , 在 阿里巴巴集团 CEO吴泳铭 的演讲中徐徐展开。今年的主题是 "云智一体·硅碳共生"。 举办了十年的云栖大会,一直是阿里及其合作企业展示先进技术的窗口,近年来集中展示了尖端模型、先进算力和创新应用。 文 / 初见泉 十年后的云栖大会 杭州的秋天,依旧炎热。互联网的江湖,依旧充满 燥 热。如果二十年前人们谈论的是 "门户""搜索""电商",那么如今"模型""算力""智能体"是绝 对的主角。 在一家成了不到两年、名为 "原力无限"的杭州机器人公司的展台上,吴老师先是被穿着马面裙的机器人"算了一卦",接着他穿上"机器衣",对着 空气比划着手,只见一旁的机器人按照吴老师的手势,一点点把积木搭了起来 。 在宇树科技的擂台上,吴老师被里三层、外三层的观众围着,只 见他摆起架势,和穿着拳击手套的机器人同台竞技。当机器人被击倒后"装死"几秒又飞速起身,引得观众大笑。 "印象中以前没这么多人 。 " 一位随行的企业家学员感叹道。还有一个关于 "人"的有趣现象是,印度人、美国人、荷兰人等外国人面孔越来越多 了。 这似乎表明,云栖大会从最早的地方性互联网技术展,已逐渐发展成一场国际性科 ...
第七次谈自定义Agent
国盛证券· 2025-09-27 21:48
行业投资评级 - 增持(维持)[3] 核心观点 - 自定义 Agent 代表 AI 交互新范式,从被动响应转向主动服务,OpenAI 的 ChatGPT Pulse 功能可在用户睡眠时持续研究并推送个性化内容,支持连接 Gmail 和 Google 日历以增强上下文理解,未来可能通过广告实现商业化 [1][12][18] - 阿里云在云栖大会提出 AGI 仅是起点,终极目标是超级人工智能(ASI),发展路径分三阶段:智能涌现、自主行动和自我迭代,阿里云定位全栈 AI 服务商,通义千问开源 300 多款模型,全球下载量超 6 亿次,衍生模型超 17 万个,并推进三年 3800 亿 AI 基础设施建设计划,目标 2032 年全球数据中心能耗规模较 2022 年提升 10 倍 [2][23][24] - 自定义 Agent 应用前景广阔,金融机构可构建个人投研知识库、智能群发助手、信息整理工具、个性化工作助理、AI 编程工具和生活助手,未来用户可通过创作 Agent 分享收益,如 AI 数字劳动力市场 MuleRun 已上线 [6][32][43] 行业动态与产品发布 - OpenAI 发布 ChatGPT Pulse 预览版,支持移动端专业版用户,功能包括主动研究、个性化更新和主题可视化卡片,用户可管理研究内容并通过点赞/踩提供反馈 [1][12][14] - 阿里云发布通义大模型家族 7 连发,旗舰模型 Qwen3-Max 在 Chatbot Arena 排行榜列第三,Qwen3-Next 架构训练成本较密集模型 Qwen3-32B 降低超 90%,长文本推理吞吐量提升 10 倍以上,多模态模型 Qwen3-VL 在 32 项测评中超过 Gemini-2.5-Pro 和 GPT-5 [2][26][28] 技术发展路径 - ASI 发展三阶段:智能涌现(大模型学习全球知识,具备泛化智能和推理能力)、自主行动(大模型通过 Tool Use 和 Coding 能力创建 Agent)、自我迭代(AI 连接真实世界数据并自主优化) [2][20][21] - 大模型被视为下一代操作系统,自然语言成为编程语言,Agent 是新的软件,Context 是新的 Memory,超级 AI 云是下一代计算机,需要更稠密算力和高效网络 [2][22][23] 应用场景展望 - 个人投研知识库:支持资料检索、分析和分享汇报,可导入调研纪要和访谈记录,实现协作和客户汇报自动化 [6][32] - 智能群发助手:分析聊天记录实现差异化群发和自动回复闭环 [6][34] - 信息整理工具:提炼微信消息、研报和公众号要点,支持个性化规则设置 [6][35] - 个性化工作助理:保存自定义设置,如要求输出时附权威来源链接 [6][37] - AI 编程工具:通过对话生成数据分析代码和实用工具,如底稿生成和报销助手 [6][40] - 生活助手:整合竞品平台查询,如美团"小美"测试点餐功能,未来可自定义跨平台 Agent [6][41] 商业化与生态发展 - Pulse 创新可能影响新闻和社交媒体消费习惯,未来通过广告商业化 [1][18] - MuleRun 作为全球首个 AI 数字劳动力市场,允许用户上传 Agent 并通过算力积分获取收益,平台抽成,实现低门槛开发和持续收益 [6][43] 建议关注公司 - 算力领域:寒武纪、海光信息、中际旭创、浪潮信息、中科曙光等 [7][47] - Agent 领域:阿里巴巴、腾讯控股、科大讯飞、用友网络、恒生电子等 [7][47] - 自动驾驶领域:江淮汽车、赛力斯、小鹏汽车、理想汽车等 [8][48] - 军工 AI 领域:拓尔思、能科科技、中科星图等 [8][48]
先进科技主题:阿里巴巴推进3800亿的AI基础设施建设,华为公布自研AI芯片路线图
上海证券· 2025-09-27 18:33
行业投资评级 - 电子行业评级为增持(维持)[2] 核心观点 - 人工智能产业正处于应用快速发展期 相应的基础设施建设也处于同样阶段 AIDC需求快速增加[8] - 大模型进入实用化阶段 人工智能正催生出大量全新的应用场景[8] - 短期涨幅过高后的回调下 重视PCB ODM AIOT AIDC板块的逢低布局机会[9] 市场回顾 - 本周上证指数报收3820.09点 周涨跌幅为-1.3% 深证成指报收13070.86点 周涨跌幅为+1.14% 创业板指报收3091点 周涨跌幅为+2.34% 沪深300指数报收4501.92点 周涨跌幅为-0.44%[5] - 中证人工智能指数报收2243.85点 周涨跌幅+1.17% 跑赢大盘[5] 重大行业动态 - 华为全联接大会2025公布最新昇腾AI芯片路线图:2026年第一季度推出昇腾950PR芯片 四季度推出昇腾950DT 2027年四季度推出昇腾960芯片 2028年四季度推出昇腾970芯片[7] - 华为鲲鹏CPU路线图:2026年四季度推出鲲鹏950 拥有96核心192线程和192核心384线程两个版本 2028年一季度推出鲲鹏960 拥有96核心192线程高性能版本和大于等于256核心512线程高密度版本 单核性能提升50%[7] - 华为全面开放超节点基础硬件 包括NPU模组 风冷刀片 液冷刀片 AI标卡 CPU主板和级联卡等不同形态硬件[7] - 阿里巴巴在2025云栖大会推出模型Qwen3-Max 并宣布积极推进3800亿AI基础设施建设[7] - 阿里巴巴计划到2032年使全球数据中心能耗规模提升10倍 意味着算力投入将指数级提升[7] - 英伟达与OpenAI宣布达成战略合作 OpenAI将建成并部署至少10吉瓦的AI数据中心 配备数百万块英伟达GPU[8] - 英伟达将在新系统落地过程中向OpenAI投资至多1000亿美元 首阶段系统目标于2026年下半年通过Vera Rubin平台上线[8] - 10吉瓦算力相当于400-500万块GPU 与英伟达今年预计出货量一致 是英伟达去年出货量的两倍[8] 技术发展趋势 - 目前我国单机柜功率正从当前的50kW向300kW甚至更高水平推进[8] - 超节点规模的扩展使单集群供电需求跃升至数百MW 远超现有数据中心单栋楼10-20MW供电能力[8] - 华为开放灵衢协议和超节点参考架构 允许产业界基于技术规范自研相关产品或部件[7] - 开源操作系统灵衢组件 用户可将源代码集成到现有操作系统中[7] 投资建议与重点公司 - PCB板块关注胜宏科技 东山精密 沪电股份 景旺电子 生益电子[10] - PCB设备板块关注芯碁微装 大族数控 东威科技 日联科技[10] - PCB材料板块关注天承科技 江南新材[10] - 自主可控板块关注芯原股份 翱捷科技 北方华创[10] - AI新消费场景板块关注泰凌微 思特威[10] - AIDC板块关注飞龙股份 潍柴重机[10] - 端侧ODM板块关注华勤技术 龙旗科技[10] 产能扩张情况 - 胜宏科技越南人工智能HDI项目总投资18.15亿元 产能15万平方米 泰国高多层印制线路板项目投资14.02亿元 产能150万平方米[11] - 沪电股份人工智能芯片配套高端印制电路板扩产项目投资约43亿元[11] - 深南电路泰国工厂投资12.74亿元 生产高多层和HDI产品[11] - 景旺电子泰国一期项目投资20亿元 产能10万平方米/月 计划2026年初投产[11] - 生益电子智能算力中心高多层高密互连电路板建设项目第一阶段产能15万平方米 2025年试生产 第二阶段产能10万平方米 2027年试生产[11] 财务数据表现 - 中际旭创2025Q2营业收入81.15亿元 同比增长36.25% 归母净利润24.12亿元 同比增长78.80%[17] - 新易盛2025Q2营业收入63.85亿元 归母净利润23.70亿元[17] - 沪电股份2025Q2营业收入44.56亿元 同比增长56.91% 归母净利润9.20亿元 同比增长47.01%[17] - 胜宏科技2025Q2营业收入47.19亿元 同比增长91.51% 归母净利润12.22亿元 同比增长390.14%[17] - 生益电子2025Q2营业收入21.89亿元 同比增长101.12% 归母净利润3.30亿元 同比增长374.34%[17]
高代码时代来临,阿里云百炼要让 Agent 真正跑在业务里
36氪· 2025-09-27 15:19
行业趋势与市场动态 - AI Agent成为企业提升效率的关键路径 普华永道调研显示79%的受访公司已在某些业务中应用AI Agent 其中66%实现生产力提升 57%实现成本下降 55%加快决策效率 54%提升客户体验 [1] - Agent平台成为互联网巨头竞争焦点 海外LangChain/LangGraph 微软AutoGen Google ADK升级 国内腾讯 华为 百炼在2025年9月集中推出和升级Agent平台 [1] - 低代码Agent平台存在局限性 依赖预定义编排逻辑 仅适合简单问答或流程自动化 难以处理跨系统调用 长链条任务和多轮反思决策 [2] 阿里云百炼平台战略定位 - 平台定位为企业提供AI Agent开发"土壤" 集成模型调用 框架搭建 资源调度 合规运维等全套能力 [4] - 基于完整技术栈构建产业链 顶层通义系列大模型 中间百炼企业级开发平台 底层云计算基础设施 [4] - 平台开发者生态规模显著 过去一年20多万开发者开发超80万个Agent [4] 平台技术架构与能力升级 - 推出ModelStudio-ADK高代码框架 突破预定义编排方式 支持自主决策 多轮反思和循环执行能力 [2][7] - 采用双轨并行开发模式 低代码ADP支持快速原型验证 高代码ADK支持复杂业务深度定制和大规模部署 [4][8] - 集成七大企业级能力矩阵 包括工具调用 记忆存取 动态推理调度 沙箱环境 全链路可观测性 支付通道 [2][5] 模型与组件能力建设 - 持续更新通义千问旗舰模型 Qwen3系列推理性能提升50% 决策成功率达90% [5] - 开放200多款业界模型调用接口 支持Qwen Wan DeepSeek等模型一键接入 [5][9] - 搭建Pay Server支付通道 成为业内首个面向企业级Agent的专业商业化支付解决方案 [5] 实际应用与性能表现 - 网商银行贷款审核应用处理26类凭证和400多种细粒度物体 识别准确率超95% 将3小时人工作业压缩至5分钟内 [12] - 平台模型月调用量过去一年增长15倍 承接千行百业AI应用开发需求 [5] - 开源DeepResearch Agentic-RAG Computer Use等示例项目 支持开发者直接体验和二次开发 [11] 技术演进与行业影响 - Agent技术从实验室试验向企业大规模生产演进 阿里云通过平台+框架+组件系统布局打通全链路 [12] - 高代码框架解决Agent规模化落地难题 保证复杂场景灵活性稳定性 补齐可控性 可观测性和商业化能力 [8][11] - OpenAI预测2025年AI代理将加入劳动力大军并改变公司产出 阿里云全栈AI能力正推动该趋势成为现实 [13]
阿里巴巴-W(9988.HK):2025阿里云栖大会:以大模型OS与AI云计算机重塑智能时代
格隆汇· 2025-09-27 11:05
核心战略定位 - 公司以超级人工智能(ASI)为终极目标 明确大模型是下一代操作系统与AI云是下一代计算机两大核心判断 旨在重塑AI时代计算范式 [1] - 公司提出从学习人到辅助人再到超越人的三阶段演进路线图 ASI致力于创造超级科学家以解决人类根本性科学难题 [1] - AGI只是起点 ASI目标致力于抢占未来AI领域战略制高点 [1] 大模型战略 - 发布性能跻身全球前三的Qwen3-Max旗舰模型 坚定选择开源路线 将通义千问打造为AI时代的Android [1] - 自然语言成为AI时代编程语言 Agent成为新软件 软件研发范式发生巨大变革 [1] - 发布全栈全模态通义全家桶 包括ModelStudio-ADK等开发框架 大幅降低AI应用门槛 旨在构建繁荣开发者生态 [1] 基础设施投入 - 发布自研磐久AI服务器和HPN 8.0高性能网络为代表的全栈AI基础设施 进行全面迭代 [1][2] - 宣布推进三年3800亿元AI基建投资计划 以应对未来数据中心10倍能耗规模增长 [1][2] - 超级AI云作为下一代计算机 支撑海量Agent应用 [2] 竞争战略 - OS加计算机的新范式 结合饱和式投入和开源生态战略 构筑未来全球超级云计算平台核心竞争力 [2]
吴泳铭给出了中国版的“加速主义”AI叙事
观察者网· 2025-09-27 11:02
阿里巴巴AI战略愿景 - 阿里巴巴CEO吴泳铭将通用人工智能(AGI)视为确定性事件,并视其为超级人工智能(ASI)的起点 [1] - AGI目标是将人类从80%日常工作中解放,ASI将创造超级科学家和全栈超级工程师,以指数级速度解决医学、能源、气候及星际旅行等难题 [3] - 阿里巴巴定位为全栈人工智能服务商,提供世界领先的智能能力和全球AI云计算网络 [4] 技术发展路径 - AI发展分为三阶段:智能涌现(学习人)、自主行动(辅助人)、自我迭代(超越人) [3] - AI需直接从物理世界获取全面原始数据,通过自主学习实现自我优化并跨越技术奇点 [3] - 大模型被定义为下一代操作系统,超级AI云被视为下一代计算机 [4] 行业投资与竞争格局 - 阿里巴巴宣布投入3800亿人民币建设AI基础设施,计划2032年将数据中心能耗规模提升10倍 [4] - 全球AI行业过去一年投资总额超4000亿美元,未来5年累计投入预计超4万亿美元 [6] - 全球AI云计算平台可能仅存5-6个超级集群,需整合数百万GPU及吉瓦级电力与冷却能力 [7] 国际视角与行业共识 - 雷·库兹韦尔预测2045年实现技术奇点,AGI于2029年实现并遵循计算能力每18个月翻倍的加速回报定律 [5] - 萨姆·奥特曼认为AGI将引发超级指数级经济增长,使个人生产力提升10-100倍 [5] - 中美AI投入差距显著:美国4家科技巨头过去5年资本开支总和达5.36万亿人民币,中国7家头部公司仅6300亿人民币 [6] 中国AI生态与厂商布局 - 中国AI云市场前五大厂商(阿里云、火山引擎、华为云、百度AI云、腾讯云)有望竞争全球5-6个超级平台席位 [8] - 阿里巴巴具备全栈技术能力,包括基础模型Qwen3-Max及深度整合的AI云解决方案 [7] - 阿里强调AI需与物理世界互动,通过真实场景数据驱动发展 [7]
周靖人解读阿里云大模型“七连发” 与OpenAI、谷歌比拼迭代与创新
中国经营报· 2025-09-26 19:51
阿里云大模型技术发布 - 阿里云在2025云栖大会上一口气发布七款大模型技术产品 覆盖语言、语音、视觉、多模态、代码等模型领域 在模型智能水平、Agent工具调用、Coding能力、深度推理、多模态等方面实现突破 [1] - 通义千问家族最大最强的基础模型Qwen3-Max预训练数据量达36T tokens 总参数超过万亿 在SWE-Bench Verified测试中Instruct版本斩获69.6分 位列全球第一梯队 在Tau2-Bench测试中取得突破性的74.8分 超过Claude Opus4和DeepSeek-V3.1 [2] - 通义万相Wan2.5-preview首次实现音画一体视频生成等功能 成为阿里迄今为止最强的全模态视觉生成大模型 首次采用原生多模态架构 涵盖文生视频、图生视频、文生图和图像编辑四大模型 [2] 多模态与语音模型发展 - 语音大模型通义百聆新发布语音识别大模型Fun-ASR和语音合成大模型Fun-CosyVoice Fun-ASR基于数千万小时真实语音数据训练而成 具备强大的上下文理解能力与行业适应性 Fun-CosyVoice可提供上百种预制音色 用于客服、销售、直播电商、消费电子、有声书、儿童娱乐等场景 [3] - 通义大模型家族包含300个大模型 从0.5B到超万亿 覆盖LLM、编程、图像、语音、视频等"全模态" 满足从智能终端到云上的多场景需求 [3] 阿里云战略定位与竞争优势 - 阿里云定位为全栈人工智能服务商 提供世界领先的智能能力和遍布全球的AI云计算网络 向全球各地提供开发者生态友好的AI服务 [5] - 阿里云是全球少数几家在大模型和云计算方面都能够做到全栈自研 能够做到联合创新的云计算公司之一 全栈自研包括三部分 AI模型、Agent开发以及AI基础设施 [5] - 阿里云是全球前四里面唯一一个中国的云厂商 也是中国唯一具备国际影响力和具有国际很强大竞争力的云厂商 [6] 技术路径与投入规划 - 阿里云选择"全栈式"技术攻坚路径 从底层芯片到上层应用构建完整技术闭环 腾讯则秉持"生态融合"战略 将AI技术深度嵌入微信、游戏、广告等核心业务场景 更强调"场景化"技术落地策略 [6] - 阿里云积极推进三年3800亿元的AI基础设施建设计划 并持续追加更大投入 对比2022年GenAI的元年 2032年阿里云全球数据中心的能耗规模将提升10倍 [6] 行业趋势与判断 - 实现通用人工智能(AGI)已是确定性事件 大模型是下一代操作系统 大模型代表的技术平台将会替代现在苹果OS的地位 成为下一代的操作系统 [1][3] - AI将会替代能源的地位 成为最重要的商品 超级AI云是下一代的计算机 [5]
OpenAI 3万亿美元测试,AI首战44个行业人类专家
36氪· 2025-09-26 17:47
AI下半场,AGI已成过去式,ASI正引领新智能革命!OpenAI推出的GDPval评估体系,通过真实工作任务审视大模型潜力,揭示AI如何从实验 室走向3万亿经济战场,助力人类从日常琐事中解放,拥抱创造性未来。 AI下半场真来了! AGI都过时了,现在AI业内讨论的是超级人工智能ASI: AGI能把人类从80%的日常工作中解放出来; 而ASI则全面超越人类智能的系统。 刚刚,在a16z访谈中,OpenAI首席科学家Jakub Pachocki,透露OpenAI的研究路线图的下一步是推理,下一个5年的重点目标是打造自动化研究人员: AI自动发现新想法,自动化研究人员的工作,自动化机器学习研究。 但理解AI潜力最清晰的方式,并不是预测未来,而是看看模型现在已经能做什么。 历史经验告诉我们,从互联网到智能手机,每一项重大技术从诞生到普及都需要十年以上。 OpenAI希望以更透明的方式,展示大模型如何真正服务于现实世界。 因此,他们推出了一项全新的评估体系GDPval,在有据可依的基础上审视AI进步轨迹,而不是凭空臆测。 论文地址:https://cdn.openai.com/pdf/d5eb7428-c4e9-4a ...