General Artificial Intelligence (AGI)

搜索文档
OpenAI测试称GPT-5媲美专家
36氪· 2025-09-26 09:27
OpenAI表示,其GPT-5模型以及竞争对手Anthropic公司的Claude Opus 4.1"已经接近行业专 家的工作质量"。 当地时间周四(9月25日),人工智能(AI)研究公司OpenAI发布了一项新的基准测试,用于比较其AI 模型与各行业专业人士的工作表现。 这项测试名为GDPval,是一次初步尝试,旨在评估OpenAI的系统距离在经济价值工作上超越人类有多 近。而经济价值工作是OpenAI开发通用人工智能(AGI)的关键环节。 OpenAI周四表示,其GPT-5模型以及竞争对手Anthropic公司的Claude Opus 4.1"已经接近行业专家的工 作质量"。 例如,某项任务要求投行人员为"最后一公里配送行业"制作竞争格局分析,并与AI生成的报 告进行对比。OpenAI随后将AI模型在全部44个职业中对抗人类报告的"胜率"进行平均计 算。 结果显示,GPT-5-high(高算力版本GPT-5)在40.6%的情况下被评为优于或与行业专家持平。 而Anthropic的Claude Opus 4.1模型则在49%的任务中被评为不输于行业专家,这一表现超过了OpenAI的 模型。 OpenAI对此 ...
AI办公应用能力评价考试网:大厂开出百万美金期权激励,谁能拿到?
搜狐财经· 2025-09-25 10:15
近年来,随着人工智能技术加速渗透到各行各业,AI人才市场呈现出前所未有的繁荣景象。从顶尖科研人才到应届毕业生,互联网大厂和头部AI企业纷纷 开出天价薪酬和福利来吸引精英。 近日,大模型企业MiniMax启动百万美金期权激励计划,覆盖技术、产品甚至实习生岗位,字节跳动也为旗下Seed部门推出长达18个月的期权增发方案,员 工每月可获得价值数万元的期权。 与此同时,脉脉发布的数据显示,截至2025年7月,人工智能相关岗位的平均月薪高达4.7万至7.8万元,部分实习生日薪甚至达到4000元。这股高薪浪潮不仅 体现在社会招聘中,校招市场同样火热:百度今年秋招AI职位占比超九成,阿里超六成,腾讯、美团等也大幅增加AI岗位投入。这些现象无不印证着AI人 才的稀缺性和行业对技术的迫切需求。 高 薪成为AI领域的代名词,背后是技术驱动的产业升级。人工智能作为新一轮科技革命的核心,正重塑金融、医疗、制造等传统行业。企业愿意重金投入, 正是因为AI能带来效率提升和商业模式创新。例如,MiniMax的期权激励旨在鼓励员工追求通用人工智能(AGI),字节跳动的期权计划则聚焦大模型研 发,这些都显示了企业对长期技术布局的重视。校招数据 ...
从Transformer到GPT-5,听听OpenAI科学家 Lukasz 的“大模型第一性思考”
36氪· 2025-09-22 21:04
2017 年,一篇标题看似简单、甚至有些狂妄的论文在线上出现:《Attention Is All You Need》。 在当时的 AI 研究界,这是一个石破天惊的宣言。它提议彻底抛弃被奉为圭臬的循环神经网络(RNN),只用一种名为"注意力"的机制来处理语言。最 初,许多人对此持怀疑态度。然而,这篇仅 15 页的论文很快就点燃了一场燎原之火。它所提出的 Transformer 架构,以摧枯拉朽之势,重塑了人工智能的 版图。今天,从驱动你手机输入的预测文本,到生成惊艳图像的 DALL-E,再到改变世界的 ChatGPT,其底层的心跳,都源于那篇论文。截至发文,其在 Google Scholar 上的引用次数高达 197159 次。 | TITLE | CITED BY | YEAR | | --- | --- | --- | | Attention is all you need | 197159 | 2017 | | A Vaswani, N Shazeer, N Parmar, J Uszkoreit, L Jones, AN Gomez, | | | 论文的火爆,也让研究圈的目光落在了背后的作者——当时在 ...
AI人才争夺战下的暗流:谁在为源头创新续费?
36氪· 2025-09-12 17:01
全球AI人才格局与中国青年科研力量 - 中国在全球AI专利占比达61.1% [1] - 全球顶尖AI团队(如OpenAI、谷歌DeepMind)核心成员包含大量华人面孔 [1] - 青年科研者面临产业界快速变现与学术界长期基础研究的职业选择 [1] 四大前沿科技竞争领域 - 通用人工智能(AGI)为产业界人才竞争最激烈领域 [2] - 具身智能需攻克"人类水平泛化能力"基础科学难题 [5] - 数字医学需突破数据、伦理及法规壁垒 [6] - 数据处理与安全隐私是AI时代的底层"护栏"技术 [6] 产学研协同创新模式 - 学术界长期研究解决产业爆发期核心痛点(如电子科技大学张帆的医疗影像技术将处理时间从数小时压缩至几分钟) [8] - 产业界经验反哺学术研究(如北京大学李萌基于Meta工作经历聚焦端侧部署与隐私计算) [9] - 学术与产业边界模糊化协同进化(如上海交大李永露与穹彻智能合作具身智能研究) [9][13] - 中国人民大学张峰的数据压缩技术为阿里"智行通2.0"实现14%成本下降 [13] 科技企业人才战略布局 - InTech奖新增10位顶尖博士生奖学金作为长期价值投资 [14] - 蚂蚁集团构建AGI全栈能力覆盖基础技术至应用场景 [14] - 通过"Plan A"招聘计划、AGI部门及校企合作构建多层次人才平台 [18]
Altman描绘AI十年路线图:"智能即电力",任何软件秒生,10人公司也能年入10亿
华尔街见闻· 2025-09-10 23:34
在与OpenAI早期投资人Vinod Khosla的最新对话中,OpenAI CEO Sam Altman勾勒了一幅未来十年人工 智能(AI)发展的图景:到2035年,软件将实现即时生成,10人公司年收入可达10亿美元,而AI的成 本将趋同于电力成本。 这场与硅谷传奇风险投资人Vinod Khosla的深度对话揭示了AI技术将如何重塑商业格局,同时保持人类 核心体验的不变性。 软件行业面临根本性重构 传统软件商业模式正面临前所未有的挑战。Altman指出,当用户可以通过简单描述需求就能获得定制软 件时,购买现成SaaS产品的必要性将大幅降低。这种转变将比需要复杂供应链的物理世界变革来得更 快。 《财富》500强企业的消亡速度也将在2030年代显著加速。Khosla预测,企业能否生存将取决于其适应 速度,而新公司的增长速度将达到空前水平。OpenAI自身就是这一趋势的典型例证——作为一家从研 究实验室起步的公司,其商业化速度远超传统路径。 这种变革的核心驱动力来自三大支柱的持续优化:更好的算法、更大的计算能力和更多的数据。Altman 建议创业者假设模型在"各个维度都会变得更好、更便宜",并以此为基础进行产品规 ...
一位被开除的00后爆红
投资界· 2025-09-01 15:42
核心观点 - 前OpenAI研究员Leopold Aschenbrenner被开除后创立对冲基金 通过押注AI受益行业及做空落后行业 实现基金规模达15亿美元 上半年回报率47% 远超市场基准[5][11][12] - 其投资策略基于对AI技术发展的深刻理解 重点布局半导体 基础设施 电力公司及新兴AI企业如Anthropic[11] - 基金获得多位科技及投资界知名人士支持 包括Stripe创始人 Collison兄弟 Meta的AI团队领导Daniel Gross和Nat Friedman 以及投资者Graham Duncan[11] 基金表现与规模 - 基金上半年回报率达到47% 同期标普500指数回报率为6% 技术对冲基金指数回报率为7% 超额收益显著[12] - 资金规模迅速突破15亿美元 折合人民币约108亿元(按1:7.2汇率)[11] - 投资者愿意将资金锁定数年 显示对基金策略的强烈信心[12] 创始人背景与经历 - Leopold Aschenbrenner为00后 15岁进入哥伦比亚大学 19岁获数学 统计学和经济学三个学位[13] - 曾任职于OpenAI的"超级对齐"团队 致力于确保超级智能AI与人类价值观一致[16] - 2024年4月因向董事会提交安全漏洞备忘录后被OpenAI以泄密理由解雇[17] 投资策略与理论基础 - 基金投资策略直接源于其撰写的165页分析文章《Situational Awareness: The Decade Ahead》[10][19] - 核心论点为AI正处于指数级增长阶段 从GPT-2到GPT-4代表多个数量级(OOM)的提升[20][21] - 驱动因素包括扩展定律(Scaling Laws) 算法创新及海量数据集使用[22][26] - 预测到2027年可能实现通用人工智能(AGI) 将引发各行业革命性变化[26][28] 行业影响与技术展望 - AGI发展将显著提升生产力和效率 但同时带来失业 AI伦理及治理结构等挑战[28] - 超级智能可能出现"智能爆炸" 通过自我完善循环实现指数级智力增长[29] - 构建AGI需大规模计算基础设施 涉及算力 设备效率 能源利用及信息处理能力的全面提升[31] - 国家安全机构将在AGI技术管理中发挥更大作用 其战略意义可比曼哈顿计划[33]
23岁小哥被OpenAI开除,成立对冲基金收益爆表,165页论文传遍硅谷
机器之心· 2025-08-30 12:12
文章核心观点 - 前OpenAI员工Leopold Aschenbrenner被解雇后创立对冲基金 通过押注AI相关领域实现47%回报率 远超市场平均水平[1][14] - Aschenbrenner预测2027年将实现通用人工智能 其依据是AI能力的指数级增长和算力扩展定律[29][38] - AI发展将引发各行业变革 需关注算力基础设施 国家安全和治理结构等关键因素[31][36][38] Leopold Aschenbrenner背景 - 23岁 拥有哥伦比亚大学数学 统计学和经济学三个学位 GPA年级第一[16] - 曾任职OpenAI超级对齐团队 参与Weak-to-Strong Generalization研究 后因泄露内部信息被解雇[7][18] - 在FTX Future Fund工作期间专注于AI安全和全球风险管理[17] 对冲基金表现 - 基金规模达15亿美元 投资策略为做多半导体 基础设施 电力公司及Anthropic等AI企业 同时做空可能被淘汰行业[10][11] - 2024年上半年回报率47% 同期标普500指数回报6% 技术对冲基金指数回报7%[14] - 获得Stripe创始人 Collison兄弟 Meta的AI团队领导及著名投资者Graham Duncan支持[11] AI技术发展预测 - 从GPT-2到GPT-4代表多个数量级(OOM)进步 即指标十倍增长[26] - AI进步依赖三大因素:扩展定律 算法创新及海量数据集 性能提升接近指数级[27][29] - AGI系统将具备并行研究能力 可同时进行多项测试 解决复杂科学技术难题[35] 行业影响与基础设施 - AGI将改变材料科学 能源和健康领域 显著提高经济生产力和人类福祉[35] - 构建AGI需大规模计算基础设施 包括设备效率 能源利用和信息处理能力提升[36] - 科技巨头正投入重金建设大规模AI算力基础设施[38]
刚刚,GPT-5 Pro自证全新数学定理,OpenAI总裁直呼颠覆,大佬们集体转发
36氪· 2025-08-21 11:13
AI数学问题解决能力突破 - GPT-5 Pro独立攻克数学论文中关于梯度下降法步长η的未解区间问题 从零开始且未参考人类已有证明方法[1][6][15] - 模型将已知下限从1/L推进至1.5/L 证明过程被评价为非常优雅[6][12][17] - 该证明与论文作者后续发布的v2版本证明方法完全不同 属于v1证明的演进[12][15] 技术实现细节 - 研究针对光滑凸优化中梯度下降步长η与函数值曲线凸性的关系 未解决区间原为[1/L, 1.75/L][2][3][5] - 论文v1版本证明η<1/L时成立 η>1.75/L时存在反例[3] - 人类作者在v2版本中将阈值改写为1.75/L 彻底解决该问题[12] 行业影响与评价 - OpenAI总裁Greg Brockman认为这可能是AI在数学领域展现生命力的迹象[13][14] - 此次突破由面向用户的GPT-5 Pro版本实现 而非内部推理模型[15] - 前微软AI副总裁Sebastien Bubeck用25分钟验证结论 确认AI实际证明该问题[17][20] 研究者背景与方向 - Sebastien Bubeck现任OpenAI研究工程师 专注智能涌现与AGI物理学研究[18][21][22] - 拥有微软研究院10年工作经验 曾获STOC2023、NeurIPS2018/2021等多个最佳论文奖[20] - 职业生涯前15年主要研究凸优化、在线算法及机器学习对抗鲁棒性[20]
OpenAI史上最大失误:放走这位MIT学霸,美国AI「三朝元老」,现实韦小宝
36氪· 2025-08-21 08:39
AI算力基础设施规模 - AI基础设施规模超越阿波罗登月与曼哈顿计划[1] - AGI算力投入年增速高达3倍[2] - 2027至2028年算力增长存在不确定性[3] Anthropic发展历程 - 公司由OpenAI前团队成员联合创立[4] - 初创团队仅7人且缺乏明确产品规划[5] - Claude系列产品现已成为全球开发者首选工具[7] - 公司员工规模已超2000人且保持使命驱动文化[36] 技术突破与市场表现 - GPT-3训练实现从TPU到GPU的算力架构转型[29] - Scaling Law证明算力规模与智能水平呈正相关[31] - Claude 3.5 Sonnet版本实现编程场景市占率从个位数升至80%-90%[37] - Claude Code通过"心智切换"理论实现智能体式编程突破[41][42] 人才发展与行业趋势 - 线性代数B-成绩者通过自学成为AI核心研发人员[3][19] - 分布式系统与机器学习复合型人才极为稀缺[25] - 行业更注重内在驱动而非传统学历认证路径[46][47] - FAANG公司职业路径价值在AI时代被重新评估[48]
GPT-5 能让普通人变成博士,但魔法依旧没有
36氪· 2025-08-08 11:50
产品发布与核心能力 - OpenAI发布GPT-5 模型系统 具备256k token上下文窗口 支持文本和图像输入 函数调用和结构化输出[12] - 模型自动判断查询意图 简单问题路由到极速响应版本 复杂问题路由到深度思考版本[13][14] - 在数学领域AIME 2025测试得分94.6% 真实世界编码SWE-bench Verified得分74.9% 多模态理解MMMU得分84.2% 健康领域HealthBench Hard得分46.2%[18] - 在GPQA测试中无需工具得分88.4% 凭借扩展推理能力创下新高[18] - 幻觉显著降低 启用搜索时事实性错误比GPT-4o减少45% 思考模式下比OpenAI o3降低80%[25] - 欺骗行为大幅改善 对不存在图像给出自信答案的概率从o3的86.7%降至9%[27] - 思考效率提升 在视觉推理 代理编码和科学问题解决中输出token数量减少50%至80%[28] 实际应用与用户体验 - 能够生成交互式应用 例如用一句话创建流体力学伯努利公式的可互动页面[3] - 支持定制化学习工具生成 如法语学习应用 并可通过自然语言修改应用功能[5] - 为创业公司CFO生成详细财务状况演示板 仅需100字描述 3分钟内完成[7] - 通过3段提示词生成带射击游戏功能的3D城堡模型 包含音效和交互元素[7] - 在医疗健康领域提供专业建议 帮助癌症患者理解治疗方案并做出决策[9][11] - 成为最强大编码工具 可一次性创建美观且响应迅速的网站 应用程序和游戏[15] - 作为最强大写作工具 处理结构模糊文本如抑扬格五音步或自由诗 辅助起草报告 邮件等[17][18] 性能评估与行业地位 - 在LMArena排行榜以1481分位列第一 超越Gemini 2.5 Pro的1460分和o3的1450分[21][22] - 在Intelligence Analysis评测中获得第一名[22] - 被类比为博士级专家水平 而GPT-4o仅为大学生水平[1][32] - 但被部分行业人士评价为"非巨大飞跃" 未达到AGI水平 Grok 4在ARC-AGI-2测试中表现更优[36][37] 商业化与定价策略 - API定价极具竞争力 输入价格1.25美元/百万token 输出价格10美元/百万token[30][31] - 价格低于Claude Opus 4的15/75美元和Gemini 2.5 Pro的2.5/15美元 与Gemini 2.5 Pro低价版本持平[31] 市场反响与争议 - 发布会持续时间超1小时 较以往半小时显著延长 体现公司重视程度[32] - 发布会图表出现严重错误 SWE-bench数据标注混乱 引发公众质疑[33][35] - 马斯克宣称Grok 4 Heavy比GPT-5更智能[35] - 学者指出需关注实际性能 利润模式仍不清晰 技术护城河尚未明确[37]