通用人工智能
搜索文档
AI教父Hinton,重新能坐下了
虎嗅· 2025-08-03 12:53
行业与公司发展 - 2012年Hinton团队在ImageNet竞赛中以15.3%错误率夺冠,标志深度学习在图像分类领域的重大突破 [30][31] - 深度学习复兴的两大前提:2010年前后计算能力与大数据成熟 [34] - Hinton团队开发的神经网络技术使机器识别常见物体的准确度达到前所未有的水平 [33] 关键技术突破 - Hinton与搭档提出玻尔兹曼机和反向传播算法,解决机器"从数据中自动提炼内部表征"的核心难题 [20] - ChatGPT底层架构采用Transformer,属于神经网络的一种特殊形式 [13] - 2012年深度学习从纯学术研究转向产业应用,成为科技巨头战略核心 [42][43] 重大商业事件 - 2013年谷歌以4400万美元收购Hinton创立的DNNResearch公司 [40][41] - 谷歌随后以6.5亿美元收购DeepMind,该交易被视为谷歌最值得的投资之一 [54] - DeepMind被收购后开发出AlphaGo、AlphaFold、Gemini等里程碑式AI产品 [55][57] 行业影响与趋势 - 2019年Hinton与LeCun、Bengio共获图灵奖,表彰其推动神经网络成为科技产业核心 [59][60] - 2023年Hinton预警AI风险,提出"AI30年内导致人类灭绝概率10%-20%"的观点 [76] - AI发展速度超预期,Hinton修正预测认为"AI5年内可能比人类更聪明" [76] 行业应用前景 - Hinton认为AI将颠覆所有行业,仅水管工等需要高度创造力的职业暂时安全 [76] - 谷歌通过整合DeepMind与谷歌大脑部门,持续产出尖端AI产品 [57] - 全球科技巨头围绕深度学习重构业务,涵盖搜索、语音、图像识别、自动驾驶等领域 [43]
全网苦等GPT-5,超级对齐团队遗作成重要线索,奥特曼发话「惊喜很多」
机器之心· 2025-08-03 12:21
GPT-5技术进展 - OpenAI正在开发名为"通用验证器"的技术,可能是GPT-5的核心组件之一[1] - 该技术源于OpenAI去年发表的论文,通过小模型验证大模型的推理链并反馈奖励信号[1] - 验证者模型设计轻量化,适合大规模部署,明确为未来GPT部署准备[4] 证明者-验证者机制 - 采用双人格架构:证明者生成严谨推理,欺骗者植入错误逻辑[6] - 通过左右脑互搏游戏提升模型输出质量,类似GAN的对抗训练模式[5] - 训练方法使模型逐步产生结构清晰、逻辑严密的答案[9] 技术突破意义 - 代表AI发展从数据堆料转向架构创新的新阶段[11] - 可能突破当前数据瓶颈,实现更高级别的通用人工智能[11] - 系统将整合到未来主流模型的RLHF流程中[11] GPT-5实际表现 - 泄露版本显示存在GPT-5和5 Pro两个子版本[15] - 已具备生成动态效果丝滑的动画内容能力[17] - 可还原复杂游戏场景如Doom片段,展示强大生成能力[19] 行业影响 - 技术来自OpenAI已解散的超级对齐团队,显示持续研发路径[13] - 行业期待值达到新高,普遍认为将开启AI新时代[20][22] - OpenAI此前已在GPT-4代码助手中测试类似"批评家"机制[10]
北京出新政推动未来产业发展
中国新闻网· 2025-08-02 00:56
未来产业发展规划 - 北京将建立健全要素联动投入、集成转化、合理增长机制,促进未来产业从研发创新到集群化规模化发展 [1] - 鼓励市区两级政府投资基金、国企基金加强对未来产业的投入,并引导社保基金、保险资金等长期资本投资 [1] - 聚焦城市交通、医疗健康、绿色能源、公共服务等领域,开放一批代表性强、影响力大的应用示范场景 [1] 技术创新与成果转化 - 完善工程化成果转化体系,鼓励高校、科研院所联合企业开展实验室技术验证与工艺优化 [2] - 建立覆盖"原型设计-概念验证-中试样品"的梯度开发机制,促进产品迭代熟化 [2] - 对在全国范围内首次试用的创新产品给予一定补贴 [2] 产业链与国际化布局 - 支持大型企业通过"新投资""新并购"推动产业链上下游裂变式创业,促进产业"强链""补链" [2] - 支持企业拓展海外市场,汇聚国际优质资源要素 [2] 重点技术领域 - 聚焦通用人工智能、人形机器人、6G、量子信息等领域,加强新场景谋划 [1]
GLM-4.5大模型杀出重围,“领跑者”智谱走上台前
北京商报· 2025-07-31 21:45
当业界探讨智能体功能、开发环境时,近日北京智谱华章科技股份有限公司(以下简称"智谱")低调发布新一代旗舰 大模型GLM-4.5,这是一款专为智能体应用打造的基础模型,在复杂推理、代码生成及智能体交互等通用能力上实现 能力融合与技术突破。OpenAI"跳票"多次的GPT-5也强调融合,并在6月底将智谱列入全球竞争对手,没想到智谱率先 登场,GLM-4.5的综合得分位列全球第三、国产第一。 在资本市场,智谱也是"沉默的领跑者",4月已在北京证监局办理上市辅导备案,由中金公司担任辅导机构,成为第 一家启动IPO上市的"大模型六小虎"。根据辅导备案报告,8月智谱将进入正式辅导期第二阶段,在这期间,这家脱胎 于清华的大模型公司还密集收获多地国资的战略投资。从实验室到产业,智谱走出了中国通向AGI(通用人工智能) 的另一条路径。 全球第三,国产第一 最近的开源浪潮中,智谱的GLM-4.5发布仅2小时,就被X平台推荐上了首页,发布12小时后,它已经位列国际开源社 区Hugging-Face榜单全球第二,创增速纪录。 在涵盖研究生水平推理和复杂软件工程解题等12项全球公认的硬核测试中,GLM-4.5的综合得分位列全球第三,在 ...
21书评︱“深度学习之父”辛顿:信仰之跃
21世纪经济报道· 2025-07-31 17:32
刘嘉/文 编者按:"深度学习之父"杰弗里·辛顿近日首次来到中国,出席2025世界人工智能大会,受到社会广泛关注。辛顿是一位颇具传 奇色彩的科学家,2024年,他因在使用人工神经网络进行机器学习的基础性发现和发明,被授予诺贝尔物理学奖。但他曾多次 变换学习和研究的领域,甚至一度离开学术界,他投身人工神经网络研究时,正值人工智能跌入谷底,他的研究被认为没有出 路,甚至当时多伦多大学校长曾说过:"我们学校一个疯子就够了,绝对不能进第二个搞人工神经网络的人。"但最终,人工智 能因辛顿等人引领性的贡献走出停滞,进入大模型时代。 近日,清华大学基础科学讲席教授、心理与认知科学系主任刘嘉出版了新书《通用人工智能:认知、教育与生存方式的重 构》。在新书的跋里,刘嘉向读者讲述了辛顿的故事。作者为何专门介绍辛顿?这与作者自身的经历和本书的写作目的有关。 刘嘉在1994年读大学时就接触到人工神经网络,但当他1997年慕名拜访人工智能之父马文·明斯基后,却备受打击,明斯基对人 工智能的态度不算积极,刘嘉和他聊人工神经网络,但由于当时的人工智能正在经历第二次寒冬,所以连他也说不清未来走向 何方。因此他鼓励刘嘉留在麻省理工学院脑与认知科 ...
“北京造”大模型GLM-4.5开源,综合性能世界领先
新京报· 2025-07-30 23:59
7月28日晚,北京智谱华章科技股份有限公司(以下简称"智谱AI")发布其新一代旗舰大模型GLM-4.5,这是一款专为智能体应用打造的基础模型,在复杂 推理、代码生成及智能体交互等通用能力上实现能力融合与技术突破,综合测试性能已跻身全球领先行列。 这款新模型的发布,代表了AI迈向通用人工智能的一次重要转变。它不再满足于扮演一个被动回答问题的"聊天机器人",而是要成为能够理解复杂目标、自 主规划并执行多步骤任务的"全优生"。例如,模型能够胜任全栈开发任务,一键生成较为复杂的应用、游戏、交互网页。在实际例子中,用户通过z.ai使用 该模型时,仅用一句简单的指令,就可让GLM-4.5独立开发出具备搜索功能的"谷歌"网站、可以发弹幕的"B站",甚至直接上线一个完整的"Flappy Bird"小游 戏。 在性能评估中,GLM-4.5的表现展示了其架构优势。在涵盖研究生水平推理和复杂软件工程解题等12项全球公认的硬核测试中,其综合得分位列全球第三, 在所有国产模型和开源模型中均排名第一。 大型语言模型性能评估表,包含智能体、推理与编码基准测试数据(图源:智谱) 市场有风险,投资需谨慎。本文不构成个人投资建议,也未考虑到个别 ...
Jinqiu Select | OpenAI夺IMO金牌背后的技术路线揭秘
锦秋集· 2025-07-30 23:51
技术路线的关键亮点 - 模型推理时长从几秒扩展到超过100分钟(1.5小时),并计划向数千小时推进,逐步解决人类未攻克的前沿科学难题 [5][6] - 首次在难以快速验证的复杂任务(如数学证明)上取得重要进展,体现出大模型处理复杂现实问题的能力 [6][7] - 开发了高度通用化的多智能体并行计算技术,有效利用大规模计算资源,未来可扩展到更多复杂任务场景 [6][9] - 技术路线放弃专门为数学设计的形式化工具(如Lean),坚持更通用的自然语言推理架构,适用于更广泛领域 [6][10][11] - 未来重点方向是从被动"回答问题"转变为主动"提出新问题",赋予AI自主发现和创造问题的能力 [6][13] 能力突破与通用性提升 - AI过去擅长明确答案的任务(如计算题或棋类游戏),此次显著提升在"难以验证"任务(如数学证明)上的能力 [7] - 通过多智能体并行计算架构,多个智能体同时推理、协调配合,实现高效高质量解决方案 [9] - 多智能体技术高度通用,非为IMO单独开发,OpenAI正放弃单一领域定制路线,专注跨领域通用智能模型 [9] 对未来人工智能发展的战略展望 - 核心战略之一是继续提升AI持续推理时长,扩展到千小时级,以攻克重大科学发现、理论创新等长期难题 [12] - AI下一步需发展自主发现和提出有价值科学问题的能力,代表从工具型智能向自主创造型智能转变的关键 [13] - 计划将通用推理技术应用到更多科学领域(如物理、化学、生物)及经济、社会决策等现实场景 [15] - 未来可能出现强大的科学研究助手AI、战略分析AI及解决复杂决策问题的新智能体 [15]
全球开源模型榜单前十中国霸榜九席,第一来自北京!
北京日报客户端· 2025-07-30 23:34
刚刚过去的几天,中国最大AI独角兽、总部位于北京的智谱开源了新一代旗舰大模型GLM-4.5 。该款大模型发布仅十小 时,就冲上国际开源社区"抱抱脸"(Hugging-Face)榜单全球第二,创增速记录,引发国际关注。记者发现,截至7月30 日晚,在Hugging-Face Trending榜单中,排名前10的10个开源模型席位中有9个来自中国,其中北京企业智谱的模型登顶 该榜单。 | Hugging Face Q Search models, datasets, users ... | | | | | --- | --- | --- | --- | | Filter by name Models 1,904,983 | Full-text search | 7 Add filters | 1J Sort: Trending | | Z zai-org/GLM-4.5 | | | | | To Text Generation · .: 358B · Updated 2 days ago · ≥ 3.93k · + · ♡ 638 | | | | | Qwen/Qwen3-Coder-480B-A35B-Inst ...
开出10亿美元天价,小扎挖人Mira创业公司惨遭拒:俺们不差钱
机器之心· 2025-07-30 13:13
Meta的AI人才争夺战略 - Meta超级智能实验室持续挖人,目标包括OpenAI前CTO创立的Thinking Machines Lab [2][3] - 向Thinking Machines Lab十几名员工提供天价报价,最高单份多年总额超10亿美元,四年报价在2-5亿美元区间,首年保障金额达5000万-1亿美元 [4] - 招聘策略包括扎克伯格通过WhatsApp直接联系候选人,快速安排与CEO、CTO等高管的深度面试 [5] Thinking Machines Lab的竞争壁垒 - 公司刚完成20亿美元种子轮融资(a16z领投,英伟达、AMD参投),估值达120亿美元且未发布产品 [4][11] - 拒绝Meta报价的核心原因包括对Meta领导层经验不足的担忧,以及对其产品路线图(如Reels/Facebook优化)缺乏兴趣 [9][10] - 公司资金充裕,研究人员无需在理想主义与高薪间抉择,可兼顾技术使命与商业回报 [10][11] Meta与苹果的人才争夺战 - 一个月内挖走苹果第四名核心AI研究员Bowen Zhang,其原属基础模型团队(负责Apple Intelligence平台开发) [13][14][15] - 苹果AFM团队此前已流失三名成员至Meta,包括团队创始人庞若鸣及早期大模型研究者Tom Gunter [17] - 苹果被动提高AFM团队薪酬但仍落后于竞争对手报价 [18] Meta的AI竞争策略 - 通过开源策略削弱OpenAI优势,计划发布与ChatGPT直接竞争的开源模型以实现技术商品化 [7] - 内部压力显著,Llama 4因性能问题推迟发布且陷入基准测试操纵争议 [8] - 招聘话术强调构建世界级AI助手、创作者工具、企业服务及开源生态的愿景 [7]
面向智能体应用,“北京造”大模型GLM-4.5开源
北京日报客户端· 2025-07-30 12:16
实际上,在模型发布后不到两个小时,就迅速引发了众多国际媒体关注。全球性社交媒体X平台就在首 页推荐了这款中国大模型。美国消费者新闻与商业频道CNBC报道称:"中国企业正在研发的人工智能 模型不仅智能化水平提升,使用成本也持续降低,这与深度求索(DeepSeek)当年震动市场的突破核 心优势相呼应。" 彭博社表示,OpenAI的挑战者智谱发布开源模型,试图在这个蓬勃发展的行业中抢占 制高点。发布后不到12小时,GLM-4.5模型已位列国际开源社区Hugging-Face榜单全球第二,受到国内 外业界高度关注。 7月28日晚,总部位于北京的清华系大模型明星企业智谱发布其新一代旗舰大模型GLM-4.5,并在 Hugging Face与ModelScope平台同步开源。这是一款专为智能体应用打造的基础模型,在复杂推理、代 码生成及智能体交互等通用能力上实现能力融合与技术突破,综合测试性能已跻身全球领先行列。 技术人员介绍,GLM-4.5 参数量为 DeepSeek-R1的二分之一、Kimi-K2 的三分之一,但在多项标准基准 测试中表现得更好,得益于模型更高的参数效率。在性能优化之外,GLM-4.5系列也在成本和效率 ...