Workflow
通用人工智能
icon
搜索文档
辛顿敷衍走场,是对科学的败坏
观察者网· 2025-08-04 14:24
文章核心观点 - 文章对当前人工智能领域的过度乐观情绪和炒作提出批判,认为人工智能缺乏坚实的科学理论基础,本质上仍是一种基于统计方法和暴力计算的现代工匠技艺,而非科学原理的突破 [1][2][9] - 文章指出大语言模型具备文字符号层面的统计性理解能力,但其理解方式与人类有本质差异,无法实现符号与现实世界的对应,因此“通用人工智能”遥不可及 [4][14][16] - 文章认为2024年诺贝尔物理学奖颁发给人工智能学者,标志着基础科学原理发展进入停滞期,人类正进入“后科学”时代,科学真理性可能被稀释 [8][18] 人工智能的科学理论基础 - 人工智能领域缺乏符合现代科学规范的基础理论,图灵测试被认为是一种主观测试方式,违背了科学客观性要求,未能为人工智能奠定科学基础 [7] - 学术界对“智能”的定义尚无统一看法,批评杰弗里·辛顿“智能的本质在于推理”的观点是以偏概全,忽视了人类智慧中“洞察”等非逻辑推理部分 [6][7] - 自20世纪70年代以来,基础原理性科学突破出现停滞,2024年诺贝尔物理学奖授予人工智能学者被视为物理学界含蓄承认此停滞局面 [8] 人工智能的技术原理与应用定位 - 人工智能技术原理上是一种基于经验的工匠技艺,依赖统计方法和计算机暴力计算在应用层面解决问题,而非理论层面突破 [9] - 信息技术应用中,人工智能仅是人类大脑可完成的复杂任务导向的技术之一,其目标应是拓展人类活动深度与广度,而非单纯替代人类劳动 [11][12][14] - 类似于Sora模型被炒作成“世界模拟器”的现象,是缺乏科学理性分析的非理性想象或别有目的的炒作 [9][10] 人工智能的发展前景与局限性 - 在可预见的未来,人工智能将在人类各活动领域通过解决具体信息性问题来拓展人类能力,但其发展带有偶然性,复杂度有限 [15] - 制造出与人类具有同等意识能力的机器是遥不可及的梦想,因为缺乏相关科学理论,且历史经验表明无法通过经验性技艺创造不理解的事物 [15][16] - 杰弗里·辛顿关于人工智能威胁论的说法被指缺乏科学依据,是历史上反复出现又很快被遗忘的耸人听闻之词 [16][18]
谢耘:诺奖得主辛顿敷衍走场,是对科学的败坏
虎嗅· 2025-08-04 13:57
人工智能理论争议 - 乐观派认为人工智能本质在于推理,但这一观点被批评为西方文化唯理性论的思维局限[4][11] - 悲观派指出大语言模型仅懂概率计算而非概念推理,缺乏真正理解能力[5] - 中间立场认为大语言模型具有文字符号层面的统计性理解能力,但与人类理解存在本质差异[7][8] 人工智能技术现状 - 当前人工智能主要依赖统计方法和暴力计算,属于应用层面的工匠技艺而非理论突破[14] - 2024年OpenAI发布的Sora视频生成模型被过度解读为"世界模拟器",实际未突破物理定律发现[15] - 计算机在特定智能活动(如计算)上已超越人类,但整体仍无法替代人类意识活动[20] 行业发展阶段 - 人工智能领域缺乏符合现代科学规范的基础理论,仍处于技术积累阶段[10][11] - 2024年诺贝尔物理学奖授予AI学者被视为基础科学进入停滞期的标志[12] - 信息技术应用应超越单纯替代人类劳动,聚焦拓展人类活动深度与广度[19][21] 历史发展规律 - 现代科学经过400年发展已遇到"止境",进入"后科学"时代面临理论突破瓶颈[24] - 传统工匠技艺发展缓慢且不可预测,现代信息工匠技艺可能更灵活但同样受限[22] - 制造具有人类意识的机器在可预见未来仍不可实现,因缺乏相关科学理论支持[23]
苹果“掉队”?
经济网· 2025-08-04 10:55
文章核心观点 - 在2025年全球人工智能浪潮中,苹果公司因战略摇摆、投入保守、文化冲突及人才流失等因素,在AI领域显露出“掉队”迹象,与英伟达、微软等竞争对手的市值差距拉大,面临转型困境 [1][2][3] - 尽管面临挑战,苹果公司仍拥有由超20亿活跃设备构成的庞大生态网络这一核心优势,其未来的关键在于能否利用此平台价值,通过开放合作弥补技术短板,并快速转身以适应AI时代 [4] 行业竞争格局与资本表现 - 截至7月25日,英伟达凭借AI算力芯片优势,以4.24万亿美元市值登顶全球,微软以3.8万亿美元紧随其后,而苹果市值已滑落至3.19万亿美元,与英伟达差距高达万亿美元 [1] - 微软、谷歌、亚马逊等科技巨头以及中国的百度、华为等企业,正重金布局AI技术革命 [1] - OpenAI的ChatGPT在2022年横空出世,点燃生成式AI热潮,微软、谷歌、亚马逊等巨头乘势大举投入,迅速构筑技术领先优势 [1] 苹果公司的历史与现状 - 苹果曾是AI领域先行者,于2010年以2亿美元收购Siri并整合进iPhone,开创智能语音助手商业化先河 [1] - 自2011年乔布斯离世后,公司创新步伐变慢,Siri发展陷入停滞 [1] - 苹果的“稳扎稳打”策略在AI市场爆发时显得格格不入,相较于竞争对手的千亿美元级投入,其更多依赖企业合作与外部采购,虽降低风险但也逐渐丧失核心技术话语权 [2] - 被寄予厚望的Apple Intelligence项目多项功能因未达测试标准而反复延期,导致2024年WWDC宣布的功能至今年仍未完全兑现,引发市场质疑 [3] 内部挑战与困境根源 - 公司内部存在技术路线分歧:一方致力于探索通用人工智能(AGI),另一方聚焦文本摘要、图像生成等实用功能快速落地,战略内耗导致决策低效与关键机遇错失 [2] - 早在2022年,苹果团队已构建好几个大语言模型,但因高层质疑“实用性不足”而被搁置,错失先机 [2] - 伴随战略摇摆而来的是核心人才流失,OpenAI、Anthropic等新锐企业不断“挖角”苹果顶尖人才 [2] - 公司追求“完美体验”的产品文化与AI技术快速迭代的特性存在根本矛盾,陷入“过度打磨”困境 [3] - 高管对AI战略价值的认知差异,导致资源投入不足与决策延误 [3] 核心优势与潜在路径 - 苹果的核心优势在于掌控全球超20亿活跃设备构成的庞大生态网络,深度嵌入用户生活核心场景,具有无与伦比的用户触达与场景渗透能力 [4] - 基于生态优势,公司正积极考虑从“闭门造车”转向“开放共生”,寻求外部合作以弥补自身在生成式AI核心技术上的短板 [4] - 任何志在最大化用户规模的AI企业(如Anthropic或OpenAI)都无法绕过苹果的生态 [4]
观察者网WAIC直播实录:AI大潮下的具身和人形,中国在跟跑还是并跑?
观察者网· 2025-08-03 13:36
行业格局与公司战略 - 美的集团通过2016年收购库卡机器人实现To B转型 布局四大板块:楼宇科技 工业技术 机器人与自动化 新兴AI业务[4] - 美的2023年启动人形机器人规划 凭借核心零部件技术积累和完整产品线切入赛道 2024年加速产品开发与应用尝试[4] - 库卡机器人主要服务汽车制造 3C 船舶 飞机制造等行业 在美的灯塔工厂应用广泛[5] - 格灵深瞳作为首家科创板AI计算机视觉上市公司 深耕金融安防领域 近期拓展体育考试训练和AI PC大模型一体机业务[5] - 真格基金重点布局AI与机器人早期项目 已投资月之暗面 Manus Genspark等具身智能企业[6][57] 技术演进路线 - 人形机器人关节数量从传统200+缩减至40个左右 强化学习算法显著降低调试难度[8][9] - 技术路线从液压传动转向电动传动 控制方式从rule-base转向learning-base 中国供应链优势推动成本下降[12] - 双足形态在动态平衡性上具优势 轮式更适合标准化场景 智元创新的轮足折叠设计尝试融合两者优势[13][16][19] - 五指灵巧手在70%场景可被两指夹具替代 但数据采集和复杂操作仍需五指结构[27][28] - 视频模型和world model成为具身智能关键技术 需解决物理世界数字化重建的高成本难题[37][43] 应用场景展望 - 工业场景将率先落地 上汽计划引入500台人形机器人进厂 聚焦搬运 装配等六大核心工序[9][15] - 家庭场景面临安全隐私等挑战 需分阶段从工业→商业→家庭推进 预计5-10年实现普及[13][66][67] - 家电机器人化成为新方向 如智能烤箱通过视觉识别和自动调节实现主动服务[64] - 高人力成本场景优先突破 如美国餐厅后厨等海外市场更具商业化潜力[58][73] 中美竞争态势 - 中国占据全球40%人形机器人专利 机电产业链优势显著 核心部件价格快速下降[69][72] - 美国在AI基础技术领先 中国在场景落地和政策支持方面占优[70][71] - 人才储备呈现"中美华人竞争"格局 中国需突破算力瓶颈并拓展全球化市场[72][73]
AI大潮下的具身和人形,中国在跟跑还是并跑?
观察者网· 2025-08-03 13:35
具身智能与人形机器人发展现状 - 具身智能被视为通往AGI的必经之路 特斯拉Optimus和波士顿动力Atlas的进展引发全球关注 [1] - 中国在具身智能领域已从"跟跑"转向与美国"并跑"甚至寻求"弯道超车" [1] - 行业讨论焦点集中在电机供应链 强化学习算法 落地场景与资本路径 [1] 美的集团机器人战略布局 - 2016年起通过收购库卡等企业布局To B业务 形成四大板块:楼宇科技 工业技术 机器人与自动化 新兴AI业务 [3][4] - 人形机器人业务2023年启动规划 2024年加速发展 依托电机 减速机等核心零部件技术积累 [4] - 库卡机器人主要服务汽车制造(60%) 3C(20%) 船舶/航空(15%)等工业领域 [4] 格灵深瞳技术路线 - 中国首家科创板AI上市公司 深耕计算机视觉12年 覆盖金融安防 智慧体育等场景 [5] - 推出视觉基础大模型MVT 1.5版本 实现图像到视觉token的转换 [5][32] - 探索视频模型技术 提升机器人对动态场景的理解能力 [36] 人形机器人技术演进 - 关节数量从传统200+缩减至现代40个(全身30个) 强化学习使复杂控制成为可能 [8][9] - 技术路线从液压传动(波士顿动力)转向电动传动(中国供应链优势) [12] - 控制方式从rule-base转向learning-base 提升任务泛化能力 [11][12] 形态路线争议 - 双足形态:适合动态复杂场景(工厂阶梯 火星移民) 具备动力学平衡优势 [16][18] - 轮式形态:平坦场景效率更高(家庭 标准工厂) 安全性更优 [13][15] - 混合形态:智元推出可折叠轮足机器人 尝试平衡效率与适应性 [20] 灵巧手发展路径 - 五指灵巧手:符合人机交互直觉 数据采集便利 但成本高达数万元 [22][25] - 两指夹爪:满足70%基础任务 成本优势明显 成为当前主流方案 [25][26] - 美的认为通用人形机器人必须配备五指手 工业场景则倾向专用末端 [22][23] 技术概念解析 - 具身智能:实现感知-决策-执行的完整闭环 需与物理世界持续交互 [30][33] - World Model:物理世界的数字重建 面临数据采集成本高难题 [40] - 强化学习:具身智能必备组件 但reward函数设计仍是关键挑战 [42][46] 中美产业对比 - 中国优势:机电产业链成熟(占全球人形机器人专利40%) 人才储备充足 政策支持力度大 [63][64] - 美国优势:AI基础研究领先 人力成本推动场景落地更快 [63][66] - 硬件创新中国占优(蔚小理等) 软件创新美国领先 全球市场成为共同目标 [66] 商业化落地展望 - 工业场景优先:上汽计划引入500台人形机器人 分阶段实现自动化 [9][60] - 家庭场景需突破:安全标准 隐私保护 个性化交互等核心问题 [61] - 数据采集瓶颈:需建立类似特斯拉FSD的规模化数据获取机制 [57]
AI教父Hinton,重新能坐下了
虎嗅· 2025-08-03 12:53
行业与公司发展 - 2012年Hinton团队在ImageNet竞赛中以15.3%错误率夺冠,标志深度学习在图像分类领域的重大突破 [30][31] - 深度学习复兴的两大前提:2010年前后计算能力与大数据成熟 [34] - Hinton团队开发的神经网络技术使机器识别常见物体的准确度达到前所未有的水平 [33] 关键技术突破 - Hinton与搭档提出玻尔兹曼机和反向传播算法,解决机器"从数据中自动提炼内部表征"的核心难题 [20] - ChatGPT底层架构采用Transformer,属于神经网络的一种特殊形式 [13] - 2012年深度学习从纯学术研究转向产业应用,成为科技巨头战略核心 [42][43] 重大商业事件 - 2013年谷歌以4400万美元收购Hinton创立的DNNResearch公司 [40][41] - 谷歌随后以6.5亿美元收购DeepMind,该交易被视为谷歌最值得的投资之一 [54] - DeepMind被收购后开发出AlphaGo、AlphaFold、Gemini等里程碑式AI产品 [55][57] 行业影响与趋势 - 2019年Hinton与LeCun、Bengio共获图灵奖,表彰其推动神经网络成为科技产业核心 [59][60] - 2023年Hinton预警AI风险,提出"AI30年内导致人类灭绝概率10%-20%"的观点 [76] - AI发展速度超预期,Hinton修正预测认为"AI5年内可能比人类更聪明" [76] 行业应用前景 - Hinton认为AI将颠覆所有行业,仅水管工等需要高度创造力的职业暂时安全 [76] - 谷歌通过整合DeepMind与谷歌大脑部门,持续产出尖端AI产品 [57] - 全球科技巨头围绕深度学习重构业务,涵盖搜索、语音、图像识别、自动驾驶等领域 [43]
全网苦等GPT-5,超级对齐团队遗作成重要线索,奥特曼发话「惊喜很多」
机器之心· 2025-08-03 12:21
GPT-5技术进展 - OpenAI正在开发名为"通用验证器"的技术,可能是GPT-5的核心组件之一[1] - 该技术源于OpenAI去年发表的论文,通过小模型验证大模型的推理链并反馈奖励信号[1] - 验证者模型设计轻量化,适合大规模部署,明确为未来GPT部署准备[4] 证明者-验证者机制 - 采用双人格架构:证明者生成严谨推理,欺骗者植入错误逻辑[6] - 通过左右脑互搏游戏提升模型输出质量,类似GAN的对抗训练模式[5] - 训练方法使模型逐步产生结构清晰、逻辑严密的答案[9] 技术突破意义 - 代表AI发展从数据堆料转向架构创新的新阶段[11] - 可能突破当前数据瓶颈,实现更高级别的通用人工智能[11] - 系统将整合到未来主流模型的RLHF流程中[11] GPT-5实际表现 - 泄露版本显示存在GPT-5和5 Pro两个子版本[15] - 已具备生成动态效果丝滑的动画内容能力[17] - 可还原复杂游戏场景如Doom片段,展示强大生成能力[19] 行业影响 - 技术来自OpenAI已解散的超级对齐团队,显示持续研发路径[13] - 行业期待值达到新高,普遍认为将开启AI新时代[20][22] - OpenAI此前已在GPT-4代码助手中测试类似"批评家"机制[10]
北京出新政推动未来产业发展
中国新闻网· 2025-08-02 00:56
未来产业发展规划 - 北京将建立健全要素联动投入、集成转化、合理增长机制,促进未来产业从研发创新到集群化规模化发展 [1] - 鼓励市区两级政府投资基金、国企基金加强对未来产业的投入,并引导社保基金、保险资金等长期资本投资 [1] - 聚焦城市交通、医疗健康、绿色能源、公共服务等领域,开放一批代表性强、影响力大的应用示范场景 [1] 技术创新与成果转化 - 完善工程化成果转化体系,鼓励高校、科研院所联合企业开展实验室技术验证与工艺优化 [2] - 建立覆盖"原型设计-概念验证-中试样品"的梯度开发机制,促进产品迭代熟化 [2] - 对在全国范围内首次试用的创新产品给予一定补贴 [2] 产业链与国际化布局 - 支持大型企业通过"新投资""新并购"推动产业链上下游裂变式创业,促进产业"强链""补链" [2] - 支持企业拓展海外市场,汇聚国际优质资源要素 [2] 重点技术领域 - 聚焦通用人工智能、人形机器人、6G、量子信息等领域,加强新场景谋划 [1]
GLM-4.5大模型杀出重围,“领跑者”智谱走上台前
北京商报· 2025-07-31 21:45
公司产品发布与性能 - 智谱公司低调发布新一代旗舰大模型GLM-4.5,这是一款专为智能体应用打造的基础模型,在复杂推理、代码生成及智能体交互等通用能力上实现能力融合与技术突破 [1] - GLM-4.5发布后,在涵盖研究生水平推理和复杂软件工程解题等12项全球公认的硬核测试中,其综合得分位列全球第三,在所有国产模型和开源模型中均排名第一 [3] - GLM-4.5采用混合专家架构,其中GLM-4.5总参数量3550亿,激活参数320亿;GLM-4.5-Air总参数1060亿,激活参数120亿 [3] - 在真实代码智能体的人工对比评测中,GLM-4.5实测结果为国内最佳,在包含推理、代码、智能体的综合能力测评中达到开源SOTA水平 [3] - 在52个编程开发任务的真实场景Agentic Coding测试中,GLM-4.5相比其他开源模型展现出竞争优势,特别在工具调用可靠性和任务完成度方面表现突出,尽管相比Claude-4-Sonnet仍有提升空间,但在大部分场景中可以实现平替效果 [4] - GLM-4.5的API调用价格为输入0.8元/百万tokens、输出2元/百万tokens,高速版最高100tokens/秒,综合成本和参数表现,外界评价其为“成本更低、性能更优” [4] 产品技术特点与定位 - GLM-4.5是首款原生融合模型,首次在单个模型中实现将推理、编码和智能体能力原生融合,以满足智能体应用的复杂需求 [5] - 该模型能够胜任全栈开发任务,一键生成较为复杂的应用、游戏、交互网页,例如用户通过简单指令即可让其独立开发出具备搜索功能的“谷歌”网站、可以发弹幕的“B站”或完整的“Flappy Bird”小游戏 [5] - 大模型的下一个范式被公司认为是将各种能力整合到一起,成为一个“全优生”,GLM-4.5正是朝着统一各种能力这一目标努力,力求在一个模型中集成不同的能力 [5][7] - 公司CEO表示,双方(智谱与OpenAI)都努力探索不同方向的能力边界,此次发布的首个原生融合模型代表行业一个新的发展方向 [7] 行业竞争与市场地位 - OpenAI在6月底将智谱列入全球竞争对手,而智谱率先发布了GLM-4.5 [1] - OpenAI CEO曾提及GPT-5将整合大量技术,并多次推迟发布时间,最新目标推出时间是8月初 [6] - 在开源社区,GLM-4.5发布仅2小时就被X平台推荐上首页,发布12小时后位列国际开源社区Hugging-Face榜单全球第二,创增速纪录 [3] - 专家分析指出,智谱专注通用大模型与智能体,与聚焦机器人、物理世界交互的具身智能公司在应用场景、技术栈、客户群体上差异显著,直接竞争较少,且智谱的商业模式相对更为成熟 [8] 公司背景与发展进程 - 智谱公司已在北京证监局办理上市辅导备案,由中金公司担任辅导机构,成为第一家启动IPO上市的“大模型六小虎” [1] - 根据辅导备案报告,公司计划于8月进入正式辅导期第二阶段 [1] - 公司脱胎于清华大学,其核心优势主要体现在技术积累和产学研结合方面 [7] - 公司密集收获多地国资的战略投资,显示出其在资源整合和政策支持方面的优势 [1][7] - 公司股东背景多元,可以同时获得应用场景、政务资源、国际市场等支持 [7]
21书评︱“深度学习之父”辛顿:信仰之跃
21世纪经济报道· 2025-07-31 17:32
文章核心观点 - 文章通过回顾“深度学习之父”杰弗里·辛顿的传奇学术生涯与思想转变 探讨了坚持“信仰”对于人工智能领域突破性发展的重要性 并指出脑科学与人工智能的结合是通向通用人工智能的关键路径 [1][2][11] 人物背景与早期经历 - 杰弗里·辛顿于2024年因人工神经网络的基础性发现和发明获得诺贝尔物理学奖 是2018年图灵奖获得者 被公认为人工智能之父 [1][4] - 辛顿在剑桥大学本科期间频繁更换专业 从物理学辍学 后转向生理学、哲学 最终以心理学获得学士学位 毕业后曾成为一名木匠 [4][5] - 其家族学术背景显赫 父亲是剑桥大学教授、英国皇家学会院士 曾祖父是数学家兼科幻作家 曾祖父的岳父是布尔代数的创立者乔治·布尔 [5] - 辛顿早期远离学术选择成为木匠 被认为是对家族期望压力的逃避和对权威的无意识反抗 [6] 学术转折与研究信仰 - 辛顿在阅读心理学家唐纳德·赫布的《行为的组织》后深受启发 书中“共同放电则彼此连接”的赫布法则点燃了他用仿生方法研究大脑智能的火种 [7] - 他在一个心理工作坊中喊出“我真正想要的是一个博士学位” 从而决心重返校园 进入爱丁堡大学攻读人工智能博士学位 [7] - 当时神经网络研究正处严冬 人工智能先驱马文·明斯基在其著作《感知机》中批判神经网络是“死胡同” 主张符号主义AI 辛顿的导师也转投符号主义阵营 [7] - 辛顿坚信“让人工智能真正奏效的唯一途径 是让计算方式尽量像人脑” 并认为人工神经网络能做到人脑能做的一切 [9] 研究历程与行业影响 - 在近40年的时间里 辛顿因其对神经网络的执着而承受强烈的孤独感和学界敌意 其研究曾被普遍认为没有出路 [1][9] - 20世纪80年代中期 辛顿在麻省理工学院向明斯基等人展示其神经网络模型“玻尔兹曼机”时 场面一度凝重紧张 [9] - 四十多年后 深度卷积网络在图像识别领域大放异彩 Transformer架构重塑了自然语言处理 验证了辛顿当年的信仰之跃 [11] - 辛顿选择神经网络的部分原因是受其昆虫学家父亲从生物学角度理解生命的影响 他决意通过神经网络来创造通用人工智能这一新生命 [11] 人工智能领域发展启示 - 清华大学教授刘嘉在新书《通用人工智能:认知、教育与生存方式的重构》中借辛顿的故事提出 下一代人工神经网络的发展又到了需要赌一个像辛顿当年的“信仰”的时候 [2] - 刘嘉在1997年拜访马文·明斯基后因人工智能处于第二次寒冬而错过该领域 他现在的研究方向是让脑科学和人工智能结合 认为这对通向真正的通用人工智能可能有帮助 [2] - 脑科学与人工智能被描述为DNA的双螺旋结构 存在紧密且关键的联系 [2] - 真正的信仰被比喻为克尔凯郭尔笔下的“信仰骑士” 在于跃向绝望深渊时的决断 而非对结果的确定把握 [10][11]