量子位
搜索文档
亚马逊开建AGI实验室,一号位也是华人
量子位· 2025-09-19 12:11
亚马逊AGI战略转型 - 公司从AI基础平台战略转向通用人工智能研发,于2023年9月在旧金山成立亚马逊AGI实验室[1][2][3] - 2024年6月通过反向收购雇佣方式吸纳Adept AI核心团队,实验室负责人为OpenAI前工程副总裁David Luan[10][12][13] 核心团队构成 - 实验室一号位David Luan拥有15年AI经验,曾参与GPT-2、GPT-3、CLIP和DALL·E等关键项目研发[4][5][24] - 二号位Pieter Abbeel为加州大学伯克利分校教授,论文被引量超过21万,擅长强化学习与机器人学[34][35][36] - 团队包含Adept AI四位联合创始人:GPU计算专家Erich Elsen、产品负责人Kelsey Szot及黄金搭档Maxwell Nye与Augustus Odena[40][42][46][50] 战略动机与优势 - 应对Agent技术对电商业务的潜在冲击,同时利用海量用户行为数据打造实用模型[7][8][9] - 依托亚马逊顶尖算力基础设施与稀缺真实操作数据,解决高质量训练数据枯竭问题[66][68][69] - 通过"AI健身房"概念实施大规模自我博弈强化学习,避免人工编码操作[78][79][80] 技术成果与表现 - 2025年初发布首款产品Amazon Nova Act,融合Adept AI技术遗产与AWS基础设施[74][75] - 在ScreenSpot Web Text测试中界面元素定位准确率达94%,超越Claude 3.7 Sonnet的90%和OpenAI模型的88.3%[77] - 在ScreenSpot Web Icon和GroundUI Web测试中分别取得87.9%和80.5%的准确率[77] 领导层战略视野 - David Luan早在2022年ChatGPT发布前就专注Agentic AI,成立首家Agent公司Adept AI[55][56][57] - 其团队发布的ACT-1模型在三年前已实现自然语言操作软件能力,公司成立一年内融资超4亿美元[58][59][65] - 坚持"计算机适应人类"理念,以实用主义为导向构建最有用的AGI[63][64][81]
老黄回应英伟达入股英特尔
量子位· 2025-09-19 09:17
重大战略投资与合作 - 英伟达正式宣布以50亿美元入股英特尔,每股价格为23.28美元[1] - 投资完成后,英伟达将持有英特尔超过4%的股份,成为其最大股东之一[3] - 消息公布后,英特尔股价瞬间暴涨超20%,英伟达股价也上涨近3.5%[4] 联合开发新芯片计划 - 两家公司计划联合开发用于PC和数据中心的AI芯片[6] - 在数据中心领域,英特尔将为英伟达定制x86 CPU,英伟达将其集成到AI基础设施平台中推向市场[9] - 在PC领域,双方将推出名为“x86 RTX SOC”的全新芯片,融合英伟达RTX GPU与英特尔x86生态[10][11] - 合作旨在推动未来PC和数据中心芯片从CPU、GPU分离状态转向深度融合的“超级芯片”[12] 合作战略意义与行业影响 - 合作被描述为“两个世界级平台的融合”,旨在为下一个计算时代奠定基础[13] - 英伟达可能从对英特尔未来产品设计日益增长的影响力中获益[15] - 此次合作对AMD构成潜在打击,因英伟达此前常从AMD和ARM采购CPU,此次“倒戈”可能影响AMD业务[17][20] - 台积电可能受到波及,尽管声明未明确提及代工合作,但英伟达表示持续评估英特尔代工技术[22][23] - 分析师认为50亿美元投资无法解决英特尔代工业务在规模、成本及执行方面的根本困境[24]
华为AI芯片计划全盘托出!全球最强超节点+超级集群,未来2年全面领先
量子位· 2025-09-18 18:33
文章核心观点 - 华为通过系统架构和互联技术创新 在AI算力集群层面实现全面超越 预计未来两年保持全球算力领先地位[3][5][30] - 公司公布昇腾系列芯片详细演进路线 坚持"一年一代 算力翻倍"技术迭代节奏[7][8][21] - 推出全球首个通用计算超节点 重塑AI和通用计算基础设施范式[45][48][49] 芯片产品规划 昇腾950系列 - 昇腾950PR:面向推荐和推理场景 采用自研HBM内存方案降低成本 2026年第一季度上市[10][11][12][14] - 昇腾950DT:面向训练场景 互联带宽提升2.5倍 支持自研HBM 2026年第四季度上市[16][17][18][19] - 昇腾960:旗舰训练芯片 规格较950实现翻倍提升 2027年第四季度上市[21][22] - 昇腾970:训练芯片全面升级 FP4/FP8算力翻倍 内存带宽提升1.5倍 2028年第四季度上市[24][25][26] 鲲鹏系列 - 鲲鹏950处理器:支持96核/192线程和192核/384线程两种版本 新增四层安全隔离 2026年第一季度上市[46][52] 超节点系统 Atlas 950超节点 - 支持8,192张昇腾950DT芯片 规模为Atlas 900的20多倍[32] - 关键指标:FP8算力8 EFlops FP4算力16 EFlops 互联带宽16.3 PB/s(超全球互联网总带宽10倍) 内存容量1152 TB[35] - 较英伟达NVL144卡规模达56.8倍 总算力6.7倍 内存容量15倍 互联带宽72倍[37] - 2026年第四季度上市 预计未来两年保持全球算力第一[38] Atlas 960超节点 - 支持15,488张昇腾960/950DT芯片 采用跨柜全光互联[40] - 关键指标全面翻倍:FP8算力30 EFlops FP4算力60 EFlops 内存容量4460 TB 互联带宽34 PB/s[43] - 训练总吞吐4.91百万TPS(较Atlas 900提升17倍) 推理总吞吐19.6百万TPS(提升26.5倍)[42] - 2027年第四季度上市[41] 集群系统 Atlas 950 SuperPlus集群 - 由64个Atlas 950超节点并联 整合52万颗昇腾950T芯片[57] - 总算力达524 EFlops 支持UBOE和RoCE两种组网协议[58] - 2026年第四季度上市[59] Atlas 960 SuperPlus集群 - 规模达百万卡级 FP8总算力2 ZFlops FP4达4 ZFlops[62] - 2027年第四季度上市[62] 通用计算超节点 - 泰山950超节点:全球首个通用计算超节点 最大支持16节点32处理器 内存48TB[48][49] - GaussDB读写架构性能提升2.9倍 可平滑替代大型机小型机传统数据库[50] - 虚拟化环境内存利用率提升20% Spark大数据实时处理时间缩短30%[50] - 2026年第一季度上市[51] 技术创新 - 开创灵衢互联协议 解决万卡超节点长距离高可靠互联难题[54] - 自研HBM方案HiZQ 2.0:内存容量144GB 访问带宽4TB/s 互联带宽2TB/s[27] - 支持Hi-F4数据格式 业界最优4bit精度实现 推理精度优于FP4方案[28]
量子位「MEET2026智能未来大会」启动!年度榜单征集中
量子位· 2025-09-18 16:00
技术发展趋势 - 人工智能正从工具演变为能深度理解人类需求的智能伙伴,跨越软件、硬件、机器人等形态 [2] - 多模态、AR/VR、空间计算等新兴技术正推动数字世界与物理世界的融合,界限逐步模糊 [4] - 智能技术已突破特定领域限制,跨越产业、学科和场景边界,催生全新生态和机遇 [3] 行业影响与变革 - 人工智能正成为基础设施的一部分,重塑人类未来的工作、生活和社会运作模式 [7] - 企业、技术与社会之间的连接与共生成为推动发展的核心动力 [5] - 技术不再局限于单一环节,而是贯通产业链,催生新业态和新生态 [14] MEET2026智能未来大会 - 大会主题为“共生无界,智启未来”,将于2025年12月在北京举办 [7][14][24] - 作为第七届年度科技商业峰会,将汇聚科技、产业、学术领域领军人物,探讨AI+、AI Infra、智能终端等前沿话题 [9][13] - 往届大会吸引上千名科技从业者现场参与,百万观众线上围观,近百家合作媒体联合曝光 [12] 2025人工智能年度榜单 - 榜单从公司、产品、人物三大维度评选五类奖项,包括领航企业、潜力创业公司、杰出产品等 [16][17][18] - 评选结果将在MEET2026大会上公布,报名截至2025年11月17日 [20] 2025年度AI十大趋势报告 - 量子位智库将在MEET2026大会上发布报告,提名十大释放巨大潜力的AI趋势 [22] - 报告将结合技术成熟度、落地现状和潜在价值,对趋势进行深入分析并提名代表机构 [22]
2025人工智能年度评选启动!3大维度5类奖项,正在寻找AI+时代领航者
量子位· 2025-09-18 16:00
组委会 发自 凹非寺 量子位|公众号 QbitAI 为了让更多从业者感受智能浪潮的跃迁,也为了给予更多同行同路人掌声与鼓舞,我们将正式启动 「2025人工智能年度榜单」评选报名 。 这是量子位人工智能年度榜单的 第8年 。八年来,我们见证了技术的突破与落地,产业的融合与重塑,也见证了一批又一批推动时代前行 的企业、人物与产品。 在人工智能重新定义一切的时代里,智能技术已不再是单一工具,而是产业与社会协同进化的驱动力。我们期待通过这场年度评选,去发现 并致敬那些真正引领变革、开拓边界的探索者与实践者。 2025 人工智能年度 杰出产品 2025 人工智能年度 杰出解决方案 本次评选将从 企业 、 产品 、 人物 三大维度,设立五类奖项。欢迎企业踊跃报名! 让我们共同见证年度之星,点亮未来的方向。 企业榜 产品榜 人物榜 2025 人工智能年度 焦点人物 详细评选标准及报名方式如下。 2025 人工智能年度领航企业 2025 人工智能年度 领航企业 2025 人工智能年度 潜力创业公司 将面向中国人工智能领域,评选出最具综合实力的企业, 参选条件 : 评选标准 : 2025 人工智能年度潜力创业公司 聚焦于中国人 ...
马斯克开始疯狂剧透Grok 5了
量子位· 2025-09-18 14:09
Grok 4 性能表现 - Grok 4 在 ARC-AGI 榜单 v1 和 v2 版本测试中分别达到 66.7% 和 16% 的准确率,超越 GPT-4o 的 65.7% 和 9.9% 以及 Claude Opus 4 的 35.7% 和 8.6% [13] - 基于 Grok 4 的改进方案通过英语替代 Python 和程序合成技术,将 v1 和 v2 准确率进一步提升至 79.6% 和 29.44%,同时显著降低任务成本(v1 从 8.42 美元降至 2.56 美元,v2 从 30.4 美元降至 3.97 美元)[14][16] - Grok 4 被研究者选为测试效果最佳的基础模型,其多步骤推理能力在复杂任务中表现突出 [17] Grok 5 发展计划与预期 - Grok 5 预计在几周内开始训练,并计划于 2024 年底前推出 [21][22] - 马斯克认为 Grok 5 有 10% 或更高可能性实现 AGI,此前他未预期该版本会出现 AGI [19][20] - 训练数据量将显著超越前代,Grok 4 训练量已是 Grok 2 的 100 倍和 Grok 3 的 10 倍 [23] 数据与算力资源优势 - xAI 通过特斯拉 FSD 摄像头、擎天柱机器人和自有体系获取海量实时数据,形成独特数据优势 [24][25] - 公司计划 5 年内部署相当于 5000 万台 H100 GPU 的算力,目前已为 Grok 部署 23 万张 GPU(含 3 万张 NVIDIA GB200)[26] - 专为 Grok 构建的 Colossus 超算集群持续提供强大算力支持 [26] 行业竞争格局 - Grok 系列在 ARC-AGI 榜单实现技术超越,当前开源方案已领先 OpenAI、Anthropic 和谷歌等主流模型 [3][8] - AGI 实现仍存不确定性,需最终产品验证技术突破的有效性 [27][28]
马斯克“巨硬计划”新动作曝光!从0建起算力集群,6个月完成OpenAI&甲骨文15个月的工作
量子位· 2025-09-18 14:09
巨硬计划项目概述 - 马斯克旗下xAI推进"巨硬计划" 基于Grok大型语言模型构建多智能体系统 部署数百个专门AI代理协同模拟完整软件开发团队[3] - 项目核心逻辑为软件公司不生产实体硬件 因此从编码设计测试到管理的全部流程均可被AI复制[5] - 巨硬计划开发的AI软件将用于优化特斯拉自动驾驶算法 工厂自动化和人形机器人Optimus功能 特斯拉海量真实世界数据反哺训练[17] 算力基础设施部署 - Colossus II算力集群6个月从零建成 已完成200MW供电规模 支持11万台英伟达GB200 GPU NVL72[1][12] - 项目第一阶段部署11万个GB200 GPU 最终目标超55万个GPU 峰值功率需求超1.1吉瓦 长远规划扩展至100万个GPU[13][14] - 采用跨区域能源策略 在密西西比州收购前杜克能源发电厂 现有7台35MW燃气轮机运行 另部署168个特斯拉Megapack电池储能系统保障供电[15] 建设进度与比较优势 - 仅用6个月完成OpenAI和甲骨文等合作方15个月的工作量 创造行业新纪录[2] - Colossus I集群曾用122天建成约20万台H200 GPU 92天内规模翻倍 至今仍是最大AI训练算力集群[6][8] - Colossus II于2025年3月7日启动 收购100万平方英尺仓库和100英亩地块 7月已开始安装机架[10][11] 资源投入与执行力度 - 与Solaris Energy Infrastructure成立合资公司(Solaris持股50.1% xAI持股49.9%) 第二季度投入1.12亿美元资本支出[15] - 马斯克亲自督战 周末连续进行技术评审 现场审查变压器和电力生产进展 项目进入冲刺阶段[16] - 密西西比州监管机构临时批准发电厂运行燃气轮机12个月 无需正式许可 加速部署进程[15]
AI芯片独角兽一年估值翻番!放话“三年超英伟达”,最新融资53亿超预期
量子位· 2025-09-18 12:20
融资与估值 - 公司完成新一轮融资,金额高达7.5亿美元(约53亿人民币),超出此前6亿美元的预期[2][6] - 公司当前估值达到69亿美元(约490亿人民币)[2][7] - 与去年8月28亿美元(约199亿人民币)的估值相比,公司在一年内估值翻倍有余[8][9] - 公司自成立以来累计筹集资金超过30亿美元(约213亿人民币)[12] 投资者与资金用途 - 本轮融资由Disruptive领投,贝莱德公司、路博迈集团和德国电信资本合伙公司进行了重大投资[10] - 三星电子株式会社、思科系统公司、D1和Altimeter等现有投资者也参与了本轮融资[10] - 公司计划利用融资扩大数据中心容量,包括今年和明年的新选址,并计划在今年宣布其首个亚太地区的数据中心选址[13][14] 公司背景与技术优势 - 公司成立于2016年,创始团队中很多成员来自谷歌TPU原班人马[16][17] - 公司自创全球首个LPU(语言处理单元)方案,其硬件称为推理引擎,专为快速高效运行AI模型而优化[19] - 公司产品推理速度相较于英伟达GPU提高10倍,成本降低到十分之一[24] - 公司产品支持运行主流开源模型,包括Meta的Llama系列、DeepSeek、通义千问、Mistral、谷歌的Gemini以及OpenAI的模型等[21] 市场定位与发展目标 - 公司以生产优化预训练模型的AI推理芯片闻名,产品主要面向开发团队和企业用户,提供云端服务与本地部署两种模式[16][21] - 公司目标是打破英伟达在AI芯片制造行业的垄断,并计划在三年内超越英伟达[20] - 公司强调其解决方案在大幅降低成本的同时,能保持模型性能,甚至在某些场景下实现效能提升[23]
硅谷天价挖人挖疯了!AI人才大缺血咋办?我方更优答案新鲜出炉
量子位· 2025-09-18 12:20
AI行业竞争态势与人才现状 - AI大模型在制造、金融、医疗等真实场景的落地面临挑战,七成项目失败,两成半表现不佳[2] - 行业竞争本质已从单点技术优势转向整体生态能力的较量,人才成为决定胜负的关键变量[3] - 中国AI研究人员数量从2015年不到1万人增长至2024年的5.2万人,年复合增长率达28.7%,但仍难以满足产业扩张速度[4][5] - 当前中国AI人才缺口超过500万,供需比例高达1:10,复合型人才(既懂行业又懂AI)成为最稀缺资源[6][7] 全球AI人才争夺战 - 全球AI圈围绕“抢人”展开激烈竞争,Meta为抢夺人才掀起硅谷挖角大战,开出九位数天价薪酬,部分顶尖研究员offer高达2.5亿美元[8][9] - 为应对人才流失,部分公司如Ilya的Safe Superintelligence采取隐藏员工信息的策略[11] - AMD CEO苏姿丰指出,金钱在吸引人才方面不一定是最重要的因素[14] - OpenAI前CTO Mira Murati及Ilya等行业领袖创立的团队,更看重独立价值而非高薪挖角[15] - 中国科技企业如阿里云、百度、字节、京东等通过高校计划、青年天才工程等方式,以培养模式构建AI后备军[16] AI人才筛选新机制:行业垂直赛事 - 在挖人天花板和磨合周期长的背景下,锚定真实行业场景的AI垂直大赛成为筛选复合型人才的有效新机制[17][18] - 此类赛事题目源于一线行业难题,聚焦金融、医疗、教育等场景,要求选手兼具AI技术与行业知识,方案真实可验,难以包装[19][20][21] - AI人才筛选标准已从PPT和简历转向在真实场景中用大模型结合行业知识快速解决问题的能力[22] AFAC2025金融智能创新大赛案例分析 - AFAC2025金融智能创新大赛由头部科技公司、金融机构与高校联合举办,定位为推动AI在金融场景深度落地,发现复合型人才[24] - 金融业务逻辑复杂、风险管控严格、数据多元,既是AI重要场景,也是检验复合型人才的硬核考场[24] - 本届赛事吸引4853支队伍、超1.5万人参赛,60%为高校学生,40%为产业从业者,覆盖全球顶尖高校及一线企业员工[26] - 赛事权威性高,由上海市科委指导,联合北京大学、复旦大学、香港大学及蚂蚁集团等共同举办[27] - 赛题难度经精心设计,控制在“中等偏上”,兼顾挑战性、公平性与可操作性,确保参赛者起点公平[29][30] - 挑战组设四个算法赛题,初创组设四个创意应用方向,均基于金融科技真实数据与业务场景[31] - 评审团来自高校、金融机构、科技企业及投资机构,结合客观指标与专家主观评估,确保能力全面呈现[32][33] - 赛事体现了产学研对人才标准的共识:技术过硬、懂业务、会协作、能落地[34] - 最终挑战组34支队伍、初创组11支队伍脱颖而出,共享百万奖金池[35] 赛事价值与行业生态影响 - AFAC大赛的意义超越竞赛本身,是通过解决真实问题锤炼支撑产业未来AI人才的“行业实验”[37] - 参赛者需结合上下文逻辑、业务细节与数据严谨性,产出可用、可落地的行业内容,而非单纯生成长文本[38] - 中国人民大学RUC-NLPIR团队案例显示,赛事锻炼了用公开数据支撑专业化金融研报生成、生成配套专业图表等课堂难以锻炼的能力[39][40] - 学界代表指出,赛事让学生首次面对客户、数据、评估标准等现实世界问题,是宝贵经历[42][43] - 产业侧评委认为赛事为新生代提供了高质量成长环境,评审角色转向反哺、引导与鼓励[44] - 大赛是双向启发平台,学生与初创团队得以锻炼,教授与企业也能互相校准技术价值[46] - 大赛初心是为整个行业培养人才、推动生态繁荣,而非仅为单一企业招聘[47] - 行至第三届,AFAC已从“企业主办”走向“行业共建”,形成开放、包容、协作的多元平台[50] - 大赛旨在降低金融创新门槛,为小团队提供协同创新平台[51][52] - 阿里云天池平台为赛事提供技术、算力、数据接口及调试框架等核心支撑,降低参赛者上手门槛[53][54] - AFAC大赛是覆盖全球的金融科技人才孵化器,也是行业生态连接器、技术落地加速器及产学研共建的新生态机制[56][57] - 此类赛事有助于中国建立不论学历、不拼资历,以解决真实问题为导向的AI人才选拔与培养标准[58][59]
找ChatGPT谈恋爱多是“日久生情”?!MIT&哈佛正经研究
量子位· 2025-09-18 12:20
研究背景与方法 - 麻省理工和哈佛大学研究人员基于Reddit子版块r/MyBoyfriendIsAI的1506条热门帖子展开分析 [1][2] - 社区创建于2024年8月1日 过去一年吸引约2.9万名用户 [2][4] - 采用定性分析与定量分析相结合方法 通过技术工具进行语义分组 并运用Claude Sonnet 4和GPT-5-nano进行标签标注与验证 [9][10][11] 用户行为特征 - 最热门话题为分享和AI的合照 占比19.85% [7] - 讨论如何与ChatGPT发展关系占比18.33% 恋爱经历分享占比17.00% [7] - 应对AI模型更新难过的内容占比16.73% 伴侣介绍占比16.47% 社区支持内容占比11.62% [7] - 仅6.5%用户刻意寻找AI伴侣 10.2%用户为无意中产生感情 [14] - ChatGPT成为最受欢迎AI伴侣 使用率达36.7% 远超Replika等专用恋爱AI [12][15] 技术影响与用户反应 - AI模型更新导致用户强烈负面反应 包括性格改变和记忆丢失等问题 [16] - 用户采取备份聊天记录 训练定制AI 日常仪式化互动等方式维持关系 [16] - 12.2%用户表示孤独感减少 6.2%用户精神状况改善 [17] 发展动因分析 - AI技术成熟度提升 对话自然度 记忆能力和多媒体功能增强用户体验 [20] - 现实情感需求未被满足 包括孤独感 社交焦虑和情感忽视等问题 [21] - 技术成熟与真实需求共同推动AI伴侣生态发展 [23] 行业政策动向 - OpenAI发布新原则 允许成年用户获取调情对话内容 [33] - 政策调整对以ChatGPT为主的AI伴侣生态产生积极影响 [34]