通用人工智能 (AGI)
搜索文档
新华财经晚报:两部门出台措施严管养老机构预收费 原则上通过存管银行收取
新华财经· 2025-11-19 18:36
【重点关注】 ·财政部在卢森堡成功发行40亿欧元主权债券 ·中国疫苗行业协会倡议:严禁以低于成本的报价参与竞标 ·市场监管总局:我国现有220多项儿童相关国家标准含强制性国家标准45项 ·两部门出台措施严管养老机构预收费原则上通过存管银行收取 【国内要闻】 ·据财政部,11月18日,中华人民共和国财政部代表中央政府在卢森堡成功发行了40亿欧元主权债券。 其中,4年期20亿欧元,发行利率为2.401%;7年期20亿欧元,发行利率为2.702%。这是我首次在卢森 堡发行欧元主权债券,受到市场热烈欢迎,国际投资者认购踊跃,总认购金额1001亿欧元,是发行金额 的25倍。其中,7年期认购倍数26.5倍。 ·国家市场监督管理总局标准技术司二级巡视员蔡彬19日表示,我国现有220多项儿童相关国家标准,其 中强制性国家标准45项,覆盖儿童日常生活、玩具文具、运动健康、交通出行等方面,为守护广大儿童 健康安全提供全方位标准保障。 ·国家市场监督管理总局质量监督司副司长苗雨晨19日在新闻发布会上表示,下一步,市场监管总局将 按照GB 6675《玩具安全》系列强制性国家标准要求,强化玩具产品质量安全监管,持续深入推进儿童 和学生 ...
新模型“屠榜”,第一财经对话谷歌团队:AI“新旗手”如何诞生
第一财经· 2025-11-19 14:20
文章核心观点 - Gemini 3 Pro在几乎所有主流基准测试中实现全面领先,大模型竞争格局可能就此改写[3] - 谷歌在三年间完成了从追赶到领先的反超,差异化的全栈式技术方案是关键支撑[5][22] - 新模型被定义为"能将任何想法变为现实",在用户实际体验中表现出色[11] - 谷歌在发布首日就将Gemini 3整合进搜索并推出AI编程产品Antigravity,显示商业化成熟度[17][19] - 市场认为Gemini 3是重要里程碑,可能帮助谷歌夺得AI领先地位,股价创历史新高[21] 模型性能表现 - 在"人类最后一次考试"基准测试中取得37.5%成绩,领先第二名GPT-5.1的26.5%达10个百分点[9] - GPQA Diamond测试得分91.9%,超过GPT-5.1的88.1%[10] - 多模态理解推理刷新纪录:MMMU-Pro分数81%,Video-MMMU分数87.6%[11] - 数学能力测试AIME 2025不使用工具时达95%,使用代码执行时达100%[9] - 编程能力LiveCodeBench Pro的Elo评分达2,439分,远超GPT-5.1的2,243分[9] - 长上下文性能MRCR v2在128k上下文平均达77.0%,在1M上下文达26.3%[9] 产品应用与用户体验 - 智能体功能可处理多步骤复杂任务,如整理邮件收件箱和购买票务[14][15] - 搜索整合带来强推理能力,可生成交互式工具和模拟界面[17] - 代码生成能力显著提升,可生成3D可视化内容并直接玩游戏[14] - 用户实测显示三个月内进步巨大,可复刻Mac OS网页和编写web操作系统[11] 商业化战略与市场影响 - 月活跃用户超6.5亿,1300万开发者基于Gemini构建应用,AI概览功能月用户超20亿[22] - 推出类IDE编程产品Antigravity,押注编程领域,但强调与Cursor保持合作[19][20] - 谷歌市值突破3.5万亿美元创历史新高,目前维持在3.43万亿美元高位[21] - Loop Capital将评级从"持有"上调至"买入",目标股价从260美元上调至320美元[21] - 伯克希尔·哈撒韦重仓买入谷歌,成为第十大股票持仓[22] 技术优势与发展前景 - 全栈式技术方案从TPU芯片到计算集群环环相扣[5][23] - 技术进步体现在"模型能赋能的新场景"而不仅是全新能力诞生[5][24] - 生图产品Nano Banana在泰国、印尼、印度等国带来病毒式传播效应[23] - 团队认为这是迈向通用人工智能的重要一步,比OpenAI和xAI进展更快[24]
新模型「屠榜」,对话谷歌团队:AI「新旗手」如何诞生
新浪科技· 2025-11-19 13:49
产品发布与市场反响 - 谷歌于11月19日正式发布Gemini 3 Pro模型,该模型在几乎所有主流基准测试中实现全面领先,被业内视为可能改写大模型竞争格局的“王牌”[1] - 发布后,OpenAI CEO奥尔特曼公开祝贺称其“看起来是个很棒的模型”,特斯拉CEO马斯克也评价“Nice work”,显示出行业对此次发布的高度关注[1] - 谷歌官方高调宣称该模型“开启智慧新纪元”,公司CEO桑达尔·皮查伊在社交媒体连发8条帖子介绍产品,员工也积极助阵[1] 基准测试性能表现 - 在“人类最后一次考试”基准测试中,Gemini 3 Pro在不使用工具的情况下取得37.5%的成绩,较第二名GPT-5.1的26.5%领先10个百分点[7] - GPQA Diamond测试中得分达91.9%,高于GPT-5.1的88.1%,显示其在科学与数学问题解决上的高可靠性[8] - 多模态能力方面,MMMU-Pro分数达81%,Video-MMMU分数达87.6%,刷新多模态推理纪录[9] - 数学能力测试AIME 2025中,无工具条件下得分95%,使用代码执行后达100%[7] - 长上下文性能测试MRCR v2中,128k上下文平均得分77%,1M上下文点状得分26.3%,显著优于竞品[7] 实际应用场景展示 - 用户测试显示,模型可一键生成高难度光影质感海报,复刻Mac OS网页时表现超出预期[11] - 谷歌DeepMind CEO哈萨比斯用模型在几小时内重现一款游戏,产品总监多西强调其生成3D可视化内容并直接游玩的体验[17] - 智能体模式可处理多步骤复杂任务,如梳理每日50多封邮件、筛选需回复邮件、购买演唱会门票等,显著提升效率[18][19] 商业化与生态整合 - 发布首日即将Gemini 3整合至谷歌搜索,增强搜索引擎推理能力并解锁生成UI体验,如交互式三体问题模拟界面[20][21] - 推出类IDE编程产品Antigravity,支持智能体自主规划执行端到端软件任务,模型通过API向开发者开放[24] - 月活跃用户已超6.5亿,1300万名开发者基于Gemini构建应用,搜索AI概览功能月用户超20亿[26] 技术优势与行业影响 - 谷歌通过全栈式技术方案(自研TPU芯片、计算集群等)实现三年内从追赶到领先的反超[4][27] - 行业认为谷歌可能托起AI牛市叙事,Loop Capital将母公司评级从“持有”上调至“买入”,目标股价从260美元调至320美元[26] - 公司市值一度突破3.5万亿美元创历史新高,巴菲特旗下伯克希尔重仓买入谷歌股票[26]
OpenAI推出最新人工智能模型GPT-5
新华社· 2025-08-08 10:04
新华社旧金山8月7日电(记者吴晓凌)美国开放人工智能研究中心(OpenAI)7日发布其最新人工智能 模型GPT-5。 OpenAI表示,GPT-5采用统一系统架构,整合了高效基础模型、深度推理模块和实时路由系统,能够根 据不同情况判断何时该快速回应,何时应进行深度推理思考以提供专家级的答案。 OpenAI首席执行官萨姆·奥尔特曼称,GPT-5是"世界上最好的模型",代表着OpenAI在开发通用人工智 能 (AGI) 道路上迈出了"重要一步"。 据介绍,GPT-5面向用户免费开放,但不同订阅等级的用户享有不同的使用权限和功能。例如,Pro订 阅用户可使用功能更强大的GPT-5 pro版本。 据OpenAI官网介绍,这是迄今为止该机构推出的最强大的人工智能系统,在各类基准测试中超越了先 前的模型,在编程、数学、写作、健康、视觉感知等方面都具备业界领先的性能,在减少幻觉(错误生 成)、提升指令执行能力、降低"逢迎"倾向方面都有重大进展。 美国全国广播公司新闻台报道说,GPT-5的新功能似乎主要是对ChatGPT和其他人工智能系统已有功能 的改进。该报道引用OpenAI发言人的话称,GPT-5在"持久记忆、自主性和跨 ...
XBIT最新美股价格累涨20%,香港稳定币牌照明年发放
搜狐财经· 2025-07-31 09:39
美股市场表现 - 美东时间周二三大指数同步收跌 道指下跌0.46%至44632.99点 标普500指数微跌0.30%收于6370.86点 纳指下跌0.38%报21098.29点[1] - 自2025年4月以来美股累计涨幅达20% 科技股表现尤为强势[1] - 英伟达股价持续攀升 市值突破3.89万亿美元 距4万亿美元关口仅一步之遥 成为推动大盘上行的核心动力[1] 科技行业动态 - 特斯拉股东将就投资xAI进行投票 SpaceX拟向xAI注资20亿美元 预示科技板块与人工智能领域融合深化[5] - Grok AI正式登陆特斯拉车载系统 自7月12日起美版新车标配该功能 提升智能汽车赛道估值预期[5] - 微软与OpenAI就通用人工智能(AGI)技术使用权进行谈判 为科技股估值扩张打开想象空间[5] 政策与监管影响 - 美国众议院通过"美丽大法案"税收与支出法案 为企业和家庭提供政策红利 能源、工业、金融及消费品等周期性行业直接受益[4] - 香港《稳定币条例》8月1日正式生效 金管局副总裁陈维民表示首阶段稳定币发行人牌照数量取决于申请材料质量 牌照预计明年初发放且门槛较高[2] - 香港允许稳定币采用单一法币或一揽子法币挂钩模式 只需在申请时明确币种即可[2] 经济指标与市场预期 - 非农数据等关键经济指标波动持续影响市场对美联储政策走向的预期 成为短期美股价格波动的重要扰动因素[4] - 美财长表态释放美联储可能降息信号 直接压低市场无风险收益率 推动资金向权益市场迁移[6] 跨市场联动效应 - 美股价格波动不仅是美国经济基本面的直接映射 更对全球资本流动产生显著外溢效应[2] - 稳定币监管进展成为跨市场联动新纽带 通过流动性传导间接影响美股等传统金融市场[2] - 美股市场呈现震荡上行态势 虽偶有调整但整体韧性凸显 成为加密货币投资者跨市场观察的重要参照[2] 投资策略观察 - 需跟踪宏观经济数据与政策动态 把握周期性行业轮动机会[6] - 关注科技巨头技术突破与商业落地进展 评估估值合理性[6] - 分散投资策略尤为关键 通过跨行业、跨资产类别配置降低单一市场波动风险[6]
OpenAI将部署第100万颗GPU,展望一亿颗?
半导体行业观察· 2025-07-22 08:56
OpenAI的计算能力扩张计划 - 公司计划在2024年底前上线超过100万个GPU,这一数字是xAI当前GPU数量的5倍(xAI运行约20万个Nvidia H100 GPU)[2] - 首席执行官Sam Altman进一步提出将计算能力提升100倍的目标,即1亿个GPU,按当前市场价格估算成本约3万亿美元(接近英国GDP)[5][7] - 100万个GPU的部署将使公司成为全球最大AI计算消费者,远超行业一年前1万个GPU即被视为重量级竞争者的标准[6] 基础设施与能源挑战 - 位于德克萨斯州的数据中心当前耗电量300兆瓦(相当于中型城市供电),预计2026年中期将达1千兆瓦,引发当地电网运营商对电压稳定的担忧[5] - 公司正与甲骨文合作建设自有数据中心,并探索谷歌TPU加速器,以减少对Nvidia硬件的单一依赖[6] - 能源需求和硬件规模扩张需要突破性技术,包括定制芯片、新型架构或更高能源效率方案[5][7] 行业竞争与技术战略 - 公司面临GPU短缺问题,曾因资源不足推迟GPT-4.5发布,现优先推进计算扩展项目[4] - 行业正经历军备竞赛,Meta、亚马逊等企业自主研发AI芯片并投资高带宽内存(HBM)[6] - OpenAI的基础设施建设旨在突破计算瓶颈,确保长期竞争优势,而非仅优化模型训练速度[6] 未来愿景与行业影响 - 100万个GPU被视为AI基础设施的新基线,标志着行业计算能力标准的大幅提升[7] - 1亿GPU目标虽不现实,但推动行业探索制造、能源和成本领域的创新可能性[7] - 公司通过多样化计算堆栈(Azure、甲骨文、TPU)和潜在定制芯片计划强化技术自主性[6][7]
芯片行业,正在被重塑
半导体行业观察· 2025-07-11 08:58
技术革命与AI发展 - 生成式人工智能(GenAI)性能每六个月翻一番,超越摩尔定律,被称为"超摩尔定律",云端AI芯片制造商预计未来十年性能每年翻一番或三倍[1] - 专家预测通用人工智能(AGI)将在2030年左右实现,随后超级人工智能(ASI)也将出现,AGI具备类似人类推理能力,ASI能自我编程并超越人类智力[1] - 人工智能在复杂任务上迅速超越人类,并逼近推理、数学问题解决和代码生成等领域,能力提升速度远超历史停滞期[2] 半导体行业影响 - GenAI推动对先进云端SoC的强劲需求,预计2030年该领域规模接近3000亿美元,复合年增长率33%[4] - GenAI发展速度颠覆半导体市场旧有假设,其普及速度超过PC、智能手机、平板电脑和互联网,39.4%的18-64岁美国人在ChatGPT发布后两年内使用[5][7] - 地缘政治加剧市场震荡,中美科技竞争使半导体成为战略资产,美国实施出口限制阻止中国获得AI处理器,中国以开源芯片等举措应对[7] AI芯片市场格局 - NVIDIA B200以4.5 PFLOPS(FP16)、192GB VRAM和8TB/s带宽领先,采用4nm工艺[10] - AMD MI325和Intel Gaudi 3分别以1.3 PFLOPS和1.835 PFLOPS(FP16)竞争,采用5nm工艺[10] - Cerebras WSE-3以125 PFLOPS(FP16)和21PB/s带宽展现晶圆级芯片创新,但VRAM仅44GB[10][12] 芯片制造商策略 - NVIDIA和AMD凭借GPU架构和海量HBM内存带宽主导市场[11] - AWS、Google和Microsoft依赖定制硅片优化数据中心性能[12] - Cerebras和Groq推动晶圆级芯片和数据流执行等创新架构,Cerebras单芯片运算达125 PFLOPS,Groq强调超低延迟推理[12] 行业挑战与趋势 - GenAI加速发展重塑半导体行业,芯片制造商竞相提升处理能力和效率,策略多样且创新[12] - 基于云端的AI部署面临有效且可持续扩展的复杂性挑战[12]
ICML 2025 | 千倍长度泛化!蚂蚁新注意力机制GCA实现16M长上下文精准理解
机器之心· 2025-06-13 23:45
长文本建模的挑战与GCA的创新 - 长文本建模面临两大核心挑战:主流LLMs的Transformers架构存在平方复杂度及显存开销线性增长问题,以及full-attention外推能力有限难以泛化到超长输入[1] - 高效处理长上下文不仅关乎工业界降本增效,更涉及AGI核心问题——构建具有永久记忆的智能体,这将成为大语言模型公司的数据护城河[1] - 蚂蚁团队提出GCA机制,模拟人类开卷考试模式,通过因果检索注意力实现端到端学习,仅关注相关历史片段,显著降低显存开销[2] GCA技术原理与架构 - GCA采用两阶段注意力机制:分组注意力收集各chunk信息,chunk-level融合通过softmax加权整合关键信息用于预测[14][15] - 架构结合GCA与滑动窗口注意力,前者负责长程检索后者处理短程信息,通过Triton kernel实现优化显存管理[15] - 与传统检索方式相比,GCA让检索分参与前向运算获得梯度,实现检索模块的端到端学习[13] 实验性能表现 - 128M模型实现1000倍长度泛化,16K预训练模型在16M上下文passkey retrieval达到100%准确率[5][17] - 训练开销随序列长度呈线性增长,推理显存接近常数且速度持平Transformers,CPU卸载策略使48K上下文显存仅增加1.62倍[17][20] - 在arXiv-math数据中展示语义级检索能力,能识别引理和变量声明的逻辑相关性[21] 行业技术对比 - 相比滑动窗口注意力牺牲长程信息、温度调节法泛化有限等现有方案,GCA突破性地实现有效利用超长上文信息[7][8] - 与DeepSeek的NSA形成技术互补:GCA侧重长度泛化,NSA优化稀疏attention,后续HSA工作融合两者优势[5] 开源与学术影响 - 技术实现已通过Triton kernel全部开源,论文被ICML 2025接收[3][11] - 尽管实验规模较小,但为机器永久记忆机制提供新思路,首次实现16M长度完美信息检索[23]
李飞飞的世界模型,大厂在反向操作?
虎嗅· 2025-06-06 14:26
公司概况 - 李飞飞创办的World Labs专注于开发具备"空间智能"的下一代AI系统,探索AI对三维世界的理解与建模能力[2] - 公司在2024年成立后三个月内完成两轮融资,累计筹集2.3亿美元,估值突破10亿美元成为AI领域独角兽[3] - 投资方包括a16z、英伟达NVentures、AMD Ventures、Intel Capital等科技与风投机构[4] 技术方向 - 核心研究方向为"世界模型",即AI对现实世界的三维理解能力,需结合视觉、空间感、动作等多维度信息[15][18] - 关键技术包括:NeRF(神经辐射场)实现二维图像到三维重建、高斯平面表示法提升实时渲染效率、扩散模型优化空间数据细节[30][33][38] - 需突破多视角数据融合与物理动态建模,使AI能预测物体运动(如风吹树叶、球体滚动)[41][46] 应用场景 - 游戏行业:AI根据照片或视频自动生成逼真三维场景,替代传统手工建模[51] - 建筑行业:几分钟内生成立体结构并模拟光照效果,大幅提升设计效率[53] - 机器人领域:赋予三维视觉能力,解决二维视觉导致的距离判断与导航问题[54] - 数字孪生:构建工厂/城市的虚拟副本用于灾害模拟与优化[56] - 创意产业:辅助艺术家进行空间化创作,成为"创作者伙伴"[59] 行业挑战 - 数据瓶颈:需大量带深度信息与空间结构的真实场景数据,目前获取成本高[63][64] - 算力限制:NeRF等技术计算资源需求大,难以大规模商业化落地[66] - 泛化能力:模型在陌生场景中易失效,需提升适应性[67] - 需跨学科协作整合硬件、软件、数据与应用生态[69] 团队与行业趋势 - World Labs团队涵盖计算机视觉、图形学、扩散模型、物理仿真与机器人控制等多领域专家[73][75] - AI研究范式从单一学科转向多学科融合,需集体智慧推动系统工程[77] - 空间智能被视为实现通用人工智能(AGI)的第一步,需具备空间感知与动态推理能力[94][95]
英伟达股价,暴跌
半导体行业观察· 2025-02-28 11:08
华尔街对Nvidia的悲观看法 - Nvidia股价周四下跌逾8%至12015美元,拖累微软、亚马逊等"七巨头"股票表现疲软[2] - 公司预计Q1营收增幅约65%,远低于过去三位数增幅,毛利率预计降至71%(至少一年最低水平)[3] - 1月季度营收3933亿美元仅超预期34%,去年同期超预期幅度达7%以上[6] - 中国初创公司DeepSeek的低成本AI模型引发市场对科技巨头AI基础设施投入的质疑[3] 财务与估值表现 - 公司市值在AI热潮中突破3万亿美元,但上月单日市值蒸发超5000亿美元创华尔街纪录[3] - 当前股价交易于29倍预期市盈率(两年前为80倍),低于AMD的22倍市盈率[8] - 分析师目标价中值175美元隐含33%上涨空间,63位分析师中33位给予"强力买入"评级[8] 产品与技术路线图 - Blackwell芯片已获得110亿美元收入,Blackwell Ultra将于2025年下半年推出[7][9] - B300系列将配备12-Hi HBM4E内存(最高288GB),性能较B200提升约50%[10] - 下一代Rubin架构GPU计划2026年推出,配备HBM4E内存和NVLink 6交换机(3600GB/s带宽)[11] - 2027年可能推出配备12个HBM4E堆栈的Rubin Ultra,采用台积电55倍尺寸CoWoS中介层[12] 市场需求与竞争态势 - 微软削减数据中心租赁引发市场对科技支出的担忧[4] - Q1营收指引430亿美元(±2%)高于分析师平均预期的4178亿美元[4] - 公司被视为AI支出健康度的晴雨表,但增长放缓迹象引发投资者担忧[3][5] 产品性能参数 - Blackwell Ultra将配备新型网络和12-Hi HBM3E内存[9] - B300系列搭载Mellanox Spectrum Ultra X800以太网交换机(支持512端口)[10] - Rubin平台包含Vera CPU、CX9网卡(1600Gb/s)和X1600交换机[11]