通用人工智能(AGI)

搜索文档
李彦宏出手!百度大模型终于开源
搜狐财经· 2025-06-30 12:25
智东西6月30日消息,百度正式开源文心大模型4.5系列模型! 此次百度一口气开源了10款模型,涵盖47B、3B激活参数的混合专家(MoE)模型,0.3B参数的稠密型模型等,并实现预训练权重和推理代码的完全开源。 智东西 作者 | 程茜 编辑 | 云鹏 ▲Hugging Face上的文心大模型4.5系列模型开源列表 目前,文心大模型4.5开源系列已可在飞桨星河社区、Hugging Face等平台下载部署使用,同时开源模型API服务也可在百度智能云千帆大模型平台使用。 自此,百度成为国内继腾讯、阿里、字节之后的又一家开源大厂,这也是百度面向大模型进入应用爆发黄金时期的最新举措。 早在今年2月,百度就已预告了文心大模型4.5系列的推出计划,并明确将于6月30日起正式开源。不过百度这次的开源列表没有其升级版文心大模型4.5 Turbo系列。 飞桨星河社区:https://aistudio.baidu.com/modelsoverview GitHub:https://github.com/PaddlePaddle/ERNIE 一、开发者热议,点名文心大模型4.5 Turbo开源 Reddit上的开发者认为,百度此次开 ...
刚刚,OpenAI全员放假一周!被Meta高薪连挖8人「偷家」,真麻了
机器之心· 2025-06-30 11:18
机器之心报道 机器之心编辑部 面对 Meta 一亿美元签字费挖人的条件,OpenAI 的回应是…… 随着高级研究人员接连被竞争对手挖走,OpenAI 高管向团队成员保证,公司不会「袖手旁观」。据《连线》杂志报道,上周六,OpenAI 首席研究官 Mark Chen 向员工发出了一份措辞强硬的备忘录,承诺要在顶尖研究人才争夺战中与 Meta 进行正面交锋。 这一次,《连线》甚至以 「OpenAI 领导层回应 Meta 挖角:有人闯进了我们家」为题进行了专题报道。 生成式 AI 竞争如火如荼的当口, OpenAI 却突然宣布本周全员放假,还是直接放一周。 这当然不是因为 GPT-5 已经造好,或是竞争对手全被打败了,而是因为 OpenAI 被挖人挖麻了。 在那份备忘录中,Mark Chen 表示:「我现在有一种强烈的预感,就像有人闯入我们家偷了东西一样。请相信,我们并没有袖手旁观。」 就在几天前,Meta 首席执行官马克・扎克伯格成功从 OpenAI 招募了四名高级研究人员加入 Meta 的「超级智能实验室」。而更早几天,Meta 更是将 OpenAI 苏黎 世办公室的三位研究者一锅端走。详情可参阅我们之前的两篇 ...
雷军盛赞蔚来;格力高管怒怼同行;特朗普T1手机被曝由中国公司生产;李宇春谈当年拒绝代言锤子手机;国外生产充电宝不检查3C……
搜狐财经· 2025-06-30 10:50
充电宝监管新规 - 新规禁止旅客携带不合规充电宝乘坐境内航班 旅客可通过国家市场监管管理总局缺陷产品召回技术中心官网查询召回信息 [1] - 国外生产充电宝不适用3C标志检查要求 仍按原标准执行 [1] - 可反向充电产品检查标准维持原要求不变 [1] 小米汽车安全设计 - 小米YU7全车配备双层夹胶玻璃 随车赠送专用破窗锤 破窗锤采用5mm钨钢尖设计 内置安全带割刀 [2] - 破窗锤可收纳于中控台下方不占空间 交付时将随车赠送 [2] 舞蹈培训市场乱象 - 部分机构以"舞蹈工作室"名义规避监管 存在无证办学和无证教学现象 [3] - 无资质培训机构已导致多起少年儿童舞蹈训练伤残事件 [3] 新能源汽车行业动态 - 雷军公开称赞蔚来为中国新能源汽车行业做出重要贡献 转发蔚来FE电动方程式夺冠十周年博文 [5] 科技公司人才竞争 - OpenAI首席研究官指责Meta挖角行为如同"闯入家中偷窃" 考虑提供财务补偿留住人才 [6] - OpenAI员工每周工作80小时 公司将安排停工期让员工休息 [6] 字节跳动机器人布局 - Seed团队正密集招募机器人方向"一号位" 包括产品/工程/大模型三个负责人 [7] - 团队规模已超200人 预计2025年扩编至300人以上 可能推动首款机器人产品落地 [7][8] 家电行业竞争态势 - 格力高管批评同行3%净利润率的低价策略 认为会损害行业健康发展 [14] - 指出部分企业通过现有渠道跨界竞争但难以持续 [14] 新能源汽车市场表现 - 小米YU7闲鱼租价达1500-5000元/天 Max车型超3000元/天 价格媲美兰博基尼等豪车 [19] - 高租金反映市场供不应求 显示在年轻消费群体中的影响力 [19] 手机制造业动态 - 特朗普T1手机删除"美国制造"描述 被曝实际由中国公司生产 [20] - 原售价499美元(约3600元人民币) 官网改为"令美国人自豪的设计" [20] 会计师事务所调整 - 普华永道计划裁减175名初级审计员 [21] 汽车行业动态 - 莲花汽车否认关闭英国赫塞尔工厂 称暂停Emira生产非永久性 [18] - 强调英国作为品牌核心市场地位 过去六年已进行大量投资 [18] 产品召回方案更新 - 安克更新充电宝召回流程 用户需泡盐水24小时后上传凭证获赔 [11][13] - 原计划寄送防火保护袋因快递限制调整方案 [11]
Gary Marcus惊世之言:纯LLM上构建AGI彻底没了希望!MIT、芝大、哈佛论文火了
机器之心· 2025-06-29 12:23
论文核心观点 - 大型语言模型(LLM)存在"波将金式理解"现象,即模型能正确定义概念但在实际应用中频繁出现自相矛盾的错误,揭示其概念表征存在深层次内在不一致性[2][3][17] - 这种现象普遍存在于各类主流模型中,包括GPT-4o、Claude-3.5、Gemini-2.0等,波将金率总体达到55%(分类)、40%(生成)、40%(编辑)[32][33] - 研究通过两种互补方法验证:基于三大领域(文学技巧/博弈论/心理偏差)的基准测试和自动化评估程序,结果显示模型内部存在对同一概念的冲突表征[28][36][39] 研究框架 - 提出形式化理论框架:将概念理解定义为函数f:X→{0,1},人类正确解释为f*,误解集合为F_h[21][22] - 引入"基石集"概念:最小实例集S⊆X,通过有限示例测试即可判定是否真正理解概念[24][25] - 基准测试有效性前提:LLM的误解方式需与人类相似,否则高分仅反映"波将金式理解"[17] 实证方法 - 基准测试覆盖32个概念/3159条标注数据,测量模型在定义正确后分类/生成/编辑任务的错误率[28][29] - 自动化程序检测内部不一致性:让模型评估自身生成的实例,结果显示不一致得分范围0.02-0.64[37][39] - 测试模型包括7个主流LLM:Llama-3.3正确率57%/43%/36%,GPT-4o为53%/38%/35%,Qwen2-VL表现最差达66%/62%/52%[32] 行业影响 - 模型定义准确率94.2%,但应用时表现断崖式下跌,证明传统基准测试存在局限性[33] - DeepMind科学家测试显示Gemini 2.5 Pro能正确处理论文案例,但需验证完整测试集表现[12] - 争议点:部分观点认为LLM无需真正理解,只需表现持续改进即可满足需求[11]
AI日报丨抢人抢技术!Meta一亿美元从OpenAI强揽三员大将,AI顶级人才争夺战白热化
美股研究社· 2025-06-27 22:26
AI行业动态 - 理想汽车进行组织架构调整,将"研发与供应群组"和"销售与服务群组"整合为"智能汽车群组",由总裁马东辉负责,CEO李想将更多精力投入AI领域[3] - Meta从OpenAI挖走顶级研究员Trapit Bansal,加入其新成立的AI超级智能部门,Bansal是OpenAI强化学习关键推动者和首个AI推理模型o1的基础贡献者之一[4] - Meta从OpenAI苏黎世研发中心挖走三位核心研究员卢卡斯・拜耶、亚历山大・科列斯尼科夫、翟晓华,为拜耶开出5000万美元签约奖金加股权激励的薪酬包[5] 科技公司AI战略 - 摩根士丹利分析师认为微软对OpenAI的投资取得成功,Azure AI业务进展使微软在生成式AI创新周期中处于有利地位,预计实现中等个位数复合年增长率[6][7] - 亚马逊生成AI副总裁瓦西・菲洛明离职,他曾领导AWS的AI产品战略并主导开发Amazon Bedrock平台,其职责由副总裁Rajesh Sheth接管[9][10][11][12][14] 半导体行业表现 - 英伟达股价上涨0.8%,市值达3.80万亿美元,巩固其全球最大市值公司地位,微软以3.68万亿美元市值位居第二[16][17] - 费城半导体指数上涨0.5%,Marvell Technology上涨5%,Credo Technology和Allegro MicroSystems上涨2%,Broadcom、高通、Analog Devices和英特尔均上涨1%,Astera Labs飙升8%[18] - 美光科技股价下跌2%,但自2025年4月4日以来已上涨近一倍[18]
国内数据产业规模已超2万亿元,腾讯云程彬:Data+AI赛道将爆发
钛媒体APP· 2025-06-27 22:04
腾讯云"Data+AI"战略布局 - 腾讯云将于下半年发布数据智能体产品,构建"Data+AI"深度融合能力,实现从数据存储到智能交互的跃迁 [2] - 公司提出新一代DIaaS平台,集成多模态数据处理、AI模型和Data Agent,使非结构化数据可被AI理解与利用 [5] - 与传统"DataxAI"概念不同,腾讯云强调"Data+AI"是原生一体化平台,目标是让数据智能成为基础设施级的服务 [5][6] 数据产业规模与增长 - 2024年中国数据生产总量达41.06ZB(同比增长25%),人均31.31TB(同比增长25.17%) [2] - 当前中国数据领域企业超19万家,产业规模超2万亿元,预计2030年达7.5万亿元(年均增长率20%+) [8] - 非结构化数据占比达70%-90%,相关IT支出将占数据管理总支出的40%(2027年预测) [3][5] 行业技术变革趋势 - AI大模型推动数据平台转型:从被动数据仓库发展为主动交互的"知识母体" [4][5] - 企业面临数据源激增挑战(平均管理400+异构数据源),需建立动态可追溯的治理体系 [3] - Gartner预测2027年80%的数据治理措施可能因缺乏危机意识失效 [3] 市场竞争格局 - 国际头部企业Databricks估值600亿美元、Snowflake市值740亿美元,已成功转型"Data+AI" [7] - 国内尚未出现对标Snowflake的技术型大数据初创公司,但预计下半年将涌现新竞争者 [7] - 腾讯云认为行业协同至关重要,单独企业难以满足全部客户需求 [7] 技术应用前景 - 生成式AI推动非结构化数据处理需求爆炸式增长,合规压力加剧企业管理难度 [3] - Agent智能体短期内(1-3年)可提升数据价值,但长期可能被AI模型替代 [7] - 大语言模型技术成熟与用户需求增长是推动数智平台发展的双重动力 [6]
AI 开始「自由玩电脑」了!吉大提出「屏幕探索者」智能体
机器之心· 2025-06-27 12:02
研究背景与目标 - 研究聚焦于开发能在开放世界图形用户界面(GUI)中自主探索的智能体,这是实现通用人工智能(AGI)的关键路径之一 [2] - 当前大语言模型(LLMs)和视觉语言模型(VLMs)已展现出跨领域任务泛化能力,为GUI智能体开发奠定基础 [2] - 吉林大学团队提出《ScreenExplorer》项目,旨在训练视觉语言模型实现GUI环境自主探索 [3] 方法论创新 - 构建实时交互的在线强化学习框架,智能体通过鼠标/键盘函数调用与真实GUI环境交互 [10][11] - 引入"好奇心机制"解决开放环境反馈稀疏问题,利用世界模型预测状态转移并估算新颖度 [10] - 采用"经验流蒸馏"训练范式,将每代智能体探索经验自动提炼用于下一代微调 [10] - 设计启发式+世界模型驱动的奖励体系,包含轨迹差异奖励、好奇心奖励、格式奖励和意图对齐奖励 [12] - 采用GRPO算法进行强化学习训练,实现多环境并行推理与实时策略更新 [14][15] 实验结果 基础模型表现 - 未经训练的Qwen2 5-VL-3B模型仅能随机点击屏幕,无法打开任何软件 [17] - 经过初步训练后,3B模型可成功打开桌面软件,7B模型能完成"加购物车"完整流程 [18][20] 性能对比 - ScreenExplorer-3B-E1训练后探索多样性达0 51,显著优于基础模型Qwen2 5-VL-3B的0 21 [23] - 7B版本ScreenExplorer-7B-E1表现更优,探索多样性达0 54,超过专用GUI模型doubao-1 5-ui-tars的0 45 [23] - 世界模型好奇心奖励对训练至关重要,去除后模型无法突破冷启动阶段 [26][28] 涌现能力 - 训练后智能体展现出跨模态翻译、现状计划制定和复杂推理等新能力 [29][32][34] - 探索产生的"意图"字段可自动生成标注数据,为后续任务训练提供基础 [34] 技术价值 - 首次实现视觉语言模型在真实GUI环境中的自主探索训练 [35] - 经验流蒸馏技术显著降低对人工标注数据的依赖,实现能力自主进化 [10][35] - 为开发更自主的智能体和实现AGI提供了可行的技术路径 [35]
诺贝尔奖得主给你支招:AI时代年轻人该学什么 ?
老徐抓AI趋势· 2025-06-27 03:01
戴密斯·哈萨比斯的背景与成就 - 国际象棋神童:4岁学棋,13岁达到大师水平,多次成为英国少年队队长 [6] - 学术跳级:16岁考入剑桥大学计算机系,20岁毕业 [7] - 游戏创业:毕业后创立游戏公司,开发多款畅销游戏,实现财务自由 [7] - 转向AI与神经科学:认为人类大脑处理数据能力有限,希望通过AI创造"加强版大脑"加速科研 [8] - 深造神经科学:29岁攻读伦敦大学博士,研究大脑运作机制,为AI研究奠定基础 [9] - 创立DeepMind:2010年创办DeepMind,目标用AI解决复杂科学问题 [10] - AlphaGo突破:2016年AI系统击败围棋冠军李世石,2017年再胜柯洁,震惊全球 [11] - AlphaZero进化:AI从零自学围棋,3天碾压AlphaGo,展现超越人类的策略创新能力 [12] - 蛋白质革命与诺奖贡献:AlphaFold将单次蛋白质结构研究时间从数年缩短至分钟级,开源2亿个蛋白质结构数据,2024年获诺贝尔化学奖 [13] AI时代的学习与就业方向 - 基础能力重要性:AI时代更应学习编程、数学和物理等基础科学,掌握底层原理才能有效调教和定制AI工具 [15][16] - AI工具应用能力:能否将AI转化为超级助手,关键在于对底层的理解和调教能力,而非依赖AI的自动化功能 [17][18] AI高考志愿助手产品 - 产品功能:基于北大分段策略模型,结合三年录取数据,提供"冲保稳"分类推荐 [19] - 智能搜索:支持模糊搜索和场景提问(如"适合不擅长数学的专业"、"上海小语种强校") [19] - 个性化AI问答:根据省份、分数、偏好生成定制化建议,非标准化答案 [19] - 使用建议:可对比多个工具,因志愿填报为重大决策需谨慎投入 [21] AI时代的机遇与挑战 - 时代特征:AI带来大量机会,但也会淘汰未能适应技术变革的群体 [24] - 关键行动:需持续关注AI、积极拥抱技术并将其深度融入工作与学习 [25]
阿里巴巴,重磅发布!
中国基金报· 2025-06-26 22:04
阿里2025财年年报核心数据 - 2025财年总收入达9963.47亿元,净利润同比增长77%至1259.76亿元 [5] - 阿里云财年收入实现双位数增长,AI相关产品收入连续七个季度三位数同比增长 [2] - 淘天集团客户管理收入(CMR)同比增长6%,88VIP会员规模超5000万且留存率稳定 [6] - 国际数字商业集团收入同比增长29%,跨境业务表现强劲 [2] 业务板块表现 - **云计算与AI**:阿里云服务63%中国A股上市公司,模型平台"百炼"用户显著增长,通义Qwen3模型性能全球领先,已开源200余款模型衍生超10万个子模型 [6][9] - **电商与用户增长**:淘天集团"全站推广"营销工具商家渗透率提升,88VIP会员活跃比例与上年持平 [6] - **创新业务**:夸克月活突破2亿,钉钉付费周活达4200万并成为国内最大效率办公App,高德、虎鲸文娱实现单季度盈利 [6] - **战略调整**:有序退出高鑫零售、银泰百货等资产,优化互联网平台经营效率 [6] 战略方向与AI布局 - **双核心战略**:聚焦"用户为先"与"AI驱动",所有互联网业务贯彻用户优先原则 [9] - **AI技术路径**:坚持开源开放路线,目标推动全球协作实现AGI,通义模型家族规模全球最大 [9] - **第二增长曲线**:以"AI+云"为核心,依托中国云计算市场领导地位(亚太第一)加速全球化布局 [10] 管理层展望 - 未来十年变革将由AI驱动,公司需以创业者心态捕捉机遇,强调"创造而非守成"的基因 [3][8][10] - 阿里云将打造全球云计算网络,支持中国企业全球化,AI国际化蕴含重大机遇 [10]
通往 AGI 之路的苦涩教训
AI科技大本营· 2025-06-26 19:10
核心观点 - Google DeepMind CEO Demis Hassabis预测未来5到10年内有50%概率实现通用人工智能(AGI)[1] - AI发展历程中最大的教训是过度依赖人类经验而非算力与数据规模[2][3] - 当前AGI探索面临技术路径的隐忧,包括强化学习的局限性、脑模拟的算力瓶颈以及NLP的认知边界问题[9][14] 技术路径分析 - **强化学习**:虽为早期突破性技术,但存在"短视"缺陷,需结合更宏观的智能框架[14] - **脑模拟**:受限于算力瓶颈与理论盲区,难以完全复现人类认知机制[14] - **自然语言处理(NLP)**:虽进展迅速,但语言能力不等同于认知能力,模型输出与真实思想存在本质差异[9][15] 行业趋势与反思 - **算力驱动**:历史表明AI突破的核心引擎是计算规模而非人类直觉[2][3] - **大模型争议**:Scaling Law下参数膨胀可能掩盖智能本质,引发"进化还是幻觉"的质疑[15] - **跨学科融合**:脑科学与AI交叉研究成为新方向,强调对世界理解与知识迁移的能力[7][13] 关键人物与事件 - **刘嘉教授**:从AI转向脑科学再回归,提出AGI需融合认知科学、心理学等多学科视角[7][13] - **AlphaGo事件**:标志性技术转折点,推动研究者重新审视智能的本质与构建路径[7] - **《苦涩的教训》**:Richard Sutton指出AI发展应放弃人类经验依赖,专注算力与数据扩展[2][3] 未来探讨方向 - AGI构建是否需突破语言模型的表层能力,实现真正的认知理解[9][15] - 技术路线选择如何平衡短期效果(如NLP)与长期智能本质(如脑模拟)[14] - 跨学科研究(脑科学+AI)对突破现有范式局限的潜在价值[7][13]