General Artificial Intelligence (AGI)
搜索文档
DeepSeek月均下载量暴跌72.2%!周鸿祎:梁文锋不屑于做APP,他把技术全都开源免费【附大模型行业市场分析】
前瞻网· 2025-07-25 09:34
DeepSeek下载量变化 - 2025年二季度月均下载量从一季度的8111.3万骤降至2258.9万,降幅达72.2% [2] - 用户流失主要因第三方平台分流,59.2%转向百度App,38.6%转向豆包App [2] - 阿里、字节、百度等大厂推出低价同类API进一步挤压市场空间 [2] DeepSeek开源策略与行业影响 - 采用低成本高性能开源模式,训练成本仅600万美元+2048块H800 GPU [3] - 开源推动第三方平台开发更优质服务,加速AI技术普及 [3] - 创始人梁文锋专注AGI研发而非流量变现,技术全开源免费 [4] 国内大模型竞争格局 - 截至2024年4月国内推出305个大模型,其中10亿参数以上达254家 [4] - 百度文心4.5性能超GPT4.5但API价格仅1%,文心X1价格约为DeepSeek-R1一半 [5] - 主流模型特点:文心系列侧重综合能力,通义千问采用混合推理,DeepSeek-R1数学推理强且成本为国际模型1/10 [6] 技术成本优势与行业应用 - DeepSeek-R1推理成本为OpenAI的1/30 [5] - AI大模型成为城市规划和工业革新核心驱动力,提升动态规划与决策效率 [7] - 轻量化、低成本化趋势加速行业大模型开发与规模化应用 [9]
最强人才接连被挖,创业大佬离开 OpenAI 后说了实话:7 周硬扛出 Codex,无统一路线、全靠小团队猛冲
AI前线· 2025-07-16 13:08
核心人才流动 - OpenAI研究员Jason Wei和Hyung Won Chung将加盟Meta超级智能实验室 两人在OpenAI的Slack账户已停用 [1] - Jason Wei曾参与OpenAI的o3模型开发 是强化学习领域的专家 此前在谷歌专注于思维链研究 [1] - 人才流动引发外界对OpenAI团队文化的好奇 前员工Calvin French-Owen分享内部观察 [2][3] 公司文化特征 - OpenAI采用自下而上的研究模式 没有统一路线图 研究方向由研究员兴趣驱动 [10][11] - 沟通高度依赖Slack 任职期间仅收到10封邮件 信息管理依赖个人组织能力 [10] - 决策迅速 能根据新信息快速转向 体量庞大仍保持敏捷性 [12] - 推崇任人唯贤 领导晋升取决于提出好问题和实践能力 而非会议说服力或政治手腕 [11] 研发与项目运作 - Codex项目仅用7周完成 由8名工程师 4名研究员等组成的小团队推动 [26][28] - 采用"迷你主管"模式 研究人员自主探索问题 结果导向决定资源投入 [12] - 存在多个并行原型项目 如Codex发布前内部有3-4个不同原型在推进 [11] - 使用单体monorepo代码库 主要语言为Python 服务运行在Azure Kubernetes上 [20][22] 业务与竞争格局 - 最大成本为GPU算力 Codex某项功能的GPU成本相当于Segment整个基础设施 [17] - 同时竞争数十个领域 包括API产品 深度研究 硬件 图像生成等 [18] - 面临Meta 谷歌 Anthropic三足鼎立的AGI竞争格局 [33] - 高度关注Twitter舆论 有专人跟进热门帖文 被戏称"靠网络舆论运转" [18] 产品与技术特点 - ChatGPT Connectors采用异步方案 用户可像对待同事一样与编程智能体交互 [28] - Codex擅长处理大型代码库 能同时启动多任务比较输出 发布53天生成63万条PR [30] - 模型训练经历从小规模实验验证到大规模运行的工程化过程 [24] - 安全团队规模庞大 优先处理实际风险如仇恨言论 生物武器制造等 [16] 组织扩张与挑战 - 员工数量从1000人快速扩张至3000人 任职一年的员工资历排名前30% [10] - 不同团队文化差异显著 有的全力冲刺 有的稳定推进 有的专注临门一脚 [10] - 工程工具跟不上团队扩张速度 主服务器CI频繁中断 测试运行需半小时 [22] - 保留技术理想主义 以实现AGI为目标 允许试错并快速修正 [4][15]
AGI离我们还有多远?斯坦福专家:未来五年AI将重塑白领工作
36氪· 2025-07-15 18:15
当前格局将如何塑造未来 - 生成式人工智能标志着人工智能为企业带来的变革性转变 并带来重大价值与变革的三大领域:用户体验及人机交互方式 应用层自动化 以及平台核心引擎[2] - SAP已在应用中嵌入约230项人工智能功能和代理 计划到2025年底增加到400项 以提高生产效率并降低成本[2] - 企业需将AI定位为增强工具而非生产力工具 定位方式显著影响使用频率 需从业务问题出发量化价值实现[2][3] 对AI未来的预测 - 技术通用人工智能(AGI)定义为AI在大多数认知任务中达到或超越人类通用性 未来五年将在白领工作中取得巨大进展[4] - AI发展六大变革支柱:超越当前能力的下一代AI 未来数据平台 机器人技术 量子计算 下一代企业用户体验 以及未来云架构[6] - 合成数据生成和提高数据质量将至关重要 因现实世界数据源如维基百科已被AI模型完全吸收[6] - 机器人技术迅速发展 边缘设备可安装强大AI 量子计算将实现流程优化和模拟的范式转变[6] - 2030年后新一代职场用户体验范式将发生变革 需要情感连接和自适应屏幕的沉浸式体验[7]
年薪开到一亿美元!AI巨头疯狂挖人的背后
证券之星· 2025-07-15 14:02
硅谷巨头争夺顶尖AI人才的现状 - Meta从OpenAI挖走四名核心研究员,包括GPT-4o和o系列模型的关键缔造者[1][3] - 谷歌以24亿美元代价整体收编AI初创公司Windsurf的核心团队[1][4] - Meta曾开出1亿美元签约奖金试图挖角OpenAI顶尖人才[1][4] - 苹果、马斯克的xAI等公司也参与这场人才争夺战[4] 顶尖AI人才的稀缺性与价值 - 全球真正顶尖AI专家不足1000人[2][5][6] - 自2019年以来AI技能职位招聘数量每年增长21%,远超过人才供应速度[5] - 顶尖人才决定大模型能力上限,是构建AGI不可或缺的"胜负手"[2][6] - 数据筛选、模型优化等关键环节高度依赖顶尖人才的专业判断[6] 巨头争夺人才背后的战略考量 - 顶尖人才是建立技术壁垒、驱动数据飞轮的核心资源[7] - 先发优势可定义行业标准并形成生态系统[7] - 人才争夺是维系霸主地位的"防御性"策略[8] - 失去顶尖人才意味着丧失创新火种和先发优势[8] 具体人才流动案例 - Meta挖角的四名OpenAI研究员包括Shengjia Zhao、Shuchao Bi、Jiahui Yu和Hongyu Ren[3] - 这些人才曾负责GPT-4.1、GPT-4o、o系列模型及开源项目等关键项目[3] - 谷歌收编Windsurf团队联创Douglas Chen及部分高级研究员[4] - Meta收购Scale AI近一半股份并吸纳其CEO担任首席AI官[4]
南大等8家单位,38页、400+参考文献,物理模拟器与世界模型驱动的机器人具身智能综述
机器之心· 2025-07-15 13:37
具身智能技术综述 - 具身智能是机器人与人工智能领域的前沿课题,关注智能体在物理世界中感知、推理并行动的能力,被视为实现通用人工智能(AGI)的关键路径[1][5] - 物理模拟器与世界模型的深度融合是当前最具潜力的技术方向:物理模拟器提供安全高效的虚拟训练环境,世界模型则赋予智能体内部预测与规划能力[1][5] - 该领域研究由多所顶尖高校与机构(南京大学、香港大学、清华大学等)联合推进,论文整合25张图表、6张表格及超400篇参考文献[1][4] 核心技术框架 - **物理模拟器**:主流平台包括Webots、Gazebo、MuJoCo、Isaac系列,差异体现在物理引擎精度(ODE/DART/PhysX)、渲染质量(OpenGL/Vulkan/RTX)及对柔性体/流体等特殊场景的支持[12][18][19] - **世界模型**:架构涵盖预测网络、生成式模型和多任务复合模型,应用于自动驾驶轨迹预测、关节机器人仿真-现实闭环校准等场景[13][20] - 技术协同效应:物理模拟器提供外部训练环境,世界模型构建内部认知框架,二者结合推动从虚拟训练到真实部署的跨越[5][9] 机器人能力分级体系 - 提出IR-L0至IR-L4五级标准:从基础执行(L0)到完全自主(L4),涵盖环境感知、多模态交互、目标生成与伦理决策等维度[10][15] - 关键技术里程碑包括:L2级实现多模态感知与避障,L3级突破动态场景人机协作,L4级需具备自我目标生成与长期学习能力[15] 行业应用进展 - **运动控制**:深度强化学习推动腿式机器人从模型预测控制(MPC)向端到端策略演进,双足行走与摔倒恢复技术显著提升[16] - **操作交互**:视觉-语言-动作一体化模型(VLM/LLM驱动)实现单臂抓取到全身协同控制,认知协作与社会嵌入成为研究热点[16] - **自动驾驶**:世界模型在nuScenes、Waymo等数据集上实现轨迹预测、BEV语义建模等突破,扩散模型与Transformer架构主导前沿研究[20] 开源生态 - 论文团队维护持续更新的文献与开源项目仓库(GitHub),涵盖物理模拟器配置、世界模型实现及跨平台部署方案[4][5]
李飞飞:高校学生应追逐AI“北极星”问题
虎嗅· 2025-07-08 16:15
行业趋势与技术创新 - 数据驱动方法成为AI发展的关键转折点,ImageNet项目通过构建包含10亿张图片的全球视觉分类体系,开创了计算机视觉领域的数据范式转变[4][5][6] - 2012年AlexNet突破性成果将CNN算法与GPU并行计算结合,识别错误率从30%显著降低,标志着深度学习时代的开启[7][8] - 生成式AI技术实现从图像描述到图像生成的跨越,扩散模型等创新推动内容创作进入新阶段[10][11][12] 3D空间智能与AGI发展 - 空间智能被视为AGI的核心组件,3D世界建模涉及5.4亿年进化形成的复杂能力,需解决3D结构理解、物理规则模拟等挑战[13][14][16] - World Labs聚焦空间智能基础模型开发,应用场景覆盖建筑设计、机器人技术、元宇宙内容生成等领域[20][21][23] - 3D建模技术难度远超语言模型,涉及多维数据处理、传感器融合及物理规律约束,目前行业缺乏高质量训练数据集[17][19] 企业战略与人才发展 - 跨学科研究成为学术界差异化方向,科学发现、小数据学习、理论可解释性等方向存在突破机会[34][35][36] - 初创企业需专注"北极星"问题,通过技术精英团队实现突破,World Labs核心成员包括NERF论文作者等顶尖人才[14][15][33] - 人才招聘强调思想无畏特质,工程、产品、3D建模等领域需兼具技术实力与解决复杂问题勇气[31][32][33] 技术生态与商业模式 - 开源策略需匹配商业目标,Meta等平台型企业通过开源构建生态,而技术商业化公司可采用混合授权模式[42][43] - 硬件与软件融合将推动元宇宙发展,3D内容创作工具链完善是突破瓶颈的关键[21][23] - 行业呈现多元化技术路线,视觉智能与语言模型在架构设计、数据需求等方面存在显著差异[18][19][22]
李飞飞最新对话
投资界· 2025-07-04 20:05
李飞飞对AGI与空间智能的核心观点 - 空间智能是实现通用人工智能(AGI)不可或缺的组成部分 没有空间智能 AGI就不完整 [1][4][29][33] - 3D世界建模是人工智能领域最基础且最具挑战性的问题之一 包括理解三维世界 生成三维世界 推理三维世界和在三维世界中行动 [7][8][33] - 创建超越平面像素 跨越语言障碍 真正捕捉三维世界结构和空间智能的世界模型是当前AI研究的终极目标之一 [9][33] ImageNet项目的历史意义 - ImageNet项目始于2007年 旨在通过互联网下载十亿张图片并创建视觉分类体系 为机器学习提供数据基础 [17][18] - 该项目包含14,197,122张图片和21,841个synsets索引 为计算机视觉研究建立了标准化数据集 [20] - 2012年AlexNet在ImageNet挑战赛中取得突破性进展 识别错误率从30%大幅下降 标志着数据 GPU和神经网络首次成功结合 [22][23][24] 计算机视觉的发展历程 - 从物体识别(如ImageNet解决的"识别猫或椅子")发展到场景描述 再扩展到三维世界理解 是计算机视觉研究的自然演进 [25][26][30] - 2015年左右 图像字幕生成技术取得重大突破 为后来的生成式AI发展奠定了基础 [27] - 视觉智能的进化历史长达5.4亿年 远比语言进化(3-5亿年)更复杂 这解释了为什么空间智能研究更具挑战性 [32][33] 空间智能研究的挑战 - 空间智能面临数据严重缺失的问题 与语言数据不同 三维世界的信息主要存在于人类大脑中 难以直接获取 [36] - 3D建模的数学复杂度远高于一维语言处理 需要将2D投影反向推导为3D结构 并遵守物理规律 [34][35] - 人类视觉皮层处理数据的神经元数量远超语言处理区域 这暗示了空间智能模型的架构可能需要与LLMs完全不同 [37][38] World Labs的研究方向 - 公司专注于解决空间智能这一AI领域最困难的问题 正在构建能够输出3D世界的基础模型 [31][40][41] - 研究团队由多位顶尖专家组成 包括Pulsar创造者 Justin Johnson和Nerf作者等 [34] - 应用场景涵盖设计 建筑 游戏开发 机器人学习以及元宇宙内容生成等多个领域 [41][42][44] 行业研究方法论 - 数据驱动方法需要与高质量数据并重 避免"输入垃圾输出垃圾"的问题 [73] - 鼓励跨学科研究 特别是在科学发现领域与AI的结合 [60] - 小数据研究和理论突破是学术界在资源受限情况下的重要方向 [61][62]
阿里,3800亿AI新长征
21世纪经济报道· 2025-07-03 19:16
公司战略转型 - 阿里巴巴正从电商巨头向科技驱动型企业转型,AI和云计算成为核心增长引擎 [2][3] - 公司未来十年将AI视为最大增量与变量,全力投入基础设施和技术先进性建设 [3][4] - 管理层明确"AI+云"为第二增长曲线,计划三年投入3800亿元建设AI基础设施,金额超过去十年总和 [5][8] 财务表现 - 2025财年集团总收入9963.47亿元,净利润同比增长77%至1259.76亿元 [2] - 阿里云收入达1180亿元同比增长11%,Q4收入301.27亿元创三年最快增速(同比+18%) [2] - AI相关产品收入连续七个季度三位数增长,高盛预计2027财年AI收入占比将达29% [4][7] 技术布局 - 构建全球最大开源模型族群,通义系列已开源200余款模型,衍生模型超10万个 [7] - 技术覆盖机器学习、NLP、计算机视觉等领域,形成从基础设施到商业应用的完整AI价值链 [5][6] - 2023年发布大语言模型"通义千问",2024年通义Qwen3模型性能领先全球多个评测榜单 [6][7] 投资与生态 - 资本开支同比激增120.68%至246.12亿元(2025Q1),全年资本开支860亿元 [8] - 领投月之暗面(投后估值25亿美金)、MiniMax(6亿美元A轮)等头部大模型企业 [8][9] - 战略投资具身智能领域(星动纪元3亿元Pre-A、逐际动力5亿元A轮)和美图(2.5亿美元可转债) [9][10] 业务协同 - 投资企业将优先使用阿里云服务,形成"投资—算力消耗—云收入增长"闭环 [10] - 与美图合作开发AI电商工具,提升商家营销效率并带动云服务采购(三年不低于5.6亿元) [10] - 通过技术共享和客户资源整合强化生态竞争力,被投企业成为云业务重要客户 [10][11]
李飞飞最新访谈:没有空间智能,AGI就不完整
量子位· 2025-07-02 17:33
李飞飞对AGI与空间智能的核心观点 - 空间智能是通用人工智能(AGI)不可或缺的组成部分 没有空间智能 AGI就不完整 [1][4][29] - 3D世界建模是实现AGI的关键 包括理解三维世界 生成三维世界 推理三维世界和在三维世界中做事 [7][29] - 目标是创建超越平面像素 跨越语言障碍 能够真正捕捉三维世界结构和空间智能的世界模型 [8][29] - 视觉智能的进化历史长达5.4亿年 远比语言进化(3-5亿年)更复杂 是智能发展的基础 [27] ImageNet项目的历史意义 - 2009年创建的ImageNet解决了AI领域的关键数据问题 为现代计算机视觉搭建了数据骨架 [11][13] - 项目构想源于机器学习需要范式转变 通过下载十亿张图片创建视觉分类体系来训练算法 [13][14] - 2012年AlexNet突破性进展 将卷积神经网络 GPU和深度学习首次结合 错误率从30%大幅下降 [15][17][19] - ImageNet开源策略和挑战赛机制推动了整个AI社区的发展 [15] 计算机视觉的发展历程 - 从物体识别(ImageNet)到场景描述(2015年图像字幕技术)再到3D世界建模的演进 [19][20][22][24] - 自然语言与视觉信号的融合让智能体能够讲述世界的故事 [22] - 生成式AI的发展使得从文字生成图像成为可能 展现了AI的惊人进步 [22] 空间智能的挑战与机遇 - 3D建模面临数据缺失问题 互联网缺乏空间智能数据 信息主要存在于人类大脑中 [9][33][49] - 3D世界比语言(一维)复杂得多 涉及物理规律 投射转换等多重数学难题 [30][31] - World Labs正在构建3D基础模型 应用场景包括设计 建筑 游戏开发和机器人等领域 [35] - 元宇宙是重要应用方向 需要硬件和软件的融合以及内容生成的世界模型 [35][36][37] 人才培养与团队建设 - 思想上的无畏精神是成功人士的核心特质 也是招聘的重要标准 [41][42] - World Labs正在招募工程 产品 3D和生成模型领域的人才 [43] - 跨学科AI和小数据领域是学术界值得关注的方向 [44][45] - 研究生阶段应被强烈好奇心引领 专注于解决根本性问题 [47][48]
Arm服务器出货,激增70%
半导体行业观察· 2025-07-01 09:03
服务器市场增长预测 - 2025年全球服务器市场规模预计达到3660亿美元,同比增长44.6% [1][6][7] - 2025年第一季度服务器市场规模达952亿美元,同比增长134.1% [1][2] - 服务器市场规模将在三年内增长两倍 [1][4][6] Arm服务器市场表现 - 基于Arm的服务器2025年出货量预计增长70%,占全球总出货量的21.1% [1][4][7] - Arm原定目标为2025年占据数据中心CPU销售额的50%,但实际份额低于预期 [1] - 大型机架配置(如Nvidia DGX GB200 NVL72)推动Arm服务器需求 [1][4] x86与非x86服务器增长 - x86服务器2025年预计增长39.9%,市场规模达2839亿美元 [2][3][6] - 非x86服务器(包括Arm)预计增长63.7%,市场规模达820亿美元 [2][3][6] AI服务器需求 - 配备GPU的AI服务器预计增长46.7%,占2025年市场总价值的近50% [1][4][6] - 超大规模客户和云服务提供商加速采用AI服务器 [1][4][6] - 从聊天机器人到推理模型的演进需要更高处理能力,尤其是推理需求 [2][4][7] 区域市场表现 - 美国服务器市场2025年预计增长59.7%,占全球总收入的62% [2][5][9] - 中国服务器市场预计增长39.5%,占全球季度收入的21%以上 [2][5][9] - 欧洲、中东和非洲地区增长7%,拉丁美洲增长0.7%,加拿大因大额交易下降9.6% [2][5][9] - 日本和亚太地区(除日本)预计分别增长33.9%和10.8% [5][9] 行业动态与投资 - "星际之门"项目计划投资5000亿美元用于AI基础设施建设以推动AGI发展 [4][7] - DeepSeek的R1推理模型引发对基础设施投资必要性的讨论 [4][7] - 高效模型将减少资源使用,提升多用户环境扩展性,推动高级推理和AGI发展 [5][7]