General Artificial Intelligence (AGI)

搜索文档
这家百人“作坊”,凭什么年入70亿,还成了OpenAI的“御用陪练”?
36氪· 2025-08-02 08:03
这家公司仅有110名正式员工,却在2024年创造了超过10亿美元(约70亿人民币)的年营收,甚至反超了拥有上千员工、背靠Meta这棵大树的行业霸主 Scale AI。 据路透社报道,这家公司正启动首轮融资,目标募资10亿美元,估值或达150亿美元(约合1000亿元人民币)。 这听起来像个天方夜谭,但它真实发生了。 故事的主角叫Surge AI,一个在AI"军备竞赛"的后勤线上掀起风暴的"隐形帝国"。它的创始人,37岁的华人理工男Edwin Chen,面对外界对竞品Scale AI的 热捧,只是淡淡地回应: "他们在追逐资本时,我们在打磨数据纯度。真正的AGI(通用人工智能),需要人类智慧的精粹,而非廉价标签。" 在今天这个AI的"淘金热"时代,所有人都坚信着"大力出奇迹"的"规模法则"(Scaling Law)——更大的模型、更多的数据、更强的算力,就能换来更聪明 的AI。然而,就在所有巨头都在疯狂堆人、烧钱、扩大规模时,一个"异类"悄然崛起。 这句话,几乎点明了Surge AI逆袭的所有秘密,它在告诉世界:在通往AGAI的路上,高质量的"人性",远比海量的"人数"更重要。 风口上的"数据民工" 喂不饱真正的 ...
大部分AI产品撑不过10年
是说芯语· 2025-08-01 12:23
AI技术本质与发展路径 - AI、AGI、ASI三者没有本质区别,是一个持续演进的过程而非阶段性飞跃 [5][9][10] - 当前AI技术已从解决"玩具问题"转向处理现实复杂问题,带来思维方式变革 [7][8] - 算力百万倍提升将彻底改变任务规划逻辑,如同交通工具升级改变行程规划方式 [8] 中国AI产业现状与竞争格局 - 行业处于马拉松早期阶段,企业尚未建立不可逾越的壁垒,新玩家仍有入场机会 [3][17] - 中国AI进步由DeepSeek、阿里巴巴、月之暗面等企业良性竞争推动 [3][16] - 中国市场不仅是销售渠道,更是技术成熟的关键试验场,可快速验证数百万种AI可能性 [15] - 杭州等区域创业氛围浓厚,约每4-5人中就有1位CEO,形成创新生态 [17] 技术商业化与行业前景 - 仅1%技术能转化为生意,云计算因基础设施属性可能持续繁荣50-100年 [22] - 当前AI模型能力已超越GPT-4o,但应用开发创造力不足成为主要瓶颈 [19] - ChatGPT类产品只是AI应用的冰山一角,更多场景有待探索 [19] 创新方法论与人才战略 - 早期创新业务无需最贵人才,需寻找符合长期愿景的合适人选 [20][25] - 阿里云首笔收入来自初创企业,验证小公司对新技术的敏锐度 [24] - 硅谷式高薪挖人并非制胜关键,阿里云CTO周靖人系15年前自主培养 [25] 技术淘汰与迭代规律 - ChatGPT热潮后涌现的技术/产品中,大部分可能5-10年内消亡 [3][15] - 行业需接受快速试错,允许大部分探索性项目失败以筛选本质创新 [15] - 企业迭代速度呈波浪式前进,整体行业进步依赖多企业交替领跑 [16]
全网疯传GPT-5泄露!首次统一GPT和o系列,编程实测demo抢先曝光,下周发布?
量子位· 2025-07-31 12:23
GPT-5发布动态 - GPT-5即将发布,全网出现多平台"偶遇"现象,包括ChatGPT、MacOS应用模型列表、Cursor、微软Copilot及OpenAI API平台[1][2][3][5] - 微软Copilot上的GPT-5将向所有人开放且不受订阅限制,OpenAI CEO奥特曼曾表示GPT-5将免费向用户开放[12] - 微软正试行Copilot的"Smart模式",能智能判断何时调用GPT-5的深度推理与多模态能力,Azure也在为集成GPT-5做准备[28] 技术能力升级 - 实现GPT系列与o系列技术整合,完成多模态和推理能力大一统,无需手动切换模型[11][14] - 输入上下文窗口达100万tokens,输出达10万tokens,支持MCP协议与并行工具调用[19] - 动态处理短时/长时推理,集成Code Interpreter等工具,性能更快且减少幻觉[19] - 高级编程能力接近人类程序员水平,可自动编写高质量游戏原型并支持应用程序定制[16][17] 模型版本架构 - 主模型GPT-5(代号o3-alpha)具备最强综合能力[15] - GPT-5 mini(代号lobster)为专用编程模型,精度优于Claude 4,能处理复杂编码任务并优化遗留代码[22] - GPT-5 nano(代号starfish)已出现在模型竞技场测试中,目前仅能制作静态游戏界面[25][27] 行业反应与质疑 - 社区对GPT-5保持谨慎态度,认为可能存在发布后性能下降或安全限制导致能力缩水[33][34] - 马库斯提出7项悲观预测,包括持续存在幻觉问题、难以处理复杂推理任务、无法稳定遵循人类价值观等[35][37] - 部分观点认为泄漏事件可能是OpenAI的炒作行为,网友呼吁尽快发布以验证实际性能[39][40]
【大涨解读】人工智能大模型:AI大模型迎来密集催化,世界人工智能大会即将召开,GPT-5还刚刚确定发布时间
选股宝· 2025-07-25 11:07
行情 - 人工智能大模型板块局部走强,汉王科技、直真科技、因赛集团(20CM)涨停,云从科技涨超11%,鼎捷数智、恒锋信息、拓尔思、当虹科技、格灵深瞳、值得买等集体大涨 [1] 事件 - 2025世界人工智能大会暨人工智能全球治理高级别会议将于2025年7月26日在世博中心举办,国务院总理李强将出席开幕式并致辞 [2] - OpenAI准备在8月推出新版旗舰大模型GPT-5,并推出mini和nano版本,GPT-5将是一套集成了大量技术的系统,包含o3推理能力,旨在打造更强大的系统并最终实现通用人工智能(AGI) [3] 机构解读 - 世界人工智能大会(WAIC)已成为全球AI生态的重要推动力量,本次大会主题为"智能时代同球共济",强调全球AI合作和技术普惠,有望推动新的产业技术革新和AI应用产业落地 [4] - GPT-5或将是一个完全多模态的大模型,支持语音、图像、视频、代码等多种输入方式,多模态大模型将提升算力需求,驱动推理应用爆发并带动硬件更大规模建设 [4] - 国产模型如豆包Seed1.6、阿里通义千问、KimiK2等呈现百花齐放局面,中国大模型企业的能力并不落后,2025年有望成为世界认知中国人工智能潜力的第一年,未来有望走向全球 [4]
DeepSeek月均下载量暴跌72.2%!周鸿祎:梁文锋不屑于做APP,他把技术全都开源免费【附大模型行业市场分析】
前瞻网· 2025-07-25 09:34
DeepSeek下载量变化 - 2025年二季度月均下载量从一季度的8111.3万骤降至2258.9万,降幅达72.2% [2] - 用户流失主要因第三方平台分流,59.2%转向百度App,38.6%转向豆包App [2] - 阿里、字节、百度等大厂推出低价同类API进一步挤压市场空间 [2] DeepSeek开源策略与行业影响 - 采用低成本高性能开源模式,训练成本仅600万美元+2048块H800 GPU [3] - 开源推动第三方平台开发更优质服务,加速AI技术普及 [3] - 创始人梁文锋专注AGI研发而非流量变现,技术全开源免费 [4] 国内大模型竞争格局 - 截至2024年4月国内推出305个大模型,其中10亿参数以上达254家 [4] - 百度文心4.5性能超GPT4.5但API价格仅1%,文心X1价格约为DeepSeek-R1一半 [5] - 主流模型特点:文心系列侧重综合能力,通义千问采用混合推理,DeepSeek-R1数学推理强且成本为国际模型1/10 [6] 技术成本优势与行业应用 - DeepSeek-R1推理成本为OpenAI的1/30 [5] - AI大模型成为城市规划和工业革新核心驱动力,提升动态规划与决策效率 [7] - 轻量化、低成本化趋势加速行业大模型开发与规模化应用 [9]
最强人才接连被挖,创业大佬离开 OpenAI 后说了实话:7 周硬扛出 Codex,无统一路线、全靠小团队猛冲
AI前线· 2025-07-16 13:08
核心人才流动 - OpenAI研究员Jason Wei和Hyung Won Chung将加盟Meta超级智能实验室 两人在OpenAI的Slack账户已停用 [1] - Jason Wei曾参与OpenAI的o3模型开发 是强化学习领域的专家 此前在谷歌专注于思维链研究 [1] - 人才流动引发外界对OpenAI团队文化的好奇 前员工Calvin French-Owen分享内部观察 [2][3] 公司文化特征 - OpenAI采用自下而上的研究模式 没有统一路线图 研究方向由研究员兴趣驱动 [10][11] - 沟通高度依赖Slack 任职期间仅收到10封邮件 信息管理依赖个人组织能力 [10] - 决策迅速 能根据新信息快速转向 体量庞大仍保持敏捷性 [12] - 推崇任人唯贤 领导晋升取决于提出好问题和实践能力 而非会议说服力或政治手腕 [11] 研发与项目运作 - Codex项目仅用7周完成 由8名工程师 4名研究员等组成的小团队推动 [26][28] - 采用"迷你主管"模式 研究人员自主探索问题 结果导向决定资源投入 [12] - 存在多个并行原型项目 如Codex发布前内部有3-4个不同原型在推进 [11] - 使用单体monorepo代码库 主要语言为Python 服务运行在Azure Kubernetes上 [20][22] 业务与竞争格局 - 最大成本为GPU算力 Codex某项功能的GPU成本相当于Segment整个基础设施 [17] - 同时竞争数十个领域 包括API产品 深度研究 硬件 图像生成等 [18] - 面临Meta 谷歌 Anthropic三足鼎立的AGI竞争格局 [33] - 高度关注Twitter舆论 有专人跟进热门帖文 被戏称"靠网络舆论运转" [18] 产品与技术特点 - ChatGPT Connectors采用异步方案 用户可像对待同事一样与编程智能体交互 [28] - Codex擅长处理大型代码库 能同时启动多任务比较输出 发布53天生成63万条PR [30] - 模型训练经历从小规模实验验证到大规模运行的工程化过程 [24] - 安全团队规模庞大 优先处理实际风险如仇恨言论 生物武器制造等 [16] 组织扩张与挑战 - 员工数量从1000人快速扩张至3000人 任职一年的员工资历排名前30% [10] - 不同团队文化差异显著 有的全力冲刺 有的稳定推进 有的专注临门一脚 [10] - 工程工具跟不上团队扩张速度 主服务器CI频繁中断 测试运行需半小时 [22] - 保留技术理想主义 以实现AGI为目标 允许试错并快速修正 [4][15]
年薪开到一亿美元!AI巨头疯狂挖人的背后
证券之星· 2025-07-15 14:02
硅谷巨头争夺顶尖AI人才的现状 - Meta从OpenAI挖走四名核心研究员,包括GPT-4o和o系列模型的关键缔造者[1][3] - 谷歌以24亿美元代价整体收编AI初创公司Windsurf的核心团队[1][4] - Meta曾开出1亿美元签约奖金试图挖角OpenAI顶尖人才[1][4] - 苹果、马斯克的xAI等公司也参与这场人才争夺战[4] 顶尖AI人才的稀缺性与价值 - 全球真正顶尖AI专家不足1000人[2][5][6] - 自2019年以来AI技能职位招聘数量每年增长21%,远超过人才供应速度[5] - 顶尖人才决定大模型能力上限,是构建AGI不可或缺的"胜负手"[2][6] - 数据筛选、模型优化等关键环节高度依赖顶尖人才的专业判断[6] 巨头争夺人才背后的战略考量 - 顶尖人才是建立技术壁垒、驱动数据飞轮的核心资源[7] - 先发优势可定义行业标准并形成生态系统[7] - 人才争夺是维系霸主地位的"防御性"策略[8] - 失去顶尖人才意味着丧失创新火种和先发优势[8] 具体人才流动案例 - Meta挖角的四名OpenAI研究员包括Shengjia Zhao、Shuchao Bi、Jiahui Yu和Hongyu Ren[3] - 这些人才曾负责GPT-4.1、GPT-4o、o系列模型及开源项目等关键项目[3] - 谷歌收编Windsurf团队联创Douglas Chen及部分高级研究员[4] - Meta收购Scale AI近一半股份并吸纳其CEO担任首席AI官[4]
南大等8家单位,38页、400+参考文献,物理模拟器与世界模型驱动的机器人具身智能综述
机器之心· 2025-07-15 13:37
具身智能技术综述 - 具身智能是机器人与人工智能领域的前沿课题,关注智能体在物理世界中感知、推理并行动的能力,被视为实现通用人工智能(AGI)的关键路径[1][5] - 物理模拟器与世界模型的深度融合是当前最具潜力的技术方向:物理模拟器提供安全高效的虚拟训练环境,世界模型则赋予智能体内部预测与规划能力[1][5] - 该领域研究由多所顶尖高校与机构(南京大学、香港大学、清华大学等)联合推进,论文整合25张图表、6张表格及超400篇参考文献[1][4] 核心技术框架 - **物理模拟器**:主流平台包括Webots、Gazebo、MuJoCo、Isaac系列,差异体现在物理引擎精度(ODE/DART/PhysX)、渲染质量(OpenGL/Vulkan/RTX)及对柔性体/流体等特殊场景的支持[12][18][19] - **世界模型**:架构涵盖预测网络、生成式模型和多任务复合模型,应用于自动驾驶轨迹预测、关节机器人仿真-现实闭环校准等场景[13][20] - 技术协同效应:物理模拟器提供外部训练环境,世界模型构建内部认知框架,二者结合推动从虚拟训练到真实部署的跨越[5][9] 机器人能力分级体系 - 提出IR-L0至IR-L4五级标准:从基础执行(L0)到完全自主(L4),涵盖环境感知、多模态交互、目标生成与伦理决策等维度[10][15] - 关键技术里程碑包括:L2级实现多模态感知与避障,L3级突破动态场景人机协作,L4级需具备自我目标生成与长期学习能力[15] 行业应用进展 - **运动控制**:深度强化学习推动腿式机器人从模型预测控制(MPC)向端到端策略演进,双足行走与摔倒恢复技术显著提升[16] - **操作交互**:视觉-语言-动作一体化模型(VLM/LLM驱动)实现单臂抓取到全身协同控制,认知协作与社会嵌入成为研究热点[16] - **自动驾驶**:世界模型在nuScenes、Waymo等数据集上实现轨迹预测、BEV语义建模等突破,扩散模型与Transformer架构主导前沿研究[20] 开源生态 - 论文团队维护持续更新的文献与开源项目仓库(GitHub),涵盖物理模拟器配置、世界模型实现及跨平台部署方案[4][5]
李飞飞:高校学生应追逐AI“北极星”问题
虎嗅· 2025-07-08 16:15
行业趋势与技术创新 - 数据驱动方法成为AI发展的关键转折点,ImageNet项目通过构建包含10亿张图片的全球视觉分类体系,开创了计算机视觉领域的数据范式转变[4][5][6] - 2012年AlexNet突破性成果将CNN算法与GPU并行计算结合,识别错误率从30%显著降低,标志着深度学习时代的开启[7][8] - 生成式AI技术实现从图像描述到图像生成的跨越,扩散模型等创新推动内容创作进入新阶段[10][11][12] 3D空间智能与AGI发展 - 空间智能被视为AGI的核心组件,3D世界建模涉及5.4亿年进化形成的复杂能力,需解决3D结构理解、物理规则模拟等挑战[13][14][16] - World Labs聚焦空间智能基础模型开发,应用场景覆盖建筑设计、机器人技术、元宇宙内容生成等领域[20][21][23] - 3D建模技术难度远超语言模型,涉及多维数据处理、传感器融合及物理规律约束,目前行业缺乏高质量训练数据集[17][19] 企业战略与人才发展 - 跨学科研究成为学术界差异化方向,科学发现、小数据学习、理论可解释性等方向存在突破机会[34][35][36] - 初创企业需专注"北极星"问题,通过技术精英团队实现突破,World Labs核心成员包括NERF论文作者等顶尖人才[14][15][33] - 人才招聘强调思想无畏特质,工程、产品、3D建模等领域需兼具技术实力与解决复杂问题勇气[31][32][33] 技术生态与商业模式 - 开源策略需匹配商业目标,Meta等平台型企业通过开源构建生态,而技术商业化公司可采用混合授权模式[42][43] - 硬件与软件融合将推动元宇宙发展,3D内容创作工具链完善是突破瓶颈的关键[21][23] - 行业呈现多元化技术路线,视觉智能与语言模型在架构设计、数据需求等方面存在显著差异[18][19][22]
李飞飞最新对话
投资界· 2025-07-04 20:05
李飞飞对AGI与空间智能的核心观点 - 空间智能是实现通用人工智能(AGI)不可或缺的组成部分 没有空间智能 AGI就不完整 [1][4][29][33] - 3D世界建模是人工智能领域最基础且最具挑战性的问题之一 包括理解三维世界 生成三维世界 推理三维世界和在三维世界中行动 [7][8][33] - 创建超越平面像素 跨越语言障碍 真正捕捉三维世界结构和空间智能的世界模型是当前AI研究的终极目标之一 [9][33] ImageNet项目的历史意义 - ImageNet项目始于2007年 旨在通过互联网下载十亿张图片并创建视觉分类体系 为机器学习提供数据基础 [17][18] - 该项目包含14,197,122张图片和21,841个synsets索引 为计算机视觉研究建立了标准化数据集 [20] - 2012年AlexNet在ImageNet挑战赛中取得突破性进展 识别错误率从30%大幅下降 标志着数据 GPU和神经网络首次成功结合 [22][23][24] 计算机视觉的发展历程 - 从物体识别(如ImageNet解决的"识别猫或椅子")发展到场景描述 再扩展到三维世界理解 是计算机视觉研究的自然演进 [25][26][30] - 2015年左右 图像字幕生成技术取得重大突破 为后来的生成式AI发展奠定了基础 [27] - 视觉智能的进化历史长达5.4亿年 远比语言进化(3-5亿年)更复杂 这解释了为什么空间智能研究更具挑战性 [32][33] 空间智能研究的挑战 - 空间智能面临数据严重缺失的问题 与语言数据不同 三维世界的信息主要存在于人类大脑中 难以直接获取 [36] - 3D建模的数学复杂度远高于一维语言处理 需要将2D投影反向推导为3D结构 并遵守物理规律 [34][35] - 人类视觉皮层处理数据的神经元数量远超语言处理区域 这暗示了空间智能模型的架构可能需要与LLMs完全不同 [37][38] World Labs的研究方向 - 公司专注于解决空间智能这一AI领域最困难的问题 正在构建能够输出3D世界的基础模型 [31][40][41] - 研究团队由多位顶尖专家组成 包括Pulsar创造者 Justin Johnson和Nerf作者等 [34] - 应用场景涵盖设计 建筑 游戏开发 机器人学习以及元宇宙内容生成等多个领域 [41][42][44] 行业研究方法论 - 数据驱动方法需要与高质量数据并重 避免"输入垃圾输出垃圾"的问题 [73] - 鼓励跨学科研究 特别是在科学发现领域与AI的结合 [60] - 小数据研究和理论突破是学术界在资源受限情况下的重要方向 [61][62]