AGI
搜索文档
37岁1200亿,他登顶今年最年轻富豪
华尔街见闻· 2025-09-29 19:12
Surge AI公司概况 - 公司正进行10亿美元首轮融资 对应估值约240亿美元(约1712亿元人民币)[4] - 公司成立五年未对外融资 但实现年营收超10亿美元[4][7] - 公司创始人Edwin Chen持有75%股份 身家达180亿美元(约1281亿元) 首次入选福布斯美国最年轻亿万富豪[5][12] 业务模式与市场地位 - 主营业务为AI数据标注服务 被比喻为"卖铲子"的刚性需求[7][11] - 客户涵盖OpenAI、Anthropic、谷歌、微软、Meta等全球AI巨头[15] - Meta生成式AI部门去年在公司全流程标注服务上支出超1.5亿美元[15] 创始人背景与创业历程 - 创始人Edwin Chen为85后华裔 毕业于麻省理工学院 曾任职于对冲基金、谷歌、Facebook等机构[4][13] - 创业灵感源于大厂项目外包数据标注质量差 发现行业痛点[13] - 产品上线12个月内实现八位数营收 并抓住大语言模型兴起的风口[14] 行业竞争格局 - 主要竞争对手Scale AI获Meta约150亿美元入股 估值超290亿美元[8] - 竞争对手Scale AI已离职创始人Lucy Guo凭借5%股份成为最年轻白手起家女亿万富豪[8] - 数据标注行业被视为AI基础设施 无论技术如何演进都离不开高质量数据[10][11] AI行业投融资动态 - AI搜索引擎Perplexity获2亿美元融资承诺 估值达200亿美元(约1425亿元)[16] - 法国初创公司Mistral AI即将完成20亿欧元融资 估值达120亿欧元(约1000亿元)[16] - Mistral AI成立一个月凭借7页PPT融资1亿美元 刷新欧洲种子轮纪录[16][17] 二级市场表现 - 英伟达、甲骨文股价创历史新高 A股寒武纪市值突破6000亿元 超越贵州茅台成新任"股王"[17] - A股算力三巨头"易中天"(新易盛、中际旭创、天孚通信)股价五个月内均实现翻倍[18] - 海光信息股价较三年前发行价涨超7倍 与寒武纪、工业富联组成"纪连海"概念[17]
大佬连发警告,“人类只剩最后5年”
虎嗅· 2025-09-29 13:47
AI技术发展时间表 - 萨姆·奥特曼预测到2030年人工智能将在所有维度上超越人类[3] - Emad Mostaque预测未来1000天内AI将取代人类工作岗位并重塑经济结构[5] - AI将主导GDP增长,人类智能被机器智能替代,大量认知劳动被AI智能体取代[6] AI对就业市场的影响 - AI带来“偏向资历的技术变革”,初级岗位受冲击最大,平均减幅达7.7%[10][11] - 企业通过减少招聘新人而非裁员实现初级岗位数量下降[12] - 资深员工因能操纵AI获得更多内部晋升机会[13] - 受冲击最严重的是毕业于公立一般大学或中段私立大学的求职者,形成“U型效应”[14] 科技行业裁员趋势 - 2025年全球科技行业已有204家公司裁员,89964名员工被解雇[21] - 微软2025年5月裁员6000人(占员工总数3%),AI技术已能生成公司20%~30%的代码[22] - IBM2025年3月裁员约9000人,Cloud Classic团队25%员工受影响[22] - 2025年裁员针对性集中在可被AI替代的中层技术和管理岗位[23] 企业AI战略转型 - 多数裁员公司同时大幅增加AI技术投资,显示人力资源结构调整趋势[25] - 微软2025财年承诺投入800亿美元用于AI数据中心建设[28] - 软银愿景基金在盈利背景下裁员,将资源重新配置到AI等“突破性技术”[28] AI人才市场需求 - 2025年AI岗位量同比增长10倍,超1000家企业发布超7.2万个AI岗位[31] - AI领域非技术岗位数量增长7.74倍,产品、运营与设计成为三大热招方向[32] - 2025年1~7月,平均月薪5万元~8万元的应届生岗位占比42.66%,8万元以上岗位占比14.68%[33] 顶尖AI人才争夺 - 字节跳动启动“Top Seed人才专项”,以百万年薪和算力资源吸引顶尖院校毕业生[36] - 蚂蚁集团“Plan A AI人才专项”由CTO带队在顶级会议宣讲,董事长亲自与候选人交流[36] - 百度2026届校招释放4000余个offer,AI岗位占比高达90%[37] - Meta为OpenAI的GPT-4核心架构师开出超过1亿美元薪酬包,为苹果大模型负责人开出两亿美元合同[40] - 微软启动针对MetaAI人才的“精准打击”计划,提供最高数百万美元薪酬包[41]
Flash Attention作者最新播客:英伟达GPU统治三年内将终结
量子位· 2025-09-29 12:57
英伟达市场地位与竞争格局 - 英伟达当前在AI芯片市场占据约90%主导地位,主要优势在于芯片设计、软件生态及网络通信技术[9][10] - AMD在推理端具备内存容量优势,但在训练端因网络通信瓶颈仍落后于英伟达[10] - 未来2-3年内AI硬件格局将转向多元化,专用芯片厂商如Cerebras、Grok、SambaNova将针对不同工作负载实现差异化竞争[23][24] AI芯片技术发展趋势 - 芯片设计将更适配Transformer、MoE等特定架构,工作负载集中化使专用芯片开发更易实现[10] - 稀疏计算(如MoE架构)增加芯片设计复杂度,需应对内存访问模式变化[13][14] - 硬件需支持三类工作负载:低延迟智能体系统(毫秒级响应)、高吞吐批量处理(海量数据生成)、交互式聊天机器人[24][96][111] 推理成本优化与技术突破 - 近三年推理成本下降约100倍,未来有望再降低10倍[73][90] - 量化技术推动参数表示从16位降至4位,GPT-oss模型1200亿参数仅需60GB存储空间[82][83] - 架构优化如Flash Attention减少内存访问,DeepSeek的multi-head latent attention压缩KV缓存规模[84] - MoE架构显著提升稀疏度,从Mistral的8专家激活2个(25%)演进至GPT-oss的128专家激活4个(1/32)[86][87] 模型架构演进方向 - Transformer仍是基础架构,但MoE、状态空间模型(如Mamba)等创新持续涌现[13][94][132] - 混合架构(Transformer+Mamba)在降低成本的同时提升推理性能[132] - 架构设计趋向"推理优先",以最大化每浮点操作的推理效率[131][133] AI工作负载分类与优化 - 三类核心工作负载形成:传统聊天机器人(中等延迟)、极低延迟场景(代码辅助等)、大规模批处理(合成数据生成)[96][111] - 低延迟场景用户愿支付更高成本,高吞吐场景注重批量折扣(如OpenAI批量API提供50%折扣)[24][110] - 代理型工作负载成为新焦点,需整合Web搜索、工具调用等外部能力[20][115] 开发工具与抽象层进展 - Triton成为跨芯片抽象层关键,支持英伟达、AMD、Intel GPU,但需牺牲约5%性能换取开发效率提升[38][40][41] - Mojo、Gluon等领域专用语言快速迭代,解决GPU内核开发痛点[45][50][52] - AI辅助编程工具(如Claude Code)提升开发效率约1.5倍,但全自动内核生成仍处早期阶段[56][67][68] 新兴应用场景与市场机会 - 实时视频生成成为消费端趋势,代表企业包括Pika Labs、Hetra[117][118] - 机器人领域存在重大机遇,需解决多分辨率数据处理与现实世界交互数据缺失问题[135][137][138] - 合成数据市场被低估,在航空、金融等专业领域具有经济价值[99][102][148] 学术与产业协同创新 - 基础突破多源于学术界(如Attention机制、Adam优化器、LayerNorm),产业界负责商业化落地[143][144][145] - 学术探索周期长(2-3年),产业执行速度快(周/月级),形成互补创新模式[140][145] - 政府资金支持早期探索(5-10%成功率),风险投资推动规模化应用[142][146]
OpenAI:人类只剩最后5年
虎嗅· 2025-09-29 07:36
对未来AI能力的预测 - 山姆·奥特曼预测五年后AI将全面超越人类,人类智力霸权时代进入倒计时 [1] - 预计到2030年,GPT-8有资格成为真正的AGI,能解决量子引力等终极难题并阐述思考过程 [2][3] - 智库METR预测大语言模型能力每7个月翻倍,到2030年AI可在数小时内完成人类一个月的工作量 [8][9] 当前AI应用的实际效能 - 实验表明,使用AI工具的软件工程师组比纯人工组效率慢了19%,而非预期的提升40% [13][14] - 当前AI存在“能力-可靠性缺口”,其产出无法达到企业业务水平,人类需花费大量时间检查更正错误 [19][20][22] - 生成式AI目前只能胜任审核、阅片等重复性高的工作,因同质化和细节缺失问题,无法作为合格工具 [59][60] AI行业的市场现状与投资 - 全国现存人工智能相关企业超过424.3万家,2025年新增注册约28.6万家 [28][29] - 2024年全球生成式AI投资额较2023年增长超过70%,预计2025年总支出将达到2024年的3倍 [34] - 微软、Meta、谷歌、亚马逊四巨头2024年资本投入高达3000亿美元,大部分流入AI项目 [33] AI企业的经营困境与淘汰率 - 除英伟达外,目前几乎没有AI企业真正盈利,行业呈现高投入、低回报特征 [31][32] - 多家AI初创公司面临困境,如SD背负1亿美元债务,Stability AI核心团队辞职,Character AI卖身谷歌 [37] - 2022年11月至2024年7月,全国共有78,612家新注册AI企业处于注销、吊销或停业状态,占同期新注册总量的8.9% [40] AI在具体行业的潜在影响 - 在游戏行业,AI可替代初级策划的重复性工作,实现降本增效并提升游戏质量(如个性化NPC) [68][71][72] - 行业预测随着技术升级,游戏行业50%的从业者可能面临转行,其他行业亦感受到压力 [79][80] - AI真正产生变革的门槛是达到人类从业者平均水平,届时将彻底改变市场生态 [65][66] 企业对AI的认知与应用误区 - 许多中小企业管理层跟风强调AI降本增效并普遍裁员,但结果往往是只降本未增效 [84][87] - 部分企业将购买高配电脑、生成数字人主播等同于数字化转型,存在认知偏差 [90][91] - 当前AI应用市场规模虽预计突破5000亿元,但市场炒作成分较大 [89][92]
撞墙的不是Scaling Laws,是AGI。
自动驾驶之心· 2025-09-29 07:33
文章核心观点 - Scaling Laws本身并未失效,其是数据结构的内在属性,当前大模型发展的瓶颈在于训练数据的质量和分布,而非计算规模本身[1][7][14] - 互联网原始数据总量虽大,但针对特定任务的有效数据分布稀疏,且不同Token的价值不均等,导致模型通用智能发展受限[4][8][15] - 行业趋势正从追求通用大模型转向专注于高价值领域的专业化模型,通过使用合成数据提升数据密度,可在减小模型尺寸的同时显著提升特定领域能力[10][11][12] 数据与Scaling Laws的关系 - Scaling Laws反映了数据结构的内在属性,基于Transformer的下一词预测复杂度随计算量和参数数量呈对数线性下降[3][4][14] - 原始互联网数据混合体并非实现AGI的最佳数据分布,模型训练为每个Token投入的计算量相同,但不同Token的价值并不相等[4][15] - 通过改变预训练数据的幂律分布,例如均衡每个Token的智能含量,可以从根本上改进Scaling Laws[15] 大模型发展现状与趋势 - GPT-4级别的模型已基本消耗完互联网可用数据,其涌现的智能主要是基础的语言智能,而非行业专业知识[9] - 从Claude Opus 3开始,通过引入合成数据,模型的专业能力(如代码能力)得到增强,同时模型行为更具可控性[10] - 模型发展呈现专业化趋势,例如Sonnet 3.5相比Sonnet 3模型尺寸更小,但因合成数据密度更高,其在代码方面的能力更强[11] - GPT-5体现了极致专业化,模型尺寸减小、专业性增强,但通用聊天能力被削弱,这引发了用户争议[12] 行业驱动因素与影响 - 模型厂商面临成本压力,将逐渐放弃通用性和超大模型路线,将智能资源集中堆叠于高价值领域[7][12] - 高价值领域如编程和搜索市场规模巨大,搜索领域可能催生两万亿美元的估值预期[12] - 高密度合成数据结合强化学习,能显著提升模型在特定行业的模式匹配能力和自动化水平,但全球上千个行业中,仅有少数像编程和搜索这样具有足够高价值来吸引AI公司投入[12] - 当前“你喂我吃”的深度学习范式下,单个语言模型通向AGI的道路天然受到成本限制,对全球的影响力可能有限[12]
AI产业跟踪:云栖大会首日,关注阿里开源与全球战略、全栈产品与生态协作的全面升级
长江证券· 2025-09-28 22:52
行业投资评级 - 看好 维持[8] 核心观点 - 阿里巴巴CEO提出AI发展三阶段演进路径:从通用人工智能(AGI)迈向超级人工智能(ASI)[2][5] - 宣布三年3800亿元AI基础设施投入计划 目标打造"超级AI云"[2][5] - 通义千问坚持开源开放路线 致力打造"AI时代的Android"[11] - 全球布局加速:在巴西、法国、荷兰首次设立地域节点 扩建墨西哥、日本等5地数据中心 2032年全球数据中心能耗规模将提升10倍[11] - 发布旗舰模型Qwen3-Max引领"参数革命" 展示模型实力前沿突破[11] - 与英伟达开展Physical AI合作 共同加速机器人在物理世界中的应用开发[11] - 国内AI Infra厂商受益于模型能力迭代与AI应用货币化 Agent投资逻辑持续强化[2][11] 技术演进路径 - AI发展分为四个阶段:智能涌现(学习人)→自主行动(辅助人)→自我迭代(超越人)→ASI[11] - 从学习人到辅助人的关键:大模型具备Tool Use能力连接数字化工具 大模型Coding能力提升解决复杂问题[11] - 从辅助人到超越人的关键:AI连接真实世界全量原始数据 实现Self-learning自主学习[11] 战略布局 - 两大核心判断:大模型是下一代操作系统("Token就是未来的电") 超级AI云是下一代计算机(全球可能仅存5-6个平台)[11] - 三大战略:通义千问开源开放 构建超级AI云提供全球智能算力网络 加速全球数据中心布局[11] 投资机会 - AI Infra厂商核心受益[11] - AI Agent相关商业化机遇[2][11] - 中国推理算力产业链[11] - CSP厂商推理需求推动[11] - 与头部大厂合作的IDC[11]
「理想同学」的进化史:从AI助手到智能体的自研之路
雷峰网· 2025-09-28 18:34
" 从传统的AI助手到大模型时代下的智能体,「理想同学」如何让 座舱实现自我革命? " 作者丨 梁辰 编辑丨 李雨晨 如果要选出最早凭借座舱功能占领用户心智的一家造车新势力,答案或许是理想。 "冰箱彩电大沙发"是理想最被人所知的卖点。但抛开这些精准的硬件定义,作为未来用户智驾空间与娱乐 的第三空间,座舱里只有这些是远远不够的。智能化尤其是座舱空间的智能化,已经成为车企的核心卖 点。 2023年5月,理想汽车智能空间副总裁勾晓菲曾在美国硅谷的一次半公开宣讲会上说,"触控不是座舱最 主要的交互方式,把触控做得再好,生态做得再好,它不适合在这个终端里。 基于触控生态的车机系统, 就是在用正确的方式回答了一个错误的问题 。" 勾晓菲这句话说完后的一个月,理想汽车推出了自研认知大模型"Mind GPT",并将其以"理想同学"App 的形式嵌入车机系统中,成为座舱里众多用户与数字内容交互的"新按钮"。 大模型加速上车后,智能座舱的竞争更显白热化。作为全公司最大的产品经理,李想对于AI的投入非常坚 决,每个月都会参加数场AI的主题会。 他经常说的一句话是:"我们是一个AI公司,我们必须把大模型做出来,没有大模型就不配称为A ...
AI周报 | 英伟达将向OpenAI投资1000亿美元;加码AI,阿里市值日增近3000亿
第一财经· 2025-09-28 08:39
加码AI,阿里市值日增近3000亿港元 在9月24日举行的2025杭州云栖大会上,阿里云宣布和英伟达在Physical AI(物理人工智能)领域达成 合作,整合英伟达用于机器人和自动驾驶汽车训练的 AI 开发工具。与此同时, CEO吴泳铭在主旨演讲 中表示,未来五年全球 AI 投资预计达 4 万亿美元,阿里必须保持同步。阿里正积极推进今年 2 月公布 的计划——未来三年投入 3800 亿元用于云和 AI 硬件基础设施建设,并计划追加更大的投入,不过未 透露具体增加金额。当天阿里港股大涨超9 %,创近三年新高,市值日增近3000亿港元。 点评:阿里一系列动作,推动市场对其信心回升。本月阿里股价已累计上涨超四成,年内涨幅接近翻 倍。截至9月26日收盘,阿里港股总市值达到3.2万亿港元。美股方面,华尔街明星基金经理"木头姐"凯 茜•伍德(CathieWood)旗下基金本周重启对阿里巴巴持仓,这是四年来的首次。吴泳铭表示,AI 和云 计算与电商并列为阿里增长引擎,他认为,AGI已是确定性事件,但这只是起点,终极目标是发展出能 自我迭代的超级人工智能ASI。 Meta 再挖 OpenAI墙脚;摩尔线程IPO过会。 英伟 ...
蔡浩宇,正在招人
投资界· 2025-09-26 15:20
蔡浩宇新公司Anuttacon动态 - 公司近期发布远程招聘信息 招聘AI训练师岗位 工作内容包括标注和评估AI回复 创建高质量训练数据 时薪20-30美元(约140-210元人民币)[2][3] - 公司从去年9月起面向全球广纳精英 重点招聘预训练与LLM人才 办公地点包括硅谷 目前正大举招募LLM 多模态 infra 工程开发等人才 基地覆盖美国 新加坡 中国北京和上海[5][7] 公司团队与技术布局 - 核心团队云集技术大牛 包括前微软亚洲研究院首席研究员童欣(现任首席研究员) 上海首批人工智能高级专家叶理灯(负责底层架构) 前Meta高级研究科学家吴箫剑(大模型研究负责人) 前B站副总裁王宇阳 前亚马逊应用科学家Yunzhe Tao等[5][6] - 首款产品为融入大语言模型的科幻互动叙事游戏《群星低语》 团队规模约50人 其中半数成员出自米哈游团队[6] - 公司定位AGI创业项目 早期聚焦AI+游戏 后续拓展至内容平台 旨在通过前沿技术推动游戏开发变革[3][5] 全球AI人才竞争态势 - AI顶尖人才全球不足千人 主要集中在OpenAI 谷歌 Meta等科技公司核心团队 真正推动AI发展的核心人才可能仅数百人[12][13] - Meta为抢占人才斥资约150亿美元(约1078亿元人民币)收购Scale AI 并开出1亿美元奖金挖角其他公司AI人才[12] - 中国AI研究人员占全球50% 成为最大单一人才群体 名校出身的技术人才在竞争中尤为抢手[13]
车机AI智能体加速落地,不止“一句话点咖啡”
21世纪经济报道· 2025-09-25 14:20
AI作为下一代操作系统 - AI被视为下一代操作系统 AGI将向ASI超人工智能发展 [1] - 阿里巴巴CEO吴泳铭认为AI需直接从物理世界获取原始数据实现突破 例如新一代自动驾驶通过原始车载摄像头数据学习实现更高驾驶能力 [6] 车企AI智能体应用加速落地 - 理想 比亚迪 智己 蔚来等车企过去半年已宣布将AI智能体引入智能座舱 [2] - 车内智能体可实现语音点餐功能 车主行车中语音点餐到达后无缝取餐 [2] - 理想汽车展示智能体"理想同学"调用星巴克小程序完成点单支付全流程 演示视频持续一分多钟 [1] 智能体技术框架与生态连接 - 车机智能体主要通过CUA和MCP/A2A两种框架运作 [2] - CUA框架通过多模态大模型理解任务生成动作 最终通过小程序或APP执行任务 例如理想OTA7.5系统接入支付宝生态 [2] - MCP/A2A框架将任务分发给第三方智能体完成 例如肯德基点单由肯德基自有智能体实现业务逻辑 [4] - 支付环节设置安全验证 需刷脸或语音确认 小额支付可启用免密支付 [4][5] 技术瓶颈与解决方案 - GUI Agent图形界面智能体准确率较低 15步任务准确率约30% 影响停车登记等复杂任务稳定性 [3] - 理想采用"多步轨迹"拆解方案 基于用户想法页面截图和对话状态预测页面动作 通过有限集合预测提高准确率 [3] 未来发展方向 - 理想发布Agent 2.0框架 重点发展全信息记忆和环境感知能力 [5] - 全信息记忆涵盖程序记忆情景记忆语义记忆 包括用户屏幕操作环境互动和人物关系认知 [5] - 环境感知能力通过摄像头识别真实二维码等信息 结合全信息记忆由大模型规划推理完成任务 [5] - 智能体从被动辅助转向主动代劳 例如自动完成车牌号输入等重复操作 [5]