General Artificial Intelligence (AGI)
搜索文档
我国科研机构主导的大模型成果首次登上Nature
观察者网· 2026-02-07 09:15
核心观点 - 北京智源人工智能研究院在《Nature》上发表的Emu3模型,证明了仅使用“下一词预测”这一统一范式,即可让机器同时掌握看、听、说、写乃至行动等多模态能力,挑战了当前AI领域依赖专用模型拼接的主流技术路线 [1][21] 技术架构与突破 - **统一范式**:Emu3采用极简设计,仅通过“下一词预测”任务训练一个decoder-only Transformer模型,统一处理文本、图像、视频和机器人动作指令,无需复杂的编码器拼接或模态融合机制 [1][10] - **视觉分词器**:模型核心是一个高效的视觉分词器,能将512×512图像压缩为4096个离散符号(压缩比64:1),并将4帧视频片段同样压缩至4096个符号,使用包含32768个“词汇”的码本,通过三维卷积核原生捕捉视频时空信息 [8][9] - **性能表现**:在多项基准测试中,Emu3性能与专用模型持平或超越:图像生成人类偏好评估得分70.0,超越Stable Diffusion XL的66.9;视觉语言理解12项测试平均分62.1,与LLaVA-1.6的61.8持平;视频生成VBench评估得分81.0,超过Open-Sora-1.2的79.8 [11] - **规模定律**:研究证实多模态学习遵循可预测的规模定律,当训练数据翻倍时,文字到图像、图像到文字、文字到视频等任务的验证损失均以0.55的指数下降,基于小模型数据可高精度预测大模型性能(拟合优度>0.99,误差<3%) [12] 行业比较与定位 - **与Meta Chameleon比较**:两者均尝试统一多模态学习,但Emu3通过优化视觉分词器和训练策略,弥合了统一模型与专用模型之间的性能差距 [17] - **与OpenAI Sora比较**:Sora基于扩散模型,擅长视频生成但本质是生成器,需额外嫁接模型以实现理解;Emu3的自回归范式则天然统一生成与理解于单一模型内 [17][18] - **与Google Gemini比较**:Gemini整合多模态但仍依赖预训练视觉编码器和复杂融合机制;Emu3采用从零训练策略,虽计算成本更高,但获得了更纯粹、一致的多模态表征 [18] - **开放性优势**:团队承诺开源视觉分词器、训练代码和预训练权重,与OpenAI的封闭策略形成对比,为全球AI社区提供了可复现、可改进的新技术路线 [18] 应用潜力与商业化 - **部署效率**:模型基于标准Transformer架构,可复用大语言模型成熟的推理基础设施(如vLLM、PagedAttention),团队已开发支持无分类器引导的推理后端,实现低延迟高吞吐 [19] - **应用统一性**:单一模型架构可支撑图像生成、视觉问答、视频理解等多种能力,降低多模型部署带来的运维复杂度和资源浪费 [19] - **交互变革**:模型同时具备生成与理解能力,能处理图文视频任意组合,支持如根据产品视频生成图文说明书、描述场景生成视频并实时问答等新型交互 [20] - **垂直领域**:在教育、电商、医疗等领域有应用潜力,例如作为统一助手生成教学内容、处理电商产品图片与问答、辅助医疗影像分析与报告 [20] 行业意义与影响 - **范式挑战**:Emu3的成功是对当前主流多模态技术路线的根本性挑战,证明了一条更简洁、统一的道路可行,可能引发AI领域的范式转移 [21] - **中国AI研究标杆**:此项原创性工作为中国AI研究树立了新标杆,展示了在顶级学术期刊提出并验证不同于海外巨头的技术路线的能力 [21] - **具身智能路径**:在CALVIN机器人操控基准测试中,Emu3在“连续完成五个任务”上达到87%成功率,展示了其作为通往具身智能捷径的潜力 [14][15] - **世界模型前景**:模型能够根据烹饪视频前两秒预测后续画面,展现了“世界模型”的潜力,为整合感知、语言和行动的通用人工智能提供了有希望的道路 [15][22]
AI,突传重磅!四大巨头,同时出手!
券商中国· 2026-01-29 21:02
OpenAI拟进行大规模融资 - 公司正寻求募集高达1000亿美元的新资金,若足额完成,其估值最高可达8300亿美元 [2][3] - 英伟达、微软、亚马逊正在就向OpenAI投资至多600亿美元展开初步磋商,这可能是人工智能领域迄今规模最大的融资轮之一 [1][2] - 其中,英伟达作为现有投资者,正洽谈投资高达300亿美元;微软作为长期支持者,正洽谈投资不超过100亿美元;亚马逊作为新投资者,正洽谈投资远超100亿美元,甚至可能超过200亿美元 [2] - 软银作为现有投资者,正洽谈向OpenAI追加至多300亿美元投资,以进一步扩大其持股规模 [1][3] - 融资旨在应对训练和运行大规模人工智能模型所需的庞大算力、专用硬件及长期基础设施投入带来的成本攀升,支撑公司在模型开发与部署方面的扩张 [3] - 公司选择与多个基础设施提供商合作,而非依赖单一平台,以应对不断增长的计算需求,这反映出运行先进人工智能系统的规模与高昂成本 [4] xAI融资进展与业务动态 - 特斯拉宣布将向埃隆·马斯克的人工智能公司xAI投资20亿美元 [1][5][6] - xAI于今年1月6日完成E轮融资,融资额达200亿美元,超过了此前设定的150亿美元目标,整体估值达到2300亿美元,较去年春季时的估值翻了一番 [1][6] - 参与xAI E轮融资的投资者包括Valor Equity Partners、Stepstone Group、富达管理及研究公司、卡塔尔投资局等,战略投资者英伟达和思科投资也参与其中,并将继续支持xAI扩展计算基础设施 [6] - 自成立以来,xAI推出了多个版本的Grok模型,去年11月正式发布新版本Grok 4.1,并计划在今年一季度发布Grok 5,该模型有10%的概率实现通用人工智能(AGI) [7] - 公司正在构建模型以支持其向游戏和机器人领域的扩张计划,显示出构建全方位AI生态系统的野心 [7] - 2024年4月,xAI以全股票交易方式收购社交媒体平台X,合并后xAI的估值为800亿美元,X的估值为330亿美元,结合了双方的数据、计算能力、员工和用户资源,两个平台的月活跃用户总数已超过6亿 [7] 行业背景与影响 - OpenAI的融资谈判发生在整个人工智能行业投资激增的背景下,各公司纷纷筹集巨额资金用于建设基础设施、延揽人才和推动产品开发 [6] - 参与投资OpenAI的公司在人工智能生态中各具独特角色:英伟达是关键的人工智能芯片供应商,微软与亚马逊则是主要的云服务提供商,它们作为投资方介入,可能会影响OpenAI在计算资源的采购与规模化部署策略 [3] - 如此规模的融资将凸显当前涌入人工智能领域的资本体量,并可能对人工智能开发者、云平台及硬件提供商之间的竞争格局产生深远影响 [3] - 对xAI的投资印证了将特斯拉从电动汽车制造商转型为人工智能公司的计划,而人工智能正是该公司市值达到约1.5万亿美元的关键所在 [6]
MiniMax 融资故事:4 年 7 轮,谁在推动中国 AI 第一场资本盛宴
晚点LatePost· 2026-01-09 12:54
文章核心观点 - 大模型领域的IPO并非行业竞争结束的标志,而是新一轮更激烈竞赛的开始,其实质意义在于为公司获取更多资源以支持持续高强度的研发投入[2][3] - 公司的发展路径体现了在商业化前景不确定、技术快速迭代的行业中,通过平衡技术探索、产品应用与财务策略,力求“留在浪潮里”的生存与发展哲学[32][34] 公司发展历程与融资轨迹 - 公司成立于2022年初ChatGPT热潮前夕,天使轮融资3100万美元,投后估值2亿美元,由高瓴领投,米哈游、IDG、云启跟投[6][7][16] - 上市前共完成7轮融资,累计融资额达15亿美元,投后估值从2亿美元增长至上市前的42.4亿美元[3][6] - 主要投资方包括:阿里(持股超13%,为最大外部股东)、高瓴(持股7.14%,为第二大外部股东及第一大财务投资人)、明势(投资轮次最多的机构之一)、红杉(持股3.81%,为第三大财务投资人)等[3][13][20][24][26] 创始团队背景与特质 - 创始人闫俊杰拥有深厚技术背景(中科院自动化所博士)与丰富的产业经验(曾任商汤副总裁,管理过千余人团队),被评价为兼具技术前瞻性、工程落地能力和商业思维的创业者[8][11][31] - 创始团队在创业初期即确立了“Intelligence with everyone”的愿景,并选择同时研发文本、语音、图像模型及多模态技术的技术路径[11] - 创始人经历过上一轮AI(计算机视觉)行业的起伏,其韧性被投资人视为比单纯的“Super smart”更珍贵的品质[14][15] 关键融资节点与投资方视角 - **高瓴资本**:作为最早的投资人,看重创始人将多种前沿技术系统性整合的视野以及从算法、工程到商业化的综合能力,投资决策迅速[8][11] - **米哈游**:基于打造虚拟世界的长期愿景与公司方向契合而投资,作为“创始人友好型”投资人,不过多干预运营,给予团队高度信任[14] - **明势资本**:在ChatGPT发布前成为公司第二轮融资的唯一新股东,认可创始人关于大模型“One Model for all”将改变AI商业化逻辑的判断,并欣赏其技术驱动的创业决心[17][18][20] - **阿里巴巴**:在2024年3月的Pre-B轮中投资4亿美元,该轮总融资额6.54亿美元,投后估值达25.5亿美元,阿里最初希望获得更高股比,最终成为公司最大外部股东[26] - **非传统VC投资人**:如中国人寿(看重团队可靠性与战略执行力)、柏睿资本(宁德时代背景,欣赏创始人在成本和算力受限条件下寻求发展的务实商业思维)等机构的加入,提供了多元的投资视角[27][29][30] 产品、技术与商业化策略 - 公司采取“模型+应用+平台”的均衡策略:星野/Talkie等陪伴型AI应用、海螺AI/语音生成内容工具、以及开放平台API业务各贡献约30%的收入,形成1:1:1的收入结构[32] - 技术研发上敢于集中资源押注前瞻方向,如2023年下半年全力投入MoE模型,2024年将80%研发资源投入线性注意力架构,最终推出M1模型[33] - 公司坚持探索面向普通消费者(to C)的AI应用路径,避免陷入上一代AI公司定制化to B项目的老路[19] - 在算力获取上展现出成本意识和运营能力,曾在大模型热潮前以半价租用到自动驾驶公司退租的GPU算力[19] 行业竞争格局演变 - ChatGPT的发布(2022年11月)是行业分水岭,之前公司是市场少数选择,之后进入“百模大战”,智谱、百川智能、零一万物、月之暗面等竞争对手快速涌现并获得融资[21][22] - 科技巨头态度影响格局:字节跳动曾考虑投资公司,但最终决定全部自研;阿里巴巴则采取“自研+投资”双线策略,广泛投资多家大模型公司[23][25] - 2024年后,随着字节、阿里等巨头全面投入,以及像DeepSeek这样不考虑商业化压力的开源模型出现,基础模型领域的融资频率降低,创业公司面临的竞争环境更加复杂[27] IPO表现与未来定位 - 公司于港股IPO,发行价165港元,上市首日午盘股价上涨超78%至294港元,市值达到898亿港元[5] - IPO被视为新一轮竞赛的“鼓点”,其核心目的是更高效地获取资源,以应对确定性的持续高研发投入和不确定性的商业化前景[2][3] - 公司的长期目标是持续参与并推动AI浪潮,在极大的不确定性中,用有限资源寻找成功概率,确保自身能“留在浪潮里”[32][34]
“全球大模型第一股”诞生!智谱如何走通中国AGI商用范式?
证券时报· 2026-01-08 12:42
文章核心观点 - 智谱华章作为中国最大的独立大模型厂商,成功在港交所上市,成为“全球大模型第一股”,这标志着中国人工智能产业从技术探索迈向规模化商业应用的重要里程碑,并为全球投资者提供了分享中国AI基础层技术红利的机会 [1][3] - 公司凭借其原创的GLM预训练架构、完整的全栈模型矩阵、清晰的AGI发展路径以及领先的商业化能力,被OpenAI列为全球主要竞争对手之一 [1][4][5][6][9] - 公司是中国收入规模最大的独立大模型厂商,已建立起可规模化的MaaS和中国特色企业服务双重商业模式,营收连续三年翻倍,毛利率保持在50%以上,展现出清晰的可持续商业化路径 [10][11][13][14] - 公司被视为全球AI竞赛中的“中国队长”,获得了包括产业资本、VC/PE及国资在内的广泛资本支持,并正通过推动主权AI基建出海,在全球人工智能竞争中为中国守住关键阵地 [15][16][18][19] 公司概况与上市里程碑 - 公司全称为北京智谱华章科技股份有限公司,是中国最大的独立大模型厂商,以AGI基座模型为核心业务 [1] - 于2025年1月8日在港交所主板挂牌上市,发行价为每股116.20港元,开盘价120港元/股,最高冲至130港元/股,涨幅超过10%,市值突破570亿港元 [1] 技术实力与行业地位 - 公司是中国最早研发大模型的企业,由清华大学技术成果转化而来,被业界称为中国大模型的“黄埔军校” [5] - 凭借原创的GLM预训练架构,构建了覆盖语言、代码、多模态及智能体的全栈模型矩阵,模型适配了40余款国产芯片 [5] - 自2019年成立便瞄向AGI,并于2024年发布了清晰的AGI五阶段路径图(L1-L5),目前已自研开发出前三个阶段的大模型及智能体 [5][6] - 产品矩阵完整,包括中国首个千亿规模大模型GLM-130B、首个开源大型聊天模型ChatGLM、首个具备反思和行动能力的AI Agent AutoGLM等 [6] - GLM系列模型每3-6个月完成一次基座迭代,其最新模型GLM-4.7在全球百万用户盲测的Code Arena上,位列全球开源第一、国内第一 [6] - 在权威评测榜单Artificial Analysis Intelligence Index中,GLM-4.7综合成绩登顶全球开源模型与国产模型双料榜首 [7] 商业化进展与财务表现 - 公司是中国收入体量最大的独立大模型厂商,早在2021年便开始布局MaaS,是唯一一家做到MaaS有规模收入的创业公司 [10][11] - 已建立起高度可防御的商业模式:既有可规模化的MaaS模式,也有独特高毛利、“模型驱动”的中国特色企业服务模式 [11] - MaaS平台客户主要覆盖科技互联网和企业服务市场,中国前十大互联网公司中有九家使用其GLM大模型 [12] - GLM-4.5/4.6/4.7模型在海外市场受到欢迎,北美、欧洲的科技大厂如Windsurf、Cerebras、Vercel等均官宣接入 [12] - 在全球大模型超市OpenRouter上,GLM-4.5/4.6的调用量稳居全球前10,付费API收入超过其他所有国产模型之和 [13] - 截至目前,GLM大模型已赋能全球12000家企业客户、逾8000万台终端用户设备及超4500万名开发者,是中国赋能终端设备最多的独立通用大模型厂商 [13] - 模型日均token消耗量呈现跨数量级跃升:2022年约5亿,2023年约21亿,2024年12月约0.2万亿,2025年6月约4.6万亿 [13] - 营收连续三年翻倍:2022年收入5740万元,2023年1.245亿元,2024年3.124亿元,年复合增长率达130%;2025年上半年收入1.9亿元,同比增长325% [13] - 毛利率持续保持在50%以上:2022年54.6%,2023年64.6%,2024年56.3%,2025年上半年为50% [14] 资本背景与战略意义 - 在IPO前已完成8轮融资,累计融资规模超83亿元人民币,投资方涵盖美团、蚂蚁、阿里、腾讯、小米等产业资本,以及君联资本、启明创投、红杉中国、高瓴等知名机构,还有各地方政府国资 [16] - 在港交所18C章程下,领航资深独立投资者为君联资本和美团,其他资深独立投资者为启明创投 [17] - “国资引领、产业护航”的资本结构为公司应对国际竞争和技术长跑提供了坚实后盾 [18] - 公司正积极推动中国原创大模型及解决方案出海,例如主导发起“自主大模型国际共建联盟”,帮助共建“一带一路”国家构建可控的国家级AI基础设施,实现我国大模型技术出海的“零的突破” [19] - 上市募资将主要用于通用AI大模型研发、MaaS平台优化、战略投资及营运资金需求,推进“自主大模型国际共建联盟”,输出主权AI基建,并向“模型、应用、算力”一体化生态转型 [19]
人均29岁的AI公司要IPO了,用户超2亿,米哈游阿里腾讯小红书持股
36氪· 2025-12-22 07:49
公司概况与上市进程 - 中国AI大模型龙头企业MiniMax(稀宇科技)于12月21日发布聆讯后资料集,正式冲刺港股“大模型第一股”,有望成为从成立到IPO历时最短的AI公司 [1] - 公司成立于2022年初,是一家全球化的通用人工智能(AGI)公司,专注于全模态模型研发,也是当前国际化收入最高的中国大模型公司 [3] - 公司拥有豪华股东阵容,获得米哈游、阿里、腾讯、小红书、高瓴、IDG、红杉、经纬、明势、云启等多家顶尖机构的投资和支持,是目前成长最快、估值最高的AI科技公司 [3] 财务表现与运营效率 - 收入快速增长:2023年、2024年、2025年1-9月,收入分别为346万美元、3052万美元、5344万美元 [10]。2025年前9个月营收同比增长超过170% [3] - 亏损收窄与高效资本利用:2023年、2024年、2025年1-9月,经调整净亏损分别为8907万美元、2.44亿美元、1.86亿美元 [13]。2025年前9个月亏损与去年同期相比近乎持平,在高速增长下实现有效收窄 [16]。公司自成立以来累计消耗约5亿美元(约合人民币35亿元),仅相当于OpenAI开销的不到1% [3][16] - 费用控制有效:2025年前9个月,在收入同比增长超170%的同时,研发开支同比增幅为30%,销售及营销开支同比下降26% [16] - 现金储备充足:截至2025年9月30日,现金储备超过11亿美元,可支持超50个月运营 [17] 业务模式与产品矩阵 - 公司基于自研大模型打造了覆盖C端与B端的AI原生产品矩阵,包括海螺AI、Talkie、星野、MiniMax等,并为企业和开发者提供开放平台服务 [3][8] - 产品采用多元化的盈利模式,包括免费增值、订阅、基于token的API计费和应用内购买、在线营销服务等 [9] - AI原生产品在2024年及2025年1-9月为公司贡献了超过71%的收入 [20]。2025年1-9月,来自海外市场的收入贡献占比超过70% [3][22] - 用户增长迅猛:截至2025年9月30日,公司已有超过200个国家及地区的逾2.12亿名个人用户,以及超过100个国家的13万家企业客户 [3]。AI原生产品的平均MAU从2023年的314万增长至2025年1-9月的2764万 [19] 技术实力与研发成果 - 公司是全球唯四全模态进入第一梯队的大模型公司,拥有以MiniMax M2、Hailuo-02和Speech-02为核心的自研全模态大模型组合 [32][33] - 语音生成模型Speech 02综合性能达全球第一,累计已生成超过2.2亿小时的语音 [33] - 视频生成模型Hailuo-02在Artificial Analysis视频评测中位列全球第二,累计生成视频超5.9亿个 [35] - 文本大模型MiniMax M2在Artificial Analysis评测中位列全球前五、开源第一,是中国开源大模型首次在该榜单跻身全球前五 [39] - 公司早期采用混合专家(MoE)架构及混合注意力机制,在保持领先性能的同时降低计算消耗 [43]。训练相关的云计算服务开支占收入比已从2023年的超过1300%优化至2025年1-9月的266.5% [43] 团队与组织架构 - 公司团队年轻高效,截至2025年9月底共有385名员工,平均年龄29岁,研发人员占比近74%,海外归国人才占比超30% [25] - 核心研发团队来自微软、谷歌、Meta、阿里巴巴、字节跳动、DeepSeek等全球AI领先企业 [26] - 创始人兼CEO闫俊杰博士拥有逾十年研发经验,在顶级会议及期刊上发表约200篇学术文章,引用次数超过30000次 [26] - 公司董事会平均年龄仅32岁,以扁平化管理架构实现高效运营 [27] 行业地位与市场前景 - 根据灼识咨询,按2024年基于模型的收入计,MiniMax是全球第四大pureplay大模型技术公司 [32] - 全球大模型市场规模预计2030年将超过3000亿美元,IDC预计到2030年人工智能将累计为全球经济贡献19.9万亿美元 [44] - 公司被视为全球AGI赛道的稀缺标的,有望成为具有全球竞争力的AI领军企业 [4]
“AI六小虎”稀宇科技通过港交所上市聆讯,有望成从成立到IPO历时最短的AI公司
新浪财经· 2025-12-21 21:50
公司上市进程 - 稀宇科技(MiniMax)已在港交所上载聆讯后资料集,拟根据《上市规则》第18C章在香港主板上市 [1] - 公司有望成为从成立到IPO历时最短的AI公司 [1] 公司基本情况 - 稀宇科技是一家通用人工智能(AGI)科技公司,于2022年初成立,致力于推动人工智能科技前沿发展 [1] - 公司的投资者包括阿里巴巴及腾讯 [1] 产品与技术组合 - 公司的大模型组合包括大语言模型、视频生成模型以及语音和音乐生成模型 [1] - MiniMax M系列是其大语言模型旗舰产品线,由MiniMax M1和MiniMax M2组成 [1] - MiniMax M1于今年6月推出,是一款开源的大规模混合注意力推理模型 [1] - Hailuo-02系列模型能够从多种形式信息输入中生成高质量视频内容 [1] - Speech-02模型旨在从文本输入中生成自然、高质量的语音 [1] - MiniMax是公司的智能agent应用,可通过自然语言指令自主执行类型广泛的任务 [1] 收入来源 - 公司收入主要有两大来源:AI原生产品及开放平台及其他基于AI的企业服务 [1]
最快上市AI公司诞生?MiniMax通过港交所聆讯,成立不足四年
财经网· 2025-12-21 20:46
公司概况与市场地位 - 公司是全球领先的通用人工智能公司 致力于研发具备国际竞争力的通用模型 基于自研大模型打造了覆盖C端与B端的AI原生产品矩阵 包括海螺AI Talkie和星野等 并提供开放平台服务 [1] - 公司成立于2022年初 此次赴港IPO有望刷新记录 成为从成立到IPO历时最短的AI公司 [1] - 公司获得米哈游 阿里 腾讯 小红书 高瓴 IDG 红杉 经纬 明势 云启等多家顶尖机构的投资和支持 是目前成长最快 估值最高的AI科技公司之一 [4] 财务与运营表现 - 2025年前九个月营收同比增长超过170% 海外市场收入贡献占比超70% [1] - 2025年前九个月 在收入同比增长超170%的同时 研发开支同比增幅为30% 销售及营销开支同比下降26% [3] - 经调整净亏损在2025年与上年同期相比近乎持平 实现了在高速增长下的亏损有效收窄 [3] - 自成立到2025年9月累计花费5亿美金 约35亿人民币 [3] - 截至2025年9月底 公司员工385人 平均年龄29岁 研发人员占比近74% 董事会平均年龄32岁 [3] 用户与客户规模 - 截至2025年9月30日 公司已有超过200个国家及地区的逾2.12亿名个人用户 以及超过100个国家的13万企业客户 [1] 技术实力与产品进展 - 公司专注全模态模型自研 是“全球唯四全模态进入第一梯队”的大模型公司 [1] - 语音领域 2023年推出国内首个基于Transformer架构的语音大模型Speech 01 2024年将综合性能提升至全球第一的Speech 02 累计已生成超过2.2亿小时的语音 [2] - 视频生成方面 2024年8月发布的Video-01模型及海螺AI产品达到当时业界顶尖水平 2025年6月推出的升级版Hailuo-02 在权威的Artificial Analysis视频评测中位列全球第二 累计生成视频超5.9亿个 [2] - 文本模型上 2025年10月 公司发布并开源新一代文本大模型MiniMax M2 在Artificial Analysis位列全球前五 开源第一 也是中国开源大模型首次在该榜单中跻身全球前五 M2在全球模型聚合平台OpenRouter上迅速爬升到国内模型token用量第一 编程场景排名全球token用量第三 [2] 行业背景与上市意义 - 随着全球AGI赛道从“百模大战”进入整合期 具备全模态技术能力 已验证全球化商业化路径且组织高效的公司 其上市进程备受市场瞩目 [4] - 此次赴港IPO 公司不仅即将成为全球AGI赛道中的稀缺标的 也有望成为具有全球竞争力的AI领军企业 [4]
IBM CEO:以现有成本建设AI数据中心“几乎不可能回本”
搜狐财经· 2025-12-02 19:24
数据中心建设成本与经济效益 - 行业投入的巨额资本支出在当前数据中心建设与运营成本下几乎不可能获得足够回报 [1] - 当前基础设施成本结构难以支撑AI企业为追求通用人工智能而不断扩大计算能力的规模化投资的经济可行性 [1] - 基于当前成本估算,一个1吉瓦数据中心需要约800亿美元投入 [3] - 单家公司计划建设20至30吉瓦数据中心,其资本支出规模将达到约1.5万亿美元(约合10.62万亿元人民币) [3] - 全球范围内与AGI相关的建设承诺总量可能接近100吉瓦,对应投入约8万亿美元(约合56.63万亿元人民币) [3] - 仅利息成本就意味着需要约8000亿美元利润才能覆盖 [3] - 目前的数据中心芯片通常需在五年期限内完成折旧,此后可能被替换,这使长期回报更加难以实现 [3] 对通用人工智能发展的评估 - 不认为现有技术路径可以在没有进一步突破的情况下实现通用人工智能,并将概率评估为0%至1% [4] - 多位科技领域人士也对通用人工智能的加速发展持保留意见 [4] - 大模型时代的"扩规模效应"已趋于极限,未来将重新进入以研究驱动的阶段 [4] - 未来可能需要将硬知识体系与大模型结合,才能推动通用人工智能发展的下一步,但对其成功可能性仍保持慎重态度 [4] 当前AI技术的价值与前景 - 肯定当前AI工具对企业生产力的价值,并认为这些技术将在企业领域释放"数万亿美元级"的效率收益 [4]
Ilya Sutskever 重磅3万字访谈:AI告别规模化时代,回归“研究时代”的本质
创业邦· 2025-11-27 11:51
AI行业发展阶段 - 行业将AI发展划分为两个阶段:2012-2020年为"研究时代",2020-2025年为"规模化时代",当前正重新回归拥有超级算力的"研究时代"[4][37][38][39][40] - 规模化时代由GPT-3的出现主导,行业形成通过堆叠更多数据和算力即可使智能涌现的线性思维共识[7][38] - 预训练数据的红利终将耗尽,数据是有限的,单纯将规模扩大100倍后,量变可能不再带来质变,行业突破将依赖于寻找比单纯预训练更高效的新学习"配方"[7][39][40] 当前AI模型的局限性 - 当前模型类似于练习了一万小时竞赛题的学生,虽能解题但缺乏真正的专家直觉与"特质因素",泛化能力远不如人类[4][10][25] - 模型在基准测试中表现出色,但在解决现实世界复杂问题时(如修复代码错误)可能陷入"修复一个错误、引入另一个错误"的死循环,显示出评估性能与实际经济影响的脱节[10][19][20][22] - 当前强化学习训练使模型过于迎合评估标准,却未赋予其真正的推理和自我修正能力,其学习覆盖呈S形曲线,与预训练的幂律关系不同[10][21][50] 未来AI发展方向 - 未来AI应借鉴人类进化赋予的高效"先验知识"和"价值函数",人类情绪系统本质上是一个高效的价值函数,是智能高效运作的基石而非理性对立面[13][33][34][35] - 构建类似人类的内部价值函数机制是关键,使AI能在行动前预判路径优劣,实现更高效的学习,而非仅预测下一个token[13][14][34] - 未来AI应具备持续学习能力,而非静态成品,人类通过持续学习适应新工作,而非依赖预训练式的通用人工智能[44][45][61][62] SSI的战略与超级智能路径 - SSI筹集了30亿美元,但拒绝参与商业"老鼠赛跑",不发布任何中间产品,将所有算力集中于直接构建安全的超级智能这一单一目标[4][14][15][54][56][57] - 公司认为市场竞争迫使企业在研究资源和工程落地间妥协,其战略是隔绝商业干扰,专注于研究,待准备就绪后再出现[4][14][15][57] - 公司计划构建的超级智能需具备"关怀有感知生命"的底层属性,这种基于同理心的对齐可能比僵硬的规则更具鲁棒性,因AI本身最终也将成为有感知的存在[4][15][70][71] AI的经济影响与未来生态 - 一旦AI突破持续学习瓶颈,经济将迎来爆发式增长,广泛部署将产生强大经济驱动力,AI将渗透到整个经济体系[18][64][66] - 未来AI市场不会被单一巨头垄断,竞争将导致高度专业化的生态,出现无数占据不同生态位的AI公司,如同生物进化[4][16][64] - 人类角色可能通过"神经连接"与AI实现部分融合,以在超级智能时代保持平衡,实现理解的整体性传输[16][75] 研究哲学与算力需求 - 伟大的研究源于对大脑机制的正确直觉,追求简洁、优雅与美感,丑陋在研究中没有立足之地[4][16] - 研究时代仍需一定量计算资源,但远非绝对必要使用史上最大算力,AlexNet使用2块GPU,Transformer论文实验未超过64块GPU,相当于今天约2块GPU[52][53] - SSI用于研究的计算量相对充足,因公司资金专注于研究而非推理或产品工程,且若进行不同范式的研究,未必需要绝对最大规模来证明其可行性[54][55]
AI 顶尖科学家、前 OpenAI 联创 Ilya Sutskever 的 18 个最新思考
Founder Park· 2025-11-26 21:06
AI行业发展阶段与范式转变 - Scaling(扩展)时代已结束,单纯将规模扩大100倍不会带来模型能力的质变[4][8] - 行业从2020年至2025年是扩展时代,而2012年至2020年是研究时代[9] - 行业正重新进入研究时代,特征是尝试多种方法并观察有趣现象的发生[11] - 当前真正瓶颈是模型泛化能力远不如人类,而非算力[4][13] 技术研发方向与核心挑战 - 预训练数据终将耗尽,行业正在探索魔改版预训练用于强化学习等其他方法[7] - 模型能力呈"锯齿状",评测表现与真实世界表现存在巨大断层[27][30] - 泛化能力包含两个子问题:样本效率低以及难以教会模型所需技能[25] - 人类样本效率极高,可能源于进化赋予的核心先验知识或更好的机器学习算法[26] 价值函数与情感的作用 - "情感"作为一种价值函数未来一定会被广泛使用,简单但能在广泛情境下发挥作用[4][18] - 价值函数能让强化学习更高效,无需等待任务完成即可提供实时反馈[16][17] - 人类情感对于生存和有效行动至关重要,类比为大模型中的价值函数[15] - 价值函数的使用界限开始模糊,可能是新配方的关键组成部分[10] AI公司竞争格局与商业模式 - 沿用"盲目扩大规模"路线的公司可能获得惊人收入但不一定有利润[4] - 未来竞争将导致价格下降,公司需在同质化竞争中寻找差异化[34] - 可能出现专业化竞争格局,不同AI公司专注不同复杂领域[34] - 大规模部署AI可能带来经济飞速增长,但增长速度难以预料[35] 超级智能发展与对齐目标 - 未来5-20年可能出现具备人类级别学习能力并能走向超智能的系统[44] - 最终对齐目标是让超级智能真正关心和感知所有生命[4][43] - 构建关爱感知生命的AI比只关爱人类的AI更容易,因为未来大多数感知体将是AI自身[43] - 渐进式部署AI比纯粹思考更重要,让世界感受AI能力是关键[4][39] 研究方法与公司战略 - 好的研究品味需要美感、简洁、优雅以及从大脑汲取的正确灵感[37][38] - SSI公司专注于研究,技术路线与众不同且全力以赴[57][58] - 公司认为分阶段发布模型至关重要,部署过程本身就是试错和学习时期[53][56] - 持续学习非常重要,AI应像绝顶聪明的15岁少年那样充满干劲地学习[56]