大模型(LLM)
搜索文档
LeCun离职后不止创一份业,押注与大模型不同的路线,加入硅谷初创董事会
36氪· 2026-01-30 16:11
公司动态:Yann LeCun的职业布局 - 人工智能领域知名专家Yann LeCun在离开Meta后,采取了多元化的职业发展策略,不仅创立了自己的初创公司AMI,还加入了另一家初创公司Logical Intelligence [1][2] - LeCun正式加入Logical Intelligence,担任技术研究委员会的创始主席,这标志着其技术理念与该公司的发展路线高度契合 [3][24] 公司介绍:Logical Intelligence - Logical Intelligence是一家于今年1月对外亮相的AI初创公司,专注于研发一种名为能量-推理模型的新型人工智能技术 [12][13] - 公司的创始人是Eve Bodnia,其表示Yann LeCun是能量-推理模型及相关架构领域的唯一专家,是公司启动该项目时唯一可咨询的人选 [24] 核心技术:能量-推理模型 - 公司主推能量-推理模型,该模型通过根据约束条件进行评分来验证和优化解决方案,其目标是找到符合逻辑约束、能量最低的稳定状态 [13][15][16][17] - 该技术路线与当前主流的大模型截然不同,其体系假定问题本身由严格约束构成,推理过程服务于满足约束这一目标 [3][18] - 公司已推出首款工作型能量-推理模型Kona,其参数量低于2亿 [25] 技术论点与优势 - 公司提出三大核心技术论点:大模型作为推理模型存在根本性受限;能量-推理模型克服了基于大模型的推理模型固有的主要难题;扩展AI推理需要结合能量-推理模型与大模型进行协调 [19][20][21] - 能量-推理模型在训练数据方面具有独特优势,其训练数据可以是任何东西,公司旨在为每个独立业务创建较小的专用模型,而非通用大脑,且模型能够从稀疏数据中提取完整信息 [34] 产品性能:Kona模型 - 在数独游戏的性能测试中,Kona模型在单个Nvidia H100 GPU上运行,解决数独问题的速度远快于当前顶尖的大模型 [27] - 具体表现为:Kona完成数独填写用时不到1秒,而GPT 5.2、Claude Opus 4.5、Claude Sonnet 4.5等模型运行超过100秒仍未得出正确结果 [4] - 在准确率上,Kona也遥遥领先,其他如Gemini 3 Pro、Claude Opus 4.5等模型在超过100秒后给出的结果仍是错误的 [28][32] - 选择数独进行测试是为了突出能量模型在强约束、零容错的逻辑问题上的搜索效率优势 [33] 市场定位与发展愿景 - 公司的目标不仅是解决数独类游戏,而是瞄准现实世界中最为棘手的强约束问题,例如优化复杂的能源网络分配或实现精密制造过程的自动化 [33] - 公司CEO Eve Bodnia强调,这些目标任务与语言无关,且对AI幻觉的容忍度非常低 [33] - 公司认为当前行业处于“大模型泡沫”中,而通往通用人工智能的道路需要不同类型的人工智能各司其职 [25][26] - 目前Kona模型为闭源,但公司最终会考虑将部分内容开源,并强调在公开发布前需要充分理解其安全性、可能性与界限 [35][36]
全球生成式 AI 消费支出将大幅增长, 2030 年逼近 7000 亿美元,但能否满足投资者预期仍存疑
Counterpoint Research· 2025-12-25 14:14
全球AI消费支出预测 - 全球生成式AI消费支出预计将从2023年的2250亿美元增长至2030年的6990亿美元,复合年增长率达21% [7] - 消费者在生成式AI领域的支出正加速重塑全球科技产业格局,涵盖AI软件和硬件设备 [5] AI硬件市场 - AI硬件将占据整体消费支出的最大比重,增长核心动力在于AI功能在个人终端设备中的集成 [5] - 2023至2030年间,全球生成式AI智能手机出货量将以26%的复合年增长率增长,相应收入的复合年增长率为16% [5] - 高端智能手机在2030年前仍是营收主要支撑,但出货量增长正逐步由中端机型驱动,显示AI能力加速普及 [6] - 笔记本电脑、XR设备及AI原生终端等新兴形态目前规模有限,但已成为下一阶段增长的重要方向,将推动AI硬件生态从以智能手机为核心向多元化形态演进 [6] AI软件市场 - 面向消费者的AI软件市场增长潜力更为突出,其快速扩张主要受益于用户规模的显著提升 [5] - AI对话平台是增长最快的板块,个人助理型AI和内容生成工具同样有望实现显著扩张 [7] - AI对话平台的月活跃用户数预计在预测期内累计增加近50亿,到2030年预计将突破50亿 [5][7] - 除AI对话平台外,AI艺术生成工具、AI陪伴型应用以及照片编辑软件等AI应用市场同样具备强劲增长动能 [6] 市场竞争格局 - 尽管OpenAI预计仍将保持用户规模领先地位,但在预测期内,Google和Microsoft的月活跃用户增长速度预计将最为显著 [6] - 大模型供应商之间的竞争持续升温,预测期内市场格局和份额或将出现明显变化 [7] - 未来五年内AI软件市场将实现大幅扩张,但短期内行业中不可避免地将会出现赢家与输家之分 [6] 行业发展趋势 - 生成式AI正迅速从“高端差异化功能”演变为“面向大众市场的标配” [6] - 未来几年AI硬件支出仍将保持强劲,但真正决定新一代AI生态系统成败的关键在于软件支出的增长 [6]
耗时15年、扫描1400个大脑,她发现了藏在人脑中的“生物版ChatGPT”
36氪· 2025-12-08 11:04
研究核心发现 - 麻省理工学院神经科学家Ev Fedorenko通过扫描约1400人的大脑,识别出一个普遍存在的、专门处理语言的“语言网络”,其功能类似于一个“生物版ChatGPT” [1][3][10] - 该语言网络不负责思考或情绪,其核心功能是映射词语与意义,并将词语组合成句子,揭示了语言与思维是可分离的独立过程 [1][2][6] - 语言网络在物理上是一个“自然类别”,存在于每一个典型的成年人大脑中,其相关组织聚在一起约有一颗草莓大小 [6][11][16] 语言网络的功能与特性 - 语言网络是一个专门化的功能单元,负责计算语言结构,存储词义映射和组句规则,是连接外部输入(如听觉、视觉信息)与大脑内部意义表征(如情景记忆、社会认知)的“翻译器” [6][16][21] - 其主要功能分为两方面:一是将内部模糊念头转换为词序以进行表达,二是将感知系统处理后的词序解析并指向存储的意义以完成理解 [18][19][20][21] - 该网络对有意义句子和无意义句子(如“无色的绿色想法愤怒地沉睡”)的反应强度几乎一样,表明它是一个专注于语言形式的浅层系统,与高级思维和现实知识无直接联系 [27][28][29] 语言网络的解剖定位与证据 - 语言网络主要位于左脑,大多数人的额叶皮层有三个特定区域,另有一些区域沿中颞回侧面分布,这些区域在语言处理时总是一起活动 [16] - 该网络与布罗卡区等传统语言相关脑区不同,布罗卡区更侧重于发音动作规划,位于语言网络的下游 [17] - Fedorenko团队通过过去15年的研究,利用fMRI扫描等技术,建立了该网络出现位置的“概率地图”,尽管个体间略有差异,但整体模式非常一致 [5][10][16] 与大型语言模型(LLM)的类比与区别 - 人类的语言网络在许多方面类似于早期的大型语言模型,专注于学习语言规律和词与词之间的关系,可被视作一个“不具备心智的语言处理器” [3][30][31] - 与LLM的关键区别在于,人类的语言网络不会随意生成听起来合理但无内容的句子,它需要连接大脑中外部输入和内部丰富的意义表征 [6] - 研究表明,一个人可以说话流畅但内容空洞,这可能是只动用了语言网络功能而未启用思考部分的结果,这进一步支持了语言与思维的分离 [32][33]