BERT - 财报，业绩电话会，研报，新闻

BERT

搜索文档

前阿里、字节大模型带头人杨红霞创业：大模型预训练，不是少数顶尖玩家的算力竞赛｜智能涌现独家

搜狐财经· 2025-10-30 16:35

采访｜周鑫雨邓咏仪文｜周鑫雨编辑｜苏建勋在阿里、字节接连做了近7年大模型的杨红霞，身上有一种鲜明的挑战精神。在阿里早期，她从内部的业务阿里搜索推荐系统，投身于初期并不被看好的大模型研究之路。后来，她带领林俊旸（现通义千问负责人）、周畅（前通义千问大模型负责人）等这一轮中国大模型的核心人才，在达摩院磕出了通义千问的前身，M6 大模型。 2024年7月，杨红霞从字节离职创业后，被曝出仍要做模型相关技术的消息。 "阿里、字节大模型核心人物"的光环，没有盖住彼时市场上悲观的声音：入局太晚，创业公司怎么和大厂争？时隔一年零三个月，杨红霞带着她的新 AI 公司 InfiX.ai，杀回了大模型赛道。 10月初，《智能涌现》与身在香港的杨红霞，在线上交流了她的创业近况。然而，杨红霞对我们强调："模型知识的注入只发生在预训练阶段，后训练提供的是规则。"就好比，预训练一段是 8 年制的医学博士生涯，后训练则是临床实习的过程。这就导致，基于企业数据后训练的模型，在实际业务中仍然会出现不少"幻觉"。 "中心化"模型的研发经历，让杨红霞形成了创业的两个原始判断：但仅从技术中，就能窥见 InfiX.ai 的宏大版图 ...

Embedding黑箱成为历史！这个新框架让模型“先解释，再学Embedding”

量子位· 2025-10-21 17:05

UIUC团队投稿量子位 | 公众号 QbitAI 让模型先解释，再学Embedding！来自UIUC、ANU、港科大、UW、TAMU等多所高校的研究人员，最新推出可解释的生成式Embedding框架——GRACE 。过去几年，文本表征（Text Embedding）模型经历了从BERT到E5、GTE、LLM2Vec，Qwen-Embedding等不断演进的浪潮。这些模型将文本映射为向量空间，用于语义检索、聚类、问答匹配等任务。简单来说， GRACE不再是"把文本压成向量"，而是"让模型先解释，再学Embedding" —— 模型首先生成每个文本的"推理说明（rationale）"，然后再将这些rationale编码成Embedding。奖励信号会鼓励模型产生更有逻辑、更语义一致的推理。方法总览：生成、表征、优化三位一体概括而言，GRACE包含三个关键模块：然而，大多数方法有一个共同缺陷：它们把大语言模型当成"哑巴编码器"使用—— 输入文本，输出向量，却无法告诉我们为什么这两个文本相似。这种 "对比学习+池化" 的做法虽然有效，但本质上抛弃了大语言模型（LLM）的推理与生成能 ...

张小珺对话OpenAI姚顺雨：生成新世界的系统

Founder Park· 2025-09-15 13:59

文章核心观点 - 语言是人类实现泛化的核心工具，是构建通用人工智能系统的最本质要素 [4][7][77] - AI Agent发展已进入下半场，重点从模型训练转向任务定义和环境设计 [5][62][63] - 创业公司最大机会在于设计新型人机交互界面，而非重复ChatGPT模式 [110][112][113] - 未来AI生态将呈现既单极又多元格局，由不同超级应用共同定义智能边界 [5][146][154] 姚顺雨背景与研究历程 - 清华姚班本科、普林斯顿博士，2019-2024年在普林斯顿攻读博士学位 [13] - 2016年接触多模态嵌入技术后转向深度学习，2018年系统性开始深度学习研究 [14][15] - 博士期间从计算机视觉转向语言模型研究，因认为语言是实现AGI的更核心方向 [15] - 专注Language Agent研究6年，2024年加入OpenAI [4][19] AI Agent技术演进 - 技术发展三阶段：符号主义AI（规则系统）→深度强化学习（环境特定）→大语言模型（泛化推理）[40][41][43] - 语言智能体与传统Agent本质区别在于具备推理能力从而实现泛化 [36][38][39] - ReAct框架成为最通用方案，实现推理与行动的协同 [26][50] - 代码环境是数字智能体最重要的"手"，提供天然机器表达形式 [53][54][55] 任务与环境设计 - 当前瓶颈从方法创新转向任务定义和环境设计 [62][63] - 优秀任务需具备：结果导向奖励机制、基于规则的白盒评估、可解释性 [64][66][71] - 任务分类标准：可靠性需求型（如客服）vs创造力需求型（如证明猜想）[70][72] - 评估指标需区分Pass@k（多次尝试成功率）和Pass^k（每次成功率）[74] 产业发展与创业机会 - 模型能力溢出为创业公司创造机会，关键在于设计新型交互界面 [110][112] - 成功案例包括Cursor（编程副驾驶）、Manus（通用交互）、Perplexity（研究型搜索）[117][127][129] - 数据飞轮形成需三个条件：自主训练能力、清晰奖励信号、数据好坏分离 [123][124] - 成本不是核心瓶颈，真正关键在于找到价值超过成本的应用场景 [139][141] 未来生态展望 - OpenAI五级能力划分：聊天机器人→推理者→智能体→创新者→组织者 [44][45] - 未来12-24个月趋势：Chatbot系统自然演进为Agent系统，新型Copilot应用涌现 [165][166] - 记忆系统（Memory）将成为核心竞争壁垒，特别是上下文管理能力 [51][158][159] - 最终生态将由多个超级应用共同定义，呈现中心化与分布式并存格局 [146][152][154]

LeCun团队揭示LLM语义压缩本质：极致统计压缩牺牲细节

量子位· 2025-07-04 09:42

语义压缩研究 - 人类具备将不同事物归类到高级概念（如"水果"）的语义压缩能力，即使面对新词汇也能通过语义线索快速分类 [1][2][3] - 图灵奖得主LeCun团队提出信息论框架，对比人类与LLM在语义压缩中的策略差异：LLM偏向统计压缩，人类更注重细节与语境 [4][5][17] 研究框架设计 - 构建包含1049个项目、34个语义类别的人类概念分类基准，整合认知科学经典研究数据，包含典型性评分以反映人类概念结构 [5][6][7] - 选取30+种LLM（参数规模3亿至720亿），包括BERT、LlamA、Gemma等，从嵌入层提取静态词元表示以确保与人类分类实验基准一致 [8] - 引入信息论框架，结合速率失真理论和信息瓶颈原理分析压缩效率与语义保真度的权衡 [9][12] 核心研究发现 - LLM概念分类与人类语义分类的对齐度显著高于随机水平，验证其基本语义组织能力 [10][11] - LLM难以处理细粒度语义差异，其内部概念结构与人类直觉不符，典型性判断与余弦相似度的相关系数较弱且大多不显著 [14][16] - 关键差异：LLM追求最小化冗余信息的统计压缩，人类则保持适应性与上下文完整性 [17] 研究团队背景 - 由斯坦福大学与纽约大学联合开展，第一作者为斯坦福博士后Chen Shani，Yann LeCun作为合著者参与 [19][20][22] - LeCun是Meta首席AI科学家、CNN架构先驱，与Hinton、Bengio共获2018图灵奖，推动深度学习工业应用与自监督学习发展 [24][25][26][27][28] 补充信息 - 论文发布于arXiv（编号2505.17117），研究引发AI社区广泛讨论 [29]