Workflow
图像生成模型
icon
搜索文档
3名华人联合创始人接连出走,马斯克的xAI发生了什么
观察者网· 2026-02-14 17:49
核心观点 - xAI近期发生大规模核心人员离职潮,创始“梦之队”12人中已有6人离职或淡出,其中近一个月内就有3名华人联合创始人离开,对公司的技术实力和学术声誉造成打击 [1][4] - 离职潮发生在SpaceX收购xAI并筹备IPO的关键时期,尽管公司估值随之达到2500亿美元,但高压工作文化与公司愿景的潜在转变被认为是核心人才流失的主要原因 [7][8] - 公司创始人马斯克将人员变动解释为提升执行速度的“重组”,并公布了新的四方向团队架构,同时描绘了与SpaceX合并后的宏大月球项目愿景,试图稳定局面并构建新叙事 [3][11][13] 人事变动与团队影响 - 2025年2月10日至11日,xAI两名华人创始人吴宇怀和吉米·巴在48小时内先后宣布离职,使得一个月内离职的华人联合创始人达到3名 [1][4] - 公司成立于2023年7月,最初的12人创始团队在短短30个月内已有6人离职或淡出,人员流失速度远超正常范畴 [4] - 离职的核心技术人员包括:Grok核心架构师杨格(2025年1月因病转为顾问)、推理团队负责人吴宇怀、研究及安全负责人吉米·巴、谷歌Inception网络提出者克里斯蒂安·塞格迪(2025年2月)、Grok首席工程师伊戈尔·巴布什金(2025年8月)以及更早加盟OpenAI的基础设施负责人凯尔·科西奇(2024年中)[4][6] - 2026年2月初以来,另有产品基础设施负责人、多模态项目负责人等多位工程师离职 [6] - 吴宇怀和吉米·巴师承人工智能先驱杰弗里·辛顿,他们的离开对xAI的学术界声誉造成了实质性打击 [6] 离职原因分析 - 直接原因与公司高压工作文化导致的身体透支有关,被形容为“卷不动了”[7] - 前员工杨格透露,长期高强度工作导致免疫力下降,使其原有病情反复;另一离职员工卡泽米称工作时间长得“令人疯狂”,几乎占据所有时间包括假期和周末 [7] - 更深层原因可能与公司愿景的转变有关,马斯克虽以“了解宇宙本质”为愿景聚集了技术向善的专家,但SpaceX收购xAI后,工作重心被部分员工认为会转向资本运作,违背初心 [8][9] - 离职员工的公开感言被外界解读为对马斯克日益臃肿商业帝国的委婉告别,吴宇怀提到“小团队也能移山填海”,吉米·巴则称“AI的自我迭代循环很可能在一年内实现”[9] 公司回应与战略调整 - 马斯克将人员变动解释为公司为“提升执行速度”而进行的“重组”,并称“很遗憾,需要与一些人分道扬镳”,暗示离开者无法适应公司扩张后的新要求 [3][13] - 马斯克通过全员大会视频回应,宣布将xAI重组为四个方向的团队:Grok聊天机器人、编程AI模型、图像生成模型以及针对微软的“巨硬”智能体项目 [11] - 马斯克强调快速增长的公司组织结构需不断进化,同时宣布xAI正在积极对外招聘 [13] - 马斯克畅谈了SpaceX与xAI合并后的未来,提出在月球建造人工智能卫星工厂及巨大电磁弹射系统以向宇宙深处发射卫星的设想,但未提供详细实现方案或时间表 [13] 商业与资本背景 - 离职潮发生时,SpaceX刚刚完成对xAI的收购并正在筹备IPO [7] - 该收购带动SpaceX估值突破1万亿美元,xAI的估值也随之达到2500亿美元 [7] - 对于即将上市的公司,核心团队稳定性是监管机构和投资者重点评估的指标 [11]
前OpenAI创始人称:大模型将从“堆芯片”转向“拼研究”
AI行业发展模式转变 - 行业此前聚焦于通过海量芯片部署或获取大规模训练数据来实现算力扩张 [3] - 通过堆算力提升AI智能水平的模式已经逼近极限 [2][6] - 科技企业已投入数千亿美元采购GPU并建设数据中心以提升AI工具性能 [5] 对算力扩张路径的质疑 - OpenAI联合创始人伊利亚·苏茨克维尔对“算力扩张是AI进步核心路径”的传统共识提出质疑 [5] - 过去约五年间,算力扩张模式确实产出了具有影响力的成果,对企业而言是一种简单且风险极低的资源投入方式 [6] - 数据是有限的,而各类机构已拥有海量算力,单纯将规模扩大100倍并不会带来彻底改变 [6] 未来发展方向 - 行业需要重返研究时代,但这次有了强大的计算机加持 [4][5][6] - 需要找到高效利用现有算力的有效途径,研究将起到关键作用 [4][6][7] - 研究重点应转向让模型具备与人类相当的泛化能力,即仅通过少量信息或示例就能完成学习的能力 [7] - 算力仍是研究的必要条件,并在所有主流机构遵循同一范式时可能成为核心差异化优势之一 [6]
美国科技股创六个月来最大涨幅
观察者网· 2025-11-25 08:25
市场整体表现与驱动因素 - 市场对美联储下月降息预期增强 推动投资者抛售后在低位买入 带动美国科技股创下六个月来最大单日涨幅 [1] - 纳斯达克综合指数上涨2.7% 基准标普500指数上涨1.6% [1] - 美联储理事表态支持12月降息 称通胀上升证据不足且劳动力市场持续疲软 被市场视为积极信号 [1] - 纽约联储主席已暗示支持美联储在下月会议上降息25个基点 [1] - 分析人士指出股市对政策预期转变反应热烈 当前整体环境对多头极为有利 市场消息面温和且政策制定者表态支持市场 [1] 主要科技公司股价表现 - 芯片制造商博通股价大涨11.1% [1] - 谷歌母公司Alphabet股价攀升6.3% 创历史新高 其新推出的图像生成模型获得积极评价 [1] - 马斯克旗下特斯拉股价上涨6.8% [1] 市场近期背景与波动 - 此前不少投资者担忧市场对人工智能相关企业估值过高 以科技股为代表的美股市场在上周经历了剧烈震荡 [1] - 标普500指数较10月底创下的历史高点下跌2.7% [1] - 许多投资者选择削减对此前经历了暴涨的科技股的持仓 [1]
受降息预期推动,美国科技股创六个月来最大涨幅反弹
搜狐财经· 2025-11-25 08:18
市场整体表现 - 纳斯达克综合指数单日上涨2.7%,创下六个月来最大单日涨幅 [1] - 标普500指数单日上涨1.6% [1] - 市场此前经历剧烈震荡,标普500指数较10月底历史高点下跌2.7% [1] 主要公司表现 - 芯片制造商博通股价单日大幅上涨11.1% [1] - 谷歌母公司Alphabet股价单日攀升6.3%,创下历史新高 [1] - 特斯拉股价单日上涨6.8% [1] 市场驱动因素 - 投资者对美联储下月降息的预期不断增强,推动市场情绪转向积极 [1] - 美联储理事表态支持12月降息,称通胀上升证据不足且劳动力市场持续疲软 [1] - 纽约联储主席已暗示支持美联储在下月会议上降息25个基点 [1] - 谷歌新推出的图像生成模型获得积极评价,对公司股价形成支撑 [1] - 投资者此前因担忧人工智能相关企业估值过高而削减科技股持仓 [1]
Diffusion Model扩散模型一文尽览!
自动驾驶之心· 2025-09-14 00:04
扩散模型数学原理 朗之万采样与扩散模型基础 - 扩散模型本质是通过神经网络学习解常微分方程/随机微分方程的过程,核心是从随机噪声逐步生成目标数据分布[3] - 图像生成任务可视为从高维概率分布采样,朗之万采样通过分数函数(概率密度梯度)将随机噪声推向高概率区域[11] - 噪声项在朗之万采样中必不可少:无噪声会导致收敛到局部极大值(模式搜索),有噪声才能确保采样多样性并探索多模态分布[11][14][26] - 网络负责生成宏观结构和方向,噪声提供高频细节和纹理,两者结合产生真实感图像[11][26] 分数匹配与训练目标 - 通过高斯核密度估计(KDE)将离散分布连续化,获得可求梯度的分数函数:∇ₓlog pσ(x) = (μ_w(x) - x)/σ² [41][46][53] - 训练目标分为分数匹配和噪声预测两种等价形式:分数匹配直接预测梯度,噪声预测则估计添加的噪声,关系为 sθ(x_t, t) ≈ -(1/σ_t) · εθ(x_t, t) [64][65][66] - 方差爆炸(VE)和方差保持(VP)是两种主流噪声调度策略:VE让方差随时间递增最终变为高斯噪声,VP保持总方差不变[69][70] Flow Matching 框架 - Flow Matching 直接学习速度场而非分数函数,通过构造确定性流将先验分布传输到数据分布[144][145] - MeanFlow 学习平均速度场而非瞬时速度场,可实现一步生成(1-NFE),推理公式为 z₀ = z₁ - uθ(z₁, 0, 1) [105][107][111] - Rectified Flow 通过重流(reflow)技术拉直轨迹,使ODE可用单步欧拉求解,提升推理效率[94][97][98] - 与扩散模型对比:Flow Matching 不依赖高斯先验和边界分数,支持任意可采样分布[144][145] 分类器自由引导(CFG) - CFG 通过线性组合有条件和无条件预测增强控制效果:ū_t(x|y) = (1-w)u_t(x|∅) + wu_t(x|y),其中 w > 1 为引导尺度[179][183][184] - 训练时以概率 η 替换条件 y 为空集 ∅,统一学习有条件和无条件速度场[184][189] - 推导基于贝叶斯规则:∇log p(x|y) = ∇log p(x) + ∇log p(y|x),引导项放大分类器梯度[177][181][193] 概率流ODE统一框架 - 概率流ODE构建确定性生成路径:dX_t = [f(X_t,t) - ½g(t)²∇log p_t(X_t)] dt,其分布演化与SDE一致[148][158][164] - 分数匹配(SDE/ODE)和Flow Matching属同一家族,前者学分数再转速度,后者直接学速度场[148][151] - 扩散模型依赖高斯先验的原因:线性高斯SDE有闭式解,梯度易计算,且边界分数已知(∇log p₀(x) = -x)[133][134][143] 技术实现与优化 - 实现涉及雅可比向量积(JVP)计算,框架如Jax和Torch提供原生支持[115][122] - 损失函数设计避免EMA和stop_gradient,理论保证收敛性且训练稳定[120][121][125] - 采样效率通过平均速度场和直线轨迹优化,减少推理步数[98][105][111] 注:本文仅涉及扩散模型数学原理及算法框架,未包含风险提示、免责声明、评级规则等无关内容[3]
AI输出“偏见”,人类能否信任它的“三观”?
科技日报· 2025-07-17 09:25
AI偏见问题现状 - 大语言模型(LLM)传播全球刻板印象,包括性别歧视、文化偏见和语言不平等,并以看似权威的方式输出[1] - AI模型对刻板印象的再现具有差异化特征,在英语、阿拉伯语、西班牙语、印地语等语言环境中均表现出偏见[2] - 图像生成模型在输入"非洲村庄"时输出"茅草屋""赤脚孩童"等刻板印象图像,输入"欧洲科学家"时则清一色为白人男性形象[2] AI偏见的表现形式 - 语言模型有时会用伪科学或伪历史为刻板印象辩护,面对不常见刻板印象时会调动其他偏见进行回应[3] - 当关于刻板印象的提示是正面时,模型表现更差,更容易将偏见误当作客观事实表达[3] - AI系统在处理低资源语言(如斯瓦希里语、菲律宾语、马拉地语等)时表现远不及主流高资源语言,容易产生负面刻板印象[4] AI偏见的根源 - 当前大多数训练数据以英语和西方文化为核心,缺乏对非主流语言及其文化背景的深入理解[4] - 全球约有7000种语言,但只有不到5%在互联网中得到有效代表,导致AI研发在数据、人才、资源和权利方面存在结构性不公[4] - 最受欢迎的聊天机器人大多由美国公司开发,训练数据以英语为主,深受西方文化偏见影响[5] 解决AI偏见的措施 - 斯坦福大学建议加强对低资源语言与文化的AI投资,建立本地语言语料库,让AI能真正理解这些语言背后的语义与文化背景[6] - Hugging Face团队开发的SHADES数据集成为多家公司检测和纠正AI模型文化偏见的重要工具[6] - 欧盟《AI法案》要求"高风险"AI系统必须在投放前后进行合规评估,包括对非歧视性与基本权利影响的审查[6]