马斯克甩出王炸,X平台推荐算法重磅开源,6小时斩获1.6k Star,放话:没有对手这样做
36氪·2026-01-20 18:55

事件概述 - X平台(原Twitter)于近期正式开源了其核心的“For You”信息流推荐算法,兑现了埃隆·马斯克在7天前做出的承诺 [1][3] - 该算法采用了与xAI的Grok模型相同的Transformer架构,相关代码仓库在GitHub上线6小时内便获得了1.6k个Star [3][4] 开源动机与战略意义 - 马斯克认为社交平台的推荐算法长期处于“黑箱”状态,其开源举措旨在打造一个“自由广场”,通过透明化减少外界对“算法偏见”和“流量操纵”的质疑 [6] - 开源是X平台改造的关键一步,旨在借助全球开发者社区的力量来监督和优化算法,从而巩固其生态护城河 [7] - 公司计划后续每四周更新一次代码并附带开发者说明,这种“持续开源+透明更新”的模式在社交平台领域是前所未有的尝试 [7] - 马斯克强调“其他社交媒体公司都没有这样做”,并承认当前算法仍需大幅改进,但开源提供了透明的改进过程 [24] 开源算法技术细节 - 开源的是“For You”信息流的核心推荐系统,其内容来源分为站内内容(Thunder模块)和站外内容(Phoenix召回模块) [8] - 核心模型为Phoenix模型,基于xAI开源的Grok-1 Transformer架构,并针对推荐场景进行了适配和调整 [8] - 系统已剔除所有手工设计的特征及绝大部分启发式规则,核心计算完全由Grok Transformer模型承担,通过分析用户互动历史预测内容相关性 [8] - 技术栈以Rust和Python为主,遵循Apache License 2.0开源许可 [12] - 代码仓库按功能模块清晰划分,包括phoenix/(模型核心)、home-mixer/(编排层)、thunder/(站内内容处理)、candidate-pipeline/(候选流水线) [13] 推荐系统工作流程 - 系统工作流程分为七个核心阶段,旨在精准匹配用户兴趣并规避低质内容 [14] - 第一步:调取用户核心数据。抓取用户近期互动记录(点赞、回复等)及关注列表、偏好设置,构建用户画像基础 [15] - 第二步:抓取两类候选内容。通过Thunder模块获取用户关注账号的帖子,通过Phoenix模块从全网挖掘潜在感兴趣内容 [16] - 第三步:补全内容完整信息。为候选内容补充文本、媒体、作者信息、权限等完整维度信息 [17] - 第四步:打分前过滤无效内容。直接剔除重复、过期、用户已发布、来自屏蔽账号或包含静音关键词的内容 [18][19] - 第五步:多维度打分并排序。依次调用四款打分器:Phoenix打分器(基于Grok模型)、加权打分器、作者多样性打分器、站外内容打分器,计算最终相关性得分 [20] - 第六步:筛选。按得分高低排序,选取排名前K的候选内容 [21] - 第七步:最终验证后推送。对候选内容进行最后一轮合规性与有效性校验,确认无误后推送给用户 [22] 算法核心设计特点 - 完全摒弃手工特征,依赖Transformer模型从用户互动序列中自主学习相关性,降低了系统复杂度 [23] - 排序环节对候选内容采取“隔离计算”,确保单篇帖子得分不受同批次其他内容干扰,使结果更稳定且可缓存 [23] - 召回和排序环节采用多个哈希函数实现嵌入向量查找,提升了运行效率 [23] - 模型同时预测用户对内容的多种行为概率,而非单一相关性得分,使打分维度更全面 [23] - 基于candidate-pipeline框架搭建了可组合的流水线架构,实现了业务逻辑与执行监控的分离,支持并行执行和错误处理,具备高度灵活性和可拓展性 [23] 行业影响与市场反应 - 此次开源引发了广泛热议,有观点认为算法透明性能将“注意力”从一个神秘资源变为可理解的系统,长期可能引导用户行为从冲突转向优化与贡献 [26] - 如果X平台的“开源+透明更新”模式被证明有效,可能会倒逼其他社交平台做出改变,以满足用户对算法透明日益增长的需求 [29]

马斯克甩出王炸,X平台推荐算法重磅开源,6小时斩获1.6k Star,放话:没有对手这样做 - Reportify