马斯克刚刚真把 𝕏 平台推荐算法给开源了,核心也是Transformer
机器之心·2026-01-20 19:24

平台推荐算法开源事件 - 公司(原Twitter)已将其核心的“For You”信息流推荐算法完全开源,该算法由与xAI的Grok模型相同的Transformer架构驱动[1] - 公司创始人马斯克曾承诺在7天内开源算法,虽略晚于承诺,但最终实现,并希望未来能遵循每4周更新一次的承诺[4] - 马斯克表示开源是为了透明,承认算法目前“很笨拙”但会持续改进,并声称没有其他社交媒体公司这样做[4] 开源背景与潜在动因 - 此次开源可能部分源于监管压力,2025年7月巴黎检察官曾调查公司涉嫌算法偏见和数据提取问题,马斯克称之为“政治动机的刑事调查”[4] - 2023年12月,欧盟对该公司处以1.2亿欧元罚款,原因是其违反了《数字服务法案》下的透明度义务,涉及“蓝V”订阅、广告库及未向研究人员提供公共数据等问题[4] 新推荐系统技术架构 - 新系统彻底抛弃传统手工规则,大幅减少启发式方法,采用完全的神经网络方式[7] - 系统核心由两个组件构成:Thunder(基于内存的帖子存储与实时数据摄取系统)和Phoenix(机器学习核心组件)[8] - Thunder组件功能包括:从Kafka消费帖子事件、为每个用户维护多种帖子存储、提供亚毫秒级查询,其作用是高速获取用户关注账号的最新内容(站内关系内容)[9][10] - Phoenix组件包含召回(双塔模型)和排序(带候选隔离的Transformer)两大功能模块[10] - 召回模块通过用户塔和候选内容塔将特征编码为向量,并通过向量点积相似度检索最相关的Top-K帖子(站外发现内容)[11] - 排序模块以用户上下文和候选帖子为输入,使用特殊的注意力掩码机制,预测不同互动行为(如点赞、回复、转发)的概率,最终排序分数是这些预测概率的加权组合[8][11] 新算法的推荐逻辑与流量密码 - 新推荐逻辑不再主要依赖点赞数量,而是基于系统对深度互动行为的预测,包括引用评论、私信分享、复制链接、个人主页点击与关注以及停留时长[12] - “不感兴趣”、静音、拉黑、举报等负面行为会被赋予负权重,显著压低内容分发[12] - 情绪化标题和短期刺激型内容的收益正在下降,算法会捕捉后续负反馈,从而惩罚低质量、不可持续的互动模式[13] - 发布频率越高不等于覆盖面越广,系统会对同一作者在同一信息流中的多条内容进行递减加权,刷屏式发布反而会被压制[13] - 关注关系的重要性上升,来自关注者网络的内容保持满权重,而推送给非关注用户的内容会被系统性折扣,降低了“纯病毒式传播”的成功概率[13] - 总体来看,推荐系统正在明确优化长期关系和内容质量,而非短期热度,旨在建立稳定、正向的互动关系以获得更可持续的曝光[14]

马斯克刚刚真把 𝕏 平台推荐算法给开源了,核心也是Transformer - Reportify