马斯克刚刚真把 𝕏 平台推荐算法给开源了，核心也是Transformer

平台推荐算法开源事件 - 公司（原Twitter）已将其核心的“For You”信息流推荐算法完全开源，该算法由与xAI的Grok模型相同的Transformer架构驱动[1] - 公司创始人马斯克曾承诺在7天内开源算法，虽略晚于承诺，但最终实现，并希望未来能遵循每4周更新一次的承诺[4] - 马斯克表示开源是为了透明，承认算法目前“很笨拙”但会持续改进，并声称没有其他社交媒体公司这样做[4] 开源背景与潜在动因 - 此次开源可能部分源于监管压力，2025年7月巴黎检察官曾调查公司涉嫌算法偏见和数据提取问题，马斯克称之为“政治动机的刑事调查”[4] - 2023年12月，欧盟对该公司处以1.2亿欧元罚款，原因是其违反了《数字服务法案》下的透明度义务，涉及“蓝V”订阅、广告库及未向研究人员提供公共数据等问题[4] 新推荐系统技术架构 - 新系统彻底抛弃传统手工规则，大幅减少启发式方法，采用完全的神经网络方式[7] - 系统核心由两个组件构成：Thunder（基于内存的帖子存储与实时数据摄取系统）和Phoenix（机器学习核心组件）[8] - Thunder组件功能包括：从Kafka消费帖子事件、为每个用户维护多种帖子存储、提供亚毫秒级查询，其作用是高速获取用户关注账号的最新内容（站内关系内容）[9][10] - Phoenix组件包含召回（双塔模型）和排序（带候选隔离的Transformer）两大功能模块[10] - 召回模块通过用户塔和候选内容塔将特征编码为向量，并通过向量点积相似度检索最相关的Top-K帖子（站外发现内容）[11] - 排序模块以用户上下文和候选帖子为输入，使用特殊的注意力掩码机制，预测不同互动行为（如点赞、回复、转发）的概率，最终排序分数是这些预测概率的加权组合[8][11] 新算法的推荐逻辑与流量密码 - 新推荐逻辑不再主要依赖点赞数量，而是基于系统对深度互动行为的预测，包括引用评论、私信分享、复制链接、个人主页点击与关注以及停留时长[12] - “不感兴趣”、静音、拉黑、举报等负面行为会被赋予负权重，显著压低内容分发[12] - 情绪化标题和短期刺激型内容的收益正在下降，算法会捕捉后续负反馈，从而惩罚低质量、不可持续的互动模式[13] - 发布频率越高不等于覆盖面越广，系统会对同一作者在同一信息流中的多条内容进行递减加权，刷屏式发布反而会被压制[13] - 关注关系的重要性上升，来自关注者网络的内容保持满权重，而推送给非关注用户的内容会被系统性折扣，降低了“纯病毒式传播”的成功概率[13] - 总体来看，推荐系统正在明确优化长期关系和内容质量，而非短期热度，旨在建立稳定、正向的互动关系以获得更可持续的曝光[14]