X刚刚开源了“For You”算法的代码 你需要知道的一切在1条推文和1张图片中: 1. 原始输入(数据) 一切都始于三个大数据桶: - 社交图谱 → 你关注的人,关注你的人,你的网络连接。 - 推文互动 → 点赞、转发、回复、书签。 - 用户数据 → 你的个人资料、行为、你点击的内容、你忽略的内容。 这就是驱动整个系统的“燃料”。 2. 特征工程 原始数据通过不同的模型/特征进行处理,试图理解它: - GraphJet → 推文、转发、关注的实时图。 - SimClusters → 将人和推文分组为兴趣社区(如“AI Twitter”或“NBA Twitter”)。 - TwHIN → Twitter的“异构信息网络”,基本上是用户与推文关系的地图。 - RealGraph → 预测用户之间连接的强度。 - TweepCred → 可信度评分。 ...