热门话题
#
Bonk 生态迷因币展现强韧势头
#
有消息称 Pump.fun 计划 40 亿估值发币,引发市场猜测
#
Solana 新代币发射平台 Boop.Fun 风头正劲
X刚刚开源了“For You”算法的代码
你需要知道的一切在1条推文和1张图片中:
1. 原始输入(数据)
一切都始于三个大数据桶:
- 社交图谱 → 你关注的人,关注你的人,你的网络连接。
- 推文互动 → 点赞、转发、回复、书签。
- 用户数据 → 你的个人资料、行为、你点击的内容、你忽略的内容。
这就是驱动整个系统的“燃料”。
2. 特征工程
原始数据通过不同的模型/特征进行处理,试图理解它:
- GraphJet → 推文、转发、关注的实时图。
- SimClusters → 将人和推文分组为兴趣社区(如“AI Twitter”或“NBA Twitter”)。
- TwHIN → Twitter的“异构信息网络”,基本上是用户与推文关系的地图。
- RealGraph → 预测用户之间连接的强度。
- TweepCred → 可信度评分。
...

热门
排行
收藏