Twitter News Feed Design
- Member Graph: 会员关系图
- News Feed: 每条微博或者sns里的新鲜事等我们称作feed
- Write Based Fanout Approach:基于写的扩散方案
- User Timeline: 就是一个指定的用户发布的所有tweet
- Home Timeline: 是你所有关注用户user timeline的一个临时合并
- Social Proof:社会认同(means looking at the number of retweets, favorites, and replies)
Twitter/微博最大的挑战是有大量关注者的名人发Twitter/微博时候,如何发送Twitter/微博?(These high fanout users are the biggest challenge for Twitter)
Twitter Write Flow
timeline(Stored in Redis Cluster):
Bits for status
Tweet Service, User Service, Social Graph Service 保存在MySQL集群中。
Twitter Timeline设计
- 把每个活跃用户相关的信息保存在内存以降低延迟。
- 用户Home Timeline保存在Redis集群中,有长度限制,如800条。并有多个copy保证高可用。
- 如果用户Home Timeline不在Redis集群,会启动一个重建过程,并存入Redis集群。
- 只把User Timeline数据保存到磁盘。
- Twitter写入是,fanout daemon将查询跟踪者IDs,把Twitter_Id插入Redis集群中相应用户的Home Timeline,写一条Twitter的时间复杂度是O(n)。(这是一个可以优化的地方,对于关注者特别多的人,可以在read的时候,merge他、她的Twitter)。
- Twitter写入时,把得到的tokens写入Lucene集群中的一台。
- 搜索时候用scatter-gather模式,搜索Lucene集群中的所有机器,并处理所有返回结果。
