您当前位置：首页 > 数据库 > 数据库应用 > 大偏移量下Redis、MongoDB分页/排名性能比较

大偏移量下Redis、MongoDB分页/排名性能比较

来源：程序员人生发布时间：2014-12-19 08:32:37 阅读次数：3406次

题目其实其实不太准确，由于数据库其实不会提供分页、排名等功能，提供的只是数据的存取，分页排名这些都是我们基于数据库的实用案例而已。但是不管是Redis还是MongoDB，通常都有1些常规的做分页和排名的方法。本文就通过1些测试数据来向大家介绍Redis和MongoDB（和传统关系型数据库）在这方面的性能差别。

分页

首先我们来做1个分页，在MongoDB中示例数据以下所未：

db.scores.find(); {lid: ObjectId("4fe506dabb2bfa742d000001"), score: 1, name: 'user_1'} {lid: ObjectId("4fe506dabb2bfa742d000001"), score: 2, name: 'user_2'} {lid: ObjectId("4fe506dabb2bfa742d000001"), score: 3, name: 'user_3'} {lid: ObjectId("4fe506dabb2bfa742d000001"), score: 4, name: 'user_4'}

其中lid字段用于辨别不同的纬度，主要用在挑选上，在测试collection中，1共有5个不同的lid值，每个对应1,200,000条数据，1共6,000,000条数据。索引在lid 和 score上。（下面的查询能使用到索引）

然后我们进行下面的性能测试：

collection = Mongo::Connection.new.db('test').collection('scores') Benchmark.bmbm do |x| x.report("mongo small") do 100.times do |i| collection.find({:lid => lids.sample}, {:fields => {:_id => false, :score => true, :user => true}}).sort({:score => ⑴}).limit(20).skip(i * 20).to_a end end x.report("mongo medium") do 100.times do |i| collection.find({:lid => lids.sample}, {:fields => {:_id => false, :score => true, :user => true}}).sort({:score => ⑴}).limit(20).skip(i * 1000).to_a end end x.report("mongo large") do 100.times do |i| collection.find({:lid => lids.sample}, {:fields => {:_id => false, :score => true, :user => true}}).sort({:score => ⑴}).limit(20).skip(i * 10000).to_a end end end

上面分别对skip条数比较小，中等大小和非常大3种情况进行了测试。而limit指定获得的数据都1样是20条。这3种情况下的测试结果分别是：0.6 秒， 17 秒，173 秒。

我们可以看到，对MongoDB来讲，skip的大小严重影响性能，应当严格避免特别大的skip操作。

下面我们将类似的数据用Redis的Sorted Sets进行存储。并进行相应的性能测试

redis = Redis.new(:driver => :hiredis) Benchmark.bmbm do |x| x.report("redis small") do 100.times do |i| start = i * 20 redis.zrevrange(lids.sample, start, start + 20, :with_scores => true) end end x.report("redis medium") do 100.times do |i| start = i * 1000 redis.zrevrange(lids.sample, start, start + 20, :with_scores => true) end end x.report("redis large") do 100.times do |i| start = i * 10000 redis.zrevrange(lids.sample, start, start + 20, :with_scores => true) end end

这里skip的值和上面MongoDB中是1样的，那末Redis的表现如何呢。这3种情况下的测试结果分别是：0.028 秒， 0.025 秒， 0.028 秒。

采取类似于MongoDB的数据结构存储在PostgreSQL中并进行相同的测试，其结果比MongoDB还要差1点。具体结果以下：

mongo small   0.6
mongo medium   17
mongo large   173
redis small   0.028
redis medium   0.025
redis large   0.028
pg small   1
pg medium   122
pg large   650

排名

排名功能与分页功能类似，不同的是排名是通过计算大于某个值的条数来做的。

比如：

//sql select count(*) from scores where lid = $1 and score > $2 //mongo db.scores.find({lid: lid, score: {$gt: score}}).count()

由于排名和分页实现原理上类似，所以结果实际上差不多。测试结果以下：

mongo top rank   1.155847
mongo average 22.291007

redis top rank   0.169442
redis average 0.162205

pg top rank 0.714144
pg average   21.771570

结论

上面做了对照，那末本文要说1个甚么问题呢？

首先，在MongoDB中，尽可能避免进行比较大的skip操作，比如在分页中，如果你能知道需要获得数据的上1条score是多少，那末可能能够用下面的方法来获得你要的数据，而不是通过1次很大的skip操作。

db.scores.find({lid: lid, score: {$lt: last_score}}).sort({score: ⑴}).limit(20)

另外，如果你需要进行比较大的skip操作或count比较大的数量，那末可以斟酌采取Redis的Sorted Sets来做。

后记

本文在微博上引发了1些技术朋友的讨论，对对照的问题这里做1个说明。

我们知道，Redis是内存数据库，而MongoDB不是，所以有朋友质疑这里的对照是不是只是内存与磁盘的对照。实际上这1说法不无道理，上面的测试数据出自原作者文章，其文章也并未提及MongoDB是不是都在内存中。根据我个人的实验结果，当数据全部能够在内存中时，确切不会出现如本文中所说的 MongoDB性能严重差异。但是，随着skip的变大，操作时间还是在显著变长，而Redis的Sorted Sets则相对稳定。

同时也欢迎更多实验对照数据和原理分析的讨论。感谢大家。

生活不易，码农辛苦
如果您觉得本网站对您的学习有所帮助,可以手机扫描二维码进行捐赠
程序员人生

------分隔线----------------------------

上一篇 nodejs创建TLS服务

下一篇 [应用妹 --第一篇界面演示] android应用市场之快速开发

分享到:

------分隔线----------------------------

为码而活

积分：4237

15粉丝

7关注

栏目热点