欢迎您访问365答案网,请分享给你的朋友!
生活常识 学习资料

systemdesign关于加index搜索(nosqlDB)

时间:2023-08-10
问题定义

database是按uuid auto increase的int作为primary key。搜pk肯定不需要o(N)全表遍历,至少可以二分o(logn).

但有时候想搜某一性质的内容。比如姓名,比如车型,这样。遍历全表会很慢,如果是搜索频率比较高的性质,可以考虑做index,变成o(1) (hashmap) 或 o(logn), 提升搜索速度。

关系型数据库里,只要create index就好.

非关系型数据呢?

两种方法 1、Local Index

对每一个partition, 增加一个关于index的hashmap,这里用最简单的hash index为例子,key是想作index的那一类,比如员工姓/姓名,value是list of Primary Key、比如:

王:1, 5, 7, 99, 。。

李:2, 12, 。。。

张明:108,222, 。。。

这样每一个partition都维护一个自己的hashmap。

每在一个partition里写一个新数据,都在该partition的hashmap里相关index后面加上这个新pk。快

那么如果我们想搜王姓员工,就要遍历(scatter)每一个partition 的hashmap, 拿到每一个的王姓的结果,再合在一起(gather)。慢

应用

cassendra,mongoDB

2、Global Index

单独维护关于index的hashmap,和数据可以不在一个partition, 所有partition的数据共用一个hashmap (即global的index)。故只有一个王姓的key,所有结果都加在该key后面。

每在一个partition里写一个新数据,就在global hashmap里面相关的tag后面加上这个数据的pk。因为可能有很多相关index,且相关index可能不在同一Partition,所以慢。往往offline 异步进行。

只需要去global hashmap里面读一次,就是所有王姓的结果。快。

应用

DynamoDB,craigslist

Copyright © 2016-2020 www.365daan.com All Rights Reserved. 365答案网 版权所有 备案号:

部分内容来自互联网,版权归原作者所有,如有冒犯请联系我们,我们将在三个工作时内妥善处理。