分块索引
稠密索引因为索引项和数据集的记录个数相同,所以控件代价很大。为了减少索引项的个数,我们可以对数据集进行分块,使其分块有序,然后再对每一块建立一个索引项,从而减少索引项的个数。 分块有序,是把数据集的个数分成了若干块,并且这些块需要满足两个条件
块内无序,即每一块内的记录不需要有序。块间有序,即要求第二块内记录的所有关键字都要大于第一块内的所有关键字,第三块内的所有关键字都要大于第二块内的所有关键字。。。因为只有块间有序,才能在查找时带来效率。
对于分块有序的数据集,将每块对应一个索引项,这种索引方法叫做分块索引。
如图:
最大关键码,它存储每一块中的最大关键字,这样可以使得在它之后的下一块中的最小关键字也能比这一块中的最大关键字大;存储了快中记录的个数,便于循环时使用;用于指向块首数据元素的指针,便于开始对这一块中的记录进行遍历。
在分块索引表中进行查找,一般分为两步:
在分块索引表中先查找到关键字所在的块。由于分块索引表之间是有序的,因此很容易利用折半、插值等算法找到结果。如在如图的分块数据集中查找62,可以很快的由分块索引表中根据57<62<96得到62在第三个块中。根据块首地址找到对应的块,并在块中顺序查找关键字。因为块中可以是无序的,因此只能顺序查找。
应该说分块索引的思想还是很容易理解的。 总的来说,分块索引在兼顾了对细分块不需要有序的情况下,大大增加了整体的查找速度,所以被普遍由于数据库表的查询等技术中。
转载请注明原文地址: https://ju.6miu.com/read-2925.html