位图是一种非常常见的结构,它使用每个二进制位来存放一个值的状态,正因为这个性质,它经常被用在数据压缩或者是索引等方面。
有这样一道题:给40亿个不重复的无符号整数,没有经过排序,然后再给一个树,如何快速判断这个数是否在40亿个数之中?
在这里如果我们实打实的存放40亿个数据在内存中,那会占据将近15个G的内存,普通电脑根本无法满足,更不用说在对其进行查找操作了。 那么如果选择位图来存储的话我们只需要差不多500M就够了。大大的节省了内存的消耗。
如下图,我们把1状态设为存在状态,0状态设为不存在,那么该组数据中就存在2和5。
在我设计的BitMap里给出了三个接口
1.Set:用来把x位置的状态位置一,表示x已存在; 实现原理是将要存入的数据除以32得到他的所在字节,然后再对要存入的数据模32,得到他在这个字节的位。再把“1”状态移动到这个位。
void Set(size_t x) {//将x位置的状态置一 if (x / 32 > _v.size()) { cout << "参数" << x << "超出范围" << endl; return; } size_t index = x >> 5; size_t num = x % 32; _v[index] |= 1 << (num - 1); }2.Reset:重新把x位置的状态置零; 实现原理和Set的基本一样,但是最后因为是置零所以我们采用了异或的方法,把x的状态位清零。
void Reset(size_t x) {//将x位置的状态的置零 if (x / 32 > _v.size()) { cout << "参数" << x << "超出范围" << endl; return; } size_t index = x >> 5; size_t num = x % 32; _v[index] ^= 1 << (num - 1); }3.Find:查找x位置的状态。 查找的实现原理前两步和上面一样,先找到x的所在的位位置,然后通过位移操作取出这个位,再和1做与得并返回。
int Find(size_t x) {//查找x位置的状态并返回 if (x/32 > _v.size()) { cout << "参数"<<x<<"超出范围" << endl; return false; } size_t index = x >> 5; size_t num = x % 32; return (_v[index] >> (num - 1)) & 1; }在这三个接口里,我都加入了参数检测,是为了防止给入的参数超过位图所能存储的范围。