C++ 位圖及位圖的實現原理

Posted on 2021-05-31 by WalkonNet

概念

位圖就是bitmap的縮寫，所謂bitmap，就是用每一位來存放某種狀態，適用於大規模數據，該數據都是不重復的簡單數據。通常是用來判斷某個數據存不存在的

例如：給40億個不重復的unsigned int的整數，沒排過序的，然後再給一個數，如何快速判斷這個數是否在那40億個數當中
如果不看數據量，我們第一想到的肯定就是依次從頭遍歷，但是這個數據量是非常大的，有40億，遍歷40億次消耗的時間和內存是非常多的。但是引入位圖後，就可以專門解決這種大量數據查找是否存在的問題。查找這個數是否存在所消耗的時間復雜度為O(1)，且節省瞭32倍的容量（下面有解釋）。下面我們一起來看看位圖的原理及代碼實現

原理

查找一個數是否存在，其實答案就是存在或者不存在，這種隻需要回答是與否的問題，我們都可以用二進制中的位來表示，1表示該數存在，反之0表示該數不存在。而位圖中的每個數據單元都是一個bit位，這樣子平時我們都要話32位4字節來存儲數據，而現在我們隻需要花1個字節就能“存儲數據”，在空間上減少瞭約32倍的容量。例如40G的數據我們隻要花1.3G來存儲。但是我們平時操作的數據類型最小就是一個字節，我們不能直接對位進行操作，所以我們可以借助位運算來對數據進行操作。下面我們來看看數據在位圖中是如何存儲的
我們這裡給出一個數組
int arr[] = {1,2,4,5,7,10,11,14,16,17,21,23,24,28,29,31}；則我們隻需要花1個字節來存這些數據

在這裡插入圖片描述

解釋：我們目前很多的機器都是小端存儲，也就是低地址存低位，一個整形數據中，第一個字節用來存儲0-7的數字，第二個字節用來存儲8-15的數字，第三個字節用來存儲16-23的數字，第四個字節用來存儲24-31的數字。我們來看看數字10是如何存儲的。先通過模上32，取餘還是10，然後再將4字節中第10個比特位置為1，則表示該數字出現過。由於我們的機器是小端存儲，所以我們的每個比特位都是要從右邊開始計算的，如下圖

在這裡插入圖片描述

所以說我們隻需要將對應的比特位置為1即可。但是如果我們要存儲的數據很大呢？其實也很簡單，我們可以定義一個數組，當做一個位圖，如果該數字在0-31之間，我們就存儲在0號下標的元素中進行操作，如果在32-63之間，則就在1號下標之間進行操作。計算下標我們可以通過模32來獲得下標。

我們知道位圖的原理後，我們在通過原理來用代碼實現一個位圖吧

實現

成員變量和構造函數：在實現位圖中，我們的成員變量隻需要一個數組就可以實現。而這個數組有多我們要開多大呢？數組多開一個整形空間，就能多存32個數字，所以我們可以讓用戶提供一個準確的數，這個數是一個數據量，也是數的最大范圍。我們可以通過該數模上32，就可以獲得該數組的大小，但是0~31模上32為0，我們開0個空間那顯然不合適，所以我們要開range/32 + 1個空間大小的數組

存儲數據：存儲一個數字num需要3個步驟，第一是需要計算出該值對應的數組下標。計算數組下標方式為idx=num / 32；第二步是計算num在對應整數的比特位的位置bitIdx=num%32；第三步是要將計算出來的bite位置為1。我們之前說過，要操作位，我們可以通過位運算來操作，可以先將1左移bitIdx位後再和整數進行或運算
例如假設bitIdx=5，數據為10010011
1.將1進行左移5位==>100000
2.將數據和第一步計算出來的結果進行或運算
10010011 | 100000 =10110011，此時我們就將指定位置置位1瞭

查找數據：要判斷一個數據是否存在，其實和存儲數據是類似，也是需要計算出兩個位置idx和bitIdx。然後通過這兩個位置來判斷對應位置是否為1，為1則表示該數字存在。如何判斷呢？我們可以先將數組下標為idx的整數向右移bitIdx位，然後再和1進行與運算，如果為1則表示存在，否則不存在
例如假設bitIdx=5，數據為10110011
1.將數據進行右移5位00000101
2.將第一步計算出來的結果和1進行與運算
00000101 & 1 = 1，此時表示該數字存在，返回true

刪除數據：刪除數據和存儲數據操作一樣，唯一的區別就是將對應的bit位置為0。我們可以通過先將1進行左移bitIdx位，然後取反，將結果再和原來數據進行與運算
例如假設bitIdx=5，數據為10110011
1.將1進行左移5位後並取反011111
2.將第一步計算出來的結果和數據進行與運算
10110011 & 011111 = 10010011，刪除成功

代碼：

class BitMap
{
public:
	//位圖的內存大小和數據范圍有關
	BitMap(size_t range)
		:_bit(range / 32 + 1)
	{}

	void set(const size_t num)
	{
		//計算數組中的下標
		int idx = num / 32;
		//計算num在對應下標整數中的下標位置
		int bitIdx = num % 32;
		//將對應的比特位置1
		_bit[idx] |= 1 << bitIdx;
	}

	bool find(const size_t num)
	{
		int idx = num / 32;
		int bitIdx = num % 32;
		return (_bit[idx] >> bitIdx) & 1;
	}

	void reset(const size_t num)
	{
		int idx = num / 32;
		int bitIdx = num % 32;
		_bit[idx] &= ~(1 << bitIdx);
	}
private:
	vector<int> _bit;
};

測試截圖：

在這裡插入圖片描述

以上就是C++ 位圖及位圖的實現原理的詳細內容，更多關於C++ 位圖的資料請關註WalkonNet其它相關文章！

C++ 位圖及位圖的實現原理

概念

原理

實現

推薦閱讀：

發佈留言取消回覆

近期文章

概念

原理

實現

推薦閱讀：

發佈留言 取消回覆

近期文章

標籤

發佈留言取消回覆