python區塊鏈實現簡版工作量證明

說明

本文根據https://github.com/liuchengxu/blockchain-tutorial的內容,用python實現的,但根據個人的理解進行瞭一些修改,大量引用瞭原文的內容。文章末尾有"本節完整源碼實現地址"。

回顧

在上一節,我們構造瞭一個非常簡單的數據結構 – 區塊,它也是整個區塊鏈數據庫的核心。目前所完成的區塊鏈原型,已經可以通過鏈式關系把區塊相互關聯起來:每個塊都與前一個塊相關聯。

但是,當前實現的區塊鏈有一個巨大的缺陷:向鏈中加入區塊太容易,也太廉價瞭。而區塊鏈和比特幣的其中一個核心就是,要想加入新的區塊,必須先完成一些非常困難的工作。在本文,我們將會彌補這個缺陷。

工作量證明

區塊鏈的一個關鍵點就是,一個人必須經過一系列困難的工作,才能將數據放入到區塊鏈中。正是由於這種困難的工作,才保證瞭區塊鏈的安全和一致。此外,完成這個工作的人,也會獲得相應獎勵(這也就是通過挖礦獲得幣)。

這個機制與生活現象非常類似:一個人必須通過努力工作,才能夠獲得回報或者獎勵,用以支撐他們的生活。在區塊鏈中,是通過網絡中的參與者(礦工)不斷的工作來支撐起瞭整個網絡。礦工不斷地向區塊鏈中加入新塊,然後獲得相應的獎勵。在這種機制的作用下,新生成的區塊能夠被安全地加入到區塊鏈中,它維護瞭整個區塊鏈數據庫的穩定性。值得註意的是,完成瞭這個工作的人必須要證明這一點,即他必須要證明他的確完成瞭這些工作。

整個 “努力工作並進行證明” 的機制,就叫做工作量證明(proof-of-work)。要想完成工作非常地不容易,因為這需要大量的計算能力:即便是高性能計算機,也無法在短時間內快速完成。另外,這個工作的困難度會隨著時間不斷增長,以保持每 10 分鐘出 1 個新塊的速度。在比特幣中,這個工作就是找到一個塊的哈希,同時這個哈希滿足瞭一些必要條件。這個哈希,也就充當瞭證明的角色。因此,尋求證明(尋找有效哈希),就是礦工實際要做的事情。

哈希計算

獲得指定數據的一個哈希值的過程,就叫做哈希計算。一個哈希,就是對所計算數據的一個唯一表示。對於一個哈希函數,輸入任意大小的數據,它會輸出一個固定大小的哈希值。下面是哈希的幾個關鍵特性:

  • 無法從一個哈希值恢復原始數據。也就是說,哈希並不是加密。
  • 對於特定的數據,隻能有一個哈希,並且這個哈希是唯一的。
  • 即使是僅僅改變輸入數據中的一個字節,也會導致輸出一個完全不同的哈希。

本質上哈希是一個摘要算法。

哈希函數被廣泛用於檢測數據的一致性。軟件提供者常常在除瞭提供軟件包以外,還會發佈校驗和。當下載完一個文件以後,你可以用哈希函數對下載好的文件計算一個哈希,並與作者提供的哈希進行比較,以此來保證文件下載的完整性。

在區塊鏈中,哈希被用於保證一個塊的一致性。哈希算法的輸入數據包含瞭前一個塊的哈希,因此使得不太可能(或者,至少很困難)去修改鏈中的一個塊:因為如果一個人想要修改前面一個塊的哈希,那麼他必須要重新計算這個塊以及後面所有塊的哈希。

Hashcash

比特幣使用 Hashcash ,一個最初用來防止垃圾郵件的工作量證明算法。它可以被分解為以下步驟:

取一些公開的數據(比如,如果是 email 的話,它可以是接收者的郵件地址;在比特幣中,它是區塊頭)

給這個公開數據添加一個計數器。計數器默認從 0 開始

將 data(數據) 和 counter(計數器) 組合到一起,獲得一個哈希

檢查哈希是否符合一定的條件:

  • 如果符合條件,結束
  • 如果不符合,增加計數器,重復步驟 3-4

因此,這是一個暴力算法:改變計數器,計算新的哈希,檢查,增加計數器,計算哈希,檢查,如此往復。這也是為什麼說它的計算成本很高,因為這一步需要如此反復不斷地計算和檢查。

現在,讓我們來仔細看一下一個哈希要滿足的必要條件。在原始的 Hashcash 實現中,它的要求是 “一個哈希的前 20 位必須是 0”。在比特幣中,這個要求會隨著時間而不斷變化。因為按照設計,必須保證每 10 分鐘生成一個塊,而不論計算能力會隨著時間增長,或者是會有越來越多的礦工進入網絡,所以需要動態調整這個必要條件。

為瞭闡釋這一算法,我從前一個例子(“I like donuts”)中取得數據,並且找到瞭一個前 3 個字節是全是 0 的哈希。

實現

這裡我們實現一個簡易的區塊鏈,就不動態調節難度瞭,使用固定的難度。

class ProofOfWork(object):
    """
    pow 
    """
    _N_BITS = 16
    MAX_BITS = 256
    MAX_SIZE = sys.maxsize
    def __init__(self, block, n_bits=_N_BITS):
        self._n_bits = n_bits
        self._target_bits = 1 << (self.MAX_BITS - n_bits)
        self._block = block

這裡的_n_bits就是難度值。 在比特幣中,當一個塊被挖出來以後,“n_bits” 代表瞭區塊頭裡存儲的難度,也就是開頭有多少個 0。這裡的 16 指的是算出來的哈希前 16 位必須是 0,如果用 16 進制表示,就是前 6 位必須是 0,這一點從最後的輸出可以看出來。目前我們並不會實現一個動態調整目標的算法,所以將難度定義為一個全局的常量即可。

16 其實是一個可以任意取的數字,其目的隻是為瞭有一個目標而已,這個目標占據不到 256 位的內存空間。同時,我們想要有足夠的差異性,但是又不至於大的過分,因為差異性越大,就越難找到一個合適的哈希。這裡的
_target_bits則表示滿足要求的最大值,即一個上界,它是由1左移256-n_bits位來的。計算出來的哈希隻要滿足小於它就滿足條件瞭。

接下來我們要準備用於計算哈希的數據:

    def _prepare_data(self, nonce):
        data_lst = [str(self._block.block_header.prev_block_hash),
                    str(self._block.block_header.hash_merkle_root),
                    str(self._block.block_header.timestamp),
                    str(self._block.block_header.height),
                    str(nonce)]
        return utils.encode(''.join(data_lst))

nonce就是我們要不斷嘗試要尋找的值,就是上面 Hashcash 所提到的計數器,它是一個密碼學術語。其他數據都是區塊頭的數據。我們需要把這些數據進行合並作為計算哈希的原數據。

尋找nonce的方法:

    def run(self):
        nonce = 0
        found = False
        hash_hex = None
        print('Mining a new block')
        while nonce < self.MAX_SIZE:
            data = self._prepare_data(nonce)
            hash_hex = utils.sum256_hex(data)
            hash_val = int(hash_hex, 16)
            sys.stdout.write("try nonce == %d hash_hex == %s \r" % (nonce, hash_hex))
            if (hash_val < self._target_bits):
                found = True
                break
            nonce += 1
        if found: 
            print('Found nonce == %d' % nonce)
        else:
            print('Not Found nonce')
            raise NonceNotFoundError('nonce not found')
        return nonce, hash_hex

為防止溢出,我們要設定一個上線為int64的上限。然後我們不斷循環尋找目標值,直到滿足難度要求。當然,如果難度設計得過高,有可能尋找不到,所以也需要判斷一下。所以我們再循環內做瞭一下事:

1. 準備數據

2. 用 SHA-256 對數據進行哈希

3. 將哈希轉換成一個大整數

4. 將這個大整數與目標進行比較

然後我們還需要很方便的去檢驗這個塊的難度值是否滿足我們的要求:

    def validate(self):
        """
        validate the block
        """
        data = self._prepare_data(self._block.block_header.nonce)
        hash_hex = utils.sum256_hex(data)
        hash_val = int(hash_hex, 16)
        return hash_val < self._target_bits

最後運行以前的main.py,結果如下:

Mining a new block
...
...
...
Block(_block_header=BlockHeader(timestamp='1548213145.24', hash_merkle_root='', prev_block_hash='', hash='00008fbcbe3a817641195652d9bad37fa8c974536f152f4bc575b3ead9dc6407', nonce=62489, height=0))Block(_block_header=BlockHeader(timestamp='1548213166.65', hash_merkle_root='', prev_block_hash='00008fbcbe3a817641195652d9bad37fa8c974536f152f4bc575b3ead9dc6407', hash='9e851f78295e7933cd9749f712d1f09f1408dff9bd37cc2f79f1c65d1ab39e2e', nonce=16184, height=1))Block(_block_header=BlockHeader(timestamp='1548213171.15', hash_merkle_root='', prev_block_hash='9e851f78295e7933cd9749f712d1f09f1408dff9bd37cc2f79f1c65d1ab39e2e', hash='f88e7a382dafc50b01c43cbbdbbdfa20ac2bffcf5ddf36b97439ff09203f8c2a', nonce=8286, height=2))

可以看到這次我們產生三個塊花費瞭25秒多,比沒有工作量證明之前慢瞭很多(也就是成本高瞭很多)。

參考:

[1] proof-of-work

[2] 完整源碼

以上就是python區塊鏈實現簡版工作量證明的詳細內容,更多關於python區塊鏈工作量證明的資料請關註WalkonNet其它相關文章!

推薦閱讀: