python區塊鏈簡易版交易完善挖礦獎勵示例

Posted on 2022-05-24 by WalkonNet

說明

本文根據https://github.com/liuchengxu/blockchain-tutorial的內容，用python實現的，但根據個人的理解進行瞭一些修改，大量引用瞭原文的內容。文章末尾有"本節完整源碼實現地址"。

引言

在這個系列文章的一開始，我們就提到瞭，區塊鏈是一個分佈式數據庫。不過在之前的文章中，我們選擇性地跳過瞭“分佈式”這個部分，而是將註意力都放到瞭“數據庫”部分。到目前為止，我們幾乎已經實現瞭一個區塊鏈數據庫的所有元素。今天，我們將會分析之前跳過的一些機制。而在下一篇文章中，我們將會開始討論區塊鏈的分佈式特性。

獎勵

在上一篇文章中，我們略過的一個小細節是挖礦獎勵。現在，我們已經可以來完善這個細節瞭。

挖礦獎勵，實際上就是一筆 coinbase 交易。當一個挖礦節點開始挖出一個新塊時，它會將交易從隊列中取出，並在前面附加一筆 coinbase 交易。coinbase 交易隻有一個輸出，裡面包含瞭礦工的公鑰哈希。

實現獎勵，非常簡單，更新 send 即可：

def add_block(self, transactions):
    """
    add a block to block_chain
    """
    last_block = self.get_last_block()
    prev_hash = last_block.get_header_hash()
    height = last_block.block_header.height + 1
    block_header = BlockHeader('', height, prev_hash)
    # reward to wallets[0]
    wallets = Wallets()
    keys = list(wallets.wallets.keys())
    w = wallets[keys[0]]
    coin_base_tx = self.coin_base_tx(w.address)
    transactions.insert(0, coin_base_tx)
    block = Block(block_header, transactions)
    block.mine(self)
    block.set_header_hash()
    self.db.create(block.block_header.hash, block.serialize())
    last_hash = block.block_header.hash
    self.set_last_hash(last_hash)
    utxo = UTXOSet()
    utxo.update(block)

獎勵給當前錢包的第一個地址。

UTXO 集

在 Part 3: 持久化和命令行接口中，我們研究瞭 Bitcoin Core 是如何在一個數據庫中存儲塊的，並且瞭解到區塊被存儲在 blocks 數據庫，交易輸出被存儲在 chainstate 數據庫。會回顧一下 chainstate 的機構：

c + 32 字節的交易哈希 -> 該筆交易的未花費交易輸出記錄

B + 32 字節的塊哈希 -> 未花費交易輸出的塊哈希

在之前那篇文章中，雖然我們已經實現瞭交易，但是並沒有使用 chainstate 來存儲交易的輸出。所以，接下來我們繼續完成這部分。

chainstate 不存儲交易。它所存儲的是 UTXO 集，也就是未花費交易輸出的集合。除此以外，它還存儲瞭“數據庫表示的未花費交易輸出的塊哈希”，不過我們會暫時略過塊哈希這一點，因為我們還沒有用到塊高度（但是我們會在接下來的文章中繼續改進）。

那麼，我們為什麼需要 UTXO 集呢？

來思考一下我們早先實現的 Blockchain._find_unspent_transactions 方法：

def _find_unspent_transactions(self, address):
    """
    Find all unspent transactions
    """
    spent_txos = {}
    unspent_txs = {}
    last_block = self.get_last_block()
    last_height = last_block.block_header.height
    # Reverse
    for height in range(last_height, -1, -1):
        block = self.get_block_by_height(height)
        for tx in block.transactions:
            txid = tx.txid
            # all outputs
            for vout_index, vout in enumerate(tx.vouts):
                txos = spent_txos.get(txid, [])
                # vout_index is spent
                if vout_index in txos:
                    continue
                if vout.can_unlock_output_with(address):
                    old_vouts = unspent_txs.get(tx, [])
                    old_vouts.append(vout)
                    unspent_txs[tx] = old_vouts
            if not tx.is_coinbase():
                for vin in tx.vins:
                    if vin.can_be_unlocked_with(address):
                        txid_vouts = spent_txos.get(txid, [])
                        txid_vouts.append(vin.vout)
                        spent_txos[vin.txid] = txid_vouts
    return unspent_txs

這個函數找到有未花費輸出的交易。由於交易被保存在區塊中，所以它會對區塊鏈裡面的每一個區塊進行迭代，檢查裡面的每一筆交易。截止 2017 年 9 月 18 日，在比特幣中已經有 485，860 個塊，整個數據庫所需磁盤空間超過 140 Gb。這意味著一個人如果想要驗證交易，必須要運行一個全節點。此外，驗證交易將會需要在許多塊上進行迭代。
整個問題的解決方案是有一個僅有未花費輸出的索引，這就是 UTXO 集要做的事情：這是一個從所有區塊鏈交易中構建（對區塊進行迭代，但是隻須做一次）而來的緩存，然後用它來計算餘額和驗證新的交易。截止 2017 年 9 月，UTXO 集大概有 2.7 Gb。

好瞭，讓我們來想一下實現 UTXO 集的話需要作出哪些改變。目前，找到交易用到瞭以下一些方法：

Blockchain._find_unspent_transactions – 找到有未花費輸出交易的主要函數。也是在這個函數裡面會對所有區塊進行迭代。
Blockchain._find_spendable_outputs – 這個函數用於當一個新的交易創建的時候。如果找到有所需數量的輸出。使用 Blockchain._find_unspent_transactions.
Blockchain.find_UTXO – 找到一個公鑰哈希的未花費輸出，然後用來獲取餘額。使用 Blockchain._find_unspent_transactions.
Blockchain.FindTransation – 根據 ID 在區塊鏈中找到一筆交易。它會在所有塊上進行迭代直到找到它。

可以看到，所有方法都對數據庫中的所有塊進行迭代。但是目前我們還沒有改進所有方法，因為 UTXO 集沒法存儲所有交易，隻會存儲那些有未花費輸出的交易。因此，它無法用於 Blockchain.FindTransaction。

所以，我們想要以下方法：

Blockchain.find_UTXO – 通過對區塊進行迭代找到所有未花費輸出。
UTXOSet.reindex – 使用 UTXO 找到未花費輸出，然後在數據庫中進行存儲。這裡就是緩存的地方。
UTXOSet._find_spendable_outputs – 類似 Blockchain._find_spendable_outputs，但是使用 UTXO 集。
UTXOSet.find_UTXO – 類似 Blockchain.find_UTXO，但是使用 UTXO 集。
Blockchain.find_transaction 跟之前一樣。

因此，從現在開始，兩個最常用的函數將會使用 cache！來開始寫代碼吧。

class UTXOSet(Singleton):
    FLAG = 'UTXO'
    def __init__(self, db_url='http://127.0.0.1:5984'):
        self.db = DB(db_url)

這裡使用一個FLAG來區分普通區塊和UTXO。

def reindex(self, bc):
    key = self.FLAG + "l"
    last_block = bc.get_last_block()
    if key not in self.db:
        utxos = bc.find_UTXO()
        for txid, index_vouts in utxos.items():
            key = self.FLAG + txid
            # outs = []
            for index_vout in index_vouts:
                vout = index_vout[1]
                index = index_vout[0]
                vout_dict = vout.serialize()
                vout_dict.update({"index": index})
                tmp_key = key + "-"+str(index)
                try:
                    self.db.create(tmp_key, vout_dict)
                except ResourceConflict as e:
                    print(e)
        if not last_block:
            return
        self.set_last_height(last_block.block_header.height)
    else:
        utxo_last_height = self.get_last_height()
        last_block_height = last_block.block_header.height
        for i in range(utxo_last_height, last_block_height):
            block = bc.get_block_by_height(i)
            self.update(block)

這個方法首先判斷是否已經構建過UTXO集，如果沒有構建過就從頭開始構建UTXO集，如果已經構建過瞭，就把當前UTXO的區塊至最新的區塊進行更新。
Blockchain.FindUTXO 幾乎跟 Blockchain.FindUnspentTransactions 一模一樣，但是現在它返回瞭一個 TransactionID -> TransactionOutputs 的 map。

現在，UTXO 集可以用於發送幣：

def find_spendable_outputs(self, address, amount):
    utxos = self.find_utxo(address)
    accumulated = 0
    spendable_utxos = []
    for ftxo in utxos:
        output = ftxo.txoutput
        accumulated += output.value
        spendable_utxos.append(ftxo)
        if accumulated >= amount:
            break
    return accumulated, spendable_utxos

或者檢查餘額：

def find_utxo(self, address):
    query = {
        "selector": {
            "_id": {
                "$regex": "^UTXO"
            },
            "pub_key_hash": address
        }
    }
    docs = self.db.find(query)
    utxos = []
    for doc in docs:
        index = doc.get("index", None)
        if index is None:
            continue
        doc_id = doc.id
        txid_index_str = doc_id.replace(self.FLAG, "")
        _flag_index = txid_index_str.find("-")
        txid = txid_index_str[:_flag_index]
        ftxo = FullTXOutput(txid, TXOutput.deserialize(doc), index)
        utxos.append(ftxo)
    return utxos

有瞭 UTXO 集，也就意味著我們的數據（交易）現在已經被分開存儲：實際交易被存儲在區塊鏈中，未花費輸出被存儲在 UTXO 集中。這樣一來，我們就需要一個良好的同步機制，因為我們想要 UTXO 集時刻處於最新狀態，並且存儲最新交易的輸出。但是我們不想每生成一個新塊，就重新生成索引，因為這正是我們要極力避免的頻繁區塊鏈掃描。因此，我們需要一個機制來更新 UTXO 集：

def update(self, block):
    for tx in block.transactions:
        txid = tx.txid
        key = self.FLAG + txid
        # add uxto
        for vout_index, vout in enumerate(tx.vouts):
            vout_dict = vout.serialize()
            vout_dict.update({"index": vout_index})
            tmp_key = key + "-" +str(vout_index)
            try:
                self.db.create(tmp_key, vout_dict)
            except ResourceConflict as e:
                print(e)
        # vins delete used utxo
        for vin in tx.vins:
            vin_txid = vin.txid
            key = self.FLAG + vin_txid + "-" +str(vin.vout)
            doc = self.db.get(key)
            if not doc:
                continue
            try:
                self.db.delete(doc)
            except ResourceNotFound as e:
                print(e)
    self.set_last_height(block.block_header.height)

雖然這個方法看起來有點復雜，但是它所要做的事情非常直觀。當挖出一個新塊時，應該更新 UTXO 集。更新意味著移除已花費輸出，並從新挖出來的交易中加入未花費輸出。如果一筆交易的輸出被移除，並且不再包含任何輸出，那麼這筆交易也應該被移除。相當簡單！

# 創建創世塊
$python3 main.py
<wallet.Wallet object at 0x0000010AED8276A0> <wallet.Wallet object at 0x0000010AED827940>
19RUj6zvbrAXNnEtkuric5pYQJTkZy57nc 17AEyyKbeoEbfMa3jS8Uji6tVG37DrTJN9
Mining a new block
Found nonce == 53ash_hex == 0adfd71d90955ad9219871d8abe03ae83ef9f1f13f9a141ef6ca0ce2d16c93af
('conflict', 'Document update conflict.')
Block(_block_header=BlockHeader(timestamp='1551246051.6814992', hash_merkle_root='1f6cf2e68e8ab0dda1cc1550f85b4df85b83db3cc3af262b26a5a306121725be', prev_block_hash='', hash='ef20a87f2edc8589e813be60d534e736f51c45a3ec94e1918c18bce057afc89d', nonce=None, height=0))
Block(_block_header=BlockHeader(timestamp='1551246052.0582814', hash_merkle_root='3cf2c8514fdaac0cb2b6502f72cf267bcf9966042be28ee48eff61e4695a90f2', prev_block_hash='ef20a87f2edc8589e813be60d534e736f51c45a3ec94e1918c18bce057afc89d', hash='b0bdedf26575722a7efdf94db7dfa60c1c4dfe1483529ff04dd553d6828de718', nonce=53, height=1))
# 轉賬
$python3 cli.py send --from 19RUj6zvbrAXNnEtkuric5pYQJTkZy57nc --to 17AEyyKbeoEbfMa3jS8Uji6tVG37DrTJN9 --amount 10
Mining a new block
Found nonce == 20ash_hex == 07e91245d4e66b66279224980b0325c37d2f2e54a75402bdcd8fe55346cb3dcb
send 10 from 19RUj6zvbrAXNnEtkuric5pYQJTkZy57nc to 17AEyyKbeoEbfMa3jS8Uji6tVG37DrTJN9
# 查詢餘額
$python3 cli.py balance 19RUj6zvbrAXNnEtkuric5pYQJTkZy57nc
19RUj6zvbrAXNnEtkuric5pYQJTkZy57nc balance is 1980

一切工作正常， 19RUj6zvbrAXNnEtkuric5pYQJTkZy57nc收到瞭創世塊和轉賬的獎勵2000個，轉賬瞭兩次一共使用瞭20個，剩餘1980個。

Merkle 樹

在這篇文章中，我還想要再討論一個優化機制。

上如上面所提到的，完整的比特幣數據庫（也就是區塊鏈）需要超過 140 Gb 的磁盤空間。因為比特幣的去中心化特性，網絡中的每個節點必須是獨立，自給自足的，也就是每個節點必須存儲一個區塊鏈的完整副本。隨著越來越多的人使用比特幣，這條規則變得越來越難以遵守：因為不太可能每個人都去運行一個全節點。並且，由於節點是網絡中的完全參與者，它們負有相關責任：節點必須驗證交易和區塊。另外，要想與其他節點交互和下載新塊，也有一定的網絡流量需求。

在中本聰的比特幣原始論文中，對這個問題也有一個解決方案：簡易支付驗證（Simplified Payment Verification, SPV）。SPV 是一個比特幣輕節點，它不需要下載整個區塊鏈，也不需要驗證區塊和交易。相反，它會在區塊鏈查找交易（為瞭驗證支付），並且需要連接到一個全節點來檢索必要的數據。這個機制允許在僅運行一個全節點的情況下有多個輕錢包。

為瞭實現 SPV，需要有一個方式來檢查是否一個區塊包含瞭某筆交易，而無須下載整個區塊。這就是 Merkle 樹所要完成的事情。

比特幣用 Merkle 樹來獲取交易哈希，哈希被保存在區塊頭中，並會用於工作量證明系統。到目前為止，我們隻是將一個塊裡面的每筆交易哈希連接瞭起來，將在上面應用瞭 SHA-256 算法。雖然這是一個用於獲取區塊交易唯一表示的一個不錯的途徑，但是它沒有利用到 Merkle 樹。

來看一下 Merkle 樹：

每個塊都會有一個 Merkle 樹，它從葉子節點（樹的底部）開始，一個葉子節點就是一個交易哈希（比特幣使用雙 SHA256 哈希）。葉子節點的數量如果不是雙數，就隻取單個數據的hash。

從下往上，兩兩成對，連接兩個節點哈希，將組合哈希作為新的哈希。新的哈希就成為新的樹節點。重復該過程，直到僅有一個節點，也就是樹根。根哈希然後就會當做是整個塊交易的唯一標示，將它保存到區塊頭，然後用於工作量證明。

Merkle 樹的好處就是一個節點可以在不下載整個塊的情況下，驗證是否包含某筆交易。並且這些隻需要一個交易哈希，一個 Merkle 樹根哈希和一個 Merkle 路徑。

這部分的描述和https://github.com/liuchengxu/blockchain-tutorial/blob/master/content/part-6/transactions-2.md描述有所不同，

因為存在葉子節點為雙數，但是第二層為單數的情況，會導致原版代碼出現索引越界的情況。這部分的描述參考http://shouce.jb51.net/blockchain_guide/crypto/merkle_trie.html

實現代碼如下：

class MerkleNode(object):
    def __init__(self, left_node, right_node, data):
        self.left = left_node
        self.right = right_node
        if not self.left and not self.right:
            self.data = sum256_hex(data)
        else:
            data = self.left.data + self.right.data
            self.data = sum256_hex(data)
class MerkleTree(object):
    def __init__(self, datas):
        nodes = []
        for data_item in datas:
            node = MerkleNode(None, None, data_item)
            nodes.append(node)
        for _ in range(len(datas)//2):
            new_level = []
            for j in range(0, len(nodes), 2):
                if j + 1 >= len(nodes):
                    node = MerkleNode(nodes[j], "", None)
                else:
                    node = MerkleNode(nodes[j], nodes[j+1], None)
                new_level.append(node)
            nodes = new_level
        self.root_node = nodes[0]
    @property
    def root_hash(self):
        return self.root_node.data

如果最後隻有單個節點，那麼就將另一個數據置空，隻計算一個數據的哈希。

if j + 1 >= len(nodes):
    node = MerkleNode(nodes[j], "", None)

根節點的data域就是哈希。

@property
def root_hash(self):
    return self.root_node.data

P2PKH

還有一件事情，我想要再談一談。

大傢應該還記得，在比特幣中有一個 *腳本（Script）*編程語言，它用於鎖定交易輸出；交易輸入提供瞭解鎖輸出的數據。這個語言非常簡單，用這個語言寫的代碼其實就是一系列數據和操作符而已。比如如下示例：

5 2 OP_ADD 7 OP_EQUAL

5, 2, 和 7 是數據，OP_ADD 和 OP_EQUAL 是操作符。腳本代碼從左到右執行：將數據依次放入棧內，當遇到操作符時，就從棧內取出數據，並將操作符作用於數據，然後將結果作為棧頂元素。腳本的棧，實際上就是一個先進後出的內存存儲：棧裡的第一個元素最後一個取出，後面的每一個元素都會放到前一個元素之上。

讓我們來對上面的腳本分部執行：

步驟	棧	腳本	說明
1	空	5 2 OP_ADD 7 OP_EQUAL	一開始棧為空
2	5	2 OP_ADD 7 OP_EQUAL	從腳本裡面取出 5 放入棧上
3	5 2	OP_ADD 7 OP_EQUAL	從腳本裡面取出 2 放入棧上
4	7	7 OP_EQUAL	遇到操作符 OP_ADD, 從棧裡取出兩個操作數 5 和 2，相加後將結果放回棧上
5	7 7	OP_EQUAL	從腳本裡面取出 7 放到棧上
6	true	空	遇到操作符 OP_EQUAL，從棧裡取出兩個操作數並比較，將比較的結果放回棧內，腳本執行完畢，為空

OP_ADD 從棧內取兩個元素，將這兩個元素進行相加，然後將結果重新放回棧內。OP_EQUAL 從棧內取兩個元素，然後對這兩個元素進行比較：如果它們相等，就在棧上放一個 true，否則放一個 false。腳本執行的結果就是棧頂元素：在我們的案例中，如果是 true，那麼表明腳本執行成功。

現在來看一下在比特幣中，是如何用腳本執行支付的：

<signature> <pubKey> OP_DUP OP_HASH160 <pubKeyHash> OP_EQUALVERIFY OP_CHECKSIG

這個腳本叫做 Pay to Public Key Hash(P2PKH)，這是比特幣最常用的一個腳本。它所做的事情就是向一個公鑰哈希支付，也就是說，用某一個公鑰鎖定一些幣。這是比特幣支付的核心：沒有賬戶，沒有資金轉移；隻有一個腳本檢查提供的簽名和公鑰是否正確。

這個腳本實際存儲為兩個部分：

第一個部分，<signature> <pubkey>，存儲在輸入的 ScriptSig 字段。

第二部分，OP_DUP OP_HASH160 <pubkeyHash> OP_EQUALVERYFY OP_CHECKSIG 存儲在輸出的 ScriptPubKey 裡面。

因此，輸出定瞭解鎖的邏輯，輸入提供解鎖輸出的“鑰匙”。然我們來執行一下這個腳本：

步驟	棧	腳本
1	空	<signature> <pubKey> OP_DUP OP_HASH160 <pubKeyHash> OP_EQUALVERIFY OP_CHECKSIG
2	<signature>	<pubKey> OP_DUP OP_HASH160 <pubKeyHash> OP_EQUALVERIFY OP_CHECKSIG
3	<signature> <pubkey>	OP_DUP OP_HASH160 <pubKeyHash> OP_EQUALVERIFY OP_CHECKSIG
4	<signature> <pubKey> <pubKey>	OP_HASH160 <pubKeyHash> OP_EQUALVERIFY OP_CHECKSIG
5	<signature> <pubKey> <pubKeyHash>	<pubKeyHash> OP_EQUALVERIFY OP_CHECKSIG
6	<signature> <pubKey> <pubKeyHash> <pubKeyHash>	OP_EQUALVERIFY OP_CHECKSIG
7	<signature> <pubKey>	OP_CHECKSIG
8	true 或 false	空

OP_DUP 對棧頂元素進行復制。OP_HASH160 取棧頂元素，然後用 RIPEMD160 對它進行哈希，再將結果送回到棧上。OP_EQUALVERIFY 將棧頂的兩個元素進行比較，如果它們不相等，終止腳本。OP_CHECKSIG 通過對交易進行哈希，並使用 <signature> 和 pubKey 來驗證一筆交易的簽名。最後的操作符有點復雜：它生成瞭一個修剪後的交易副本，對它進行哈希（因為它是一個被簽名後的交易哈希），然後使用提供的 <signature> 和 pubKey 檢查簽名是否正確。

有瞭一個這樣的腳本語言，實際上也可以讓比特幣成為一個智能合約平臺：除瞭將一個單一的公鑰轉移資金，這個語言還使得一些其他的支付方案成為可能。

總結

參考：

[1] transactions2

[2] 本節完整實現源碼

這就是今天的全部內容瞭！我們已經實現瞭一個基於區塊鏈的加密貨幣的幾乎所有關鍵特性。我們已經有瞭區塊鏈，地址，挖礦和交易。我們還缺少網絡讓所有的節點聯合起來，更多關於python區塊鏈挖礦獎勵交易的資料請關註WalkonNet其它相關文章！

python區塊鏈簡易版交易完善挖礦獎勵示例

目錄

說明

引言

獎勵

UTXO 集

Merkle 樹

P2PKH

總結

推薦閱讀：

發佈留言取消回覆

近期文章

目錄

說明

引言

獎勵

UTXO 集

Merkle 樹

P2PKH

總結

推薦閱讀：

發佈留言 取消回覆

近期文章

標籤

發佈留言取消回覆