python區塊鏈簡易版交易完善挖礦獎勵示例
說明
本文根據https://github.com/liuchengxu/blockchain-tutorial的內容,用python實現的,但根據個人的理解進行瞭一些修改,大量引用瞭原文的內容。文章末尾有"本節完整源碼實現地址"。
引言
在這個系列文章的一開始,我們就提到瞭,區塊鏈是一個分佈式數據庫。不過在之前的文章中,我們選擇性地跳過瞭“分佈式”這個部分,而是將註意力都放到瞭“數據庫”部分。到目前為止,我們幾乎已經實現瞭一個區塊鏈數據庫的所有元素。今天,我們將會分析之前跳過的一些機制。而在下一篇文章中,我們將會開始討論區塊鏈的分佈式特性。
獎勵
在上一篇文章中,我們略過的一個小細節是挖礦獎勵。現在,我們已經可以來完善這個細節瞭。
挖礦獎勵,實際上就是一筆 coinbase 交易。當一個挖礦節點開始挖出一個新塊時,它會將交易從隊列中取出,並在前面附加一筆 coinbase 交易。coinbase 交易隻有一個輸出,裡面包含瞭礦工的公鑰哈希。
實現獎勵,非常簡單,更新 send 即可:
def add_block(self, transactions): """ add a block to block_chain """ last_block = self.get_last_block() prev_hash = last_block.get_header_hash() height = last_block.block_header.height + 1 block_header = BlockHeader('', height, prev_hash) # reward to wallets[0] wallets = Wallets() keys = list(wallets.wallets.keys()) w = wallets[keys[0]] coin_base_tx = self.coin_base_tx(w.address) transactions.insert(0, coin_base_tx) block = Block(block_header, transactions) block.mine(self) block.set_header_hash() self.db.create(block.block_header.hash, block.serialize()) last_hash = block.block_header.hash self.set_last_hash(last_hash) utxo = UTXOSet() utxo.update(block)
獎勵給當前錢包的第一個地址。
UTXO 集
在 Part 3: 持久化和命令行接口 中,我們研究瞭 Bitcoin Core 是如何在一個數據庫中存儲塊的,並且瞭解到區塊被存儲在 blocks 數據庫,交易輸出被存儲在 chainstate 數據庫。會回顧一下 chainstate 的機構:
c + 32 字節的交易哈希 -> 該筆交易的未花費交易輸出記錄
B + 32 字節的塊哈希 -> 未花費交易輸出的塊哈希
在之前那篇文章中,雖然我們已經實現瞭交易,但是並沒有使用 chainstate 來存儲交易的輸出。所以,接下來我們繼續完成這部分。
chainstate 不存儲交易。它所存儲的是 UTXO 集,也就是未花費交易輸出的集合。除此以外,它還存儲瞭“數據庫表示的未花費交易輸出的塊哈希”,不過我們會暫時略過塊哈希這一點,因為我們還沒有用到塊高度(但是我們會在接下來的文章中繼續改進)。
那麼,我們為什麼需要 UTXO 集呢?
來思考一下我們早先實現的 Blockchain._find_unspent_transactions 方法:
def _find_unspent_transactions(self, address): """ Find all unspent transactions """ spent_txos = {} unspent_txs = {} last_block = self.get_last_block() last_height = last_block.block_header.height # Reverse for height in range(last_height, -1, -1): block = self.get_block_by_height(height) for tx in block.transactions: txid = tx.txid # all outputs for vout_index, vout in enumerate(tx.vouts): txos = spent_txos.get(txid, []) # vout_index is spent if vout_index in txos: continue if vout.can_unlock_output_with(address): old_vouts = unspent_txs.get(tx, []) old_vouts.append(vout) unspent_txs[tx] = old_vouts if not tx.is_coinbase(): for vin in tx.vins: if vin.can_be_unlocked_with(address): txid_vouts = spent_txos.get(txid, []) txid_vouts.append(vin.vout) spent_txos[vin.txid] = txid_vouts return unspent_txs
這個函數找到有未花費輸出的交易。由於交易被保存在區塊中,所以它會對區塊鏈裡面的每一個區塊進行迭代,檢查裡面的每一筆交易。截止 2017 年 9 月 18 日,在比特幣中已經有 485,860 個塊,整個數據庫所需磁盤空間超過 140 Gb。這意味著一個人如果想要驗證交易,必須要運行一個全節點。此外,驗證交易將會需要在許多塊上進行迭代。
整個問題的解決方案是有一個僅有未花費輸出的索引,這就是 UTXO 集要做的事情:這是一個從所有區塊鏈交易中構建(對區塊進行迭代,但是隻須做一次)而來的緩存,然後用它來計算餘額和驗證新的交易。截止 2017 年 9 月,UTXO 集大概有 2.7 Gb。
好瞭,讓我們來想一下實現 UTXO 集的話需要作出哪些改變。目前,找到交易用到瞭以下一些方法:
- Blockchain._find_unspent_transactions – 找到有未花費輸出交易的主要函數。也是在這個函數裡面會對所有區塊進行迭代。
- Blockchain._find_spendable_outputs – 這個函數用於當一個新的交易創建的時候。如果找到有所需數量的輸出。使用 Blockchain._find_unspent_transactions.
- Blockchain.find_UTXO – 找到一個公鑰哈希的未花費輸出,然後用來獲取餘額。使用 Blockchain._find_unspent_transactions.
- Blockchain.FindTransation – 根據 ID 在區塊鏈中找到一筆交易。它會在所有塊上進行迭代直到找到它。
可以看到,所有方法都對數據庫中的所有塊進行迭代。但是目前我們還沒有改進所有方法,因為 UTXO 集沒法存儲所有交易,隻會存儲那些有未花費輸出的交易。因此,它無法用於 Blockchain.FindTransaction。
所以,我們想要以下方法:
- Blockchain.find_UTXO – 通過對區塊進行迭代找到所有未花費輸出。
- UTXOSet.reindex – 使用 UTXO 找到未花費輸出,然後在數據庫中進行存儲。這裡就是緩存的地方。
- UTXOSet._find_spendable_outputs – 類似 Blockchain._find_spendable_outputs,但是使用 UTXO 集。
- UTXOSet.find_UTXO – 類似 Blockchain.find_UTXO,但是使用 UTXO 集。
- Blockchain.find_transaction 跟之前一樣。
因此,從現在開始,兩個最常用的函數將會使用 cache!來開始寫代碼吧。
class UTXOSet(Singleton): FLAG = 'UTXO' def __init__(self, db_url='http://127.0.0.1:5984'): self.db = DB(db_url)
這裡使用一個FLAG來區分普通區塊和UTXO。
def reindex(self, bc): key = self.FLAG + "l" last_block = bc.get_last_block() if key not in self.db: utxos = bc.find_UTXO() for txid, index_vouts in utxos.items(): key = self.FLAG + txid # outs = [] for index_vout in index_vouts: vout = index_vout[1] index = index_vout[0] vout_dict = vout.serialize() vout_dict.update({"index": index}) tmp_key = key + "-"+str(index) try: self.db.create(tmp_key, vout_dict) except ResourceConflict as e: print(e) if not last_block: return self.set_last_height(last_block.block_header.height) else: utxo_last_height = self.get_last_height() last_block_height = last_block.block_header.height for i in range(utxo_last_height, last_block_height): block = bc.get_block_by_height(i) self.update(block)
這個方法首先判斷是否已經構建過UTXO集,如果沒有構建過就從頭開始構建UTXO集,如果已經構建過瞭,就把當前UTXO的區塊至最新的區塊進行更新。
Blockchain.FindUTXO 幾乎跟 Blockchain.FindUnspentTransactions 一模一樣,但是現在它返回瞭一個 TransactionID -> TransactionOutputs 的 map。
現在,UTXO 集可以用於發送幣:
def find_spendable_outputs(self, address, amount): utxos = self.find_utxo(address) accumulated = 0 spendable_utxos = [] for ftxo in utxos: output = ftxo.txoutput accumulated += output.value spendable_utxos.append(ftxo) if accumulated >= amount: break return accumulated, spendable_utxos
或者檢查餘額:
def find_utxo(self, address): query = { "selector": { "_id": { "$regex": "^UTXO" }, "pub_key_hash": address } } docs = self.db.find(query) utxos = [] for doc in docs: index = doc.get("index", None) if index is None: continue doc_id = doc.id txid_index_str = doc_id.replace(self.FLAG, "") _flag_index = txid_index_str.find("-") txid = txid_index_str[:_flag_index] ftxo = FullTXOutput(txid, TXOutput.deserialize(doc), index) utxos.append(ftxo) return utxos
有瞭 UTXO 集,也就意味著我們的數據(交易)現在已經被分開存儲:實際交易被存儲在區塊鏈中,未花費輸出被存儲在 UTXO 集中。這樣一來,我們就需要一個良好的同步機制,因為我們想要 UTXO 集時刻處於最新狀態,並且存儲最新交易的輸出。但是我們不想每生成一個新塊,就重新生成索引,因為這正是我們要極力避免的頻繁區塊鏈掃描。因此,我們需要一個機制來更新 UTXO 集:
def update(self, block): for tx in block.transactions: txid = tx.txid key = self.FLAG + txid # add uxto for vout_index, vout in enumerate(tx.vouts): vout_dict = vout.serialize() vout_dict.update({"index": vout_index}) tmp_key = key + "-" +str(vout_index) try: self.db.create(tmp_key, vout_dict) except ResourceConflict as e: print(e) # vins delete used utxo for vin in tx.vins: vin_txid = vin.txid key = self.FLAG + vin_txid + "-" +str(vin.vout) doc = self.db.get(key) if not doc: continue try: self.db.delete(doc) except ResourceNotFound as e: print(e) self.set_last_height(block.block_header.height)
雖然這個方法看起來有點復雜,但是它所要做的事情非常直觀。當挖出一個新塊時,應該更新 UTXO 集。更新意味著移除已花費輸出,並從新挖出來的交易中加入未花費輸出。如果一筆交易的輸出被移除,並且不再包含任何輸出,那麼這筆交易也應該被移除。相當簡單!
# 創建創世塊 $python3 main.py <wallet.Wallet object at 0x0000010AED8276A0> <wallet.Wallet object at 0x0000010AED827940> 19RUj6zvbrAXNnEtkuric5pYQJTkZy57nc 17AEyyKbeoEbfMa3jS8Uji6tVG37DrTJN9 Mining a new block Found nonce == 53ash_hex == 0adfd71d90955ad9219871d8abe03ae83ef9f1f13f9a141ef6ca0ce2d16c93af ('conflict', 'Document update conflict.') Block(_block_header=BlockHeader(timestamp='1551246051.6814992', hash_merkle_root='1f6cf2e68e8ab0dda1cc1550f85b4df85b83db3cc3af262b26a5a306121725be', prev_block_hash='', hash='ef20a87f2edc8589e813be60d534e736f51c45a3ec94e1918c18bce057afc89d', nonce=None, height=0)) Block(_block_header=BlockHeader(timestamp='1551246052.0582814', hash_merkle_root='3cf2c8514fdaac0cb2b6502f72cf267bcf9966042be28ee48eff61e4695a90f2', prev_block_hash='ef20a87f2edc8589e813be60d534e736f51c45a3ec94e1918c18bce057afc89d', hash='b0bdedf26575722a7efdf94db7dfa60c1c4dfe1483529ff04dd553d6828de718', nonce=53, height=1)) # 轉賬 $python3 cli.py send --from 19RUj6zvbrAXNnEtkuric5pYQJTkZy57nc --to 17AEyyKbeoEbfMa3jS8Uji6tVG37DrTJN9 --amount 10 Mining a new block Found nonce == 20ash_hex == 07e91245d4e66b66279224980b0325c37d2f2e54a75402bdcd8fe55346cb3dcb send 10 from 19RUj6zvbrAXNnEtkuric5pYQJTkZy57nc to 17AEyyKbeoEbfMa3jS8Uji6tVG37DrTJN9 # 查詢餘額 $python3 cli.py balance 19RUj6zvbrAXNnEtkuric5pYQJTkZy57nc 19RUj6zvbrAXNnEtkuric5pYQJTkZy57nc balance is 1980
一切工作正常, 19RUj6zvbrAXNnEtkuric5pYQJTkZy57nc收到瞭創世塊和轉賬的獎勵2000個,轉賬瞭兩次一共使用瞭20個,剩餘1980個。
Merkle 樹
在這篇文章中,我還想要再討論一個優化機制。
上如上面所提到的,完整的比特幣數據庫(也就是區塊鏈)需要超過 140 Gb 的磁盤空間。因為比特幣的去中心化特性,網絡中的每個節點必須是獨立,自給自足的,也就是每個節點必須存儲一個區塊鏈的完整副本。隨著越來越多的人使用比特幣,這條規則變得越來越難以遵守:因為不太可能每個人都去運行一個全節點。並且,由於節點是網絡中的完全參與者,它們負有相關責任:節點必須驗證交易和區塊。另外,要想與其他節點交互和下載新塊,也有一定的網絡流量需求。
在中本聰的 比特幣原始論文 中,對這個問題也有一個解決方案:簡易支付驗證(Simplified Payment Verification, SPV)。SPV 是一個比特幣輕節點,它不需要下載整個區塊鏈,也不需要驗證區塊和交易。相反,它會在區塊鏈查找交易(為瞭驗證支付),並且需要連接到一個全節點來檢索必要的數據。這個機制允許在僅運行一個全節點的情況下有多個輕錢包。
為瞭實現 SPV,需要有一個方式來檢查是否一個區塊包含瞭某筆交易,而無須下載整個區塊。這就是 Merkle 樹所要完成的事情。
比特幣用 Merkle 樹來獲取交易哈希,哈希被保存在區塊頭中,並會用於工作量證明系統。到目前為止,我們隻是將一個塊裡面的每筆交易哈希連接瞭起來,將在上面應用瞭 SHA-256 算法。雖然這是一個用於獲取區塊交易唯一表示的一個不錯的途徑,但是它沒有利用到 Merkle 樹。
來看一下 Merkle 樹:
每個塊都會有一個 Merkle 樹,它從葉子節點(樹的底部)開始,一個葉子節點就是一個交易哈希(比特幣使用雙 SHA256 哈希)。葉子節點的數量如果不是雙數,就隻取單個數據的hash。
從下往上,兩兩成對,連接兩個節點哈希,將組合哈希作為新的哈希。新的哈希就成為新的樹節點。重復該過程,直到僅有一個節點,也就是樹根。根哈希然後就會當做是整個塊交易的唯一標示,將它保存到區塊頭,然後用於工作量證明。
Merkle 樹的好處就是一個節點可以在不下載整個塊的情況下,驗證是否包含某筆交易。並且這些隻需要一個交易哈希,一個 Merkle 樹根哈希和一個 Merkle 路徑。
這部分的描述和https://github.com/liuchengxu/blockchain-tutorial/blob/master/content/part-6/transactions-2.md描述有所不同,
因為存在葉子節點為雙數,但是第二層為單數的情況,會導致原版代碼出現索引越界的情況。這部分的描述參考http://shouce.jb51.net/blockchain_guide/crypto/merkle_trie.html
實現代碼如下:
class MerkleNode(object): def __init__(self, left_node, right_node, data): self.left = left_node self.right = right_node if not self.left and not self.right: self.data = sum256_hex(data) else: data = self.left.data + self.right.data self.data = sum256_hex(data) class MerkleTree(object): def __init__(self, datas): nodes = [] for data_item in datas: node = MerkleNode(None, None, data_item) nodes.append(node) for _ in range(len(datas)//2): new_level = [] for j in range(0, len(nodes), 2): if j + 1 >= len(nodes): node = MerkleNode(nodes[j], "", None) else: node = MerkleNode(nodes[j], nodes[j+1], None) new_level.append(node) nodes = new_level self.root_node = nodes[0] @property def root_hash(self): return self.root_node.data
如果最後隻有單個節點,那麼就將另一個數據置空,隻計算一個數據的哈希。
if j + 1 >= len(nodes): node = MerkleNode(nodes[j], "", None)
根節點的data域就是哈希。
@property def root_hash(self): return self.root_node.data
P2PKH
還有一件事情,我想要再談一談。
大傢應該還記得,在比特幣中有一個 *腳本(Script)*編程語言,它用於鎖定交易輸出;交易輸入提供瞭解鎖輸出的數據。這個語言非常簡單,用這個語言寫的代碼其實就是一系列數據和操作符而已。比如如下示例:
5 2 OP_ADD 7 OP_EQUAL
5, 2, 和 7 是數據,OP_ADD 和 OP_EQUAL 是操作符。腳本代碼從左到右執行:將數據依次放入棧內,當遇到操作符時,就從棧內取出數據,並將操作符作用於數據,然後將結果作為棧頂元素。腳本的棧,實際上就是一個先進後出的內存存儲:棧裡的第一個元素最後一個取出,後面的每一個元素都會放到前一個元素之上。
讓我們來對上面的腳本分部執行:
步驟 | 棧 | 腳本 | 說明 |
---|---|---|---|
1 | 空 | 5 2 OP_ADD 7 OP_EQUAL | 一開始棧為空 |
2 | 5 | 2 OP_ADD 7 OP_EQUAL | 從腳本裡面取出 5 放入棧上 |
3 | 5 2 | OP_ADD 7 OP_EQUAL | 從腳本裡面取出 2 放入棧上 |
4 | 7 | 7 OP_EQUAL | 遇到操作符 OP_ADD, 從棧裡取出兩個操作數 5 和 2,相加後將結果放回棧上 |
5 | 7 7 | OP_EQUAL | 從腳本裡面取出 7 放到棧上 |
6 | true | 空 | 遇到操作符 OP_EQUAL,從棧裡取出兩個操作數並比較,將比較的結果放回棧內,腳本執行完畢,為空 |
OP_ADD 從棧內取兩個元素,將這兩個元素進行相加,然後將結果重新放回棧內。OP_EQUAL 從棧內取兩個元素,然後對這兩個元素進行比較:如果它們相等,就在棧上放一個 true,否則放一個 false。腳本執行的結果就是棧頂元素:在我們的案例中,如果是 true,那麼表明腳本執行成功。
現在來看一下在比特幣中,是如何用腳本執行支付的:
<signature> <pubKey> OP_DUP OP_HASH160 <pubKeyHash> OP_EQUALVERIFY OP_CHECKSIG
這個腳本叫做 Pay to Public Key Hash(P2PKH),這是比特幣最常用的一個腳本。它所做的事情就是向一個公鑰哈希支付,也就是說,用某一個公鑰鎖定一些幣。這是比特幣支付的核心:沒有賬戶,沒有資金轉移;隻有一個腳本檢查提供的簽名和公鑰是否正確。
這個腳本實際存儲為兩個部分:
第一個部分,<signature> <pubkey>,存儲在輸入的 ScriptSig 字段。
第二部分,OP_DUP OP_HASH160 <pubkeyHash> OP_EQUALVERYFY OP_CHECKSIG 存儲在輸出的 ScriptPubKey 裡面。
因此,輸出定瞭解鎖的邏輯,輸入提供解鎖輸出的“鑰匙”。然我們來執行一下這個腳本:
步驟 | 棧 | 腳本 |
---|---|---|
1 | 空 | <signature> <pubKey> OP_DUP OP_HASH160 <pubKeyHash> OP_EQUALVERIFY OP_CHECKSIG |
2 | <signature> | <pubKey> OP_DUP OP_HASH160 <pubKeyHash> OP_EQUALVERIFY OP_CHECKSIG |
3 | <signature> <pubkey> | OP_DUP OP_HASH160 <pubKeyHash> OP_EQUALVERIFY OP_CHECKSIG |
4 | <signature> <pubKey> <pubKey> | OP_HASH160 <pubKeyHash> OP_EQUALVERIFY OP_CHECKSIG |
5 | <signature> <pubKey> <pubKeyHash> | <pubKeyHash> OP_EQUALVERIFY OP_CHECKSIG |
6 | <signature> <pubKey> <pubKeyHash> <pubKeyHash> | OP_EQUALVERIFY OP_CHECKSIG |
7 | <signature> <pubKey> | OP_CHECKSIG |
8 | true 或 false | 空 |
OP_DUP 對棧頂元素進行復制。OP_HASH160 取棧頂元素,然後用 RIPEMD160 對它進行哈希,再將結果送回到棧上。OP_EQUALVERIFY 將棧頂的兩個元素進行比較,如果它們不相等,終止腳本。OP_CHECKSIG 通過對交易進行哈希,並使用 <signature> 和 pubKey 來驗證一筆交易的簽名。最後的操作符有點復雜:它生成瞭一個修剪後的交易副本,對它進行哈希(因為它是一個被簽名後的交易哈希),然後使用提供的 <signature> 和 pubKey 檢查簽名是否正確。
有瞭一個這樣的腳本語言,實際上也可以讓比特幣成為一個智能合約平臺:除瞭將一個單一的公鑰轉移資金,這個語言還使得一些其他的支付方案成為可能。
總結
參考:
[1] transactions2
[2] 本節完整實現源碼
這就是今天的全部內容瞭!我們已經實現瞭一個基於區塊鏈的加密貨幣的幾乎所有關鍵特性。我們已經有瞭區塊鏈,地址,挖礦和交易。我們還缺少網絡讓所有的節點聯合起來,更多關於python區塊鏈挖礦獎勵交易的資料請關註WalkonNet其它相關文章!
推薦閱讀:
- python區塊鏈簡易版交易實現示例
- python區塊鏈基本原型簡版實現示例
- 教你用go語言實現比特幣交易功能(Transaction)
- python區塊鏈持久化和命令行接口實現簡版
- python區塊鏈實現簡版工作量證明