Python 概率生成問題案例詳解

Posted on 2021-09-10 by WalkonNet

概率生成問題

有一枚不均勻的硬幣，要求產生均勻的概率分佈
有一枚均勻的硬幣，要求產生不均勻的概率分佈，如 0.25 和 0.75
利用 Rand7() 實現 Rand10()

不均勻硬幣產生等概率

現有一枚不均勻的硬幣 coin()，能夠返回 0、1 兩個值，其概率分別為 0.6、0.4。要求使用這枚硬幣，產生均勻的概率分佈。即編寫一個函數 coin_new() 使得它返回 0、1 的概率均為 0.5。

# 不均勻硬幣，返回 0、1 的概率分別為 0.6、0.4
def coin():
    return 0 if random.randint(1,10) > 4 else 1

統計拋兩次硬幣的結果的概率分佈：

結果 0 1
0 0.60.6=0.36 0.60.4=0.24
1 0.40.6=0.24 0.40.4=0.16

連續拋兩枚硬幣得到 0 1 和 1 0 的概率分佈是相同的。因此這道題的解法就是連續拋兩次硬幣，如果得到 0 1，返回 0；如果得到 1 0，返回 1；如果兩次結果相同，則重新拋。

以此類推，無論這枚不均勻硬幣的概率是多少，都可以用這種方法得到等概率的結果。

ddef coin_new():
    while True:
        a = coin()
        if coin() != a:  
            return a

完整測試代碼：

def coin():
    return 0 if random.randint(1,10) > 4 else 1

def coin_new():
    while True:
        a = coin()
        if coin() != a:  
            return a
if __name__ == '__main__':
    a = 0
    b = 0
    n = 100000
    for _ in range(n):
        if coin_new():a += 1
        if coin():b += 1

    print(f"1:{a/n},1:{b/n}")

均勻硬幣產生不等概率

現有一枚均勻的硬幣 coin()，能夠返回 0、1 兩個值，其概率均為 0.5。要求編寫一個函數 coin_new()，使得它返回指定的 0、1 概率分佈。

# 均勻硬幣 
def coin():
    return random.randint(0,1)

P(0) = 1/4，P(1) = 3/4

對於均勻硬幣而言，連續拋兩次，得到 0 0、0 1、1 0、1 1 的概率均為 1/4。顯然，隻需要連續拋兩次硬幣，如果得到 0 0，返回 0，其他情況返回 1。

def coin_new():
    return coin() or coin()

P(0) = 1/3，P(1) = 2/3

連續拋兩次硬幣。如果得到 1 1，返回 0；如果得到 1 0 或 0 1，返回 1；如果得到 0 0，繼續拋硬幣。

def coin_new():
    while True:
        a, b = coin(), coin()
        if a & b: return 0
        if a | b: return 1

P(0) = 0.3，P(1) = 0.7

每拋一次硬幣，會得到二進制數的一位，連續拋 4 次硬幣，可以等概率生成 [0, 15] 的每個數，記為 x。去掉 [10, 15]，剩下 [0, 9] 的每個數依然是等概率的。如果 x ∈ [ 0 , 2 ] x \in [0, 2] x∈[0,2]，返回 0； x ∈ [ 4 , 9 ] x \in [4, 9] x∈[4,9]，返回 1； x ≥ 10 x ≥ 10 x≥10，重復上述過程。

def coin_new():
    while True:
        x = 0
        for _ in range(4):
            x = (x << 1) + coin()
        if x <= 2: return 0
        if x <= 9: return 1

總結

每拋一次硬幣，會得到二進制數的一位，連續拋 k 次硬幣，可以等概率生成 [ 0 , 2 k − 1 ] [0, 2^k-1] [0,2k−1] 的每個數在 [ 0 , 2 k − 1 ] [0, 2^k-1] [0,2k−1][ 中，選取 m 個數返回 0，n 個數返回 1，則 0、1 的概率分別為 m m + n \frac{m}{m+n} m+nm 、 n m + n \frac{n}{m+n} m+nn。

關於 k 的選擇，最少需要滿足 N < = 2 k − 1 N <= 2^k-1 N<=2k−1，N 是生成對應概率分佈至少需要多少個不同數字。比如要生成 1/3、2/3 的分佈，至少需要 3 個不同數字，則 N = 3, k = 2；要生成 3/10、7/10 的分佈，至少需要 10 個數字，則 N = 10, k = 4。

k 最多則沒有限制，我們總可以通過拋更多次硬幣來解決問題，隻需要把無用的數字舍棄即可。但我們的目的是盡可能減少無用數字的比例，因為每次遇到無用數字時，都需要重新生成新的數字。

Rand7 生成 Rand10

已有方法 Rand7() 可生成 1 到 7 范圍內的均勻隨機整數，試寫一個方法 Rand10() 生成 1 到 10 范圍內的均勻隨機整數。

拋硬幣可以看作是 Rand2()，均勻生成 0、1 兩個整數。如何根據 Rand2() 生成 Rand10()？將每次拋硬幣的結果，看作二進制的每一位，就可以得到 [ 0 , 2 k − 1 ] [0, 2^k-1] [0,2k−1] 范圍內的均勻隨機整數。隻需要拋 4 次硬幣，就能得到 [0, 15] 范圍的整數。返回 [1, 10] 范圍的整數，其他情況則重新拋硬幣。

def rand10():
    while True:
        x = 0
        for _ in range(4):
            x = x << 1 + rand2()
            
        if 1 <= x <= 10: return x

取 Rand7() – 1 作為對應的 7 進制位。每執行 k 次 Rand7()，將得到一個 k 位的 7 進制整數，在 [ 0 , 7 k − 1 ] [0, 7^k-1] [0,7k−1] 范圍內均勻分佈。

隻需執行 k = 2 次 Rand7()，就可以得到范圍為 [0, 48] 的均勻整數：

當 x ∈ [ 1 , 10 ] x \in [1, 10] x∈[1,10] 時返回 x，否則重新計算：

def rand10():
    while True:
        x = (rand7() - 1) * 7 + (rand7() - 1);
        if 1 <= x <= 10: return x

進一步優化

選擇 [1, 40] 范圍裡的數，通過取餘運算來得到 [1, 10] 范圍的數：

def rand10():
    while True:
        x = (rand7() - 1) * 7 + (rand7() - 1)
        if 1 <= x <= 40:
            return x % 10 + 1

對於上面這 9 個無用數字，計算 x % 40 可以得到 [0, 8] 范圍的均勻隨機整數。此時再調用一次 Rand7()，計算 (x % 40) * 7 + Rand7()，這相當於 Rand9() * 7 + Rand7()。顯然，可以得到 [1, 63] 范圍的均勻隨機整數。這時 [1, 60] 范圍裡的數都可以用來作取餘運算，隻有 61、62、63 共 3 個無用數字：

def rand10():
    while True:
        x = (rand7() - 1) * 7 + (rand7() - 1)
        if 1 <= x <= 40:
            return x % 10 + 1   
            
    	x = (x % 40) * 7 + rand7() # 1~63
    	if x <= 60: return x % 10 + 1

對於 61、62、63，再調用一次 Rand7()，計算 (x – 61) * 7 + Rand7()，相當於 Rand3() * 7 + Rand7()，可以得到 [1, 21] 范圍的均勻隨機整數，這時再作取餘運算，隻有 1 個無用數字（21）：

def rand10():
    while True:
        x = (rand7() - 1) * 7 + (rand7() - 1)
        if 1 <= x <= 40:
            return x % 10 + 1   
            
    	x = (x % 40) * 7 + rand7() # 1~63
    	if x <= 60: return x % 10 + 1

        x = (x - 61) * 7 + 7 # 1~21
        if x <= 20: return x % 10 + 1

每次 while 執行的時候，隻有 1 個無用數字（21）會被舍棄，重新執行的概率很低。

RandM 生成 RandN

已知 RandM() 可以等概率的生成 [0, M-1] 范圍的隨機整數，那麼執行 k 次，每次都得到 M 進制的一位，可以等概率生成 [ 0 , M k − 1 ] [0, M^k-1] [0,Mk−1] 范圍的隨機整數，記為 x。

RandN 至少需要 N 個均勻隨機整數，因此隻需要取 k，使得 M k − 1 > = N M^k-1 >= N Mk−1>=N 即可，此時有多種方式得到 RandN：
一種是隻在 x ∈ [ 0 , N − 1 ] x \in [0, N-1] x∈[0,N−1] 時返回 x，另一種是利用取餘運算，在保證等概率的前提下，盡可能多的利用生成的數字，從而減少舍棄的數字比例，降低 while 重復執行的概率。

到此這篇關於Python 概率生成問題案例詳解的文章就介紹到這瞭,更多相關Python 概率生成問題內容請搜索WalkonNet以前的文章或繼續瀏覽下面的相關文章希望大傢以後多多支持WalkonNet！

Python 概率生成問題案例詳解

概率生成問題

不均勻硬幣產生等概率

均勻硬幣產生不等概率

總結

Rand7 生成 Rand10

進一步優化

RandM 生成 RandN

推薦閱讀：

發佈留言取消回覆

近期文章

概率生成問題

不均勻硬幣 產生等概率

均勻硬幣 產生不等概率

總結

Rand7 生成 Rand10

進一步優化

RandM 生成 RandN

推薦閱讀：

發佈留言 取消回覆

近期文章

標籤

不均勻硬幣產生等概率

均勻硬幣產生不等概率

發佈留言取消回覆