從np.random.normal()到正態分佈的擬合操作

先看偉大的高斯分佈(Gaussian Distribution)的概率密度函數(probability density function):

對應於numpy中:

numpy.random.normal(loc=0.0, scale=1.0, size=None)

參數的意義為:

loc:float

此概率分佈的均值(對應著整個分佈的中心centre)

scale:float

此概率分佈的標準差(對應於分佈的寬度,scale越大越矮胖,scale越小,越瘦高)

size:int or tuple of ints

輸出的shape,默認為None,隻輸出一個值

我們更經常會用到的np.random.randn(size)所謂標準正態分佈

對應於np.random.normal(loc=0, scale=1, size)。

采樣(sampling)

# 從某一分佈(由均值和標準差標識)中獲得樣本
mu, sigma = 0, .1
s = np.random.normal(loc=mu, scale=sigma, size=1000)

也可使用scipy庫中的相關api(這裡的類與函數更符合數理統計中的直覺):

import scipy.stats as st
mu, sigma = 0, .1
s = st.norm(mu, sigma).rvs(1000)

校驗均值和方差:

>>> abs(mu < np.mean(s)) < .01
True
>>> abs(sigma-np.std(s, ddof=1)) < .01
True
            # ddof,delta degrees of freedom,表示自由度
            # 一般取1,表示無偏估計,

擬合

我們看使用matplotlib.pyplot便捷而強大的語法如何進行高斯分佈的擬合:

import matplotlib.pyplot as plt
count, bins, _ = plt.hist(s, 30, normed=True)
        # normed是進行擬合的關鍵
        # count統計某一bin出現的次數,在Normed為True時,可能其值會略有不同
plt.plot(bins, 1./(np.sqrt(2*np.pi)*sigma)*np.exp(-(bins-mu)**2/(2*sigma**2), lw=2, c='r')
plt.show()

或者:

s_fit = np.linspace(s.min(), s.max())
plt.plot(s_fit, st.norm(mu, sigma).pdf(s_fit), lw=2, c='r')

這裡寫圖片描述

np.random.normal()的含義及實例

這是個隨機產生正態分佈的函數。(normal 表正態)

先看一下官方解釋:

有三個參數

loc:正態分佈的均值,對應著這個分佈的中心.代表下圖的μ

scale:正態分佈的標準差,對應分佈的寬度,scale越大,正態分佈的曲線 越矮胖,scale越小,曲線越高瘦。 代表下圖的σ

size:你輸入數據的shape,例子:

下面展示一些 內聯代碼片。

// An highlighted block
a=np.random.normal(0, 1, (2, 4))
print(a)
輸出:
[[-0.29217334  0.41371571  1.26816017  0.46474676]
 [ 1.33271487  0.80162296  0.47974157 -1.49748788]]

看這個圖直觀些:

以下為官方文檔:

在這裡插入圖片描述

在這裡插入圖片描述

以上為個人經驗,希望能給大傢一個參考,也希望大傢多多支持WalkonNet。

推薦閱讀: