從np.random.normal()到正態分佈的擬合操作
先看偉大的高斯分佈(Gaussian Distribution)的概率密度函數(probability density function):
對應於numpy中:
numpy.random.normal(loc=0.0, scale=1.0, size=None)
參數的意義為:
loc
:float
此概率分佈的均值(對應著整個分佈的中心centre)
scale
:float
此概率分佈的標準差(對應於分佈的寬度,scale越大越矮胖,scale越小,越瘦高)
size
:int or tuple of ints
輸出的shape,默認為None,隻輸出一個值
我們更經常會用到的np.random.randn(size)所謂標準正態分佈
對應於np.random.normal(loc=0, scale=1, size)。
采樣(sampling)
# 從某一分佈(由均值和標準差標識)中獲得樣本 mu, sigma = 0, .1 s = np.random.normal(loc=mu, scale=sigma, size=1000)
也可使用scipy庫中的相關api(這裡的類與函數更符合數理統計中的直覺):
import scipy.stats as st mu, sigma = 0, .1 s = st.norm(mu, sigma).rvs(1000)
校驗均值和方差:
>>> abs(mu < np.mean(s)) < .01 True >>> abs(sigma-np.std(s, ddof=1)) < .01 True # ddof,delta degrees of freedom,表示自由度 # 一般取1,表示無偏估計,
擬合
我們看使用matplotlib.pyplot便捷而強大的語法如何進行高斯分佈的擬合:
import matplotlib.pyplot as plt count, bins, _ = plt.hist(s, 30, normed=True) # normed是進行擬合的關鍵 # count統計某一bin出現的次數,在Normed為True時,可能其值會略有不同 plt.plot(bins, 1./(np.sqrt(2*np.pi)*sigma)*np.exp(-(bins-mu)**2/(2*sigma**2), lw=2, c='r') plt.show()
或者:
s_fit = np.linspace(s.min(), s.max()) plt.plot(s_fit, st.norm(mu, sigma).pdf(s_fit), lw=2, c='r')
np.random.normal()的含義及實例
這是個隨機產生正態分佈的函數。(normal 表正態)
先看一下官方解釋:
有三個參數
loc
:正態分佈的均值,對應著這個分佈的中心.代表下圖的μ
scale
:正態分佈的標準差,對應分佈的寬度,scale越大,正態分佈的曲線 越矮胖,scale越小,曲線越高瘦。 代表下圖的σ
size
:你輸入數據的shape,例子:
下面展示一些 內聯代碼片。
// An highlighted block a=np.random.normal(0, 1, (2, 4)) print(a) 輸出: [[-0.29217334 0.41371571 1.26816017 0.46474676] [ 1.33271487 0.80162296 0.47974157 -1.49748788]]
看這個圖直觀些:
以下為官方文檔:
以上為個人經驗,希望能給大傢一個參考,也希望大傢多多支持WalkonNet。
推薦閱讀:
- python 生成正態分佈數據,並繪圖和解析
- Matplotlib可視化之自定義顏色繪制精美統計圖
- Python利用 matplotlib 繪制直方圖
- Python Matplotlib數據可視化模塊使用詳解
- Python matplotlib.pyplot.hist()繪制直方圖的方法實例