Tensorflow 實現線性回歸模型的示例代碼
1.線性與非線性回歸
線性回歸 Linear Regression:兩個變量之間的關系是一次函數關系的——圖像是直線,叫做線性。線性是指廣義的線性,也就是數據與數據之間的關系,如圖x1。
非線性回歸:兩個變量之間的關系不是一次函數關系的——圖像不是直線,叫做非線性,如圖x2。
一元線性回歸:隻包括一個自變量和一個因變量,且二者的關系可用一條直線近似表示,這種回歸分析稱為一元線性回歸分析。函數表達: y=bx+a。
多元線性回歸:包括兩個或兩個以上相互獨立的自變量(x1,x2,x3…),且因變量(y)和自變量之間是線性關系,則稱為多元線性回歸分析。函數表達:
線性回歸在深度學習中的應用: 在深度學習中,我們就是要根據已知數據點(自變量)和因變量(y)去訓練模型得到未知參數a和b、 和的具體值,從而得到預測模型,在這裡()相當於深度學習中目標對象的特征,(y)相當於具體的目標對象。得到預測模型之後再對未知的自變量x進行預測,得到預測的y。
線性回歸問題與分類問題:與回歸相對的是分類問題(classification),分類問題預測輸出的y值是有限的,預測值y隻能是有限集合內的一個。而當要預測值y輸出集合是無限且連續,我們稱之為回歸。比如,天氣預報預測明天是否下雨,是一個二分類問題;預測明天的降雨量多少,就是一個回歸問題。
案例講解
瞭解基礎概念之後,使用Tensorflow實現一個簡單的一元線性回歸問題, 調查學歷和收入之間的線性關系,如下所示:
求解未知參數a和b的方法:
1.數據集
模型訓練的數據存儲在一個.csv文件裡,Education代表學歷【自變量x】,Income代表收入【因變量y】。
目標:我們要利用已知的Education和income數據值,求解未知參數a和b的值,得到Education和Income之間的線性關系。
2.讀取訓練數據Income.csv並可視化展示
import tensorflow as tf import numpy as np # 1.查看tensorflow版本 print("Tensorflow Version{}".format(tf.__version__)) # 2.pandas讀取包含線性關系的.csv文件 import pandas as pd data = pd.read_csv('D:\Project\TesorFlow\datasets\Income.csv') print(data) # 3.繪制線性回歸關系-散點圖 import matplotlib.pyplot as plt plt.scatter(data.Education,data.Income) plt.show()
3.利用Tensorflow搭建和訓練神經網絡模型【線性回歸模型的建立】
# 4.順序模型squential的建立 # 順序模型是指網絡是一層一層搭建的,前面一層的輸出是後一層的輸入。 model = tf.keras.Sequential() model.add(tf.keras.layers.Dense(1,input_shape=(1,))) # dense(輸出數據的維度,輸入數據的維度) # 5.查看模型的結構 model.summary() # 6.編譯模型 - 配置的過程, 優化算法方式(梯度下降)、損失函數 # Adam優化器的學習速率默認為0.01 model.compile(optimizer='adam', loss = 'mse') # 7.訓練模型,記錄模型的訓練過程 history # 訓練過程是loss函數值降低的過程: # 即不斷逼近最優的a和b參數值的過程 # 這個過程要訓練很多次epoch,epoch是指對所有訓練數據訓練的次數 history = model.fit(x,y,epochs=100)
model.summary(): 查看我們創建的神經網絡模型,這裡我們隻添加瞭一層全連接層。
訓練過程:這裡隻訓練100個epoch.
4. 模型預測
# 8.已知數據預測 model.predict(x) print(model.predict(x)) # 9.隨機數據預測: # """ # 註意:pandas數據結構是數據框DataFrame和 序列 Series # 序列(Series)是二維表格中的一列或者一行。實際上,當訪問DataFrame的一行時,pandas自動把該行轉換為序列;當訪問DataFrame的一列時,Pandas也自動把該列轉換為序列。 # 序列是由一組數據(各種NumPy數據類型),以及一組與之相關的數據標簽(索引)組成,序列不要求數據類型是相同的,序列可以看作是一維數組(一行或一列) # 序列的表現形式為:索引在左邊,值在右邊。由於沒有顯式為Series指定索引,pandas會自動創建一個從0到N-1的整數型索引。 # """ # test_predict = model.predict(pd.Series([20])) # 所以這裡輸入時需要將其轉換為Series結構 test_predict = model.predict(pd.Series([10,20])) # 預測的數據為10和20 print(test_predict) print(pd.DataFrame([(10,20,30)]))
已知結果的數據預測的結果: 查看我們創建的神經網絡模型,這裡我們隻添加瞭一層全連接層。
未知結果的數據預測的結果: 可以看到預測結果很差,說明我們的神經網絡模型並沒有訓練好,求解得到的未知參數的a和b的值很差。
解決辦法:: 加深神經網絡模型的參數,訓練更多的次數epoch或者添加實驗數據。
sklearn庫有寫好瞭的線性回歸函數,from sklearn.linear_model import LinearRegression直接導入即可。
到此這篇關於Tensorflow 實現線性回歸模型的示例代碼的文章就介紹到這瞭,更多相關Tensorflow 線性回歸模型內容請搜索WalkonNet以前的文章或繼續瀏覽下面的相關文章希望大傢以後多多支持WalkonNet!
推薦閱讀:
- Tensorflow 2.4 搭建單層和多層 Bi-LSTM 模型
- Python神經網絡TensorFlow基於CNN卷積識別手寫數字
- python進階TensorFlow神經網絡擬合線性及非線性函數
- python之tensorflow手把手實例講解斑馬線識別實現
- python之tensorflow手把手實例講解貓狗識別實現