Tensorflow 實現線性回歸模型的示例代碼

1.線性與非線性回歸

線性回歸 Linear Regression:兩個變量之間的關系是一次函數關系的——圖像是直線,叫做線性。線性是指廣義的線性,也就是數據與數據之間的關系,如圖x1。

非線性回歸:兩個變量之間的關系不是一次函數關系的——圖像不是直線,叫做非線性,如圖x2。

一元線性回歸:隻包括一個自變量和一個因變量,且二者的關系可用一條直線近似表示,這種回歸分析稱為一元線性回歸分析。函數表達: y=bx+a。

多元線性回歸:包括兩個或兩個以上相互獨立的自變量(x1,x2,x3…),且因變量(y)和自變量之間是線性關系,則稱為多元線性回歸分析。函數表達:

線性回歸在深度學習中的應用: 在深度學習中,我們就是要根據已知數據點(自變量)和因變量(y)去訓練模型得到未知參數a和b、 和的具體值,從而得到預測模型,在這裡()相當於深度學習中目標對象的特征,(y)相當於具體的目標對象。得到預測模型之後再對未知的自變量x進行預測,得到預測的y。

線性回歸問題與分類問題:與回歸相對的是分類問題(classification),分類問題預測輸出的y值是有限的,預測值y隻能是有限集合內的一個。而當要預測值y輸出集合是無限且連續,我們稱之為回歸。比如,天氣預報預測明天是否下雨,是一個二分類問題;預測明天的降雨量多少,就是一個回歸問題。

案例講解

瞭解基礎概念之後,使用Tensorflow實現一個簡單的一元線性回歸問題, 調查學歷和收入之間的線性關系,如下所示:

求解未知參數a和b的方法:

1.數據集

模型訓練的數據存儲在一個.csv文件裡,Education代表學歷【自變量x】,Income代表收入【因變量y】。

目標:我們要利用已知的Education和income數據值,求解未知參數a和b的值,得到Education和Income之間的線性關系。

c53219c7b7f0961d5cda2522eb07fddd.jpg

2.讀取訓練數據Income.csv並可視化展示

import tensorflow as tf
import numpy as np
# 1.查看tensorflow版本
print("Tensorflow Version{}".format(tf.__version__))
 
# 2.pandas讀取包含線性關系的.csv文件
import pandas as pd
data = pd.read_csv('D:\Project\TesorFlow\datasets\Income.csv')
print(data)
 
# 3.繪制線性回歸關系-散點圖
import matplotlib.pyplot as plt
plt.scatter(data.Education,data.Income)
plt.show()

82977c873d0c4e877edf9ba314b59d61.jpg

3.利用Tensorflow搭建和訓練神經網絡模型【線性回歸模型的建立】

# 4.順序模型squential的建立
# 順序模型是指網絡是一層一層搭建的,前面一層的輸出是後一層的輸入。
model = tf.keras.Sequential()
model.add(tf.keras.layers.Dense(1,input_shape=(1,)))
# dense(輸出數據的維度,輸入數據的維度)
 
# 5.查看模型的結構
model.summary()
 
# 6.編譯模型 - 配置的過程, 優化算法方式(梯度下降)、損失函數
# Adam優化器的學習速率默認為0.01
model.compile(optimizer='adam',
              loss = 'mse')
 
# 7.訓練模型,記錄模型的訓練過程 history
# 訓練過程是loss函數值降低的過程:
# 即不斷逼近最優的a和b參數值的過程
# 這個過程要訓練很多次epoch,epoch是指對所有訓練數據訓練的次數
history = model.fit(x,y,epochs=100)

model.summary(): 查看我們創建的神經網絡模型,這裡我們隻添加瞭一層全連接層。

訓練過程:這裡隻訓練100個epoch.

4. 模型預測

# 8.已知數據預測
model.predict(x)
print(model.predict(x))
 
# 9.隨機數據預測: 
# """
# 註意:pandas數據結構是數據框DataFrame和 序列 Series
# 序列(Series)是二維表格中的一列或者一行。實際上,當訪問DataFrame的一行時,pandas自動把該行轉換為序列;當訪問DataFrame的一列時,Pandas也自動把該列轉換為序列。
# 序列是由一組數據(各種NumPy數據類型),以及一組與之相關的數據標簽(索引)組成,序列不要求數據類型是相同的,序列可以看作是一維數組(一行或一列)
# 序列的表現形式為:索引在左邊,值在右邊。由於沒有顯式為Series指定索引,pandas會自動創建一個從0到N-1的整數型索引。
# """
# test_predict = model.predict(pd.Series([20]))  # 所以這裡輸入時需要將其轉換為Series結構
test_predict = model.predict(pd.Series([10,20]))  # 預測的數據為10和20
print(test_predict)
print(pd.DataFrame([(10,20,30)]))

已知結果的數據預測的結果: 查看我們創建的神經網絡模型,這裡我們隻添加瞭一層全連接層。

未知結果的數據預測的結果: 可以看到預測結果很差,說明我們的神經網絡模型並沒有訓練好,求解得到的未知參數的a和b的值很差。

解決辦法:: 加深神經網絡模型的參數,訓練更多的次數epoch或者添加實驗數據。

sklearn庫有寫好瞭的線性回歸函數,from sklearn.linear_model import LinearRegression直接導入即可。

到此這篇關於Tensorflow 實現線性回歸模型的示例代碼的文章就介紹到這瞭,更多相關Tensorflow 線性回歸模型內容請搜索WalkonNet以前的文章或繼續瀏覽下面的相關文章希望大傢以後多多支持WalkonNet!

推薦閱讀: