python pipeline的用法及避坑點

說明

1、在使用之前需要在settings中打開。

2、pipeline在settings中鍵表示位置(即pipeline在項目中的位置可以自定義),值表示離引擎的距離,越近數據越先通過:權重值小的優先執行。

3、當pipeline較多時,process_item的方法必須是returnitem,否則後一個pipeline獲得的數據就是None值。

pipeline中必須有process_item方法,否則item無法接收和處理。

實例

from sklearn.pipeline import Pipeline
from sklearn.svm import SVC
from sklearn.decomposition import PCA
estimators = [('reduce_dim', PCA()), ('clf', SVC())]
pipe = Pipeline(estimators)
pipe

內容擴展:

Python的sklearn.pipeline.Pipeline()函數可以把多個“處理數據的節點”按順序打包在一起,數據在前一個節點處理之後的結果,轉到下一個節點處理。除瞭最後一個節點外,其他節點都必須實現’fit()’和’transform()’方法, 最後一個節點需要實現fit()方法即可。當訓練樣本數據送進Pipeline進行處理時, 它會逐個調用節點的fit()和transform()方法,然後點用最後一個節點的fit()方法來擬合數據。

from sklearn.linear_model import LinearRegression
from sklearn.preprocessing import PolynomialFeatures
from sklearn.pipeline import Pipeline
 
def polynomial_model(degree = 1):
    polynomial_features = PolynomialFeatures(degree = degree, include_bias = False)
    linear_regression = LinearRegression()
    pipeline = Pipeline([('polynomial_features', polynomial_features),
 ('linear_regression', linear_regression)])
    return pipeline

以上就是python pipeline的用法及避坑點的詳細內容,更多關於python pipeline的使用註意的資料請關註WalkonNet其它相關文章!

推薦閱讀: