python中自定義模型提交到spark集群

2021-10-11 03:52:49 字數 968 閱讀 4119

大資料時代,資料均採用集群儲存方式,那麼在應用這些資料做模型訓練時,遇到的乙個問題就是,如何將各種模型直接執行到spark集群,經調研發現可以通過將其進行類封裝的方式實現集群執行,具體實現方式如下:

1、開發環境準備:pytorch和sparktorch包必備

2、示例**如下:

from pyspark.sql.types import doubletype

from pyspark import keyword_only

from pyspark.ml.param.shared import hasoutputcols, param, params, hasinputcol

from pyspark.ml import pipeline, pipelinemodel

from sparktorch.pipeline_util import pysparkreaderwriter

from pyspark.ml import model

from pyspark.ml.regression import linearregression, linearregressionmodel

from pyspark.ml.util import identifiable, mlreadable, mlwritable

from pyspark.ml.param import typeconverters

spark = sparksession.builder \

.enablehivesupport() \

.getorcreate()

df = spark.read.table('hive_table_name')

class splitcol(model, hasinputcol, hasoutputcols, pysparkreaderwriter, mlreadable, mlwritable, identifiabl

自定義網路模型

看看python 函式 self kwargs.比如4.4的centerlayer沒引數,別的有引數,那麼函式定義裡面哪個指的是傳入的tensor 好像懂了,通過4.4.2,自定義帶引數的層,利用parameterdict定義所需引數,forward函式的引數列表就是傳入的地方 更新 我感覺init...

PyTorch 自定義層(區別於自定義模型)

博主在學習三值神經網路時,使用了lenet 5模型,程式設計 需要對lenet 5模型中的卷積層與全連線層進行自定義,搜尋他人方法後,博主產生了乙個疑問,絕大多數提供的自定義層方法都是繼承nn.module模型,而這方法據說是官方提供 官網 pytorch 自定義線性層 如下 class linea...

Django模型中自定義字段型別

在使用django模型建立表時,有時候不存在或者不滿足條件我們想要的表字段型別。這時我們可以繼承django模型中的field來實現自定義字段型別。如下所示 建立了乙個tinyint型別的字段 建立自定義字段型別 tinyint class tinyintfield models.field def...