機器學習庫mlib
mlib 是乙個spark機器學習庫。它的目標是使機器學習容易使用和可擴充套件。從乙個高層角度,提供了下面的工具:
機器學習演算法:比如分類,回歸,聚類和協同過濾
特徵處理: 特徵抽取,轉換,降維和選 擇
管道(pipeline):構建工具,評估,和pipelines優化
持久化:儲存和載入演算法,模型,管道
工具集:線性代數,統計,資料處理等等
spark2.0後,spark.mllib包基於rdd的api已經進入維護階段。spark ml包裡的api都是基於dataframe的。
mlib基於rdd的api預計在spark3.0時會被刪除。
TensorFlow官方文件學習(一)
乙個對手寫數字進行識別的模型。思路 1 將訓練集中獲取的手寫數字影象進行某一統一方式 全部按行或全部按列 的展開,得到乙個長向量 這是為了利用softmax做一維的回歸,不過損失了二維資訊 用乙個二維張量來索引某乙個樣本中的某一畫素。2 softmax模型 用來給不同的物件分配概率 即使在更精細的模...
TensorFlow官方文件學習(二)
開啟anaconda prompt activate tensor flow python import tensorflow as tf hello tf.constant hello s tf.session print s.run hello b hello 此處hello為utf 8編碼?列...
git 官方文件學習筆記
git完整筆記 git config list 檢查git配置 第一步安裝git時,先配置使用者名稱和郵箱 git config global user.name example git config global user.email johndoe example.com 配置預設編輯器,不配置...