tensorflow 編碼小結

2021-10-12 14:08:57 字數 482 閱讀 4724

​​​​​​​   tensorflow 編碼小結

重點搞清楚是怎麼進行資料預處理的不同的元件資料預處理的方式和結果有什麼不同比如: keras/pandas/tensorflow.feature_column/sklearn.processing/

需要進一步搞清楚 不同資料預處理的結果和不同模型的輸入資料是怎麼鏈結的,資料格式是什麼樣的。

feature_column輸入可以是原始特徵的列名,或者是feature_column。初上手感覺feature_column設計的有點奇怪,不過熟悉了邏輯後用起來還是很方便的。幾個需要習慣一下的點:

深度模型的輸入必須是dense型別,所有輸出是categorical型別需要經過indicator或者embedding的轉換才可以

indicator, embedding, bucketized的輸入不能是原始特徵,前兩者只能是categorical型別的feature_column, 後者只能是numeric_column

TensorFlow正則化小結

在設計深度學習模型的時候,我們經常需要使用正則化 regularization 技巧來減少模型的過擬合效果,例如 l1 正則化 l2 正則化等。在keras中,我們可以方便地使用三種正則化技巧 那麼,我們應該如何使用這三種正則化技巧呢?以keras中的dense層為例,我們發現有以下三個引數 這三個...

字元編碼小結

1 早期只有127以內的字元 20以內是控制字元。2 後來各國有了自己的編碼,但一般是兩個位元組表示乙個字元 中國 3 unicode 就是解決各國之間衝突的問題,定義了統一的標準。可以65025個字元。這樣英文也是乙個字元兩個位元組,這樣的好處是全世界統一。4 utf 系列其實和unicode可以...

編碼規範(小結)

走查1 1 定義變數時應該進行初始化。2 引數過長進行斷行時,應該每個引數佔一行。3 引數中帶有 時進行引數斷行時,這些運算子應該放在斷行引數前面。4 中變數型別,優先考慮區域性變數,然後再考慮成員變數,再然後考慮全域性變數等等 5 複雜函式進行分解,分解成若干個小函式。6 優先處理函式中的異常情況...