《機器學習實踐》程式清單2 2

2021-09-07 16:40:01 字數 971 閱讀 6511

將文字記錄轉換為numpy的解析程式

def

file2matrix(filename):

print("

讀入檔案

" +str(filename))

#以下兩行為開啟文字檔案並讀取內容到陣列,有沒有發現這個操作好簡單?!

fr =open(filename)

arrayolines = fr.readlines() #

把檔案中的文字轉為陣列

numberoflines = len(arrayolines)#

得到檔案行數

returnmat = zeros((numberoflines,3)) #

建立返回的numpy矩陣,1000行所有值均為0的

#print(returnmat)

classlabelvector =

index =0

for line in

arrayolines:

line =line.strip()

listfromline = line.split('\t'

)

print

(listfromline)

#訪問矩陣中的元素的方法

#returnmat[1,0:3],3個數字依次表示第1行,從第0列開始,到第2列

#returnmat[1,0:],2個數字依次表示第1行,從第0列開始,到第最後一列

#returnmat[1,:],1個數字依次表示第1行,從第0列開始,到第最後一列,即全部列

#returnmat[2,:3],1個數字依次表示第2行,從第0列開始,到第2列

returnmat[index,0:] = listfromline[0:3]

index += 1

#print(returnmat[1,0:4])

return returnmat,classlabelvector

機器學習專案清單

開頭註明 內容大部分來自機器學習實戰 基於scikit learn和tensorflow 一 架構問題,關注藍圖 1.定義當前目標 2.思考解決方案 3.是否可以重用他人的經驗與工具 4.盡可能獲取幫助 二 獲取資料 1.列出資料及其體量 2.查詢並記錄獲取資料的途徑 3.檢查需要的空間 4.檢查法...

機器學習專案清單 機器學習實戰

摘自 機器學習實戰 基於sklearn keras和tensorflow 第2版 附錄b中的機器學習專案清單,用於自查 4.對於有監督學習任務,請確定目標屬性。5.視覺化資料。6.研究屬性之間的相關性。7.研究如何手動解決問題。8.確定你可能希望使用的轉變。9.確定有用的額外資料。10.記錄所學的知...

機器學習專案流程清單

這份列表可以知道你部署自己的機器學習專案。總共有八個步驟 首先你要有乙個要解決的問題 獲取解決問題需要的資料 探索資料,對資料有乙個清楚的理解 預處理資料以便更好地輸入給機器學習演算法 探索不同的模型並且找到最好的那個 調整你的模型引數,並將這些引數組合成乙個更好的解決方案 展示你的結果 對你的系統...