將文字記錄轉換為numpy的解析程式
deffile2matrix(filename):
print("
讀入檔案
" +str(filename))
#以下兩行為開啟文字檔案並讀取內容到陣列,有沒有發現這個操作好簡單?!
fr =open(filename)
arrayolines = fr.readlines() #
把檔案中的文字轉為陣列
numberoflines = len(arrayolines)#
得到檔案行數
returnmat = zeros((numberoflines,3)) #
建立返回的numpy矩陣,1000行所有值均為0的
#print(returnmat)
classlabelvector =
index =0
for line in
arrayolines:
line =line.strip()
listfromline = line.split('\t'
)
(listfromline)
#訪問矩陣中的元素的方法
#returnmat[1,0:3],3個數字依次表示第1行,從第0列開始,到第2列
#returnmat[1,0:],2個數字依次表示第1行,從第0列開始,到第最後一列
#returnmat[1,:],1個數字依次表示第1行,從第0列開始,到第最後一列,即全部列
#returnmat[2,:3],1個數字依次表示第2行,從第0列開始,到第2列
returnmat[index,0:] = listfromline[0:3]
index += 1
#print(returnmat[1,0:4])
return returnmat,classlabelvector
機器學習專案清單
開頭註明 內容大部分來自機器學習實戰 基於scikit learn和tensorflow 一 架構問題,關注藍圖 1.定義當前目標 2.思考解決方案 3.是否可以重用他人的經驗與工具 4.盡可能獲取幫助 二 獲取資料 1.列出資料及其體量 2.查詢並記錄獲取資料的途徑 3.檢查需要的空間 4.檢查法...
機器學習專案清單 機器學習實戰
摘自 機器學習實戰 基於sklearn keras和tensorflow 第2版 附錄b中的機器學習專案清單,用於自查 4.對於有監督學習任務,請確定目標屬性。5.視覺化資料。6.研究屬性之間的相關性。7.研究如何手動解決問題。8.確定你可能希望使用的轉變。9.確定有用的額外資料。10.記錄所學的知...
機器學習專案流程清單
這份列表可以知道你部署自己的機器學習專案。總共有八個步驟 首先你要有乙個要解決的問題 獲取解決問題需要的資料 探索資料,對資料有乙個清楚的理解 預處理資料以便更好地輸入給機器學習演算法 探索不同的模型並且找到最好的那個 調整你的模型引數,並將這些引數組合成乙個更好的解決方案 展示你的結果 對你的系統...