在機器學習中python現在已經成為主流語言,但是想要快速去實現演算法還需要磨磨刀。
python工具磨刀石。
主要用的庫有numpy、pandas、matplotlib以及我推薦的乙個畫統計圖的庫seaborn。下面我以我用到的順序,具體說明一下這些小工具的用法。
讀取檔案
file=open('data.txt',r)
data=file.read()
或data= pd.read_csv('data.txt', header=none,names=['xx', '***'])
可以看出pandas的讀取功能更加強大
建立資料表
datasheet=data.dataframe(,)
刪除某一列
datasheet=datasheet.drop('one',axis=1)
或del datasheet['one']
插入某一列
datasheet=datasheet.insert(0,'zero',1)#三個引數位置、名稱、內容
合併兩列表
data=datasheet
data=pd.concat([data,datasheet],axis=1)#axis=0是行、1是列
資料提取
通過行列號提取
提取行:data.iloc[0]
提取列:data.iloc[:,[0]]
提取整塊:data.iloc[1:5,1:3]#[1,2,3,4]x[1,2]的整塊
資料自定義函式
#預設以列為單位的normal
#對列中的每乙個引數進行遍歷操作
畫點函式
plt.scatter(x,y,s,c,marker)
#點座標x,y 點大小s
#c顏色,marker形狀
畫線函式
plt.plot(x,y, label)
#點座標x,y圖例label
有了這幾個基本函式,我們來試一試可以去完成一些機器學習演算法了
機器學習中常用距離的小結
設有兩個n維向量a x11,x12,x1n 和b x21,x22,x2n 1 曼哈頓距離 曼哈頓距離也稱為城市街區距離,數學表示式為 2 歐氏距離 歐氏距離就是我們熟悉的l2範數,數學表示式為 3 閔可夫斯基距離 閔可夫斯基距離可以看作歐氏距離的一種推廣,數學表示式為 可以看到,當p值取1時,閔可夫...
機器學習 深度學習中常用的Linux命令
作為一名coder,linux命令是基本生存技能,但linux的命令何其多,要想完全掌握可不易。在我平常的學習和工作中,linux伺服器主要是用來跑ml dl 的 linux運維大神請略過 因此本文將主要從跑 的角度 一下常用的linux操作。告別手指抽筋的方向鍵 ctrl e 游標回到行末 ctr...
機器學習中常用的矩陣求導公式
機器學習中常用的矩陣求導公式 矩陣求導好像讀書的時候都沒學過,因為講矩陣的課程上不講求導,講求導的課又不提矩陣。如果從事機器學習方面的工作,那就一定會遇到矩陣求導的東西。維基百科上 根據y與x的不同型別 實值,向量,矩陣 給出了具體的求導公式,以及一堆相關的公式,查起來都費勁。其實在實際的機器學習工...