機器學習中,我們在使用一些經典的分類器對資料進行分類時,需要對資料進行一些必要的預處理。或者我們在使用別人提供的資料使用一些經典的機器學習演算法進行學習時,一般常見的資料格式會是.tsv和.csv格式,那麼這兩種格式究竟是什麼以及他們之間有什麼區別呢?下面簡單的介紹一下:
tsv:tab separated values;即「製表符分隔值」,如:
張三 20
李四 30
csv: comma separated values;即「逗號分隔值」,如:
張三,20
李四,30
注:
兩者均是以純文字形式儲存的**資料,可由**軟體匯出或讀入,編碼方式是可以自行定義的。本質而言沒有太大區別。matlab和python中都有很成熟的可供呼叫的介面處理該兩種型別的檔案。這裡不再贅述。
參考:
1 2
3 4
MySQL匯入CSV格式檔案
mysql load data infile命令可以把csv平面檔案中的資料匯入到資料庫中。linux下 load data infile home test dump ip location.csv into table ip location character set utf8 fields ...
C 讀取csv格式檔案
方法1 用乙個system.web.ui.htmlcontrols.htmlinputfile去handle檔案選取 以下是button click event中的code,用來執行當檔案選取了之後讀取檔案的內容 方法2 當成sql的資料表來讀取 select into theimporttable...
使用csv模組讀寫csv格式檔案
import csvclass handlecsv csv檔案處理類 def init self,filename 構造器 param filename csv檔名 self.filename filename defget data self 獲取csv中所有資料 return 巢狀字典的列表 w...