詳細內容
讀取資料可以方便我們的工作,python中常見的資料讀取方式有很多,那麼python如何讀取資料呢?
上面的**,read_csv中前面的是資料集存放的路徑,後面的header很重要,經常以為少了header,資料的總量減小了1,因為少掉的那一行資料變成了dataframe裡面的列索引。
還有一種是比較傳統的方法,直接用open開啟檔案,把檔案裡面的資訊先取出來,不管取出來是什麼樣子的,先取出來再說,想要作什麼處理直接對取出的變數做處理即可。f= open('/home/nw/desktop/dataset/iris.txt','rb')
dataset = pickle.load(f)
#這種方法適用於自己訪問自己的資料,有時候在讀取別人的資料的時候是不行的,因為別人存資料的方式不一定是用pickle.dump的方
##式存資料的。
f = open('/home/nw/desktop/dataset/iris.txt')
注意這裡的open後面最好不要加上其他的讀取方式,不需要『rb』之類的讀取方式。因為在後續的資料處理中可能還需要將二進位制的數
據轉換成自己想要的個數。
lines = f.readlines()
現在lines中已經包含了所有的資料資訊,我們想要得到的資料格式都可以基於lines做處理。如我讀出的iris資料格式是乙個列表的形
式,使用len(lines)得到列表中元素的個數是151,列印出lines,可以看到lines中每個元素都是乙個字串,並且每個字串後面都
有'\n'的換行字元,最後一行是空行,所以最後一行是多餘,並且要去掉每行中的'\n'
arr =
for i in range(len(lines)):
if lines[i] != '\n':
for i in range(len(arr)):
arr[i] = arr[i].strip('\n')#將每行的'\n'脫去
middles函式python python 函式
1.特性 1.1.可擴充套件性 1.2.減少 重複 1.3.程式更容易維護 2.函式的引數與區域性變數 2.1.函式裡面的 arges 元組形式儲存,kwarges 字典方式儲存,可以寫成其他,但是 必須寫 2.2.函式裡面入參可以是預設引數,固定引數,位置引數,關鍵字引數,非固定引數的 3.返回值...
discard函式python Python 集合
python 集合讀書之法,在循序而漸進,熟讀而精思。朱熹 集合的概念無序 不能重複 集合中各元素間是無序的,相同元素在集合中唯一存在.即集合是無序組合,它沒有索引和位置的概念,但可變集合中的元素是可以動態新增或者刪除的 集合的型別可變集合 set 不可變集合 frozenset set 函式 可以...
中讀取資料 讀取資料
對資料庫有一定了解的同學應該都知道資料表這個東西。資料表一般是以行列來儲存和展示資料的。每一列就是乙個資料字段,代表每一行資料的屬性。在python裡面也有類似表概念的東西,叫做dataframe。dataframe是我們資料分析和風控建模中很重要乙個元素,後續的很多資料操作都要以此為基礎。我們的資...