Python之一維資料的格式化和處理

2022-07-06 00:42:09 字數 2935 閱讀 5753

從乙個資料到一組資料

乙個資料表達乙個含義,一組資料表達乙個或多個含義。

維度:一組資料的組織形式

上圖中右上部分是採用線性方式進行組織,右下部分是採用二維方式進行組織。

一維資料

由對等關係的有序或無序資料構成,採用線性方式組織。如:

3.1413, 3.1398, 3.1404, 3.1401, 3.1349, 3.1376
對應列表、陣列和集合等概念

二維資料

由多個一維資料構成,是一維資料的組合形式。如下面的中國大學排行榜:

**是典型的二維資料。其中,表頭是二維資料的一部分

多維資料

由一維或二維資料在新維度上擴充套件形成。比如中國大學排行榜,在時間維度上又分為2023年、2023年、2023年的排行榜,在時間維度的擴充套件就變成了多維資料。

高維資料

僅利用最基本的二元關係展示資料間的複雜結構。例如字典中的鍵值對:

,

"professional": ["computer networking", "security"]

}

資料的操作週期由於資料必須存在才能進行處理,所以將資料分為以下3個階段:

儲存 表示 操作

如果資料間有序:使用列表型別

ls = [3.1398, 3.1349, 3.1376]
列表型別可以表達一維有序資料

for迴圈可以遍歷資料,進而對每個資料進行處理

如果資料間無序:使用集合型別

st =
集合型別可以表達一維無序資料

for迴圈可以遍歷資料,進而對每個資料進行處理

儲存方式一:空格分隔

如:

中國 美國 日本 德國 法國 英國 義大利
使用乙個或多個空格分隔進行儲存,不換行

缺點:資料中不能存在空格

儲存方式二:逗號分隔

如:

中國,美國,日本,德國,法國,英國,義大利
使用英文半形逗號分隔資料進行儲存,不換行

缺點:資料中不能有英文逗號

儲存方式三:其他方式

如:

中國$美國$日本$德國$法國$英國$義大利
使用其他符號或符號組合分隔,建議採用特殊符號

缺點:需要根據資料特點定義,通用性較差

這裡處理是指一維資料的儲存格式和一維資料的列表或者集合的表示方式之間的一種轉換。

儲存 表示

將儲存的資料讀入程式

將程式表示的資料寫入檔案

一維資料的讀入處理

例項:從空格分隔的檔案中讀入資料

中國 美國 日本 德國 法國 英國 義大利
txt = open(fname).read()

ls = txt.split()

f.close()

>>> ls

['中國', '美國', '日本', '德國', '法國', '英國', '義大利']

例項:從特殊符號分隔的檔案中讀入資料

中國$美國$日本$德國$法國$英國$義大利
txt = open(fname).read()

ls = txt.split("$")

f.close()

>>> ls

['中國', '美國', '日本', '德國', '法國', '英國', '義大利']

一維資料的寫入處理例項:採用空格分隔方式將資料寫入檔案

ls = ['中國', '美國', '日本']

f = open(fname, 'w')

f.write(' '.join(ls))

f.close()

例項:採用特殊分隔方式將資料寫入檔案

ls = ['中國', '美國', '日本']

f = open(fname, 'w')

f.write('$'.join(ls))

f.close()

以上內容資料均**於中國大學mooc網-北京理工大學python語言程式設計課程

Python資料的格式化

資料的格式化方法 1.d 整數型a i am d years old print a 15 i am 15 years old2.s 字串a i love s print a lili i love lili3.d與 s的組合a i am d years old,i love s print a 1...

二維資料的格式化

一維資料 列表 資料間有序 和集合型別 資料間無序 二位資料 列表型別 以逗號分隔,無空行,是通用的一二維儲存格式。如果某個元素缺失,逗號仍要保留 二維資料的表頭可以作為資料儲存,也可以另行儲存 逗號為英文半形逗號,逗號與資料之間無額外空格,如果資料 現逗號,有的會加個轉義字元或者引號 儲存方式 按...

047 一維資料的格式化和處理

目錄 三 一維資料的表示 四 一維資料的儲存 五 一維資料的處理 5.3 一維資料的寫入處理 六 單元小結 十天快速入門 python完整教程目錄 由對等關係的有序或無序資料構成,採用線性方式組織 3.1413,3.1398,3.1404,3.1401,3.1349,3.1376 由多個一維資料構成...