Task03 分類資料

2021-10-07 13:22:21 字數 2739 閱讀 1312

分類變數的建立:

pd.series(["a", "b", "c", "a"], dtype="category") #用series建立
#對dataframe指定型別建立

#利用內建categorical型別建立

#利用cut函式建立

pd.cut(np.random.randint(0,60,5), [0,10,30,60]) #預設使用區間型別為標籤

pd.cut(np.random.randint(0,60,5), [0,10,30,60], right=false, labels=['0-10','10-30','30-60']) #可指定字元為標籤

分類變數的結構:乙個分類變數包括三個部分,元素值(values)、分類類別(categories)、是否有序(order)

describe方法:描述了乙個分類序列的情況,包括非缺失值個數、元素值類別數(不是分類類別數)、最多次出現的元素及其頻數

利用set_categories修改:修改分類,但本身值不會變化

利用rename_categories修改:需要注意的是該方法會把值和分類同時修改

利用字典修改值

利用add_categories新增

利用remove_categories移除

刪除元素值未出現的分類型別

序的建立

排序標量比較

等長序列比較

等式判別(包含等號和不等號):兩個分類變數的等式判別需要滿足分類完全相同

不等式判別(包含》=,<=,):兩個分類變數的不等式判別需要滿足兩個條件:① 分類完全相同 ② 排序完全相同

Task03 資料重構

將資料train left up.csv和trainright up.csv橫向合併為一張表,並儲存這張表為result up list up text left up,text right up result up pd.concat list up,axis 1 將train left down...

TASK03 資料型別

實戰演練 總結思考 n input 輸入乙個奇數 if mod n,2 0 disp 輸入數字必須是奇數 else n1 2 n 1 m n 1 2 計算擴充套件零矩陣a的行 列數n1和上 下對角線數m 不包括主對角線 a zeros n1 for i 1 n 設定順序數矩陣v for j 1 n ...

Task03 資料型別

語法知識 3.13 奇數階魔方矩陣的程式設計 魔方矩陣又稱幻方,是有相同的行數和列數,並在每行每列 對角線上的和都相等的矩陣。魔方矩陣中的每個元素不能相同。你能構造任何大小 除了2x2 的魔方矩陣。3.14 資料型別概述 3.15 字元型陣列 字元陣列是指用來存放字元資料的陣列。其定義的一般形式為 ...