主要知道每乙個函式的返回值是什麼set是乙個無序不重複的序列
tolist 列表裡面套列表
temp_list = df["genre"].str.split(",").tolist() #[,,]
疑惑:這個迴圈不太懂
genre_list = list(set([i for j in temp_list for i in j]))#用雙重迴圈來獲得總的電影分類
這樣居然可以統計每一列的和
zeros_df.sum(axis=0)
陣列合併
join(按照行索引進行合併)要有行索引是一樣的,事實證明列是不可以overlap的,行可以
merge(按照列索引進行合併)
跟著老師敲了一遍**,後面還有根據不同型別分類沒寫。
Oracle logminer 日誌挖掘
3.新增需要分析的檔案 4.開始分析檔案 5.開始分析內容 6.結束日誌分析 logmnr 可以用來分析redo 日誌和歸檔檔案。將redo日誌或者歸檔檔案中的內容提取出來,供dba進行操作分析歷史操作,比如進行誤刪除操作的恢復。logmnr 分析日誌,需要建立乙個資料字典,這個資料字典可以儲存在外...
oracle日誌挖掘
oracle日誌挖掘是一種十分強大的資料恢復技術,只要你保障你的歸檔日誌和重做日誌是完整的,那麼就可以將你的資料恢復到任何時刻。簡單敘述一下日誌挖掘的基本原理,然後進行乙個簡單的小實驗。日誌挖掘時基於redo日誌和歸檔日誌的基礎之上來進行日誌載入並進行恢復,挖掘,挖掘,挖的就是你的redo日誌和歸檔...
資料探勘學習(一)
資料探勘 從大量資料中抽取出 隱含的 有潛在用途的 未知的 人們可以理解的 有價值的資訊和模式的過程。2.建立目標資料集 資料選擇 3.資料清理和預處理 4.資料簡化和變形 5.選擇資料探勘功能 6.選擇資料探勘演算法 7.資料探勘 尋找有趣的模式 8.模式評估和知識展示 9.知識發現的使用 方法 ...