import pandas as pdimport numpy as np
from matplotlib import pyplot as plt
#獲取各種電影型別的數量
file='./imdb-movie-data.csv'
data=pd.read_csv(file)
genre=data['genre']
genre_list=genre.str.split(',').tolist()
#轉為一維,轉為集合去重,看有哪些條目
genre_set=set([i for item in genre_list for i in item])
print(genre_list)
#建立乙個帶有索引全為0的二維陣列
inform=pd.dataframe(np.zeros((data.shape[0],len(genre_set))),columns=list(genre_set)) #獲取行數,列數,索引應該為list(列表)型別
#對data【genre】一行一行的遍歷
for i in range(data.shape[0]):
inform.loc[i,genre_list[i]]=1
#計算每一列的和
sum_genre=inform.sum(axis=0)
#排序sum_sort=sum_genre.sort_values()
print(len(sum_sort))
#畫圖plt.figure(figsize=(20,10))
統計電影的型別
給出一電影檔案,算出電影genre的電影型別。coding utf 8 import pandas as pd from matplotlib import pyplot as plt import numpy as np file path imdb movie data.csv df pd.re...
Linux統計資料夾中檔案個數以及目錄個數
首先,你要明白輸入ls l命令吧,檢視某個目錄下面的檔案,執行一下大概是這樣子的,如下所示 執行ls l命令控制台輸出的結果是一行一行,每一行對應乙個目錄或者是檔案。如果是檔案的話,該行的字串資訊的第乙個字元顯示的是 如果是目錄的話,該行的字元的第乙個顯示的是 d 意即directory,找到這兩者...
Linux統計資料夾中檔案個數以及目錄個數
首先,你要明白輸入ls l命令吧,檢視某個目錄下面的檔案,執行一下大概是這樣子的,如下所示 執行ls l命令控制台輸出的結果是一行一行,每一行對應乙個目錄或者是檔案。如果是檔案的話,該行的字串資訊的第乙個字元顯示的是 如果是目錄的話,該行的字元的第乙個顯示的是 d 意即directory,找到這兩者...