[學習資料github]
目標:自己pandas用得很少,這個task主要練習pandas基礎。
學習notes:
data = pd.dataframe(data) #將list變為dataframe格式,方便使用pandas進行分析
data.shape #顯示資料大小
data.head() #顯示資料的前五行
for idx, line in enumerate(f): #遍歷文件每一行,包括它的index
data.rename(columns=, inplace=true) # 修改列名
d = #獲取dataframe格式的d中指定的一些列
data["categories"].describe()粗略統計**的種類資訊:
data["year"] = pd.to_datetime(data["update_date"]).dt.year#將update_date從例如2019-02-20的str變為datetime格式,並提取處year
data.reset_index(drop=true, inplace=true) #重新編號
data.merge(df_taxonomy, on="categories").query("group_name == @group_name")#使用 merge 函式,對於兩個dataframe 共同的特徵 categories 進行合併
【未完待續】
資料分析 學術前沿趨勢分析 task5
作者關聯 資料建模任務 對 作者關係進行建模,統計最常出現的作者關係。主要目標資料,作者 author 構建圖關係,挖掘作者關係 拿到資料集,先看下特徵量,找到與 類別相關的特徵 作者 author 提取出來處理成常用人名格式 用pandas看下資料結構 展示前幾行,有個大致輪廓 第一作者與其他作者...
Notes鎖定機制
notes鎖定機制是 r6 的乙個新功能,軟鎖 是存在使用者的客戶端 記憶體中,只允許乙個使用者同時編輯文件。去掉軟鎖辦法 notes client的notes.ini引數中增加乙個edit no soft locks 1 或者寫 更改dim session as new notessession ...
國際經管學院舉辦計量經濟學術前沿研討會
6月10日,由首都經濟 大學國際經濟管理學院組織的 計量經濟學術前沿研討會 在博遠樓三號報告廳舉辦。此次研討會匯集海內外知名學者,校長付志峰出席活動並致辭。付志峰在致辭向遠道而來的國內外專家學者表示歡迎。他講到,首都經濟 大學高度重視科學研究在高校辦學中的地位,作為學校科學研究的重要平台,國際經管學...