用python做資料分析是一件再合適不過的事情,我們舉個簡單的例子。
例如收集資料的方法是使用問卷,實驗軟體(例如,psychopy,opensesame)和觀察。
當問卷和實驗軟體使用數字應用程式時,我們當然也會以數字檔案格式(例如,excel電子**和逗號分隔,csv,檔案)獲取資料。
如果資料集非常小,則可以使用python和pandas直接建立資料框:
使用pandas read_excel讀取excel檔案,將資料集讀入python的一種方法是使用read_excel方法,該方法有許多引數。
如果要了解其他引數,請參閱read_excel文件。
這是乙個關於如何使用pandas read_excel的工作示例:
在上面的示例中,我們正在讀取excel檔案('conflictdata.xlsx')。 資料集只有乙個工作表,但為了清楚起見我們新增了「conflictdata」工作表名稱作為引數。 也就是說在這種情況下,sheet_name不需要我們使用。
r使用者可能熟悉最後一行,以下是列印datafrane的前x行:
您可能已經注意到,當我們閱讀上面的excel檔案時,我們沒有使用header引數。 如果我們將標題設定為none,我們將獲得數字作為列名。 不幸的是,這使得使用pandas資料框有點煩人。
我們可以傳遞乙個列名列表作為引數。 最後,由於示例xlsx檔案包含列名,我們使用skiprows跳過第一行。 注意,可以使用跳過跳過多行。 只需新增乙個列表,其中包含要跳過的行號。
這是另乙個使用python pandas讀取excel檔案的示例:
我們還可以使用pandas to_excel方法儲存新的xlsx(或覆蓋舊的,如果你喜歡這樣做的話)。
df.to_excel('newfilename.xlsx', sheet_name='newcolnames', index=false)有許多方法可用於篩選資料。 一種簡單的方法是使用查詢, 此方法類似於r中的函式子集。現在我們來篩選出「piq」大於80:
下面顯示了如何使用多個條件篩選資料框。 在這種情況下,我們從性別為男性且iq大於80的df中選擇觀察值。請注意pandas中的&符號「&」是首選的and運算子。
也可以使用or運算子。 在下面的示例中,我們基於年齡大於或等於40或年齡小於14的行來過濾dataframe。此外我們還可以通過列'piq'和'viq'篩選條件。
以上就是簡單用pandas進行資料分析中讀取資料、篩選資料一環,你還可以用它還做很多資料操作,是乙個很有用的工具包。
Python做資料分析,一般的流程是怎麼樣的?
程式設計新視野 作者 python是一門動態的 物件導向的指令碼語言,同時也是一門簡約,通俗易懂的程式語言。python入門簡單,可讀性強,一段好的python 閱讀起來像是在讀一篇外語文章。python這種特性稱為 偽 它可以使你只關心完成什麼樣的工作任務,而不是糾結於python的語法。另外,p...
轉行IT,學開發怎麼樣?
想要成功轉行it,會面臨著很多選擇,比如崗位的選擇,培訓機構的選擇等等。為了增加轉行成功率,一定要做好這些選擇 1 崗位選擇。it行業中技術崗位眾多,比如開發,測試,等等。如果更傾向相對輕鬆穩定的工作,並且也期望較高的薪資待遇,那麼,軟體測試是個不錯的選擇。軟體測試是近些年才得到重視的,因為軟體越來...
資料分析師怎麼樣?哪些行業資料分析師需求量最多?
近幾年,資料對於我們日常生活的影響越來越大。也許很多人會問資料分析師怎麼樣,哪些行業資料分析師需求量最多?這也使得我們有更大的信心,相信未來資料分析行業,會發展的越來越好,人工智慧會越來智慧型。醫療行業 我們都知道,日常多做保健,可以幫助人們舒筋活血,有延年益壽的好處。但其實,醫療行業的發展,還是要...