Python 資料分析學習路線

2021-10-07 10:32:35 字數 1000 閱讀 5512

資料類有多火就不多說了,資料和資料分析在生活中的實用性和重要性都是不言而喻。正是由於此類的原因,利用業餘時間自學了一段時間的資料分析。

資料分析是指用適當利用統計分析方法對收集來的大量資料進行分析,提取有用資訊和形成結論而對資料加以詳細研究和概括總結的過程。
概括成一句話就是分析資料,得到結果。所以需要學習的東西為分析資料的方法。

2.1 知識構成

這裡記錄的是利用 python 進行資料分析的情況,基於目前的認知 (後續可能修改),大體上需要的知識構成為:

高階部分,需要掌握的知識有:

由於本人為理工男,這一部分略過了。目前來看,需要的知識主要為 《概率論與數理統計》。

由於只需要掌握計算部分的知識,python 的基礎知識需要了解以下內容:

主要掌握 python 相關資料分析包的使用,包括 numpy/pandas/matplotlib 等。這也是需要重點掌握的內容。參考的書為《利用 python 進行資料分析》。當時看完該書感覺學到了很多,然後過幾天就忘記了。所以這部分的學習內容主要是練習各個包的使用,特別是 pandas 包。另外,看書不練手往往使會使得自己很疑惑,不知道資料分析具體的工作內容到底是什麼。為此,我爬取了一些資料,練習了幾個資料分析,記錄在後續的文章中。

大部分時間都花在學習這方面的內容,根據各人的基礎不一樣,感覺這部分學習可以稍後,可以主要學習前面的內容。大概記錄下自己的學習過程。

斷續看了三本書,推導了機器學習的常用演算法。三本書為:

主要參考的是兩本中文書,第三本書看了部分內容,推導了常用的演算法 (預想之後以簡潔的不帶公式的方式介紹這部分內容)。個人覺得不是做相關方面的研究者,只需要大體上掌握各類演算法原理以及如何利用機器學習包。後續文章會有利用機器學習包實現資料分析的內容。

關於深度學習的話,目前還沒有系統的學習,零碎的了解了一下。深度學習就是各種神經網路如何解算的問題。經過簡單學習,認為最適合新手的深度學習包為 keras。(待續)

大概瞄了下 hadoop 權威指南。(待續)

python資料分析學習路線

python是一種物件導向 直譯式計算機程式語言,由guido van rossum於1989年底發明。由於他簡單 易學 免費開源 可移植性 可擴充套件性等特點,python又被稱之為膠水語言。下圖為主要程式語言近年來的流行趨勢,python受歡迎程度扶搖直上。用python玩轉資料 由於pytho...

Python 資料分析學習路線

相關資料 資料分析 資料分析是指用適當利用統計分析方法對收集來的大量資料進行分析,提取有用資訊和形成結論而對資料加以詳細研究和概括總結的過程。分析資料,得到結果 基礎部分 數學知識 python基礎知識 python資料分析包使用 高階部分 數學需要的知識主要為 概率論與數理統計 python基礎知...

Python資料分析 Pandas學習

dataframe是乙個類似於 的資料型別,如圖 data 方框內的資料 numpy ndarray structured or homogeneous dict,or dataframe index 行索引索引 index or array like columns 列索引 index or ar...