【python】
python基礎
python快速教程
python學習路線圖
python大資料學習之路
python爬蟲實戰
python-pandas技巧系(量化小講堂)
python機器學習入門資料梳理
學習群:大資料-python資料探勘2 323876621
【r】
r語言知識體系
怎樣學習r(上下)
r語言學習路線圖
ggplot2繪圖入門系列 三篇分散需要整理
r利劍系列 多篇需整理
r語言常用資料探勘包
學習群:
大資料-r語言-初級 342699237
大資料-r語言-中高階 463227290
【hadoop/spark】
hadoop學習路線圖
rhadoop實踐系列文章
spark入門實戰系列教程
學習群:
大資料-hadoop-spark 87353699
【統計學】
統計學入門經典書單
陸勤統計學筆記
學習群:
大資料-統計分析 242805921
【資料探勘/機器學習】
資料探勘演算法系列 分散需要整理
探索推薦引擎內部的秘密
機器學習路線圖
學習群:
大資料-資料探勘2 74367000
【職業規劃】
資料分析那些事(資料分析師入門必看)
資料分析與資料探勘類的職位必備技能
大資料行業如何入門-書籍、工具、案例(問題集錦)
資料科學學習路線圖(入門級)
Python爬蟲實戰(二)
實驗介紹 本實驗通過使用beautifulsoup方法對網頁進行簡單的爬取工作,並對beatifulsoup方法進行簡單的介紹。beautifulsoup開發手冊 示例網頁如下 實驗內容 從本地網頁爬取商品資訊,商品名,評分等級等相關資訊 實驗 from bs4 import beautifulso...
Python爬蟲實戰2 0
這次實戰的內容是非同步載入 非同步載入和普通的數字下表迭代的url不同的地方在於不能直接通過乙個for迴圈來獲取每乙個頁面的內容。如何判別翻頁是否是非同步載入的呢?開啟瀏覽器檢查,然後定位到頁面內容的那部分html 然後在瀏覽器按下翻頁按鈕,如果發現html 部分內容閃了一下,那麼說明網頁是通過非同...
Python文字爬蟲實戰
一 流程 1 獲取網頁原始碼 2 用python讀取原始碼 二 實現 1 原始碼獲取 文字爬蟲,是在已有的文字內容中爬取需要的資訊,這區別於網路爬蟲。由於被檢索的內容是現成的,因此,文字爬蟲又叫 半自動爬蟲 在本例中,我們以暱圖網首頁為目標 因此,我們先到暱圖網首頁,右鍵 檢視源 儲存原始碼到txt...