前言
通過貓眼電影top100榜的爬蟲,然後進行視覺化,讓學員體會到,小資料爬蟲也能玩出這樣的花樣來。
爬蟲
爬蟲分析
這裡是獲取的是top100的電影資料,進行了跨頁爬蟲,獲取的字段:電影名,主演,上映時間,評分,電影型別和時長。最後儲存在csv檔案中。
爬蟲**
資料分析資料分析我做成了ppt的樣子,大家可以看看~
總體情況
100部電影,平均得分9.0,平均電影時長128.63。
電影年份趨勢
電影年份趨勢不大,規律不太明顯。
電影月份
大家看電影都知道,電影基本在假期上映更有熱度,這裡統計出來,發現下半年的電影比上半年電影好很多~
地區
中國和美國還是佔了很多的,南韓和日本電影也很不錯~
電影型別
電影大部分都是劇情的,愛情才是真諦啊。
演員
小哥和星爺承載了我們的清楚呀~
總結
別看這小小的100條資料,是不是也可以玩出不一樣的花樣來。
python資料分析
以網路爬蟲為例,網路爬蟲是乙個自動提取網頁的程式,爬蟲是搜尋引擎的第一步,也是最容易的一部。網頁搜尋,建立索引,查詢排序 用c c 效率高,速度塊,適合通用搜尋引擎做往往爬取。但是它的缺點也特別明顯 開發慢,寫起來又臭又長的。而python無論在資料分析還是在指令碼自動化編寫尚都是簡單,易學的。良好...
python資料分析
陣列間的算術運算 npwhere pandas的使用 np.random.rand 3,4 產生乙個3行4列的矩陣 0 1之間的 in 32 data1 1,2,3,4.0 in 34 arr1 np.array data1 in 35 arr1 out 35 array 1.2.3.4.in 37...
python資料分析
1.資料分析的含義與目標 2.python與資料分析 3.python資料分析大家族 4.python環境搭建 一 numpy 功能 ndarray 多維操作 線性代數 官網 numpy是python語言的乙個擴充程式庫。支援高階大量的維度陣列與矩陣運算,此外也針對陣列運算提供大量的數學函式庫。nu...