這個作業屬於哪個課程
<2018 級計算機和綜合實驗班
>
這個作業要求在**
作業要求的鏈
這個作業的目標
《資料採集,視覺化,前端》
作業源**
first-personal-work
學號<211808579>
計畫安排
步驟計畫時間
----------
--------------------------------------
理解作業要求
30分鐘
計畫如何完成
30分鐘
相關資料的學習
2天建立倉庫並連線
15分鐘
編寫爬蟲**
1天詞頻統計及json轉化
半天製作此雲圖
半天git上傳
1小時編寫爬蟲
通過比較**發現只有 cursor 和 source 進行了改變,其他是不變的,source 是在第乙個的基礎上進行加一操作,所以只需要獲取到 cursor 即可。
編寫爬取內容
3.編寫json
在做詞頻統計的時候,在import jieba時出現問題
參考網頁
pycharm安裝jieba包(中文詞分解析)
嗚。。。這個jieba真的花了我太多時間了
而後進行頻數統計在完成**的過程中遇到報錯「unicodedecodeerror: 'utf-8' codec can't decode byte」一時間也不知道如何
解決,最後搜尋得到了解答
python 報錯"unicodedecodeerror: 'utf-8' codec can't decode byte"的解決辦法
哈哈正如他所說的「原檔案的編碼方式是「ansi」. 哦哦哦哦哦哦哦哦哦哦哦。。。。不報錯才怪呢!」
製作詞雲圖
在順利完成js之後,就到了詞雲圖的環節,在這裡我要感謝我的同學李明特,他在這個環節幫到了我許多,還給我提供了乙個比較豐富的資源,並且跟我講解了製作詞雲圖的方法,這可以說是到現在為止比較順利的緩解了!!
將所有檔案上傳到遠端倉庫
將所有的檔案一一git add 到暫存區,在經過 get commit -m 上傳
合併分支
最後git push 將所有檔案傳輸到遠端倉庫中
個人總結
總的來說這次的作業並不算順利,有許多爬蟲的知識都遺忘了,需要拿書現學。
對於git的操作和用途了解很少,很難快速準確的達到要求。
在庫的安裝上花費了比較多的時間,需要加強練習。
蔡澤淵 第一次個人程式設計作業
部落格班級 2018級計算機和綜合實驗班 作業要求 作業目標 作業源 作業鏈結 學號211806154 步驟花費時間 3h使用jieba分詞進行分詞並統計數量 2h將處理完的資料在hbuilder上製成詞雲圖 5h上傳到遠端倉庫github 找到規律後,參考了下模板,開始編寫 匯入jieba分詞庫進...
賀芳鑫 第一次個人程式設計作業
部落格班級 作業要求 homework 11732 作業目標 作業源 學號211806214 作業流程 步驟耗時 2h5h 3.製作詞雲圖 5h4.上傳github 此次作業有兩題,第二題疫情統計分布很多東西都沒有學過,相比第一題爬蟲陌生多了,分析題目查閱資料了解相關知識後開剛,這次作業還是比較難的...
徐鑫澤 第三次個人作業
這個作業屬於哪個課程 2018 級計算機和綜合實驗班 這個作業要求在 作業要求的鏈結 這個作業的目標 針對此次的問答,提出問題並盡可能提出解決方法 作業正文 見下方學號 211808579 其他參考文獻 構建之法 nabcd模型等 1.如何準確推送使用者需要的圖書 2.如何規定佔座系統的基本規則,以...