部落格班級
2018級計算機和綜合實驗班
作業要求
第一次個人程式設計作業
作業目標
資料採集,資料處理,資料分析展示(詞雲圖)以及git的使用
作業源**
first-personal-work
學號211806213
一、時間記錄
**行數
分析時間
編寫時間
100+
4h+7h+
二、作業步驟
資料採集
可以發現二者的區別是cursor=和_=的資料會發生改變。cursor=的數值在上一次資料的last中,而_=數值每次+1。
使用jieba分詞,並統計數量
分詞完後將結果以字典形式儲存為json
生成詞雲圖
三、github
轉殖倉庫到本地: git clone
進入轉殖到本地的資料夾: cd first-personal-work
新建分支: git switch -c crawl
將上傳的檔案複製到資料夾
上傳檔案: git add .
提交: git commit -m "提交資訊"
上傳: git push -u origin crawl
重複3-7操作完成另一分支
切換回主分支後合併分支: git merge crawl;git merge chart
四、經驗總結
感覺自己好廢噗_(:з)∠)_,還需要繼續學習更多知識,加強自己的程式設計能力。
五、參考文獻
介紹一種安裝python第三方庫jieba庫的方法
利用jieba進行中文分詞並進行詞頻統計
echarts繪製詞雲圖及常用屬性
顧琳傑 第一次個人程式設計作業
部落格班級 2018級計算機和綜合實驗 作業要求 第一次個人程式設計作 作業目標 資料採集,分析和展示 作業源 學號 211814168 過程花費時間 資料分析 1h 實現 2h詞雲圖實現 3h上傳 1h一 資料採集 二 資料處理 def word counter read buff words d...
第一次個人程式設計作業
psp2.1 personal software process stages 預估耗時 分鐘 實際耗時 分鐘 planning 計畫120 estimate 估計這個任務需要多少時間 120development 開發360 analysis 需求分析 包括學習新技術 60 design spec...
第一次個人程式設計作業
github倉庫位址 psp2.1 personal softwareprocess stages 預估耗時 分鐘 實際耗時 分鐘 planning 計畫50 60estimate 估計這個任務需要多少時間 3020 development 開發960 1080 analysis 需求分析 包括學習...