匯入需要使用的第三方庫
3.統計電影的推薦情況
perfect_counts=(comments_data['推薦']=="力薦").value_counts()
perfect_counts
good_counts=(comments_data['推薦']=="推薦").value_counts()
good_counts
not_bad_counts=(comments_data['推薦']=="還行").value_counts()
not_bad_counts
bad_counts=(comments_data['推薦']=="較差").value_counts()
bad_counts
terrible_counts=(comments_data['推薦']=="很差").value_counts()
繪製電影推薦情況柱狀圖
bar=bar()
bar.add_xaxis(['力薦','推薦','還行','較差','很差'])
bar.add_yaxis('',[1779,1041,442,151,145])
bar.set_global_opts(
title_opts=opts.titleopts(
title="影片戰狼推薦情況",
subtitle="人數")
#獲得分詞後的列表
seg_list=list(jieba.cut(comments_str))
#利用str.len()篩選字串長度,選出大於1的字串
keywords_counts=pd.series(seg_list)
keywords_counts=keywords_counts[keywords_counts.str.len()>1]
print(keywords_counts)
keywords_counts=keywords_counts.value_counts()
print(keywords_counts)
#構建乙個過濾詞的列表
filter_words=['知道','電影','影片','怎麼','還有','這個','這部','有用','沒用','可以','影評','可能','顯示',
'這篇','有劇','全文','乙個','沒有','就是','覺得','一部','回應','但是','還是','劇情','我們',
'還是','不是','什麼','自己','看到','沒關係','真的','感覺','**','很多','你們','豆瓣','時候',
'喜歡','雖然','哪些','那些','這樣','因為','有點','這麼','有些','那麼','這種','主角','作為','非常',
'所以','出來','開始','故事','如果','不能','邏輯','確實','地方','應該','其實','一直','各種',
'首先','一樣','題材','這是','來說','他們','對於','不過','特別','比較','裡面','評分','評價',
'有人','今天','這些','只是','尷尬','問題','鏡頭','完全','一星','不要','光環','而且','不過',
'然後','需要','一點','感受','之前','看看','之後','場景','型別','只有','不會','甚至','大家','一下',
'上映','水下','希望','以及','出現','本來','本身','呵呵','整部']
keywords_counts=keywords_counts.astype(str)
#篩選包含過濾詞的分詞字串
6.繪製詞雲圖
python小白的第一次嘗試,**可以更加優化的地方,希望大家可以指出來,共同進步。
長城評論詞云分析
最近 長城 這部電影很火,爭議也很大,我根據豆瓣底部的點評來分析這部電影在觀眾眼中是怎樣的。此為長城短評鏈結。下面給出 library xml library rcurl library stringr library rwordseg library tm library wordcloud2 l...
評論內容 詞云
coding utf 8 from wordcloud import wordcloud import jieba import matplotlib.pyplot as plt from matplotlib.font manager import fontpropertiesfrom scipy...
python電影名稱詞云 python 詞云
1 寫詞云的思路 資料採集 分詞 生成詞云 2 用到的模組 wordcloud。如果沒有這個模組,cmd進入python所在目錄的scripts資料夾,通過pip安裝。pip install wordcloud。安裝出現以下錯誤 3 開始編碼 匯入模組 from wordcloud import w...