最近愛情公寓上線了大電影,賣的就是情懷,但是據說豆瓣上已經給出了2.7的評分,也就比第一爛片逐夢演藝圈高那麼一點點,於是今天寫了乙個爬蟲,爬了豆瓣一千多條短評,看一看這個電影為什麼這麼渣。
廢話不說,直接**,因為還是挺簡單的
from lxml import etree
from urllib import request
import ssl
from jieba import analyse
import jieba
from wordcloud import wordcloud, stopwords
from matplotlib import pyplot as plt
//得到所有短評
def get_comments(comments):
print(comments)
root = etree.html(comments)
comment_content = ''
comment_list = root.xpath('//*[@class="short-content"]/text()')
print('comment size is %d' % len(comment_list))
for comment in comment_list:
comment_content += comment
comment_content = comment_content.replace('()', '')
print("comment_content is %s" % comment_content)
return comment_content
//生成詞云
def generate_wordcloud(comments):
stopwords = set(stopwords)
stopwords.add('愛情')
stopwords.add('公寓')
stopwords.add('電影')
stopwords.add('評分')
//呼叫上面的方法生成詞云
複製**
通過詞雲圖可以看出基本上就是將愛情公寓這個電影拍成了盜墓片,還有就是自身存在的抄襲問題。 感覺電視劇集和綜藝拿出來拍定影,就是圈錢。。。
扒一扒vue的資料追蹤原理
大家都知道在angular或vue中,資料的更新會實時的反應到dom上,那麼到底是什麼原理呢,下面就vue 一下。開啟vue的官網,可以看到它關於vue如何追蹤變化的原理。把乙個普通物件傳給 vue 例項作為它的 data 選項,vue.js 將遍歷它的屬性,用 object.defineprope...
jQuery原始碼學習扒一扒jQuery物件初使化
神奇的jquery可以這樣玩 jquery id css 或 jquery id html 這麼玩 jquery id 這個物件是怎麼建立出來的 所以打算來扒一扒 jquery原始碼部分 var jquery function 建構函式的原型給了fn jquery.fn jquery.prototy...
扒一扒2023年我看過的書
技術類 com技術內幕 看這本書的理由很簡單,我看到公司的 有用到com技術,雖然我的工作並不涉及這個,但以前就對com垂涎已久,所以就看了這本書,沒看完,看到第9章,後面就沒看了。內容通俗易懂,寫的很好。明年準備花一些時間再看下這書,還有 com本質論 directx 9遊戲開發程式設計基礎 傳說...