爬蟲大作業

2022-06-02 05:54:12 字數 2757 閱讀 3635

1.選乙個自己感興趣的主題。

2.用python 編寫爬蟲程式,從網路上爬取相關主題的資料。

3.對爬了的資料進行文字分析,生成詞云。

4.對文字分析結果進行解釋說明。

5.寫一篇完整的部落格,描述上述實現過程、遇到的問題及解決辦法、資料分析思想及結論。

6.最後提交爬取的全部資料、爬蟲及資料分析源**。

#

-*- coding : utf-8 -*-

#-*- author : kamchuen -*-

#-*- file : project1 -*-

#-*- time: 2018/4/28 -*-##

-*- songname: 遙遠的她-*-

import

requests

import

json

defgetcomments(musicid):

url = '

'.format(musicid)

payload =

headers =

'.format(musicid),

'host

': '

music.163.com',

'origin

': '

'}response = requests.post(url=url, headers=headers, data=payload)

data =json.loads(response.text)

hotcomments =

for hotcomment in data['

hotcomments']:

item =

#return [content['

content

'] for content in

hotcomments]

if__name__ == '

__main__':

hot = getcomments(191232)

print

(hot)

file = open('

hot.txt

','w')

for hotword in

hot:

file.write(hotword+'\n'

) file.close()

開啟txt文字生成詞云的**:

#

-*- coding : utf-8 -*-

#-*- author : kamchuen -*-

#-*- file : wordcloudtest1 -*-

#-*- time: 2018/4/28 -*-

#-*- description: 詞云測試-*-

from os import

path

from pil import

image

import

numpy as np

import

matplotlib.pyplot as plt

from wordcloud import

wordcloud, stopwords, imagecolorgenerator

d = path.dirname(__file__

)text = open(path.join(d, '

hot.txt

')).read()

alice_coloring = np.array(image.open(path.join(d, "

奧特曼.jpg

")))

stopwords =set(stopwords)

stopwords.add(

"said")

wc = wordcloud(background_color="

white

", max_words=2000, mask=alice_coloring,

stopwords=stopwords, max_font_size=85, font_path="

sthupo.ttf

",random_state=50)

wc.generate(text)

image_colors =imagecolorgenerator(alice_coloring)

#show

plt.imshow(wc, interpolation="

bilinear")

plt.axis(

"off")

plt.figure()

plt.imshow(wc.recolor(color_func=image_colors), interpolation="

bilinear")

plt.axis(

"off")

plt.figure()

plt.imshow(alice_coloring, cmap=plt.cm.gray, interpolation="

bilinear")

plt.axis(

"off")

plt.show()

結果:

爬蟲大作業

1 選乙個自己感興趣的主題。2 用python 編寫爬蟲程式,從網路上爬取相關主題的資料。3 對爬了的資料進行文字分析,生成詞云。4 對文字分析結果進行解釋說明。5 寫一篇完整的部落格,描述上述實現過程 遇到的問題及解決辦法 資料分析思想及結論。6 最後提交爬取的全部資料 爬蟲及資料分析源 impo...

爬蟲大作業

1.選乙個自己感興趣的主題。2.用python 編寫爬蟲程式,從網路上爬取相關主題的資料。3.對爬了的資料進行文字分析,生成詞云。4.對文字分析結果進行解釋說明。5.寫一篇完整的部落格,描述上述實現過程 遇到的問題及解決辦法 資料分析思想及結論。6.最後提交爬取的全部資料 爬蟲及資料分析源 impo...

爬蟲大作業

1.選乙個自己感興趣的主題。2.用python 編寫爬蟲程式,從網路上爬取相關主題的資料。3.對爬了的資料進行文字分析,生成詞云。4.對文字分析結果進行解釋說明。5.寫一篇完整的部落格,描述上述實現過程 遇到的問題及解決辦法 資料分析思想及結論。6.最後提交爬取的全部資料 爬蟲及資料分析源 在本次作...