1.選乙個自己感興趣的主題。
2.用python 編寫爬蟲程式,從網路上爬取相關主題的資料。
3.對爬了的資料進行文字分析,生成詞云。
4.對文字分析結果進行解釋說明。
5.寫一篇完整的部落格,描述上述實現過程、遇到的問題及解決辦法、資料分析思想及結論。
6.最後提交爬取的全部資料、爬蟲及資料分析源**。
#開啟txt文字生成詞云的**:-*- coding : utf-8 -*-
#-*- author : kamchuen -*-
#-*- file : project1 -*-
#-*- time: 2018/4/28 -*-##
-*- songname: 遙遠的她-*-
import
requests
import
json
defgetcomments(musicid):
url = '
'.format(musicid)
payload =
headers =
'.format(musicid),
'host
': '
music.163.com',
'origin
': '
'}response = requests.post(url=url, headers=headers, data=payload)
data =json.loads(response.text)
hotcomments =
for hotcomment in data['
hotcomments']:
item =
#return [content['
content
'] for content in
hotcomments]
if__name__ == '
__main__':
hot = getcomments(191232)
(hot)
file = open('
hot.txt
','w')
for hotword in
hot:
file.write(hotword+'\n'
) file.close()
#結果:-*- coding : utf-8 -*-
#-*- author : kamchuen -*-
#-*- file : wordcloudtest1 -*-
#-*- time: 2018/4/28 -*-
#-*- description: 詞云測試-*-
from os import
path
from pil import
image
import
numpy as np
import
matplotlib.pyplot as plt
from wordcloud import
wordcloud, stopwords, imagecolorgenerator
d = path.dirname(__file__
)text = open(path.join(d, '
hot.txt
')).read()
alice_coloring = np.array(image.open(path.join(d, "
奧特曼.jpg
")))
stopwords =set(stopwords)
stopwords.add(
"said")
wc = wordcloud(background_color="
white
", max_words=2000, mask=alice_coloring,
stopwords=stopwords, max_font_size=85, font_path="
sthupo.ttf
",random_state=50)
wc.generate(text)
image_colors =imagecolorgenerator(alice_coloring)
#show
plt.imshow(wc, interpolation="
bilinear")
plt.axis(
"off")
plt.figure()
plt.imshow(wc.recolor(color_func=image_colors), interpolation="
bilinear")
plt.axis(
"off")
plt.figure()
plt.imshow(alice_coloring, cmap=plt.cm.gray, interpolation="
bilinear")
plt.axis(
"off")
plt.show()
爬蟲大作業
1 選乙個自己感興趣的主題。2 用python 編寫爬蟲程式,從網路上爬取相關主題的資料。3 對爬了的資料進行文字分析,生成詞云。4 對文字分析結果進行解釋說明。5 寫一篇完整的部落格,描述上述實現過程 遇到的問題及解決辦法 資料分析思想及結論。6 最後提交爬取的全部資料 爬蟲及資料分析源 impo...
爬蟲大作業
1.選乙個自己感興趣的主題。2.用python 編寫爬蟲程式,從網路上爬取相關主題的資料。3.對爬了的資料進行文字分析,生成詞云。4.對文字分析結果進行解釋說明。5.寫一篇完整的部落格,描述上述實現過程 遇到的問題及解決辦法 資料分析思想及結論。6.最後提交爬取的全部資料 爬蟲及資料分析源 impo...
爬蟲大作業
1.選乙個自己感興趣的主題。2.用python 編寫爬蟲程式,從網路上爬取相關主題的資料。3.對爬了的資料進行文字分析,生成詞云。4.對文字分析結果進行解釋說明。5.寫一篇完整的部落格,描述上述實現過程 遇到的問題及解決辦法 資料分析思想及結論。6.最後提交爬取的全部資料 爬蟲及資料分析源 在本次作...