自嗨筆記 2 微博疫情輿情分析 輿情分析部分

2021-10-05 16:50:46 字數 2897 閱讀 3490

previously![ 自嗨筆記#1] 微博疫情輿情分析—爬取部分

二、建立需求

利用snownlp,情感分析

嘗試利用已有資訊,挖掘深度規律

三,**實現

def

snownlp_c

(element)

:try

: sn=snownlp(element)

return

round

(sn.sentiments,1)

except

:pass

comment[

'snownlp'

]=comment[

].transform(snownlp_c)

-0.5

#以0.5為分界線,處理為[-0.5,0.5]的區間,0.5為正向

其實這裡用柱狀圖更好些

['性別'])

['作者id'

].count(

).reset_index(

)plt.figure(

)plt.pie(a2[

'作者id'

],labels=

['女'

,'男'],

labeldistance =

1.1,autopct =

'%3.1f%%'

,shadow =

false

, startangle =

90,pctdistance =

0.6)

plt.title(

'微博作者性別統計'

['性別'])

['id'

].count(

).reset_index(

)plt.figure(

)plt.pie(a1[

'id'

],labels=

['女'

,'男'],

labeldistance =

1.1,autopct =

'%3.1f%%'

,shadow =

false

, startangle =

90,pctdistance =

0.6)

plt.title(

,fontproperties=

'simhei'

)plt.show(

)

max_date = news[

'發布時間'].

max(

)min_date = news[

'發布時間'].

min(

)print

('時間範圍'

,max_date,min_date)

n=news.groupby(by=

['暱稱'])

['新聞id'

].count(

).reset_index(

).sort_values(by=

'新聞id'

'互動時間'

]=dt[

'時間日期'

]-dt[

'發布時間'

]print

(dt[

'互動時間'

].mean(

))

m=comment.groupby(by=

'id')[

].count(

).reset_index(

).sort_values(by=

,axis=

0,ascending=

false

).head(

)print

(m)# s=comment['id'].isin(m['id'])

for i in m[

'id']:

print

(comment.loc[comment[

'id'

]== i,[,

,'新聞id'

,'時間日期']]

新浪微博API學習使用筆記(2)

因為我擅長寫的是b s的工程,所以先確定了這個分析工具是乙個b s架構的,然後來想想都應該有哪些功能點。上圖統計時間是2012 3 12晚9點20,粉絲總數為4770 開發筆記 session.getattribute accesstoken 是否有值,如果沒有則進行認證,如果有就不操作。這樣改了之...

微博應用研究 2

再看乙個使用量不大,但又不是很差的應用,也是鬧鐘應用,這個再差也比我做的強 這個應用有個最大的特點也是最大的缺點 就是違反了 微博正規化,神馬是微博正規化,如下圖 現在100 的人,認為發微博應該是這個樣子,這個也是標準的輸入框和發布按鈕為排放位置,但這個確把兩個的距離方的那麼遠,實在是沒用幾天微博...

鄂牌車主抗疫去世發帖者承認瞎編 微博點選量數億

據 報道,日前湖北孝感槐蔭公園一輛無人認領的轎車引關注。有 的報道中引用了拍攝者王先生 車主曾參與抗疫後發燒去世 說法,並引發軒然大波,微博點選量數億,還有人在該車引擎蓋上放花祭奠,然而此事很快反轉。鄂牌車主抗疫去世發帖者承認瞎編 6 月 22 日,鄂牌車主因新冠去世 拍攝者王先生稱,車主曾參與抗疫...