previously![ 自嗨筆記#1] 微博疫情輿情分析—爬取部分
二、建立需求
利用snownlp,情感分析
嘗試利用已有資訊,挖掘深度規律
三,**實現
def
snownlp_c
(element)
:try
: sn=snownlp(element)
return
round
(sn.sentiments,1)
except
:pass
comment[
'snownlp'
]=comment[
].transform(snownlp_c)
-0.5
#以0.5為分界線,處理為[-0.5,0.5]的區間,0.5為正向
其實這裡用柱狀圖更好些
['性別'])
['作者id'
].count(
).reset_index(
)plt.figure(
)plt.pie(a2[
'作者id'
],labels=
['女'
,'男'],
labeldistance =
1.1,autopct =
'%3.1f%%'
,shadow =
false
, startangle =
90,pctdistance =
0.6)
plt.title(
'微博作者性別統計'
['性別'])
['id'
].count(
).reset_index(
)plt.figure(
)plt.pie(a1[
'id'
],labels=
['女'
,'男'],
labeldistance =
1.1,autopct =
'%3.1f%%'
,shadow =
false
, startangle =
90,pctdistance =
0.6)
plt.title(
,fontproperties=
'simhei'
)plt.show(
)
max_date = news[
'發布時間'].
max(
)min_date = news[
'發布時間'].
min(
)print
('時間範圍'
,max_date,min_date)
n=news.groupby(by=
['暱稱'])
['新聞id'
].count(
).reset_index(
).sort_values(by=
'新聞id'
'互動時間'
]=dt[
'時間日期'
]-dt[
'發布時間'
]print
(dt[
'互動時間'
].mean(
))
m=comment.groupby(by=
'id')[
].count(
).reset_index(
).sort_values(by=
,axis=
0,ascending=
false
).head(
)print
(m)# s=comment['id'].isin(m['id'])
for i in m[
'id']:
print
(comment.loc[comment[
'id'
]== i,[,
,'新聞id'
,'時間日期']]
新浪微博API學習使用筆記(2)
因為我擅長寫的是b s的工程,所以先確定了這個分析工具是乙個b s架構的,然後來想想都應該有哪些功能點。上圖統計時間是2012 3 12晚9點20,粉絲總數為4770 開發筆記 session.getattribute accesstoken 是否有值,如果沒有則進行認證,如果有就不操作。這樣改了之...
微博應用研究 2
再看乙個使用量不大,但又不是很差的應用,也是鬧鐘應用,這個再差也比我做的強 這個應用有個最大的特點也是最大的缺點 就是違反了 微博正規化,神馬是微博正規化,如下圖 現在100 的人,認為發微博應該是這個樣子,這個也是標準的輸入框和發布按鈕為排放位置,但這個確把兩個的距離方的那麼遠,實在是沒用幾天微博...
鄂牌車主抗疫去世發帖者承認瞎編 微博點選量數億
據 報道,日前湖北孝感槐蔭公園一輛無人認領的轎車引關注。有 的報道中引用了拍攝者王先生 車主曾參與抗疫後發燒去世 說法,並引發軒然大波,微博點選量數億,還有人在該車引擎蓋上放花祭奠,然而此事很快反轉。鄂牌車主抗疫去世發帖者承認瞎編 6 月 22 日,鄂牌車主因新冠去世 拍攝者王先生稱,車主曾參與抗疫...