原理:pagerank演算法原理
在輿情熱點挖掘中引入 pagerank演算法思想,構造輿情網路,單個節點的重要性來 自于該網路中其 他成員節點重要性的線性組合,從而建構乙個線性方程組, 輿情網路 中各節點的重要性即該線性方程組最大特徵值所對應的特徵向量。
以下演算法可以用來描述輿情絡 的熱點挖掘過程 :
(1)取 n個直接或間接鏈結關係的頁面構建輿情網路,每個頁面為該網路的節點 ;
(2)建立該輿情網路的鄰接矩陣a,其中aij=1表示節點 i與節點j之間存在直接連線;aij=0表示節點i與節點j之間不存在直接連線 ; λ 表示矩陣a的主特徵值,主特徵值 λ 的特徵向量用 e表示 , 即e= (e1,e2,⋯,en );
(3)定義 xλ =ax , 有 :
使用公式( 3) 計算輿情網路節點的特徵向量值, 降序後輸出, 得到輿情熱點。
應用例項:
以上圖所示的簡單輿情網路中標註的a、 b、 c、 d這4個節點為例,使用pagerank方法, 通過計算 4個節點的特徵 向量挖掘**熱點。節點 a處於該輿情網路中心位置,通過 計算得知其特徵向量值為1.2,說明了 a節點的核心地位;網路節點 b的特徵向量值為1.14,位居其 次;網路節點 c的特徵向量值為1.01;網路節點 d的特徵向量值為 0.71, 其重要性即熱度相對最低。
原理:hits演算法原理
在輿情熱點挖掘中引入hits演算法基本思想,將網頁內容核心度對映為輿情網路中節點核心度,用c表示;對網頁內容核心的附屬關係則對映為輿情網路中節點的趨近核心度,用n表示.以下演算法可以用來描述輿情網路的熱點挖掘過程:
(1)用頁面和鏈結關係建立輿情網路,構造演算法的初始集合s,s中的元素為輿情網路的任意個節點p,節點數m=200;
(3)計算s中所有輿情節點p的核心度值pc和趨近核心度值pn,分別用式(1)和(2)表示
其中:各輿情節點的核心度值c和趨近核心度值n均初始化為1;
(4)對步驟3進行迭代,直至pc與pn趨於穩定;
(5)將計算所得輿情節點的核心度值pc進行降序排列後輸出,得到輿情熱點.
參考:《網路輿情熱點挖掘演算法研究與實現》黃敏
網路輿情怎麼分析研判的方案
面對網際網路上易發高發的輿情突發事件,處理不及時,就會形成社會 熱點。問題是網路資訊又是7 24小時無休止的傳播擴散,若無法做到及時監測,盡早分析研判輿情,就談不上及時主動處理。因此,做好網上輿情監測研判工作是輿情危機處理的前提。那麼,網路輿情怎麼分析研判呢?網路輿情怎麼分析研判的方案,如下 1.建...
nagle演算法在網路程式設計的作用
tcp ip協議中,無論傳送多少資料,總是要在資料前面加上協議頭,同時,對方接收到資料,也需要傳送ack表示確認。為了盡可能的利用網路頻寬,tcp總是希望盡可能的傳送足夠大的資料。乙個連線會設定mss引數,因此,tcp ip希望每次都能夠以mss尺寸的資料塊來傳送資料 nagle演算法就是為了盡可能...
鏈結分析演算法之 SALSA演算法
salsa演算法的初衷希望能夠結合pagerank和hits演算法兩者的主要特點,既可以利用hits演算法與查詢相關的特點,也可以採納pagerank的 隨機遊走模型 這是salsa演算法提出的背景。由此可見,salsa演算法融合了pagerank和hits演算法的基本思想,從實際效果來說,很多實驗...