下面是實現的**:
接下來就是實現ngd演算法公式:
public double getrelative(string keyword1,string keyword2)
double fenzi = (double) (math.max(math.log(fx), math.log(fy))-math.log(fxy));
double fenmu = (double) (math.log(n)-math.min(math.log(fx), math.log(fy)));
/*** fenzi = 0 => fx=fxy=n => "關聯大"
* fenmu = 0 => fx = fy = n => "都是頻繁詞"
* */
double ngd = 0;
if(fenmu == 0)
else if(fenzi == 0)
else
return ngd;
}
還有一點需要注意,這裡返回的值並不是關聯程度,首先它是與關聯程度成反相關的,即值越接近於0,關聯度越大,而且真正演算法中的n是baidu的總頁面數,我們只是利用baidu的搜尋上限去近似,所以算出來的數並不是我們理解的關聯程度,但是這是乙個保序的函式,即當兩個詞關聯度越大時,他們之間的ngd值就越接近於0,所以當我們對我們的系統進行大量實驗後,我們發現當ngd值小於0.35時,表明兩個詞直接具有可信任程度的關 2018 4 21 山東大學學習資源聚合平台工作
今天我主要與同學討論了一下路由問題 應當採用knowledges question id獲取到資訊 而不是採用course id knowledges question id 也許第二條路由資訊看起來更加易於理解,與model的組織形式相符,但是當想做主頁的精品推薦的時候,就必須去先進入某個cour...
2018 5 27 山東大學學習資源聚合平台工作
今天做了摘要的自動生成和手動新增操作 如果使用者選擇自動方式,就會呼叫後台的函式自動為其生成摘要,現在這個演算法只是取前面幾個字元做為摘要,後期再改進演算法,當使用者選擇手動時就可以手動輸入自己的摘要 同時在controller中新加操作 同時,同步了question和resource的介面 接下來...
山東大學學報稿件查詢
查詢稿件狀態並上傳郵箱,很多國內期刊模板一致隨意改動 coding utf 8 time 2019 12 1 22 17 author yemanzhongting email sggzhang whu.edu.cn file 1.py software pycharm usr bin python...