3)計算文章中某個詞語的重要程度,即詞頻和逆向檔案詞頻的乘積tf-idf。
tf-idf = tf * idf
1)jieba分詞;
句子a:我/喜歡/看/電視,不/喜歡/看/電影。
句子b:我/不/喜歡/看/電視,也/不/喜歡/看/電影。
3)計算每篇文章對於這個集合中的詞的詞頻;
句子a:我 1,喜歡 2,看 2,電視 1,電影 1,不 1,也 0。
句子b:我 1,喜歡 2,看 2,電視 1,電影 1,不 2,也 1。
5)計算兩個向量的余弦相似度,值越大就表示越相似;
第一次個人程式設計作業
psp2.1 personal software process stages 預估耗時 分鐘 實際耗時 分鐘 planning 計畫120 estimate 估計這個任務需要多少時間 120development 開發360 analysis 需求分析 包括學習新技術 60 design spec...
第一次個人程式設計作業
github倉庫位址 psp2.1 personal softwareprocess stages 預估耗時 分鐘 實際耗時 分鐘 planning 計畫50 60estimate 估計這個任務需要多少時間 3020 development 開發960 1080 analysis 需求分析 包括學習...
第一次個人程式設計作業
倉庫 psp2.1 personal software process stages 預估耗時 分鐘 實際耗時 分鐘 planning 計畫 estimate 估計這個任務需要多少時間100 development 開發 8802000 analysis 需求分析 包括學習新技術 240420 de...