大家都知道,我們solr一項特別大的好處是靈活的配置可以更好的實現我們的開發需求,今天就看一下在我們的實際開發中怎麼選擇fieldtype 中同義詞的選擇。
首先要知道我們如果分詞的詞項越多那麼占用我們的磁碟就會越大,但是如果同義詞是標準化格式那麼也是可以的,如果在索引時新增同義詞,那麼增加新詞時需要重新索引,這是乙個缺點,所以總結如下:
1.如果同義詞標準化配置,並且新詞頻率不高,我們可以在索引時使用同義詞
2.查詢時使用同義詞:這種方式可以適應新詞新增,同時也不會影響其效率,所以一般建議搜尋時使用同義詞。
python替換同義詞 jieba替換同義詞
所以我們打算現將使用者的輸入做乙個預處理 將一些同義詞 手動 轉化為 知識圖譜的中標準輸入。構建同義詞檔案tongyici tihuan.txt,每乙個同義詞列為一行,每行第乙個為希望分隔後呈現的詞語,後幾個為第乙個詞的同義詞,用tab鍵分隔,比如 年休假 年假 年休 北京 北平 首都在這個例子裡 ...
常見同義詞
目錄originate from derive from stem from spring from giant n.故事中常為殘酷而愚蠢的 巨人 巨人 巨獸 巨型植物 大公司 強大的組織 adj.巨大的 特大的 偉大的 vast adj.遼闊的 巨大的 龐大的 大量的 tremendous adj...
同義詞(別名)
同義詞 別名 注意 如果檢視其他使用者的表,報錯表或檢視不存在 可能是許可權不足 需要授權 conn as sysdba grant select on hr.employees to scott conn scott tiger select count from hr.employees con...