1.1 修改elasticsearch.yml配置檔案:
- 開啟啟用停用詞開關
enabled_stop_filter: true ##是否基於詞典過濾
- 配置停用詞檔案路徑: 注意這裡必須是相對於 elasticsearch.yml配置檔案 位置的 相對路徑。
stop_path: "../dic_stop/stop.dic" ##停止過濾詞典
1.2 放置停用詞檔案。我們這裡新增兩個停用詞。每行寫乙個停用詞。
重啟es後,在es上測試停用詞效果。
post提交:
_analyze?pretty=true
可以看到 * 和 ? 都被過濾掉了。
中文停用詞表 哈工大停用詞表
一一 一.昉 也 一.數 數 元 噸 subexp supsub lex 第二一番 一直乙個 一些許多 種有的是 也就是說 末 末啊阿 哎哎呀哎喲唉 俺俺們按按照 吧吧噠把罷了 被本本著比 比方比如鄙人彼 彼此邊別別的 別說並並且不比 不成不單 不但不獨 不管不光 不過不僅 不拘不論 不怕不然 不如...
中文停用詞表
末 末啊阿 哎哎呀哎喲唉 俺俺們按按照 吧吧噠把罷了 被本本著比 比方比如鄙人彼 彼此邊別別的 別說並並且不比 不成不單 不但不獨 不管不光 不過不僅 不拘不論 不怕不然 不如不特 不惟不問不只朝 朝著趁趁著乘 沖除除此之外 除非除了此此間 此外從從而打 待但但是當 當著到得的 的話等等等地 第叮咚...
Elasticsearch之停用詞
前提 elasticsearch的停用詞 1 有些詞在文字 現的頻率非常高,但是對文字所攜帶的資訊基本不產生影響。2 英文 a an the of 3 中文 的 了 著 是 標點符號等 4 文字經過分詞之後,停用詞通常被過濾掉,不會被進行索引。5 在檢索的時候,使用者的查詢中如果含有停用詞,檢索系統...