Elasticsearch之停用詞

2021-09-08 12:28:17 字數 377 閱讀 9084

前提

elasticsearch的停用詞

1、有些詞在文字**現的頻率非常高,但是對文字所攜帶的資訊基本不產生影響。

2、英文

a、an、the、of

3、中文

的、了、著、是 、標點符號等

4、文字經過分詞之後,停用詞通常被過濾掉,不會被進行索引。

5、在檢索的時候,使用者的查詢中如果含有停用詞,檢索系統也會將其過濾掉(因為使用者輸入的查詢字串也要進行分詞處理)。

6、排除停用詞可以加快建立索引的速度,減小索引庫檔案的大小。

7、英文停用詞

8、中文停用詞

/chinese-stopwords

後續部落格

ElasticSearch索引別名和零停機

起因 顯而易見,如果我們需要修改索引,而重建需要刪除舊的索引,會導致線上服務不可用,因此,我們想要在不影響線上檢索服務的同時,修改索引,就需要用到elasticsearch的乙個特性,別名機制 什麼是索引別名 索引 別名 就像乙個快捷方式或軟連線,可以指向乙個或多個索引,也可以給任何乙個需要索引名的...

elasticsearch之mapping中元屬性

1.1 all是乙個特殊的字段,它把其他欄位的值用空格分開,作為乙個大string,進行檢索,預設不會對該字段進行單獨儲存。該欄位通常用於搜尋並不知道該值是否存在文件中,類似迷糊搜尋。例如下面的例子 搜尋包含johe smith 1970任何其中乙個的文件。get my index search 注...

全文搜尋之 Elasticsearch

elasticsearch es 是乙個基於 lucene 的開源搜尋引擎,它不但穩定 可靠 快速,而且也具有良好的水平擴充套件能力,是專門為分布式環境設計的。json 輸入 輸出格式為 json,意味著不需要定義 schema,快捷方便 restful 基本所有操作 索引 查詢 甚至是配置 都可以...