es搜尋核心與實戰 Day02

2021-10-07 05:25:45 字數 1931 閱讀 5796

倒排索引包含兩個部分

​ 單詞詞典一般比較大,可以通過b +樹或雜湊拉鍊法實現,以滿足高效能的插入與查詢

get _analyze

1.standard analyzer

,,

,,,,

,,,,

,,]}

2.****** analyzer

,,

,,,,

,,,,

,]}

3.whitespace analyzer

,,

,,,,

,,,,

,]}

4.stop analyzer

,,

,,,,

,,,]

}

5.keyword analyzer

不分詞,直接將輸入當成乙個term輸出

6.pattern analyzer

7.english analyzer

page rank演算法

a.指定字段

查詢出指定字段(title)值為2012的資料

get /movies/_search?q=

2012

&df=title

b.泛查詢

查詢出任意字段值為2012的資料

get /movies/_search?q=

2012

c.term and phrase
//使用引號,phrase查詢

get /movies/_search?q=title:

"beautiful mind"

d.分組查詢
//分組,bool查詢

get /movies/_search?q=title:

(beautiful mind)

必須包含beautiful和mind

//查詢美麗心靈

get /movies/_search?q=title:

(beautiful and mind)

//查詢美麗心靈

get /movies/_search?q=title:

(beautiful %

2bmind)

必須包含beautiful不包含mind

//查詢美麗心靈

get /movies/_search?q=title:

(beautiful not mind)

e.範圍查詢

年份大於1980

//範圍查詢,區間寫法/數學寫法

get /movies/_search?q=year:

>=

1980

f.萬用字元查詢

​ title:mi?d

​ title:be*

post /movies/_search}}

post /movies/_search}}

}

post /movies/_search}}

}

​ +替代and

​ | 替代or

​ -替代not

es搜尋核心與實戰Day05

1.詞頻tf term frequency 檢索詞在子篇文件 現的頻率 檢索詞出現的次數除以文件的總字數 度量一條查詢和結果文件相關性的簡單方法 簡單將搜尋中每一乙個詞的tf進行相力 tf 區塊鏈 tf 的 tf 應用 stop word 的 在文件 現了很多次,但是對貢獻相關度幾乎沒有用處,不應該...

es搜尋核心與實戰Day07

hash演算法確保文件均勻分散到分片中 預設的 routing 值是文件id 可以自行制定routing數值,例如用相同國家的商品,都分配到指定的shard 設定index setting後,primary數,不能隨意修改的更本原因 更新乙個文件 a.倒排索引的不可變性 1.無需考慮併發寫檔案的問題...

web應用開發實戰作業day02

1.屬性和標籤什麼關係?html屬性一般都出現在html標籤中,html屬性是html標籤的一部分。標籤可以有屬性,它包含了額外的資訊,屬性的值一般要在引號中 有時也可以不加引號 標籤可以擁有乙個或多個屬性,也可以沒有屬性 屬性一般由屬性名和值成對出現。屬性選擇器可以挑選帶有特殊屬性的標籤語法 屬性...