倒排索引包含兩個部分
單詞詞典一般比較大,可以通過b +樹或雜湊拉鍊法實現,以滿足高效能的插入與查詢
get _analyze
1.standard analyzer
,,
,,,,
,,,,
,,]}
2.****** analyzer
,,
,,,,
,,,,
,]}
3.whitespace analyzer
,,
,,,,
,,,,
,]}
4.stop analyzer
,,
,,,,
,,,]
}
5.keyword analyzer
不分詞,直接將輸入當成乙個term輸出
6.pattern analyzer
7.english analyzer
page rank演算法
a.指定字段
查詢出指定字段(title)值為2012的資料
get /movies/_search?q=
2012
&df=title
b.泛查詢
查詢出任意字段值為2012的資料
get /movies/_search?q=
2012
c.term and phrase//使用引號,phrase查詢
get /movies/_search?q=title:
"beautiful mind"
d.分組查詢//分組,bool查詢
get /movies/_search?q=title:
(beautiful mind)
必須包含beautiful和mind
//查詢美麗心靈
get /movies/_search?q=title:
(beautiful and mind)
//查詢美麗心靈
get /movies/_search?q=title:
(beautiful %
2bmind)
必須包含beautiful不包含mind
//查詢美麗心靈
get /movies/_search?q=title:
(beautiful not mind)
e.範圍查詢
年份大於1980
//範圍查詢,區間寫法/數學寫法
get /movies/_search?q=year:
>=
1980
f.萬用字元查詢
title:mi?d
title:be*
post /movies/_search}}
post /movies/_search}}
}
post /movies/_search}}
}
+替代and
| 替代or
-替代not
es搜尋核心與實戰Day05
1.詞頻tf term frequency 檢索詞在子篇文件 現的頻率 檢索詞出現的次數除以文件的總字數 度量一條查詢和結果文件相關性的簡單方法 簡單將搜尋中每一乙個詞的tf進行相力 tf 區塊鏈 tf 的 tf 應用 stop word 的 在文件 現了很多次,但是對貢獻相關度幾乎沒有用處,不應該...
es搜尋核心與實戰Day07
hash演算法確保文件均勻分散到分片中 預設的 routing 值是文件id 可以自行制定routing數值,例如用相同國家的商品,都分配到指定的shard 設定index setting後,primary數,不能隨意修改的更本原因 更新乙個文件 a.倒排索引的不可變性 1.無需考慮併發寫檔案的問題...
web應用開發實戰作業day02
1.屬性和標籤什麼關係?html屬性一般都出現在html標籤中,html屬性是html標籤的一部分。標籤可以有屬性,它包含了額外的資訊,屬性的值一般要在引號中 有時也可以不加引號 標籤可以擁有乙個或多個屬性,也可以沒有屬性 屬性一般由屬性名和值成對出現。屬性選擇器可以挑選帶有特殊屬性的標籤語法 屬性...