倒排索引包含兩個部分
單詞詞典一般比較大,可以通過b +樹或雜湊拉鍊法實現,以滿足高效能的插入與查詢
1.standard analyzerget _analyze
2.****** analyzer,,
,,,,
,,,,
,,]}
3.whitespace analyzer,,
,,,,
,,,,
,]}
4.stop analyzer,,
,,,,
,,,,
,]}
5.keyword analyzer,,
,,,,
,,,]
}
不分詞,直接將輸入當成乙個term輸出
6.pattern analyzer
7.english analyzer
page rank演算法
a.指定字段
查詢出指定字段(title)值為2012的資料
b.泛查詢get /movies/_search?q=
2012
&df=title
查詢出任意字段值為2012的資料
c.term and phraseget /movies/_search?q=
2012
d.分組查詢//使用引號,phrase查詢
get /movies/_search?q=title:
"beautiful mind"
必須包含beautiful和mind//分組,bool查詢
get /movies/_search?q=title:
(beautiful mind)
//查詢美麗心靈
get /movies/_search?q=title:
(beautiful and mind)
必須包含beautiful不包含mind//查詢美麗心靈
get /movies/_search?q=title:
(beautiful %
2bmind)
e.範圍查詢//查詢美麗心靈
get /movies/_search?q=title:
(beautiful not mind)
年份大於1980
f.萬用字元查詢//範圍查詢,區間寫法/數學寫法
get /movies/_search?q=year:
>=
1980
title:mi?d
title:be*
post /movies/_search}}
post /movies/_search}}
}
+替代andpost /movies/_search}}
}
| 替代or
-替代not
es搜尋核心與實戰Day05
1.詞頻tf term frequency 檢索詞在子篇文件 現的頻率 檢索詞出現的次數除以文件的總字數 度量一條查詢和結果文件相關性的簡單方法 簡單將搜尋中每一乙個詞的tf進行相力 tf 區塊鏈 tf 的 tf 應用 stop word 的 在文件 現了很多次,但是對貢獻相關度幾乎沒有用處,不應該...
es搜尋核心與實戰Day07
hash演算法確保文件均勻分散到分片中 預設的 routing 值是文件id 可以自行制定routing數值,例如用相同國家的商品,都分配到指定的shard 設定index setting後,primary數,不能隨意修改的更本原因 更新乙個文件 a.倒排索引的不可變性 1.無需考慮併發寫檔案的問題...
web應用開發實戰作業day02
1.屬性和標籤什麼關係?html屬性一般都出現在html標籤中,html屬性是html標籤的一部分。標籤可以有屬性,它包含了額外的資訊,屬性的值一般要在引號中 有時也可以不加引號 標籤可以擁有乙個或多個屬性,也可以沒有屬性 屬性一般由屬性名和值成對出現。屬性選擇器可以挑選帶有特殊屬性的標籤語法 屬性...