當我們需要確保索引被建立在適當數量的分片上,在索引資料之前設定好分析器和型別對映。
手動建立索引,在請求中加入所有設定和型別對映,如下所示:
put /my_index
, ...
}
你可以通過在 config/elasticsearch.yml 中新增下面的配置來防止自動建立索引。
action.auto_create_index: false
使用以下的請求來刪除索引:
delete /my_index
用下面的方式刪除多個索引
delete /index_one,index_two
delete /index_*
甚至可以刪除所有索引
delete /_all
下面是兩個最重要的設定:
number_of_replicas
例如,我們可以建立只有乙個主分片,沒有複製分片的小索引。
put /my_temp_index
}
然後,我們可以用 update-index-settings api 動態修改複製分片個數
put /my_temp_index/_settings
第三個重要的索引設定是 analysis 部分,用來配置已存在的分析器或建立自定義分析器來定製化你的索引。
在下面的例子中,我們建立了乙個新的分析器,叫做 es_std,並使用預定義的西班牙語停用詞:
put /spanish_docs}}
}}
雖然 elasticsearch 內建了一系列的分析器,但是真正的強大之處在於定製你自己的分析器。你可以通過在配置檔案中組合字元過濾器,分詞器和標記過濾器,來滿足特定資料的需求。
與索引設定一樣,我們預先配置好 es_std 分析器,我們可以再 analysis 欄位下配置字元過濾器,分詞器和標記過濾器:
put /my_index
, "tokenizer": ,
"filter": ,
"analyzer": }}
}
作為例子,我們來配置乙個這樣的分析器:"char_filter":
}
"filter":
}
"analyzer":
}
put /my_index
}, "filter": },
"analyzer": }
}}}
get /my_index/_analyze
get /my_index/_analyze?analyzer=my_analyzer
the quick & brown fox
,,,
]}
## 元資料:_source 字段
在搜尋請求中你可以通過限定 _source 欄位來請求指定字段:
get /_search
}, "_source": [ "title", "created" ]
}
元資料:_all 字段
如果你決定不再使用 _all 字段,你可以通過下面的對映禁用它:
}}我們可以使用 default 對映對所有型別禁用 _all 字段,而只在 blog 欄位上開啟它:
put /my_index
},"blog": }}
}
default 對映也是定義索引級別的動態模板的好地方。
一口氣學到這裡,這章開始已經有點力不從心了,很多東西已經理解不了了,需要實際工作中,不斷查詢資料深入學習理解才能掌控了,索引管理的內容這裡並不全面,我理解不了的地方這裡我也不寫了~
《Elasticsearch 權威指南》閱讀筆記
原文 elasticsearch 權威指南 技術上來說,乙個主分片最大能夠儲存 integer.max value 128 個文件,但是實際最大值還需要參考你的使用場景 包括你使用的硬體,文件的大小和複雜程度,索引和查詢文件的方式以及你期望的響應時長。索引在預設情況下會被分配5個主分片 如果你的資料...
Hadoop 權威指南
rpm包和deb包是兩種linux系統下最常見的安裝包格式,在安裝一些軟體或服務的時候免不了要和它們打交道。rpm包主要應用在redhat系列包括 fedora等發行版的linux系統上,deb包主要應用於debian系列包括現在比較流行的ubuntu等發行版上。yum可以用於運作rpm包,例如在f...
HTTP權威指南
web 伺服器會為所有 http 物件資料附加乙個 mime 型別,content type image jpeg,content length 12984 伺服器資源名被稱為統一資源識別符號 uniform resource identifier,uri uri 就像網際網路上的郵政位址一樣,在世...