Справочник по Elasticsearch 8

ElasticSearch 8 с нуля

Справочник по Elasticsearch 8

RU Encyclopedia Основы Elasticsearch и модель данных Установка и первый доступ REST API Текстовый анализ Полнотекстовый поиск и Query DSL
34Уроки
8Модули
RUEncyclopedia

Содержание

1

Основы Elasticsearch и модель данных

1 Что такое Elasticsearch и зачем он нужен Поисково-аналитический движок поверх Lucene: где его применяют, чем он отличается от обычной БД и почему это near real-time, а не источник истины. 2 Документ, индекс и JSON: модель данных Документ как JSON-объект, поля, индекс как коллекция документов и метаполя вроде _id и _source — основные сущности, которыми оперирует ES. 3 Кластер, ноды, шарды и реплики Как данные распределяются: кластер из нод, primary- и replica-шарды, что такое отдельный индекс Lucene внутри шарда и зачем нужны реплики. 4 Типы полей: text, keyword, числа и даты Ключевое различие text и keyword, числовые поля, даты, объекты и приём multi-field, когда одно поле индексируют сразу несколькими типами. 5 Инвертированный индекс и движок Lucene Что на самом деле строится при индексации: инвертированный индекс «термин → документы», сегменты Lucene и почему полнотекстовый поиск такой быстрый.
5

Полнотекстовый поиск и Query DSL

17 Query DSL: структура запроса и контекст query vs filter Как устроено тело _search, чем query context (влияет на _score) отличается от filter context (да/нет, кешируется) и когда что использовать. 18 Полнотекстовые запросы: match, match_phrase, multi_match Запросы по анализируемым полям: match и operator/minimum_should_match, поиск фразы через match_phrase и поиск по нескольким полям multi_match. 19 Точные совпадения и фильтры: term, range, exists Запросы без анализа ввода по keyword-полям, диапазоны по числам и датам, проверка наличия поля и классическая ловушка term по text-полю. 20 Составные запросы: bool и комбинирование условий Сборка сложных условий через must, should, filter и must_not, влияние веток на релевантность и minimum_should_match. 21 Подсветка, сортировка и пагинация результатов Highlight совпавших фрагментов, сортировка по полям и по релевантности, пагинация from/size и её предел, переход на search_after и PIT. 22 Релевантность и BM25: как считается _score Откуда берётся _score: модель BM25, влияние частоты терминов и длины поля, разбор оценки через explain. 23 Бустинг полей и function_score: управление ранжированием Как поднять важность отдельных полей и документов: boost, function_score, учёт свежести и популярности при ранжировании. 24 Перколятор: обратный поиск по сохранённым запросам Перевёрнутая модель поиска: запросы хранятся в индексе через тип поля percolator, а percolate-запрос прогоняет входящий документ и показывает, какие сохранённые запросы он удовлетворяет. Подсветка совпадений и сценарий алертов и подписок.