tokenizer
Elasticsearch 6.8에서 보고 있습니다. 색인을 작성할 때 텍스트를 단어로 토큰 화하는 방법을 정의한다는 것을 알고 있습니다. 예를 들어 "빠른 갈색 여우!" 로 변환됩니다 . 용어에 텍스트 [Quick, brown, fox!]
. Elasticsearch에 텍스트가있는 필드가 있으면 "Quick brown fox!"
색인에서 세 단어로 나뉩니다. 하지만 쿼리 텍스트를 보낼 경우 어떻게 "Quick brown fox!"
, 수행 tokenizer
뿐만 아니라 해당 쿼리 매개 변수에 대한 작업을?
분석기는 인덱스의 필드 매핑에 올바르게 구성되어있는 경우 인덱싱 시간과 쿼리 시간 모두에서 작동합니다.
이 페이지 에서는 분석기가 시작되는시기에 대한 전체 설명을 볼 수 있으며 명확성을 위해 아래에서 반복합니다.
인덱스 시간 에 Elasticsearch는 다음 순서로 분석기를 찾습니다.
- 필드 매핑에 정의 된 분석기입니다.
- 인덱스 설정에서 default라는 분석기.
- 표준 분석기.
쿼리시 몇 가지 레이어가 더 있습니다.
- 전체 텍스트 쿼리에 정의 된 분석기입니다.
- 필드 매핑에 정의 된 search_analyzer입니다.
- 필드 매핑에 정의 된 분석기입니다.
- 인덱스 설정에서 default_search라는 분석기.
- 인덱스 설정에서 default라는 분석기.
- 표준 분석기.
보시다시피 분석기는 데이터를 수집 할 때와 쿼리 할 때 모두 활용할 수 있습니다.
이 기사는 인터넷에서 수집됩니다. 재 인쇄 할 때 출처를 알려주십시오.
침해가 발생한 경우 연락 주시기 바랍니다[email protected] 삭제
몇 마디 만하겠습니다