Elasticsearch에서 이메일 토크 나이저 사용

gdc

elasticsearch 문서와 Google에서 몇 가지 예제를 시도했지만 알아내는 데 도움이되지 않았습니다 ..

제가 가지고있는 샘플 데이터는 블로그 게시물이 거의 없습니다. 이메일 주소로 모든 게시물을 보려고합니다. 사용하면 "email":"someone"일치하는 모든 게시물이 표시 someone되지만 사용하도록 변경하면 [email protected]아무것도 표시되지 않습니다!

    "hits": [
             {
                "_index": "blog",
                "_type": "post",
                "_id": "2",
                "_score": 1,
                "_source": {
                   "user": "sreenath",
                   "email": "[email protected]",
                   "postDate": "2011-12-12",
                   "body": "Trying to figure out this",
                   "title": "Elastic search testing"
                }
             }
           ]

Get query를 사용하면 다음과 같이 일치하는 모든 게시물이 표시됩니다 [email protected]. 하지만이를 변경하려면 { "term" : { "email" : "someone" }}{ "term" : { "email" : "[email protected]" }}

GET blog/post/_search
{ 
 "query" : { 
   "filtered" : { 
     "filter" : { 
       "and" : [ 
         { "term" :
            { "email" : "someone" }
         }
       ] 
     } 
   } 
 } 
}

나는 다음을 위해 curl -XPUT을했지만 도움이되지 않았습니다.

curl -XPUT localhost:9200/test/  -d '
{
   "settings" : {
      "analysis" : {
         "filter" : {
            "email" : {
               "type" : "pattern_capture",
               "preserve_original" : 1,
               "patterns" : [
                  "([^@]+)",
                  "(\\p{L}+)",
                  "(\\d+)",
                  "@(.+)"
               ]
            }
         },
         "analyzer" : {
            "email" : {
               "tokenizer" : "uax_url_email",
               "filter" : [ "email", "lowercase",  "unique" ]
            }
         }
      }
   }
}
'

이메일 주소에 대한 사용자 지정 분석기를 만들었지 만 사용하고 있지 않습니다. email아래와 같이 해당 분석기를 실제로 사용하려면 매핑 유형에서 필드 를 선언해야 합니다. 또한, 그 분석기와 올바른 인덱스를 만들 수 있는지, 즉을 blog하지test

                       change this
                            |
                            v
curl -XPUT localhost:9200/blog/  -d '{
   "settings" : {
      "analysis" : {
         "filter" : {
            "email" : {
               "type" : "pattern_capture",
               "preserve_original" : 1,
               "patterns" : [
                  "([^@]+)",
                  "(\\p{L}+)",
                  "(\\d+)",
                  "@(.+)"
               ]
            }
         },
         "analyzer" : {
            "email" : {
               "tokenizer" : "uax_url_email",
               "filter" : [ "email", "lowercase",  "unique" ]
            }
         }
      }
   },
   "mappings": {              <--- add this
      "post": {
         "properties": {
            "email": {
               "type": "string",
               "analyzer": "email"
            }
         }
      }
   }
}
'

이 기사는 인터넷에서 수집됩니다. 재 인쇄 할 때 출처를 알려주십시오.

침해가 발생한 경우 연락 주시기 바랍니다[email protected] 삭제

에서 수정
0

몇 마디 만하겠습니다

0리뷰
로그인참여 후 검토

관련 기사

분류에서Dev

Spacy에서 사용자 정의 토크 나이저를 사용하여 공백없이 문자열 토큰 화

분류에서Dev

사용자 지정 토크 나이저에서 인덱싱 충돌

분류에서Dev

Roberta 모델에 사용 된 토크 나이저를 이해하기 어려움

분류에서Dev

Python에서 토크 나이저 구현

분류에서Dev

HTML을 사용하여 select2 토크 나이저에서 maxElements 속성 설정

분류에서Dev

Elasticsearch 토크 나이저 ngram에 선행 / 후행 공백 추가

분류에서Dev

정규식을 토크 나이저로 사용하십니까?

분류에서Dev

Pytorch의 사전 훈련 된 모델에서 저장된 토크 나이저를로드하는 방법

분류에서Dev

토크 나이 저는 Elasticsearch에서 인덱싱이나 쿼리 또는 둘 다를 위해 작동합니까?

분류에서Dev

lapply를 사용하여 R CoreNLP 패키지 토크 나이저 출력에 ID 열 추가

분류에서Dev

spacy 토크 나이저 : update_exc에 대한 사용자 정의 예외에서 regex를 키로 사용하는 방법이 있습니까?

분류에서Dev

Java에서 문자열 토크 나이저를 사용하여 문자열에서 문자를 하나씩 얻는 방법

분류에서Dev

Elasticsearch에서`ngram` 필터와`ngram` 토크 나이저간에 성능 차이가 있습니까?

분류에서Dev

C ++에서 범용 데이터 토크 나이저를 만드는 방법은 무엇입니까?

분류에서Dev

regexp를 사용하여 생성 된 길이 n의 토크 나이저

분류에서Dev

GPU에서 Huggingface Bert 토크 나이저 실행

분류에서Dev

문자열 토크 나이저에서 널 포인터 예외

분류에서Dev

Solr에서 여러 토크 나이저 결합

분류에서Dev

동일한 도메인의 한 워크 스테이션에서 다른 워크 스테이션으로 사용자 디렉토리 복사

분류에서Dev

GNU 메이크 파일에서 bash 산술 확장 사용

분류에서Dev

토크 나이저를 사용하여 날짜를 쓰는 방법?

분류에서Dev

문자열 용 자바 토크 나이저

분류에서Dev

MSYS를 사용하여 Windows의 메이크 파일에서 rm 사용

분류에서Dev

Lucene / Solr에서 내 사용자 정의 토크 나이저를 올바르게 구현하는 방법은 무엇입니까?

분류에서Dev

토크 나이저 / 토큰 필드 구축에 도움이 필요합니다

분류에서Dev

Huggingface 저장 토크 나이저

분류에서Dev

다른 변수에 대한 토크 나이저 읽기

분류에서Dev

Transformers 라이브러리에서 Bert 토크 나이저를 자르는 방법

분류에서Dev

이메일에서 CSS 서클 사용

Related 관련 기사

  1. 1

    Spacy에서 사용자 정의 토크 나이저를 사용하여 공백없이 문자열 토큰 화

  2. 2

    사용자 지정 토크 나이저에서 인덱싱 충돌

  3. 3

    Roberta 모델에 사용 된 토크 나이저를 이해하기 어려움

  4. 4

    Python에서 토크 나이저 구현

  5. 5

    HTML을 사용하여 select2 토크 나이저에서 maxElements 속성 설정

  6. 6

    Elasticsearch 토크 나이저 ngram에 선행 / 후행 공백 추가

  7. 7

    정규식을 토크 나이저로 사용하십니까?

  8. 8

    Pytorch의 사전 훈련 된 모델에서 저장된 토크 나이저를로드하는 방법

  9. 9

    토크 나이 저는 Elasticsearch에서 인덱싱이나 쿼리 또는 둘 다를 위해 작동합니까?

  10. 10

    lapply를 사용하여 R CoreNLP 패키지 토크 나이저 출력에 ID 열 추가

  11. 11

    spacy 토크 나이저 : update_exc에 대한 사용자 정의 예외에서 regex를 키로 사용하는 방법이 있습니까?

  12. 12

    Java에서 문자열 토크 나이저를 사용하여 문자열에서 문자를 하나씩 얻는 방법

  13. 13

    Elasticsearch에서`ngram` 필터와`ngram` 토크 나이저간에 성능 차이가 있습니까?

  14. 14

    C ++에서 범용 데이터 토크 나이저를 만드는 방법은 무엇입니까?

  15. 15

    regexp를 사용하여 생성 된 길이 n의 토크 나이저

  16. 16

    GPU에서 Huggingface Bert 토크 나이저 실행

  17. 17

    문자열 토크 나이저에서 널 포인터 예외

  18. 18

    Solr에서 여러 토크 나이저 결합

  19. 19

    동일한 도메인의 한 워크 스테이션에서 다른 워크 스테이션으로 사용자 디렉토리 복사

  20. 20

    GNU 메이크 파일에서 bash 산술 확장 사용

  21. 21

    토크 나이저를 사용하여 날짜를 쓰는 방법?

  22. 22

    문자열 용 자바 토크 나이저

  23. 23

    MSYS를 사용하여 Windows의 메이크 파일에서 rm 사용

  24. 24

    Lucene / Solr에서 내 사용자 정의 토크 나이저를 올바르게 구현하는 방법은 무엇입니까?

  25. 25

    토크 나이저 / 토큰 필드 구축에 도움이 필요합니다

  26. 26

    Huggingface 저장 토크 나이저

  27. 27

    다른 변수에 대한 토크 나이저 읽기

  28. 28

    Transformers 라이브러리에서 Bert 토크 나이저를 자르는 방법

  29. 29

    이메일에서 CSS 서클 사용

뜨겁다태그

보관