Giter VIP home page Giter VIP logo

elasticsearch-jaso-analyzer's People

Contributors

limhs25 avatar netcrazy avatar pratiable avatar skyer9 avatar

Stargazers

 avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar

Watchers

 avatar  avatar  avatar  avatar  avatar  avatar  avatar

elasticsearch-jaso-analyzer's Issues

오픈 소스 라이센스 명시해 주시면 좋겠네요.

소스를 오픈했다고 오픈소스가 되는것이 아니라
명시적으로 이 소스는 오픈소스임을 명시해야만 오픈소스가 되요.

라이센스 명시가 없으면
소스를 공개해도 여전히 개인 소스가 되어서요.

MIT 나 Apache 같은 라이센스 명시해주시면 좋을 듯 해요.

Elasticsearch 8.5.3 Version

Elasticsearch 8.5.3 버전을 쓰고 있는데 플러그인을 사용 할 수 있는 방안이 있을까요?
아니면 플러그인 버전 업그레이드 될 때까지 기다려야 할까요?

OFFSET 관련 문의

안녕하십니까.
해당 오픈소스를 사용하려고 생각중입니다.
그러던중 사소한 버그 등을 발견 해서 문의드립니다.
es상에서 검색한 토큰의 위치를 가르키는 offset의 기능이 있는데요. 이는 토큰의 시작과 끝을 가르키는 기능입니다.
highlight 기능을 사용하게 되면 해당 토큰이 있는 위치에 태그를 추가해서 리턴해주는데요.
jaso 플러그인의 동작 방식이 한영 변환, 자소 변환 등의 토큰도 추가해서 동작하며, 두개의 추가된 토큰도 offset에 영향을 주는듯 합니다.
예를 들어서 hello라는 데이터가 들어갔을 경우 hello , ㅗ디ㅣㅐ 두개의 토큰이 생성되어 offset에도 영향을 주고 있습니다.
혹시 이에 대하여 제가 버그를 수정해봐도 될지 문의 드립니다.

6.4.0 용 zip 파일

jaso-analyzer-plugin-6.4.0.0-plugin.zip

#3 에서 만들어주신 소스를 빌드해서 얻은 plugin 파일입니다.
아래 도커파일로 설치가 잘 됨을 확인했습니다.

 FROM  docker.elastic.co/elasticsearch/elasticsearch:6.4.0
 COPY /path/to/jaso-analyzer-plugin-6.4.0.0-plugin.zip /jaso-analyzer-plugin-6.4.0.0-plugin.zip
 RUN bin/elasticsearch-plugin install file:///jaso-analyzer-plugin-6.4.0.0-plugin.zip

cannot be applied to given types 에러

안녕하세요

해당 플러그인을 사용하기 위해 아래 명령을 실행시킬 경우 cannot be applied to given types 에러가 발생합니다. 그래서 관련 코드를 수정해서 pr을 요청드리고하는데 권한이 없어 작업한 브랜치가 push가 안되는것 같습니다. (403 에러)

$ ./gradlew clean build buildPluginZip 

에러가 발생하는 파일은 JasoAnalyzerProvider로 첨부드린 이미지와 같이 수정해서 pr을 올리고 싶은데 가능할까요~?
감사합니다~

스크린샷 2023-03-03 오후 5 44 46

써보니까 무지 좋네요

네이버 자동완성 부럽지 않은 기능이네요.

제 블로그 에 기능 구현해서 올려봤는데...
자모 단위 자동완성, 한영자판오류에 대해서도 검색이 되고...
정말 좋네요.

포함하는 단어

현재 데이터가
사과, 바나나사과, 사과바나나 이렇게 저장되어있으면
사과로 검색하는 경우 사과랑 사과바나나가 이렇게 뜹니다.

시작하는 단어가 아닌 포함하는 단어도 출력하는 싶은 경우 어느 부분을 수정해야할까요

jaso_tokenizer를 찾을 수 없다고 나옵니다

설치 후 이렇게 kibana에서 쿼리날려봤는데 안되네요 따로 jaso_tokenizer를 설치해야되나요?

요청

PUT kengdic
{
  "settings":{
    "analysis":{
      "filter": {
        "suggest_filter": {
          "type": "edge_ngram",
          "min_gram": 1,
          "max_gram": 50
        }
      },
      "tokenizer":{
        "nori-user-dict":{
          "type":"nori_tokenizer",
          "decompound_mode":"mixed",
          "user_dictionary":"userdict_ko.txt"
        },
        "jaso_search_tokenizer": {
          "type": "jaso_tokenizer",
          "mistype": true,
          "chosung": false
        },
        "jaso_index_tokenizer": {
          "type": "jaso_tokenizer",
          "mistype": true,
          "chosung": true
        }
      },
      "analyzer":{
        "analyzer-kor":{
          "type":"custom",
          "tokenizer":"nori-user-dict"
        },
        "analyzer-eng":{
          "type":"custom",
          "tokenizer":"standard",
          "filter":[
            "lowercase"
          ]
        },
        "kor-suggest_search_analyzer": {
          "type": "custom",
          "tokenizer": "jaso_search_tokenizer"
        },
        "kor-suggest_index_analyzer": {
          "type": "custom",
          "tokenizer": "jaso_index_tokenizer",
          "filter": [
            "suggest_filter"
          ]
        }
      }
    }
  },
  "mappings":{
    "logs":{
      "properties":{
        "word":{
          "type":"text",
          "store":true,
          "analyzer":"kor-suggest_index_analyzer",
          "search_analyzer":"kor-suggest_search_analyzer"
        },
        "def":{
          "type":"completion",
          "analyzer":"analyzer-eng"
        }
      }
    }
  }
}

응답

{
  "error": {
    "root_cause": [
      {
        "type": "illegal_argument_exception",
        "reason": "Unknown tokenizer type [jaso_tokenizer] for [jaso_search_tokenizer]"
      }
    ],
    "type": "illegal_argument_exception",
    "reason": "Unknown tokenizer type [jaso_tokenizer] for [jaso_search_tokenizer]"
  },
  "status": 400
}

8.7.1

현재 8.6.2까지 적용이 되던데 8.7.1버전은 아직 없을까요..

8.2.2

안녕하세요! 혹시 8.2.2 버전에서도 작동이 될까요?

Recommend Projects

  • React photo React

    A declarative, efficient, and flexible JavaScript library for building user interfaces.

  • Vue.js photo Vue.js

    🖖 Vue.js is a progressive, incrementally-adoptable JavaScript framework for building UI on the web.

  • Typescript photo Typescript

    TypeScript is a superset of JavaScript that compiles to clean JavaScript output.

  • TensorFlow photo TensorFlow

    An Open Source Machine Learning Framework for Everyone

  • Django photo Django

    The Web framework for perfectionists with deadlines.

  • D3 photo D3

    Bring data to life with SVG, Canvas and HTML. 📊📈🎉

Recommend Topics

  • javascript

    JavaScript (JS) is a lightweight interpreted programming language with first-class functions.

  • web

    Some thing interesting about web. New door for the world.

  • server

    A server is a program made to process requests and deliver data to clients.

  • Machine learning

    Machine learning is a way of modeling and interpreting data that allows a piece of software to respond intelligently.

  • Game

    Some thing interesting about game, make everyone happy.

Recommend Org

  • Facebook photo Facebook

    We are working to build community through open source technology. NB: members must have two-factor auth.

  • Microsoft photo Microsoft

    Open source projects and samples from Microsoft.

  • Google photo Google

    Google ❤️ Open Source for everyone.

  • D3 photo D3

    Data-Driven Documents codes.