Giter VIP home page Giter VIP logo

komoran's Introduction

KOMORAN 3.0

Build Status Coverage Status

English | 한국어

KOMORANKOrean MORphological ANalyzer의 약자로, Java로 구현한 한국어 형태소 분석기입니다.

주요 특징

  • 순수한 Java로 구현
    • 100% Java로만 개발되었기 때문에 자바가 설치된 환경이라면 어디서든지 사용 가능합니다.
  • 외부 라이브러리 독립적
    • 자체 제작한 Library들만을 사용하여 외부 Library와의 의존성 문제가 없습니다.
  • 경량화
    • 자소 단위 처리, TRIE 사전 등으로 약 50MB 메모리 상에서도 동작 가능합니다.
  • 쉬운 사용법
    • Library 적용 후 소스 코드 내 1줄만 추가하여 형태소 분석기를 사용할 수 있습니다.
  • 사전 관리 용이
    • 일반 텍스트 파일의 형태로 구성되어 가독성이 높으며 바로 편집이 가능합니다.
  • 새로운 분석 결과
    • 타 형태소 분석기와 달리 공백이 포함된 형태소 단위로 분석이 가능합니다.

데모 및 예시

  • KOMORAN 사이트에서 아래와 같이 분석 결과를 미리 확인해볼 수 있습니다.
  • 입력 문장: 대한민국은 민주공화국이다. KOMORAN Demo#1

설치

'설치하기' 문서를 참고해주세요.

빠른 사용법

'3분 만에 형태소 분석 따라하기' 문서를 참고해주세요.

사용 예시

KOMORAN 참고 자료

KOMORAN을 개발한 shineware에서 제공하는 참고자료입니다.

공식 Wrapper 자료

shineware에서 개발한 공식 wrapper 자료입니다.

  • PyKOMORAN에서 Python용 KOMORAN을 사용하실 수 있습니다.

그 외 참고 자료

사용자 분들께서 만들어주신 참고자료입니다.

  • 9bow님께서 간단히 실행해볼 수 있는 Simple API Server을 공개해주셨습니다.
  • Hyunjoong Kim님께서 Python 버전의 KOMORAN3Py(/lovit/komoran3py)를 공개해주셨습니다.
  • 사전 관리 도구

인용

@misc{komoran,
author = {Junsoo Shin, Junghwan Park, Geunho Lee},
title = {komoran},
publisher = {GitHub},
journal = {GitHub repository},
howpublished = {\url{https://github.com/shin285/KOMORAN}}

Related Publication

  • Ihm, S. Y., Lee, J. H., & Park, Y. H. (2019). Skip-gram-KR: Korean Word Embedding for Semantic Clustering. IEEE Access. (IF: 3.557)

  • Kwon, S., Ko, Y., & Seo, J. (2019). Effective vector representation for the Korean named-entity recognition. Pattern Recognition Letters, 117, 52-57. (IF: 1.952)

  • Song, H. J., Choi, J. E., Lee, Y. K., Yoon, J. H., Kim, J. D., Park, C. Y., & Kim, Y. S. (2019). A Web Service for Evaluating the Level of Speech in Korean. Applied Sciences, 9(3), 594. (IF: 1.689)

  • Han, K., Shim, H., & Yi, M. Y. (2018). A New Biomedical Passage Retrieval Framework for Laboratory Medicine: Leveraging Domain-specific Ontology, Multilevel PRF, and Negation Differential Weighting. Journal of healthcare engineering, 2018. (IF: 1.261)

  • Edmiston, D., & Stratos, K. (2018). Compositional Morpheme Embeddings with Affixes as Functions and Stems as Arguments. In Proceedings of the Workshop on the Relevance of Linguistic Structure in Neural Architectures for NLP (pp. 1-5).

komoran's People

Contributors

9bow avatar changukshin avatar gamamoe avatar shin285 avatar

Watchers

 avatar  avatar

Recommend Projects

  • React photo React

    A declarative, efficient, and flexible JavaScript library for building user interfaces.

  • Vue.js photo Vue.js

    🖖 Vue.js is a progressive, incrementally-adoptable JavaScript framework for building UI on the web.

  • Typescript photo Typescript

    TypeScript is a superset of JavaScript that compiles to clean JavaScript output.

  • TensorFlow photo TensorFlow

    An Open Source Machine Learning Framework for Everyone

  • Django photo Django

    The Web framework for perfectionists with deadlines.

  • D3 photo D3

    Bring data to life with SVG, Canvas and HTML. 📊📈🎉

Recommend Topics

  • javascript

    JavaScript (JS) is a lightweight interpreted programming language with first-class functions.

  • web

    Some thing interesting about web. New door for the world.

  • server

    A server is a program made to process requests and deliver data to clients.

  • Machine learning

    Machine learning is a way of modeling and interpreting data that allows a piece of software to respond intelligently.

  • Game

    Some thing interesting about game, make everyone happy.

Recommend Org

  • Facebook photo Facebook

    We are working to build community through open source technology. NB: members must have two-factor auth.

  • Microsoft photo Microsoft

    Open source projects and samples from Microsoft.

  • Google photo Google

    Google ❤️ Open Source for everyone.

  • D3 photo D3

    Data-Driven Documents codes.