Giter VIP home page Giter VIP logo

hate-speech-detection's Introduction

Hate Speech Detection

웹페이지에서 텍스트 상의 혐오 표현을 단계에 따라 판별하여 필터링하는 크롬 확장 프로그램입니다.

KoELECTRA의 혐오 표현 판별 모델에 대한 Fine Tuning을 진행하여 모델을 구축했습니다. 추가적으로 수집한 1784개의 인터넷 뉴스/커뮤니티 댓글 데이터를 Fine Tuning에 이용했습니다.

구성


│  .gitignore
│  README.md
│
└─word-embedding
    |  cli_model_test.py
    │  data_preprocessing.py
    │  hate_speech_dataset.py
    │  hate_speech_detector_pretrained.py
    │  test_model.py

word-embedding는 혐오 표현 판별 모델에 대한 폴더입니다.

data_preprocessing.pyhate_speech_dataset.py 파일은 이전 LSTM 모델을 구축할 때 사용한 코드로, 데이터 호출과 전처리를 수행합니다.

hate_speech_detector_pretrained.py은 사전 학습된 모델을 Fine Tuning하며, test_model.py은 Fine Tuning이 진행된 모델의 정확도를 데이터 레이블별로 계산하여 정리합니다.

한편, 테스트 데이터로의 검증은 눈에 잘 보이지 않기 때문에, cli_model_test.py를 이용해 직접 문장을 입력하고 결과를 확인할 수 있습니다.

└─word-embedding
    ├─dictionary-generator
    ├─history
    ├─model-structure
    └─saved-models

KoELECTRA 전이학습 모델 적용 이전 개발했던 다양한 신경망 모델을 구축하여 실험했습니다. history, model-structure, saved-models 폴더에 관련 내용이 저장되어 있습니다.

dictionary-generator는 단어 사전 구축 과정에서 사용한 코드입니다.

hate-speech-detection's People

Contributors

bucket1582 avatar jyngjeon avatar

Stargazers

 avatar  avatar

Watchers

 avatar

Forkers

bucket1582

hate-speech-detection's Issues

Recommend Projects

  • React photo React

    A declarative, efficient, and flexible JavaScript library for building user interfaces.

  • Vue.js photo Vue.js

    🖖 Vue.js is a progressive, incrementally-adoptable JavaScript framework for building UI on the web.

  • Typescript photo Typescript

    TypeScript is a superset of JavaScript that compiles to clean JavaScript output.

  • TensorFlow photo TensorFlow

    An Open Source Machine Learning Framework for Everyone

  • Django photo Django

    The Web framework for perfectionists with deadlines.

  • D3 photo D3

    Bring data to life with SVG, Canvas and HTML. 📊📈🎉

Recommend Topics

  • javascript

    JavaScript (JS) is a lightweight interpreted programming language with first-class functions.

  • web

    Some thing interesting about web. New door for the world.

  • server

    A server is a program made to process requests and deliver data to clients.

  • Machine learning

    Machine learning is a way of modeling and interpreting data that allows a piece of software to respond intelligently.

  • Game

    Some thing interesting about game, make everyone happy.

Recommend Org

  • Facebook photo Facebook

    We are working to build community through open source technology. NB: members must have two-factor auth.

  • Microsoft photo Microsoft

    Open source projects and samples from Microsoft.

  • Google photo Google

    Google ❤️ Open Source for everyone.

  • D3 photo D3

    Data-Driven Documents codes.