본 프로젝트는 텍스트 데이터를 분석하여 리뷰 내용이 상품의 어떤 특성을 특정하고 있는 것인지 추출하고 감성분석을 하여 사용자 리뷰가 어떤 내용에 대해 서술된 것인지, 해당 내용에 대해 긍정적인지 부정적인지를 판단할 수 있도록 하는 파이프라인을 구축하는 것을 목적으로 합니다.
텍스트데이터에서 핵심어를 추출한 결과와 감성분석을 실시한 결과를 통합하여 유의미한 비즈니스 인사이트를 얻어낼 수 있도록 가설을 세우고 이를 리뷰데이터 원문과 추출된 핵심어, 감성분석 결과를 비교하여 신뢰할 만한 결과를 도출해내는지 실험하는 방향으로 프로젝트가 진행되었습니다.
본 프로젝트는 jupyter notebook으로 구현될 수 있도록 작성되어 있습니다.
데이터셋은 data 폴더 안에 들어있습니다.
경로설정에 관련된 코드를 알맞게 수정해주시고
감성분석, 키워드 추출 노트북에 맞게
requirements.txt를 설치하면 오류없이 노트북이 실행되는 것을 확인했습니다.
-BERT와 지식 그래프를 이용한 한국어 문맥 정보 추출 시스템
http://dx.doi.org/10.7472/jksii.2020.21.3.123
-자연어처리 모델을 이용한 이커머스 데이터 기반 감성 분석 모델 구축
https://doi.org/10.15207/JKCS.2020.11.11.033
-SKTBrain의 kobert github
https://github.com/SKTBrain/KoBERT
-kobert 레퍼런스코드 참고 github
https://github.com/kimwoonggon/publicservant_AI