Comments (4)
신청 대기 중
- 13개 종 모두 신청 (아래 스샷과 같음)
- 다만 내려받기 횟수가 3회여서 이에 따른 보완책도 생각해볼 필요
from korpora.
내려받기 횟수 제한이라니.. 이름은 모두의 말뭉치이면서, 모두 중에 선별하여, 제한적으로 쓰게 하겠다는 건가요 ㅠㅜ
이 부분은 패키지 공개하면서 지속적으로 국립국어원과 논의/설득을 해야 하는 부분 같네요. 이러한 데이터 획득의 프로세스의 문제점을 잘 설득시키고, 더 좋은 대안을 제시할 수 있다면 이 프로젝트의 가치가 더 클 거 같아요. 그 부분이 정말 data loader 만드는 것보다 더 중요해 보이네요 ㅠ
from korpora.
모두의 말뭉치 관련 기능을 Korpora 에 개발하는 @lovit @ratsgo 는 Korpora 개발용으로 모두의 말뭉치 사용 권한을 완료하였습니다.
from korpora.
이 이슈는 완료되었기에 닫겠습니다.
from korpora.
Related Issues (20)
- [Corpus] Common crawl ko HOT 3
- [Corpus] Update kowikitext version v2 -> v3
- [Release] Korpora==0.3.0
- lmdata 태스크에 AIHub, 모두의 말뭉치 데이터셋도 사용이 가능하면 좋겠습니다. HOT 14
- Question_pair dataset version HOT 1
- 공개 스피치 데이터셋(AIHub, ClovaCall)의 경우, 추가가 가능할지 궁금합니다. HOT 4
- AIHub 추가 데이터 리스트
- Korpus 에 `get_corpus_path` 를 classmethod 로 추가
- 모두의 말뭉치 (메신저, 구어, 웹) 말뭉치 수정 버전, 데이터 로더 확인
- 모두의 말뭉치 신규/수정 말뭉치 배포
- namuwikitext 파싱 오류
- KoWikiText LM data 생성 이슈 HOT 1
- Korpora.load 시 SLL 오류 이슈 HOT 3
- Korpora.fetch('korean_chatbot_data') HTTP error 404 HOT 3
- 국립국어원 "개체명 분석 말뭉치 2020" 데이터에 modu_ne 로더 사용시 오류 발생
- 영화 자막 한영 병렬 말뭉치 document 오타
- README.md의 From source 설치 실패 및 대안 제시 HOT 1
- korpus_question_pair.py의 url이 유효하지 않습니다. HOT 1
- korean_chatbot_data 를 fetch로 받을 시 HTTPError: HTTP Error 404: Not Found가 뜹니다. HOT 2
- 모두의 말뭉치 누리집 URL 변경 요청드립니다.
Recommend Projects
-
React
A declarative, efficient, and flexible JavaScript library for building user interfaces.
-
Vue.js
🖖 Vue.js is a progressive, incrementally-adoptable JavaScript framework for building UI on the web.
-
Typescript
TypeScript is a superset of JavaScript that compiles to clean JavaScript output.
-
TensorFlow
An Open Source Machine Learning Framework for Everyone
-
Django
The Web framework for perfectionists with deadlines.
-
Laravel
A PHP framework for web artisans
-
D3
Bring data to life with SVG, Canvas and HTML. 📊📈🎉
-
Recommend Topics
-
javascript
JavaScript (JS) is a lightweight interpreted programming language with first-class functions.
-
web
Some thing interesting about web. New door for the world.
-
server
A server is a program made to process requests and deliver data to clients.
-
Machine learning
Machine learning is a way of modeling and interpreting data that allows a piece of software to respond intelligently.
-
Visualization
Some thing interesting about visualization, use data art
-
Game
Some thing interesting about game, make everyone happy.
Recommend Org
-
Facebook
We are working to build community through open source technology. NB: members must have two-factor auth.
-
Microsoft
Open source projects and samples from Microsoft.
-
Google
Google ❤️ Open Source for everyone.
-
Alibaba
Alibaba Open Source for everyone
-
D3
Data-Driven Documents codes.
-
Tencent
China tencent open source team.
from korpora.