业余项目“萌名NameMoe(一个基于语料库技术的取名工具)”的副产品。
不定期更新。只删词,不加词。
可用于中文分词、物种名称识别。
物种名称语料库(Species-Names-Corpus)
数据大小:20万。
语料来源:多个词典汇总。
数据清洗:已清洗,但仍存有大量badcase。
请勿提交涉政issue:
惹不起呀,谢谢~
语料中还存有的,会在后续的更新中逐步删除掉。
更新时间:
删除部分badcase。 -2019.07.27
@萌名NameMoe 整理
2019.07.27