Giter VIP home page Giter VIP logo

coconut's Introduction

coconut 说明文档

中文情感分析的一个 DEMO

1. 词典资源

1.1. 情感词资源

情感词主要来源于大连理工大学整理的情感词汇本体库, 在其基础上添加了知网的 "情感分 析用词语集" 和 **大学整理的 "NTUSD". 情感分类体系直接沿用了情感词汇本体库的格 式, 其又是在 Ekman 的6大类情感分类体系的基础上构建, 共计9大类 (由于我的无知和胆 怯, 我添加了 PX 和 NX 两类) 和21小类.

下文中大量 copy 了大连理工大学情感词汇本体库的说明文档.

1.1.1. 本体格式介绍

本体格式如下表所示, 字段之间使用制表符作为分隔符, 没内容时 默认留空.

词语 词性种类 词义数 词义序号 情感分类 强度 极性 辅助情感分类 强度 极性
无所畏惧 idiom 1 1 PH 7 1
手头紧 idiom 1 1 NE 7 0
周到 adj 1 1 PH 5 1
言过其实 idiom 1 1 NN 5 2

其中, 一个情感词可能对应多个情感, 情感分类用于刻画情感词的主要情感分类, 辅助情感 为该情感词在具有主要情感分类的同时含有的其他情感分类.

1.1.2. 情感分类及情感强度

情感分类按照论文情感词汇本体的构造 所述, 情感分为7大类21小类. 7大类分别对应: 好, 恶, 乐, 怒, 哀, 惧, 欲. 由于没有找到情感类分类的规则及其代号对应的含义, 所以我把新加的词标记为了PXNX, 分别对应积极的和消极的.

情感强度分为 1, 3, 5, 7, 9五档, 9表示强度最大, 1为强度最小.

编号 情感大类 情感类 例词
1 快乐(PA) 喜悦、欢喜、笑眯眯、欢天喜地
2 安心(PE) 踏实、宽心、定心丸、问心无愧
3 尊敬(PD) 恭敬、敬爱、毕恭毕敬、肃然起敬
4 赞扬(PH) 英俊、优秀、通情达理、实事求是
5 相信(PG) 信任、信赖、可靠、毋庸置疑

1.1.3. 词性种类

情感词汇本体中的词性种类一共分为7类, 分别是名词(noun), 动词(verb), 形容词(adj), 副词(adv), 网络词语(nw), 成语(idiom), 介词短语(prep).

1.1.4. 极性标注

每个词在每一类情感下都对应了一个极性. 其中, 0 代表中性, 1 代表褒义, 2 代表贬义, 3 代表兼有褒贬两性.

注: 褒贬标注时, 通过词本身和情感共同确定, 所以有些情感在一些词中可能极性1, 而其他的词中有可能极性为0.

1.1.5. 资源链接

1.2. 程度副词

1.3. 同义词

同义词来源于哈工大社会计算与信息检索研究中心同义词词林扩展版, 一共包含77343词条

1.3.1. 资源链接

1.4. 否定词

暂无

2. 参考文献

  1. 基于词典的中文情感倾向分析算法设计
  2. B. Pang, L. Lee, "Opinion mining and sentiment analysis."
  3. Bing Liu, "Sentiment analysis and subjectivity"

coconut's People

Contributors

ovixiao avatar

Watchers

 avatar

Recommend Projects

  • React photo React

    A declarative, efficient, and flexible JavaScript library for building user interfaces.

  • Vue.js photo Vue.js

    🖖 Vue.js is a progressive, incrementally-adoptable JavaScript framework for building UI on the web.

  • Typescript photo Typescript

    TypeScript is a superset of JavaScript that compiles to clean JavaScript output.

  • TensorFlow photo TensorFlow

    An Open Source Machine Learning Framework for Everyone

  • Django photo Django

    The Web framework for perfectionists with deadlines.

  • D3 photo D3

    Bring data to life with SVG, Canvas and HTML. 📊📈🎉

Recommend Topics

  • javascript

    JavaScript (JS) is a lightweight interpreted programming language with first-class functions.

  • web

    Some thing interesting about web. New door for the world.

  • server

    A server is a program made to process requests and deliver data to clients.

  • Machine learning

    Machine learning is a way of modeling and interpreting data that allows a piece of software to respond intelligently.

  • Game

    Some thing interesting about game, make everyone happy.

Recommend Org

  • Facebook photo Facebook

    We are working to build community through open source technology. NB: members must have two-factor auth.

  • Microsoft photo Microsoft

    Open source projects and samples from Microsoft.

  • Google photo Google

    Google ❤️ Open Source for everyone.

  • D3 photo D3

    Data-Driven Documents codes.