Giter VIP home page Giter VIP logo

weiboanalysis's Introduction

基于AdaBoost算法的情感分析研究

此项目为本科毕业设计项目,目前已经没有时间更新了,文章、代码都有很多错误,大家借鉴一下思路就好,不要仔细研究

大学时没有好好学算法,毕竟那些树、图实在提不起兴趣,好在毕业设计选择了个机器学习算法,整了个还算是有点意思的项目,至少弥补了大学的一点点的遗憾。现在将项目开源出来,虽然感觉还是写得没有达到自己的预期,大部分也是参考别人的,有兴趣的可以下载看看吧。如果可以,希望能给个star或者fork奖励奖励

文本分类基本流程

运行环境

[anaconda: 3.5+]https://www.anaconda.com/

本文项目流程

一、 使用微博应用获取微博文本,代码地址weibo_get
二、 SVM初步分类(svm_temp.py)
三、 利用贝叶斯定理进行情感分析
四、 利用AdaBoost加强分类器

完整文档可以看doc https://github.com/Zephery/weiboanalysis/blob/master/doc

一、获取微博文本

二、SVM初步分类

三、使用朴素贝叶斯分类

四、AdaBoost

4.1 二分类AdaBoost

4.2 多分类AdaBoost

4.2.1 AdaBoost.SAMME

4.2.2 AdaBoost.SAMME.R

weiboanalysis's People

Contributors

zephery avatar

Stargazers

 avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar

Watchers

 avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar

weiboanalysis's Issues

作者你好,想问一个数据集处理的问题

作者你好,请问你的爬虫获取下来的数据里有没有一些你不需要的数据,(例如:一些打广告的),这些数据你是清洗掉了吗?有一些很难清洗的数据,你是怎么清洗的呢?方便给我的邮箱回复一个你的联系方式吗?[email protected] 非常感谢!

你好,关于数据集的问题

你好,请问你是将数据集直接从数据库读取出来进行处理的吗?还有这个项目一开始对于数据的处理是从svm_train.py这个文件开始的吗?

特征编码问题请教

您好,根据您的文档和svm_train.py的文档,每个文本最后就是表示成类似这样的吗?(每个)[{'试试': 'True', '正': 'True', '礼': 'True', '人品': 'True', '专': 'True', '力': 'True', '事': 'True', '玩耍': 'True', '说': 'True', '博': 'True', '微': 'True', '[酷]': 'True', '享': 'True', '奖品': 'True', '领取': 'True', '太': 'True', '等级': 'True', '愉快': 'True'}, 'adv'] 请问不需要再进行其他编码吗?

谢谢您以及您超级详细的文档!

作者你好,关于朴素贝叶斯,问个问题啊

朴素贝叶斯应用在自然语言处理的时候,是不是只是把单词截断当作特征,全然没有考虑语序的问题啊。有没有那样的句子,比如把主谓宾调换位置,语义就变了呢?是不是朴素贝叶斯在自然语言处理方面有这种缺陷呢,这要如何处理才能规避这种缺陷呢?

版本问题

请问这份代码python的版本及其各种库的版本是什么

您好,我能问个问题么?

就是在那个Byaes.py里面,第九行代码里的那个数据我看着好像不对啊 ,找不到,知道了也不是那种句子,是词语。是不是弄错地方了?

作者我毕设和你方向差不多,有个问题

看作者有用svm进行预测,想问下作者的svm输入是什么?我也是用神经网络不过不是svm,我的输入是向量,想请教下作者吧 句子 向量化是怎么做的?能不能解答下呢

Recommend Projects

  • React photo React

    A declarative, efficient, and flexible JavaScript library for building user interfaces.

  • Vue.js photo Vue.js

    🖖 Vue.js is a progressive, incrementally-adoptable JavaScript framework for building UI on the web.

  • Typescript photo Typescript

    TypeScript is a superset of JavaScript that compiles to clean JavaScript output.

  • TensorFlow photo TensorFlow

    An Open Source Machine Learning Framework for Everyone

  • Django photo Django

    The Web framework for perfectionists with deadlines.

  • D3 photo D3

    Bring data to life with SVG, Canvas and HTML. 📊📈🎉

Recommend Topics

  • javascript

    JavaScript (JS) is a lightweight interpreted programming language with first-class functions.

  • web

    Some thing interesting about web. New door for the world.

  • server

    A server is a program made to process requests and deliver data to clients.

  • Machine learning

    Machine learning is a way of modeling and interpreting data that allows a piece of software to respond intelligently.

  • Game

    Some thing interesting about game, make everyone happy.

Recommend Org

  • Facebook photo Facebook

    We are working to build community through open source technology. NB: members must have two-factor auth.

  • Microsoft photo Microsoft

    Open source projects and samples from Microsoft.

  • Google photo Google

    Google ❤️ Open Source for everyone.

  • D3 photo D3

    Data-Driven Documents codes.