Giter VIP home page Giter VIP logo

weibo-public-opinion-analysis's People

Contributors

stay-leave avatar

Stargazers

 avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar

Watchers

 avatar  avatar  avatar  avatar

weibo-public-opinion-analysis's Issues

如何指定要爬取的主题

博主您好,如何在comment_crawler.py文件中指定想要爬取的主题呢。我成功运行了您的博文内容爬取文件。但是在这个博文评论爬取文件中,没有找到相应的提示。

topic similarity 又来叨扰楼主了

这一部分里最后的主题演变图,这个出图的代码,楼主能给分享一下 或者给指条路嘛
目前运行python 主题余弦相似度最后会生成一个.json文件。。

状态码418

爬取2022年评论,运行一会儿,报错码418,保存评论文件为空,请教下该怎么修改

主题重要性区分

请问楼主为什么可视化之后左边的圆圈会一样大呢?即每个主题都一样重要。

关于困惑度

博主您好,在我用您的代码进行计算时,发现计算出来的困惑度为负数,但是我看很多论文里面计算结果都是正的,请问您知道这是为什么吗?

评论时间

作者您好,我是个代码小白,在做一个情感分析的作业,使用您评论爬虫的过程中发现爬取不到对应的时间,想请教一下如何解决,谢谢

requirements

博主能提供一份requirements.txt吗 拜托拜托拜托🙏🏻

excel转txt报错

报错IndexError: list index out of range,列表索引超出范围
涉及到的代码result_0 = alldata[4],修改result_0 = alldata[3]就可以但是excel转txt是空的。请问这个是什么原因
微信图片_20230411090821
微信图片_20230411092010

@stay-leave

数据集

请问,数据集方便分享一份不(用于测试)

正文_2.xlsx

image
你好,这个“正文_2.xlsx”可以发一下吗

博主你好,我有点问题

博主你好,我是初次接触人工智能就被要求制作类似项目的新手,安装完环境看完说明后还是不会跑,如果你有空能麻烦你出个详细一些的教学吗

微博文件的爬取后的分布

你好,我想咨询一下,就是在爬取了所有的评论的文件以后,后续又对其进行了操作么,我看到了一个excel分月和正文分月类似的操作,想问一下这些文件夹的构造大概是如何的,能够大概讲一讲做了什么样的操作吗,我好像在爬取部分没有看到

评论无法爬取的问题

我在使用作者代码时出现了无法爬取的问题
1、按照代码要求,建立了正文_1.xlsx和正文_2.xlsx文件
image

2、添加了cookie值
image
3、运行文件
image
没有任何结果

爬取用户信息失败

您好,在爬取用户信息时显示正常爬取中,也创建了这个表,但是表却是空表,请问这是什么情况呢?

问题请教

作者你好,请问你的爬虫获取下来的数据里有没有一些你不需要的数据,(例如:一些打广告的),这些数据你是清洗掉了吗?有一些很难清洗的数据,你是怎么清洗的呢?方便给我的邮箱回复一个你的联系方式吗?[email protected] 非常感谢!

LdaMallet

from ldamattle import LdaMallet#导入mallet 您好,这个LdaMallet库去哪里下载呀,这里一直解决不了

Recommend Projects

  • React photo React

    A declarative, efficient, and flexible JavaScript library for building user interfaces.

  • Vue.js photo Vue.js

    🖖 Vue.js is a progressive, incrementally-adoptable JavaScript framework for building UI on the web.

  • Typescript photo Typescript

    TypeScript is a superset of JavaScript that compiles to clean JavaScript output.

  • TensorFlow photo TensorFlow

    An Open Source Machine Learning Framework for Everyone

  • Django photo Django

    The Web framework for perfectionists with deadlines.

  • D3 photo D3

    Bring data to life with SVG, Canvas and HTML. 📊📈🎉

Recommend Topics

  • javascript

    JavaScript (JS) is a lightweight interpreted programming language with first-class functions.

  • web

    Some thing interesting about web. New door for the world.

  • server

    A server is a program made to process requests and deliver data to clients.

  • Machine learning

    Machine learning is a way of modeling and interpreting data that allows a piece of software to respond intelligently.

  • Game

    Some thing interesting about game, make everyone happy.

Recommend Org

  • Facebook photo Facebook

    We are working to build community through open source technology. NB: members must have two-factor auth.

  • Microsoft photo Microsoft

    Open source projects and samples from Microsoft.

  • Google photo Google

    Google ❤️ Open Source for everyone.

  • D3 photo D3

    Data-Driven Documents codes.