Comments (7)
这种问题都是使用错误导致的,现在我推荐clone下来develop分支,然后同样命令启动。如果要退出,就CTRL+C即可(需要等待退出)。有什么问题就反馈,我会及时fix。
ps. develop分支目前仅单机模式可用。
from cola.
我也遇到了这个问题,develop分支也有。
from cola.
这个问题是因为没有可抓取的对象导致的,确定starts中添加了相应的初始对象,以及这些对象都有好友去进行接下去的抓取?
from cola.
运行第一次的时候,能够正常的抓取数据。再运行的时候就会得到这个问题。我怀疑是将已抓取过的对象作为初始对象导致的,但这种情况应该直接结束程序才对。
from cola.
初始对象如果抓取过,是不会再接着抓取了。出现这个提示,只会是因为没有可以抓取的对象。
from cola.
如果初始对象是被抓取过的,而size为1,那是不是就算是没有可以抓取的对象?这时候程序应该要自己结束吧。
from cola.
不是这种逻辑。因为size是说明总的抓取数。而抓取的对象可能不光是初始的对象,也有可能是从初始对象得到的。而且,一个调度器调度worker抓取,如果worker反馈没有抓取对象,就退出,会导致很多问题,可能一个网页正在被解析,而要抓取的对象还没有被push到mq中。
另外,这个地方我有考量到动态的修改,也就是说这个时候虽然没有对象,用户可以直接修改比如添加初始对象,这个时候程序会继续运行,这种情况在后续有web接口等等的功能时,就会存在。
如果程序退出了,就不能做到这点。而实际上,用户自己CTRL+C退出代价也不大。
from cola.
Related Issues (20)
- json.loads(br.response().read())["data"] HOT 1
- windows下coca无法启动分布式程序 HOT 1
- 遇到执行weibosearch的时候包不存在包问题 HOT 1
- 在CentOS 6中无法运行
- instances设置为大于core个数时,会出问题,过一段时间就会停止爬取了
- 在parser中获取网页html信息时卡住出不来
- 抓取网页出现HTTP ERROR处理问题
- 在抓取过程中突然卡住三四个小时,ctrl C不会退出。应该是mq处理出现问题了 HOT 1
- Failed to save to db, weakly-referenced object no longer exists HOT 2
- ValueError: No JSON object could be decoded HOT 8
- 怎么设置要爬取的用户 HOT 4
- 爬取follow列表的问题 HOT 2
- 爬取新浪微博出错 HOT 3
- 看了下,和上一个issues的log是一样的,应该是mq没有保护好的问题把
- 分布式爬取中,worker的主备mq同步问题
- 任务现场保存问题,任务现场保存在tmp里面,重启pc tmp会被清空
- 不太明白weibo.yaml里面的部分配置,有详细的一对一解释吗? HOT 2
- 还有更新的打算么? HOT 2
- 任务执行完成后为什么始终不退出 HOT 5
- Fix simple typo: falese -> false
Recommend Projects
-
React
A declarative, efficient, and flexible JavaScript library for building user interfaces.
-
Vue.js
🖖 Vue.js is a progressive, incrementally-adoptable JavaScript framework for building UI on the web.
-
Typescript
TypeScript is a superset of JavaScript that compiles to clean JavaScript output.
-
TensorFlow
An Open Source Machine Learning Framework for Everyone
-
Django
The Web framework for perfectionists with deadlines.
-
Laravel
A PHP framework for web artisans
-
D3
Bring data to life with SVG, Canvas and HTML. 📊📈🎉
-
Recommend Topics
-
javascript
JavaScript (JS) is a lightweight interpreted programming language with first-class functions.
-
web
Some thing interesting about web. New door for the world.
-
server
A server is a program made to process requests and deliver data to clients.
-
Machine learning
Machine learning is a way of modeling and interpreting data that allows a piece of software to respond intelligently.
-
Visualization
Some thing interesting about visualization, use data art
-
Game
Some thing interesting about game, make everyone happy.
Recommend Org
-
Facebook
We are working to build community through open source technology. NB: members must have two-factor auth.
-
Microsoft
Open source projects and samples from Microsoft.
-
Google
Google ❤️ Open Source for everyone.
-
Alibaba
Alibaba Open Source for everyone
-
D3
Data-Driven Documents codes.
-
Tencent
China tencent open source team.
from cola.