一个IT类电子书网站的爬虫程序, 此网站大约有400多本高清的电子书, 包括 PDF、epub、mobi、azw3等格式.
抓取后的结果参见: output.json
# 下载代码
git clone [email protected]:rmlzy/itpanda_spider.git
cd itpanda_spider
# 安装依赖
npm install
# 开始抓取程序, 会在 itpanda_spider 目录下生成 output.json 文件
npm run start
推荐一个 Mac 平台的 epub 阅读器: Clearview, 解压密码: www.ifunmac.com
TODO:
- 自动保存到百度网盘中