一个IT类电子书网站的爬虫程序, 此网站大约有400多本高清的电子书, 包括 PDF、epub、mobi、azw3等格式.
抓取后的结果参见: output.json
# 下载代码
git clone [email protected]:rmlzy/itpanda_spider.git
cd itpanda_spider
# 安装依赖
npm install
# 开始抓取程序, 会在 itpanda_spider 目录下生成 output.json 文件
npm run start
推荐一个 Mac 平台的 epub 阅读器: Clearview, 解压密码: www.ifunmac.com
一份下载好的前端方向的 zip: 链接:https://pan.baidu.com/s/1K2qbnDlvsCwIsYDWzNXXwA 密码:sfbs