Giter VIP home page Giter VIP logo

translators_cn's Introduction

Zotero translators 中文维护小组

目前 Zotero 中有许多抓取中文学术网站的插件,这些插件有些已经非常老旧,缺少及时的维护。希望能在这里召集一些志同道合的朋友,共同维护中文学术或其他类型网站的抓取插件。

🎯 目标网站

  • 知网或知网海外 -> CNKI.js
    • 默认保存网页快照
    • 文章格式都为PDF,学位论文的CAJ链接已经替换为PDF,注意学位论文的PDF应该是没有目录信息的。如果想要下载CAJ格式的学位论文,将CNKI.js中两处keepPDF改为false
    • 修改旧版本将知网导出refworksCN字段保存为期刊条目中的 call number,修改后CN字段不保留
    • 修改了拉取知网refworks格式引文的网址,新网址提供的摘要字数最多为500字
    • 知网海外版PDF和CAJ附件下载支持
    • 支持文献类型:期刊,学位论文,会议论文,报纸
    • 已同步到官方版本库中
  • 万方数据 -> WanFang.js
    • 抓取引文信息
    • 支持文献类型:期刊,学位论文,专利,会议论文
    • PDF附件下载
  • 维普 -> WeiPu.js
    • 抓取引文信息
    • 支持文献类型:期刊
    • PDF附件下载
  • 百度学术 -> Baidu Scholar.js
    • 修复抓取图书时错误
    • 修复中文作者姓,名问题
  • Bilibili 视频网站 -> BiliBili.js
    • 视频页抓取信息,包括Up主,标签,上传日期,视频选集
    • 搜索页面信息抓取,包括Up主,上传日期,标题,抓取信息比较少
  • 谷粉学术-谷歌学术 -> GFSOSO.js
    • 修改了网页匹配,识别抓取代码抄自Google Scholar。从搜索结果页识别搜索结果,引文信息正常
    • 部分文献的PDF下载可能会有问题,谷粉搜搜上可能没有相应的下载链接
    • 安装Adblock插件的朋友请注意下将谷粉学术*.glgoo.top添加到白名单,不然可能会出现问题
  • 专利搜索网站Soopat -> Snnopat.js
    • 搜索页面和单个专利页面信息抓取
    • PDF附件下载(需要登录,网站验证码可能会导致PDF下载失败)

📄 相关材料

在开始创建前,浏览下面这些材料可以帮你了解一些创建 translator 的基本知识和开发的工具。

🎈问题交流

如果有问题的,可以加群 913637964,一起交流。

translators_cn's People

Contributors

l0o0 avatar

Watchers

 avatar

Recommend Projects

  • React photo React

    A declarative, efficient, and flexible JavaScript library for building user interfaces.

  • Vue.js photo Vue.js

    🖖 Vue.js is a progressive, incrementally-adoptable JavaScript framework for building UI on the web.

  • Typescript photo Typescript

    TypeScript is a superset of JavaScript that compiles to clean JavaScript output.

  • TensorFlow photo TensorFlow

    An Open Source Machine Learning Framework for Everyone

  • Django photo Django

    The Web framework for perfectionists with deadlines.

  • D3 photo D3

    Bring data to life with SVG, Canvas and HTML. 📊📈🎉

Recommend Topics

  • javascript

    JavaScript (JS) is a lightweight interpreted programming language with first-class functions.

  • web

    Some thing interesting about web. New door for the world.

  • server

    A server is a program made to process requests and deliver data to clients.

  • Machine learning

    Machine learning is a way of modeling and interpreting data that allows a piece of software to respond intelligently.

  • Game

    Some thing interesting about game, make everyone happy.

Recommend Org

  • Facebook photo Facebook

    We are working to build community through open source technology. NB: members must have two-factor auth.

  • Microsoft photo Microsoft

    Open source projects and samples from Microsoft.

  • Google photo Google

    Google ❤️ Open Source for everyone.

  • D3 photo D3

    Data-Driven Documents codes.