Giter VIP home page Giter VIP logo

index_pdf_translation's Introduction

Indqx PDF 翻訳 概要

Indqx PDF 翻訳は、2024年5月31までwebにて翻訳サービスを提供していた、PDF翻訳のソースコードです。

サービス終了に伴い、Index PDF翻訳を、ローカルで実行可能なコードも提供しています。

Indqx PDF 翻訳は、PDFのフォーマットを崩さずに、翻訳することができる論文向けPDF翻訳サービスです。以下の機能があります。

  • 本文自動認識機能により、論文データの数式やタイトルなどの翻訳不要部分を無視して本文のみを翻訳します。
    • 本文認識はブロックの幅、文字数、フォントサイズにより、分析を行います。
  • 本文ブロックを認識時、終了記号(.:/など)がない場合、複数ブロックを1ブロックとして翻訳します。これによりブロック間やページ間にて翻訳文が途切れる等の問題を解決します。
  • 図や表の説明文のブロックを自動認識し、本文と分割して翻訳します。

ローカル版のインストール

本、レポジトリをクローン後、 以下のコマンドで必要ライブラリをインストールしてください。実行には、Python 3.11環境が必要です。

ライブラリーをインストール

pip install -r requirements.txt

APIキーの設定

config.pyを開き、以下のDeepL_API_Keyを変更し、https://www.deepl.com/ja/your-account/keysより取得したDeepL API Keyを入力してください。 また、DeepL API Proユーザーの場合、DeepL_URLをProAPI用URLに変更し保存してください。

DeepL_API_Key = "xxxxxx-xxxx-xxxx-xxxx-xxxxxxxxx:fx"

コードの実行

以下のコマンドを実行して、PDF翻訳を実行します。アプリケーションが起動すると、ファイルエクスプローラが表示されます。 翻訳するPDFを選択してください。翻訳が完了すると、./outputに翻訳後のPDFデータが保存されます。

 python manual_translate_pdf.py

index_pdf_translation's People

Contributors

mega-gorilla avatar

Recommend Projects

  • React photo React

    A declarative, efficient, and flexible JavaScript library for building user interfaces.

  • Vue.js photo Vue.js

    🖖 Vue.js is a progressive, incrementally-adoptable JavaScript framework for building UI on the web.

  • Typescript photo Typescript

    TypeScript is a superset of JavaScript that compiles to clean JavaScript output.

  • TensorFlow photo TensorFlow

    An Open Source Machine Learning Framework for Everyone

  • Django photo Django

    The Web framework for perfectionists with deadlines.

  • D3 photo D3

    Bring data to life with SVG, Canvas and HTML. 📊📈🎉

Recommend Topics

  • javascript

    JavaScript (JS) is a lightweight interpreted programming language with first-class functions.

  • web

    Some thing interesting about web. New door for the world.

  • server

    A server is a program made to process requests and deliver data to clients.

  • Machine learning

    Machine learning is a way of modeling and interpreting data that allows a piece of software to respond intelligently.

  • Game

    Some thing interesting about game, make everyone happy.

Recommend Org

  • Facebook photo Facebook

    We are working to build community through open source technology. NB: members must have two-factor auth.

  • Microsoft photo Microsoft

    Open source projects and samples from Microsoft.

  • Google photo Google

    Google ❤️ Open Source for everyone.

  • D3 photo D3

    Data-Driven Documents codes.