Ruby の REST API を使用してプログラムで PDF をテキストに変換する

Ruby の REST API を使用してプログラムで PDF をテキストに変換する

PDF は、テキスト、データなどを含むドキュメント ファイル形式であり、オペレーティング システムに依存しません。 TXT ファイルは、行形式のプレーン テキストを含む .TXT 拡張子を持つ標準のテキスト ドキュメントです。任意のテキスト編集ツールやワープロ ツールで開いて編集できます。場合によっては、PDF ドキュメントをプログラムでテキスト ファイルに変換する必要がある場合があります。この記事では、Ruby の REST API を使用してプログラムで PDF をテキスト ファイルに変換する方法を学習します。

この記事では次のトピックについて説明します。

PDF から TEXT への変換 REST API と Ruby SDK

PDF を TXT ファイルに変換するには、GroupDocs.Conversion Cloud API の Ruby SDK を使用します。 Rails コンソールで次のコマンドを使用してインストールできます。

gem install groupdocs_conversion_cloud

以下の手順に従う前に、GroupDocs ダッシュボード から クライアント ID とシークレットを取得してください。クライアント ID とクライアント シークレットを取得したら、以下に示すように、これらを Ruby アプリケーション コードに追加します。

# 無料登録後、https://dashboard.groupdocs.cloud から client_id と client_secret を取得します。
# http://api.groupdocs.cloud の Ruby アプリケーションに gem をロードします。

require 'groupdocs_conversion_cloud'
@client_id = "xxxxxxx-xxxx-xxxx-xxxx-xxxxxxxxxxxx"
@client_secret = "xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx"

Ruby の REST API を使用して PDF をテキスト ファイルに変換する

以下の簡単な手順に従って、PDF ファイルをテキスト ファイルに変換できます。以下の手順に従って、プログラムで PDF ドキュメントをテキスト ファイルに変換する方法を学びましょう。

  • まず、ConvertApi のインスタンスを作成します。
  • ConvertSettings のインスタンスを作成する
  • 入力 PDF ドキュメントのパスと出力形式を「pdf」に設定します
  • PdfLoadOptions のインスタンスを作成する
  • PDFファイルにパスワードを設定する
  • 次に、ロード オプション設定を提供します
  • 出力ファイルのパス「pdf-to-text」を指定します。
  • ConvertSettings を使用して ConvertDocumentRequest を作成する
  • 最後に、ConvertDocumentRequest を使用して ConvertApi.convertDocument() メソッドを呼び出します。

次のコード例は、Ruby の REST API を使用して PDF ドキュメントを TEXT ファイルに変換する方法を示しています。

# PDFをTXTファイルに変換する方法。
# APIインスタンスの作成
@fileApi = GroupDocsConversionCloud::ConvertApi.from_keys(@client_id, @client_secret)

# 変換設定を初期化する
settings = GroupDocsConversionCloud::ConvertSettings.new
settings.file_path = "pdf-to-text/four-pages.pdf"
settings.format = "pdf"

loadOptions = GroupDocsConversionCloud::PdfLoadOptions.new
loadOptions.password = "password"

settings.load_options = loadOptions
settings.output_path = "pdf-to-text"

# PDF から TEXT コンバーターを使用して変換する
result = @fileApi.convert_document(GroupDocsConversionCloud::ConvertDocumentRequest.new(settings))
puts("Successfully converted pdf document to text file.")

上記のサンプルコードは、変換されたTEXTファイルをクラウド上に保存します。

PDFの特定のページをRubyでTEXTに変換する

以下の手順に従って、PDF ドキュメントの特定のページをプログラムでテキスト ファイルに変換できます。

  • まず、ConvertApi のインスタンスを作成します。
  • 次に、ConvertSettings のインスタンスを作成します。
  • 入力 PDF ドキュメントのパスと出力形式を「pdf」に設定します
  • 次に、PdfLoadOptions のインスタンスを作成します。
  • PDFファイルにパスワードを設定する
  • TxtConvertOptions のインスタンスを作成する
  • 変換するページ番号をカンマ区切りの配列で指定します
  • 次に、loadOptions 設定オブジェクトを提供します
  • ConvertOptions を設定オブジェクトに割り当てる
  • 出力ファイルのパス「pdf-to-text」を指定します。
  • ConvertSettings を使用して ConvertDocumentRequest を作成する
  • 最後に、ConvertDocumentRequest を使用して ConvertApi.convertDocument() メソッドを呼び出します。

次のコード例は、Ruby の REST API を使用して特定のページを PDF からテキストに変換する方法を示しています。

# PDFの特定のページをテキストファイルに変換
# 必要なAPIインスタンスを作成する
@fileApi = GroupDocsConversionCloud::ConvertApi.from_keys(@client_id, @client_secret)

# 変換設定を初期化する
settings = GroupDocsConversionCloud::ConvertSettings.new
settings.file_path = "pdf-to-text/four-pages.pdf"
settings.format = "pdf"

loadOptions = GroupDocsConversionCloud::PdfLoadOptions.new
loadOptions.password = "password"

convertOptions = GroupDocsConversionCloud::TxtConvertOptions.new
convertOptions.pages = [2, 3]

settings.load_options = loadOptions
settings.convert_options = convertOptions
settings.output_path = "pdf-to-text"

# PDFの特定のページをTXTに変換します
result = @fileApi.convert_document(GroupDocsConversionCloud::ConvertDocumentRequest.new(settings))
puts("Successfully converted pdf to text file.")

無料のオンラインTXTからPDFへのコンバーター

オンラインでPDFをテキストファイルに変換するにはどうすればよいですか?弊社の最高の PDF から TXT コンバーターを無料で使用して、PDF から TXT オンラインで無料 に変換します。この無料の PDF からテキストへのコンバーターは、上記の PDF からテキストへの変換 API を使用して開発されました。

まとめ

この記事では、次の方法を学びました。

  • Rubyを使用してPDFをテキストファイルに変換する方法;
  • PDFの特定のページをルビのテキストに変換する方法;

GroupDocs.Conversion ファイル コンバータ API の詳細については、ドキュメント を使用して学習できます。また、ブラウザーを通じて API を直接視覚化して通信できる API リファレンス セクションも提供しています。

質問する

PDF to Text Converter についてご質問がある場合は、無料サポート フォーラム でお気軽にお問い合わせください。

関連項目