PDF は、テキスト、データなどを含むドキュメント ファイル形式であり、オペレーティング システムに依存しません。 TXT ファイルは、行形式のプレーン テキストを含む .TXT 拡張子を持つ標準のテキスト ドキュメントです。任意のテキスト編集ツールやワープロ ツールで開いて編集できます。場合によっては、PDF ドキュメントをプログラムでテキスト ファイルに変換する必要がある場合があります。この記事では、Ruby の REST API を使用してプログラムで PDF をテキスト ファイルに変換する方法を学習します。
この記事では次のトピックについて説明します。
- PDF から TEXT への変換 REST API と Ruby SDK
- Ruby の REST API を使用して PDF をテキスト ファイルに変換する
- PDFの特定のページをRubyでTEXTに変換する
- 無料のオンライン TXT から PDF コンバーター
PDF から TEXT への変換 REST API と Ruby SDK
PDF を TXT ファイルに変換するには、GroupDocs.Conversion Cloud API の Ruby SDK を使用します。 Rails コンソールで次のコマンドを使用してインストールできます。
gem install groupdocs_conversion_cloud
以下の手順に従う前に、GroupDocs ダッシュボード から クライアント ID とシークレットを取得してください。クライアント ID とクライアント シークレットを取得したら、以下に示すように、これらを Ruby アプリケーション コードに追加します。
# 無料登録後、https://dashboard.groupdocs.cloud から client_id と client_secret を取得します。
# http://api.groupdocs.cloud の Ruby アプリケーションに gem をロードします。
require 'groupdocs_conversion_cloud'
@client_id = "xxxxxxx-xxxx-xxxx-xxxx-xxxxxxxxxxxx"
@client_secret = "xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx"
Ruby の REST API を使用して PDF をテキスト ファイルに変換する
以下の簡単な手順に従って、PDF ファイルをテキスト ファイルに変換できます。以下の手順に従って、プログラムで PDF ドキュメントをテキスト ファイルに変換する方法を学びましょう。
- まず、ConvertApi のインスタンスを作成します。
- ConvertSettings のインスタンスを作成する
- 入力 PDF ドキュメントのパスと出力形式を「pdf」に設定します
- PdfLoadOptions のインスタンスを作成する
- PDFファイルにパスワードを設定する
- 次に、ロード オプション設定を提供します
- 出力ファイルのパス「pdf-to-text」を指定します。
- ConvertSettings を使用して ConvertDocumentRequest を作成する
- 最後に、ConvertDocumentRequest を使用して ConvertApi.convertDocument() メソッドを呼び出します。
次のコード例は、Ruby の REST API を使用して PDF ドキュメントを TEXT ファイルに変換する方法を示しています。
# PDFをTXTファイルに変換する方法。
# APIインスタンスの作成
@fileApi = GroupDocsConversionCloud::ConvertApi.from_keys(@client_id, @client_secret)
# 変換設定を初期化する
settings = GroupDocsConversionCloud::ConvertSettings.new
settings.file_path = "pdf-to-text/four-pages.pdf"
settings.format = "pdf"
loadOptions = GroupDocsConversionCloud::PdfLoadOptions.new
loadOptions.password = "password"
settings.load_options = loadOptions
settings.output_path = "pdf-to-text"
# PDF から TEXT コンバーターを使用して変換する
result = @fileApi.convert_document(GroupDocsConversionCloud::ConvertDocumentRequest.new(settings))
puts("Successfully converted pdf document to text file.")
上記のサンプルコードは、変換されたTEXTファイルをクラウド上に保存します。
PDFの特定のページをRubyでTEXTに変換する
以下の手順に従って、PDF ドキュメントの特定のページをプログラムでテキスト ファイルに変換できます。
- まず、ConvertApi のインスタンスを作成します。
- 次に、ConvertSettings のインスタンスを作成します。
- 入力 PDF ドキュメントのパスと出力形式を「pdf」に設定します
- 次に、PdfLoadOptions のインスタンスを作成します。
- PDFファイルにパスワードを設定する
- TxtConvertOptions のインスタンスを作成する
- 変換するページ番号をカンマ区切りの配列で指定します
- 次に、loadOptions 設定オブジェクトを提供します
- ConvertOptions を設定オブジェクトに割り当てる
- 出力ファイルのパス「pdf-to-text」を指定します。
- ConvertSettings を使用して ConvertDocumentRequest を作成する
- 最後に、ConvertDocumentRequest を使用して ConvertApi.convertDocument() メソッドを呼び出します。
次のコード例は、Ruby の REST API を使用して特定のページを PDF からテキストに変換する方法を示しています。
# PDFの特定のページをテキストファイルに変換
# 必要なAPIインスタンスを作成する
@fileApi = GroupDocsConversionCloud::ConvertApi.from_keys(@client_id, @client_secret)
# 変換設定を初期化する
settings = GroupDocsConversionCloud::ConvertSettings.new
settings.file_path = "pdf-to-text/four-pages.pdf"
settings.format = "pdf"
loadOptions = GroupDocsConversionCloud::PdfLoadOptions.new
loadOptions.password = "password"
convertOptions = GroupDocsConversionCloud::TxtConvertOptions.new
convertOptions.pages = [2, 3]
settings.load_options = loadOptions
settings.convert_options = convertOptions
settings.output_path = "pdf-to-text"
# PDFの特定のページをTXTに変換します
result = @fileApi.convert_document(GroupDocsConversionCloud::ConvertDocumentRequest.new(settings))
puts("Successfully converted pdf to text file.")
無料のオンラインTXTからPDFへのコンバーター
オンラインでPDFをテキストファイルに変換するにはどうすればよいですか?弊社の最高の PDF から TXT コンバーターを無料で使用して、PDF から TXT オンラインで無料 に変換します。この無料の PDF からテキストへのコンバーターは、上記の PDF からテキストへの変換 API を使用して開発されました。
まとめ
この記事では、次の方法を学びました。
- Rubyを使用してPDFをテキストファイルに変換する方法;
- PDFの特定のページをルビのテキストに変換する方法;
GroupDocs.Conversion ファイル コンバータ API の詳細については、ドキュメント を使用して学習できます。また、ブラウザーを通じて API を直接視覚化して通信できる API リファレンス セクションも提供しています。
質問する
PDF to Text Converter についてご質問がある場合は、無料サポート フォーラム でお気軽にお問い合わせください。