Ruby の REST API を使用して PDF を HTML に変換する

Ruby の REST API を使用して PDF を HTML に変換する

一般に、Web 経由で情報を提供するには HTML の方が優れているため、PDF ファイルを HTML に変換する必要がある場合があります。プログラムで形式を維持して PDF から HTML への変換を実行するために、この記事では Ruby の REST API を使用して PDF を HTML に変換する方法について説明します。さらに、オンライン PDF to HTML コンバーターの無料ダウンロード ライブラリを使用して PDF を HTML に変換するための追加オプションの使用方法も学習します。

PDF では、ドキュメントの書式を失うことなく、読み取り専用ドキュメントを共有および印刷できます。 PDF ドキュメントを HTML Web ページに簡単に変換し、任意のブラウザで表示できます。 Ruby を使用して PDF を HTML 形式に変換する方法を学びましょう。

この記事では次のトピックについて説明します。

PDF から HTML への変換 REST API - インストール

PDF を HTML 形式に変換するには、GroupDocs.Conversion Cloud API の Ruby SDK を使用します。コンソールで次のコマンドを使用して、PDF ドキュメントから HTML へのコンバーターの無料ダウンロード ライブラリをインストールできます。

gem install groupdocs_conversion_cloud

この PDF から HTML への変換ソフトウェアは無料でダウンロードできます。次に、以下の手順に従う前に、GroupDocs ダッシュボード から クライアント ID とシークレットを取得してください。クライアント ID とクライアント シークレットを取得したら、以下に示すように、これらを Ruby アプリケーション コードに追加します。

# 無料登録後、https://dashboard.groupdocs.cloud から client_id と client_secret を取得します。
# http://api.groupdocs.cloud の Ruby アプリケーションに gem をロードします。
require 'groupdocs_conversion_cloud'

@client_id = "xxxxxxx-xxxx-xxxx-xxxx-xxxxxxxxxxxx"
@client_secret = "xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx"
# ストレージ名を設定する
@storage_name = "test-internal-storage"

次に、Ruby の REST API を使用して、PDF を HTML 形式に変換する方法を段階的に見てみましょう。

Ruby の REST API を使用した PDF から HTML への変換

以下に示す簡単な手順に従って、PDF ファイルをプログラムで HTML 形式に変換できます。

  • まず、ConvertApiのインスタンスを作成します。
  • 次に、ConvertSettings を使用して変換設定インスタンスを作成します。
  • 次に、ファイルストレージ名を指定します。
  • 入力PDFファイルのパスと出力ファイル形式を「html」に設定します。
  • 次に、出力パス名を指定します。
  • その後、ConvertSettings を引数として ConvertDocumentRequest を作成します。
  • 最後に、ConvertDocumentRequest で convert\document() メソッドを呼び出して、pdf を html に変換します。

次のコードサンプルは、Ruby で PDF を HTML 形式に変更する方法を示しています。

# このコード例は、PDF ドキュメントを HTML Web ページに変換する方法を示します。
# ConvertApi インスタンスを作成する
@convert_api = GroupDocsConversionCloud::ConvertApi.from_keys(@client_id, @client_secret)

# 変換設定を準備する
@settings = GroupDocsConversionCloud::ConvertSettings.new
@settings.storage_name = @storage_name
@settings.file_path = "pdf-to-html/pdf-pages.pdf"
@settings.format = "html"
@settings.output_path = "pdf-to-html"

# PDFをHTMLに変換する
@result = @convert_api.convert_document(GroupDocsConversionCloud::ConvertDocumentRequest.new(@settings))
puts("PDF file successfully converted to HTML.")

最後に、上記のコード サンプルは HTML ファイルをクラウドに保存します。これは、PDF を HTML ドキュメントに変換する最良の方法です。

範囲のページを PDF から HTML に変換する方法

以下の手順に従って、PDF ドキュメントのページ範囲を HTML に変換できます。

  • まず、ConvertApiのインスタンスを作成します。
  • 次に、ConvertSettings を使用して変換設定インスタンスを作成します。
  • 次に、ファイルストレージ名を指定します。
  • 入力PDFファイルのパスと出力ファイル形式を「html」に設定します。
  • HtmlConvertOptions のインスタンスを作成する
  • from\page、pages\count、fixed\layout の変換オプションを設定します。
  • 次に、convert\optionsとoutput\pathの値を設定します。
  • その後、ConvertSettings を引数として ConvertDocumentRequest を作成します。
  • 最後に、ConvertDocumentRequest で convert\document() メソッドを呼び出して、オンラインで PDF を HTML コードに変換します。

次のコード サンプルは、Ruby を使用して PDF ドキュメントから HTML ファイルにページ範囲を変換する方法を示しています。

# このコード例は、Ruby でページ範囲を PDF から HTML に変換する方法を示します。
# 変換 API インスタンスの作成
@convert_api = GroupDocsConversionCloud::ConvertApi.from_keys(@client_id, @client_secret)
 
# 変換設定の作成
@settings = GroupDocsConversionCloud::ConvertSettings.new
@settings.storage_name = @storage_name
@settings.file_path = "pdf-to-html/pdf-pages.pdf"
@settings.format = "html"
@convertOptions = GroupDocsConversionCloud::HtmlConvertOptions.new
@convertOptions.from_page = 1
# 変換するページ数
@convertOptions.pages_count = 3
@convertOptions.fixed_layout = true
@settings.convert_options = @convertOptions
@settings.output_path = "pdf-to-html"
 
# 高度なオプションを使用して PDF を HTML に変換する
@result = @convert_api.convert_document(GroupDocsConversionCloud::ConvertDocumentRequest.new(@settings))
puts("PDF file converted to HTML using advance options.")

最後に、上記のコード サンプルは、クラウド上でオンラインで PDF から HTML に変換した後、ドキュメントを保存します。

PDFの特定のページをHTMLに変換する方法

以下の手順に従って、オンラインで画像付きの最高の PDF から HTML へのコンバーターを使用して、PDF ドキュメントの特定のページを HTML に変換できます。

  • まず、ConvertApiのインスタンスを作成します。
  • 次に、ConvertSettings を使用して変換設定インスタンスを作成します。
  • 次に、ファイルストレージ名を指定します。
  • 入力PDFファイルのパスと出力ファイル形式を「html」に設定します。
  • HtmlConvertOptions のインスタンスを作成する
  • ページコレクションのHTML変換オプションを提供します
  • 次に、convert\optionsとoutput\pathの値を設定します。
  • その後、ConvertSettings を引数として ConvertDocumentRequest を作成します。
  • 最後に、ConvertDocumentRequest で convert\document() メソッドを呼び出して、PDF を HTML ファイルに変換します。

次のコード サンプルは、Ruby を使用して PDF ドキュメントの特定のページを HTML ファイルにエクスポートする方法を示しています。

# このコード例は、Ruby で PDF の特定のページを HTML に変換する方法を示します。
# 変換 API インスタンスを作成する
@convert_api = GroupDocsConversionCloud::ConvertApi.from_keys(@client_id, @client_secret)
 
# 変換設定の作成
@settings = GroupDocsConversionCloud::ConvertSettings.new
@settings.storage_name = @storage_name
@settings.file_path = "pdf-to-html/pdf-pages.pdf"
@settings.format = "html"
@convertOptions = GroupDocsConversionCloud::HtmlConvertOptions.new
# 変換される特定のページのページインデックス
@convertOptions.pages = [1, 5]
@settings.convert_options = @convertOptions
@settings.output_path = "pdf-to-html"
 
# PDF 特定のページを HTML に変換
@response = @convert_api.convert_document(GroupDocsConversionCloud::ConvertDocumentRequest.new(@settings))
puts("PDF certain pages converted to HTML successfully.")

最後に、上記のコード サンプルは、クラウド上の画像を含む PDF を HTML に変換します。以下で説明するように、オンラインの PDF から HTML コードへのコンバーターがあります。

PDFからHTMLへのオンライン変換ツール

PDFをオンラインで無料でHTMLに変換する方法? Groupdocs.Conversion は、PDF を HTML 形式に変更するための 無料のオンライン PDF から HTML への変換ツール を提供します。変換したいファイルを選択するだけで、オンラインで最高の PDF から HTML コンバーターを無料で使用して、PDF ファイルを HTML ファイルに変換できます。これは、Groupdocs.Conversion オンライン PDF to HTML API を使用して開発されました。

結論

この記事では、次のことを学びました。

  • Ruby で書式設定を失わずに PDF を HTML に変換する方法;
  • Rubyで範囲ごとにPDFをHTMLファイルに変換する方法;
  • 特定の PDF ページを HTML 形式に変換します。
  • 無料でオンラインでPDFをHTMLに変換します。

さらに、GroupDocs.Conversion ファイル形式変換 API の詳細については、ドキュメント を使用して学習できます。

質問する

PDFファイルをHTML形式に変換する方法についてご不明な点がございましたら、無料サポートフォーラムまでお気軽にお問い合わせください。

関連項目