PDF は、クロスプラットフォームのサポートを提供する、現在最も一般的に使用されているファイル形式の 1 つです。しかし、PDF ドキュメント内の特定のページにリンクするのは難しく、PDF ファイルはソーシャル ネットワークで簡単に共有されません。 PDF ドキュメントの外観と操作性を HTML 形式で保持し、すばやく操作できます。この記事では、Python で PDF ファイルを HTML に変換する方法を学びます。

この記事では次のトピックについて説明します。

Python PDF to HTML Converter API – インストール

PDF ファイルを HTML Web ページに変換するには、GroupDocs.Conversion Cloud の Python SDK API を使用します。これは、機能が豊富でプラットフォームに依存しないドキュメントと画像の変換 Python ライブラリです。 サポートされているファイル形式 の画像とドキュメントを、高品質であらゆる形式に迅速に変換できます。

コンソールで次のコマンドを使用して、PDF から HTML への変換 Python ライブラリを Python アプリケーションにインストールして統合できます。

pip install groupdocs_conversion_cloud

上記の手順に従う前に、ダッシュボードからクライアント ID とシークレットを取得してください。 ID とシークレットを取得したら、Python アプリケーションにコードを追加します。

# Python アプリケーションで PDF から HTML に変換するための Python ライブラリをロードします
import groupdocs_conversion_cloud

# 無料登録後、https://dashboard.groupdocs.cloud から client_id と client_secret を取得します。
client_id = "xxxxxxx-xxxx-xxxx-xxxx-xxxxxxxxxxxx"
client_secret = "xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx"

# さまざまな構成を取得する
configuration = groupdocs_conversion_cloud.Configuration(client_id, client_secret)
configuration.api_base_url = "https://api.groupdocs.cloud"
your_storage = "groupdocs-storage-name"

次に、Python の REST API を使用して PDF を HTML 形式に変換する方法を段階的に説明します。

REST APIを使用してPythonでオンラインでPDFをHTMLに変換する方法

以下に示す簡単な手順に従って、PDF ファイルをプログラムで HTML 形式に変換できます。

  • まず、ConvertApiのインスタンスを作成します。
  • 次に、ConvertSettings を使用して変換設定インスタンスを作成します。
  • 次に、ファイルストレージ名を指定します。
  • 入力PDFファイルのパスと出力形式を「html」に設定します。
  • 次に、PdfLoadOptions のインスタンスを作成します。
  • PDF ファイルのパスワードを入力します
  • 次に、出力\パスとロード\オプションを設定します。
  • その後、ConvertSettings を引数として ConvertDocumentRequest を作成します。
  • 最後に、ConvertDocumentRequest で convert\document() を呼び出して、pdf を html に変換します。

次のコード サンプルは、Python で pdf を html 形式に変更する方法を示しています。

# Python で PDF を HTML にオンラインで変換する方法
try:
  # APIのインスタンスを作成する
  convert_api = groupdocs_conversion_cloud.ConvertApi.from_keys(client_id, client_secret)

  # 変換設定を定義する
  settings = groupdocs_conversion_cloud.ConvertSettings()
  settings.storage_name = your_storage
  settings.file_path = "python-testing/sample-pdf-file.pdf"
  settings.format = "html"

  loadOptions = groupdocs_conversion_cloud.PdfLoadOptions()
  loadOptions.password = "password"

  settings.load_options = loadOptions
  settings.output_path = "python-testing"

  # 変換ドキュメントリクエストの作成
  request = groupdocs_conversion_cloud.ConvertDocumentRequest(settings)

  # .pdf ファイルを HTML Web ページに変換する
  result = convert_api.convert_document(request)
  print("pdf File converted to html successfully: " + result[0].path)

except groupdocs_conversion_cloud.ApiException as e:
  print("Exception when calling convert_document: {0}".format(e.message))

最後に、上記のコード サンプルは HTML ファイルをクラウドに保存します。これは、PDF を HTML ドキュメントに変換する最良の方法です。

Python で PDF ファイルを HTML に変換する方法

Python で PDF ファイルを HTML に変換する方法

Pythonでページ範囲をPDFファイルからHTMLファイルに変換する

以下の手順に従って、PDF ドキュメントのページ範囲を HTML に変換できます。

  • まず、ConvertApiのインスタンスを作成します。
  • 次に、ConvertSettings を使用して変換設定インスタンスを作成します。
  • 次に、クラウド ストレージ名を入力します。
  • 入力PDFファイルのパスと出力形式を「html」に設定します。
  • 次に、HtmlConvertOptions のインスタンスを作成します。
  • from\page および pages\count オプションを設定する
  • 次に、出力パスとconvertOptionsを設定します。
  • 次に、ConvertSettings を引数として ConvertDocumentRequest を作成します。
  • 最後に、ConvertDocumentRequest で convert\document() メソッドを呼び出して、オンラインで PDF を HTML コードに変換します。

次のコード サンプルは、Python を使用して一連のページを PDF ドキュメントから HTML ファイルに変換する方法を示しています。

# Python でページ範囲を PDF から HTML に変換する方法
# APIのインスタンスを作成する
convert_api = groupdocs_conversion_cloud.ConvertApi.from_keys(client_id, client_secret)

# HTML変換設定を準備する
settings = groupdocs_conversion_cloud.ConvertSettings()
settings.storage_name = your_storage
settings.file_path = "python-testing/sample-pdf-file.pdf"
settings.format = "html"

# PDF 変換オプション: 開始ページ番号と変換する総ページ数
convertOptions = groupdocs_conversion_cloud.HtmlConvertOptions()
convertOptions.from_page = 1 
convertOptions.pages_count = 1

settings.convert_options = convertOptions
settings.output_path = "python-testing"

# 変換ドキュメントリクエストの作成
request = groupdocs_conversion_cloud.ConvertDocumentRequest(settings)

# PDFのページをHTMLファイルに変換します
result = convert_api.convert_document(request)
print("Converted range of pages from PDF to HTML web page: " + result[0].path)

最後に、上記のコード サンプルは、クラウド上でオンラインで PDF から HTML に変換した後、ドキュメントを保存します。

Python で特定のページを PDF から HTML 形式に変換する

以下の手順に従って、オンラインで画像付きの最高の PDF から HTML へのコンバーターを使用して、PDF ドキュメントの特定のページを HTML に変換できます。

  • まず、ConvertApiのインスタンスを作成します。
  • 次に、ConvertSettings を使用して変換設定インスタンスを作成します。
  • 次に、クラウド ストレージ名を入力します。
  • 入力PDFファイルのパスと出力形式を「html」に設定します。
  • 次に、HtmlConvertOptions のインスタンスを作成します。
  • 配列形式に変換するページ番号を追加します。
  • 次に、出力パスとconvertOptionsを設定します。
  • 次に、ConvertSettings を引数として ConvertDocumentRequest を作成します。
  • 最後に、ConvertDocumentRequest で convert\document() メソッドを呼び出して、オンラインで PDF を HTML コードに変換します。

次のコード サンプルは、Python を使用して PDF ドキュメントの特定のページを HTML ファイルにエクスポートする方法を示しています。

# Python で PDF ファイルの特定のページを HTML Web ページ形式に変換する方法
# APIのインスタンスを作成する
convert_api = groupdocs_conversion_cloud.ConvertApi.from_keys(client_id, client_secret)

# 変換設定を定義する
settings = groupdocs_conversion_cloud.ConvertSettings()
settings.storage_name = your_storage
settings.file_path = "python-testing/sample-pdf-file.pdf"
settings.format = "html"

# PDF 変換オプション: 変換するページ番号
convertOptions = groupdocs_conversion_cloud.HtmlConvertOptions()
convertOptions.pages = [1, 3, 5]

settings.convert_options = convertOptions
settings.output_path = "python-testing"

# 変換ドキュメントリクエストの作成
request = groupdocs_conversion_cloud.ConvertDocumentRequest(settings)

# PDFファイルをHTMLファイルに変換
result = convert_api.convert_document(request)
print("Successfully converted PDF file to HTML document: " + result[0].path)

最後に、上記のコード サンプルは、クラウド上の画像を含む PDF を HTML に変換します。以下で説明するように、オンラインの PDF から HTML コードへのコンバーターがあります。

無料のオンライン PDF から HTML コンバーター

最高の PDF から HTML へのコンバーターは何ですか? Groupdocs.Conversion は、PDF を HTML 形式に変換するための オンラインで無料の最高の PDF から HTML コンバーター を提供します。これは、Groupdocs.Conversion オンライン PDF to HTML API を使用して開発されました。

結論

この記事では、次のことを学びました。

  • Python で書式を失わずに PDF を HTML に変換する方法;
  • Pythonを使用して範囲ごとにPDFをHTMLファイルに変換する方法;
  • Python で特定の PDF ページを HTML 形式に変換します。
  • 無料のオンライン PDF から HTML コンバーター。

さらに、GroupDocs.Conversion ファイル形式変換 API の詳細については、ドキュメント を使用して学習できます。

質問する

PDF ファイルを HTML 形式に変換する方法に関する質問は、無料サポート フォーラム から行うことができます。

関連項目