PDF は、クロスプラットフォームのサポートを提供する、現在最も一般的に使用されているファイル形式の 1 つです。しかし、PDF ドキュメント内の特定のページにリンクするのは難しく、PDF ファイルはソーシャル ネットワークで簡単に共有されません。 PDF ドキュメントの外観と操作性を HTML 形式で保持し、すばやく操作できます。この記事では、Python で PDF ファイルを HTML に変換する方法を学びます。
この記事では次のトピックについて説明します。
- Python PDF to HTML Converter API – インストール
- REST APIを使用してPythonでオンラインでPDFをHTMLに変換する方法
- Pythonでページ範囲をPDFファイルからHTMLファイルに変換する
- Python で特定のページを PDF から HTML 形式に変換
Python PDF to HTML Converter API – インストール
PDF ファイルを HTML Web ページに変換するには、GroupDocs.Conversion Cloud の Python SDK API を使用します。これは、機能が豊富でプラットフォームに依存しないドキュメントと画像の変換 Python ライブラリです。 サポートされているファイル形式 の画像とドキュメントを、高品質であらゆる形式に迅速に変換できます。
コンソールで次のコマンドを使用して、PDF から HTML への変換 Python ライブラリを Python アプリケーションにインストールして統合できます。
pip install groupdocs_conversion_cloud
上記の手順に従う前に、ダッシュボードからクライアント ID とシークレットを取得してください。 ID とシークレットを取得したら、Python アプリケーションにコードを追加します。
# Python アプリケーションで PDF から HTML に変換するための Python ライブラリをロードします
import groupdocs_conversion_cloud
# 無料登録後、https://dashboard.groupdocs.cloud から client_id と client_secret を取得します。
client_id = "xxxxxxx-xxxx-xxxx-xxxx-xxxxxxxxxxxx"
client_secret = "xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx"
# さまざまな構成を取得する
configuration = groupdocs_conversion_cloud.Configuration(client_id, client_secret)
configuration.api_base_url = "https://api.groupdocs.cloud"
your_storage = "groupdocs-storage-name"
次に、Python の REST API を使用して PDF を HTML 形式に変換する方法を段階的に説明します。
REST APIを使用してPythonでオンラインでPDFをHTMLに変換する方法
以下に示す簡単な手順に従って、PDF ファイルをプログラムで HTML 形式に変換できます。
- まず、ConvertApiのインスタンスを作成します。
- 次に、ConvertSettings を使用して変換設定インスタンスを作成します。
- 次に、ファイルストレージ名を指定します。
- 入力PDFファイルのパスと出力形式を「html」に設定します。
- 次に、PdfLoadOptions のインスタンスを作成します。
- PDF ファイルのパスワードを入力します
- 次に、出力\パスとロード\オプションを設定します。
- その後、ConvertSettings を引数として ConvertDocumentRequest を作成します。
- 最後に、ConvertDocumentRequest で convert\document() を呼び出して、pdf を html に変換します。
次のコード サンプルは、Python で pdf を html 形式に変更する方法を示しています。
# Python で PDF を HTML にオンラインで変換する方法
try:
# APIのインスタンスを作成する
convert_api = groupdocs_conversion_cloud.ConvertApi.from_keys(client_id, client_secret)
# 変換設定を定義する
settings = groupdocs_conversion_cloud.ConvertSettings()
settings.storage_name = your_storage
settings.file_path = "python-testing/sample-pdf-file.pdf"
settings.format = "html"
loadOptions = groupdocs_conversion_cloud.PdfLoadOptions()
loadOptions.password = "password"
settings.load_options = loadOptions
settings.output_path = "python-testing"
# 変換ドキュメントリクエストの作成
request = groupdocs_conversion_cloud.ConvertDocumentRequest(settings)
# .pdf ファイルを HTML Web ページに変換する
result = convert_api.convert_document(request)
print("pdf File converted to html successfully: " + result[0].path)
except groupdocs_conversion_cloud.ApiException as e:
print("Exception when calling convert_document: {0}".format(e.message))
最後に、上記のコード サンプルは HTML ファイルをクラウドに保存します。これは、PDF を HTML ドキュメントに変換する最良の方法です。
Pythonでページ範囲をPDFファイルからHTMLファイルに変換する
以下の手順に従って、PDF ドキュメントのページ範囲を HTML に変換できます。
- まず、ConvertApiのインスタンスを作成します。
- 次に、ConvertSettings を使用して変換設定インスタンスを作成します。
- 次に、クラウド ストレージ名を入力します。
- 入力PDFファイルのパスと出力形式を「html」に設定します。
- 次に、HtmlConvertOptions のインスタンスを作成します。
- from\page および pages\count オプションを設定する
- 次に、出力パスとconvertOptionsを設定します。
- 次に、ConvertSettings を引数として ConvertDocumentRequest を作成します。
- 最後に、ConvertDocumentRequest で convert\document() メソッドを呼び出して、オンラインで PDF を HTML コードに変換します。
次のコード サンプルは、Python を使用して一連のページを PDF ドキュメントから HTML ファイルに変換する方法を示しています。
# Python でページ範囲を PDF から HTML に変換する方法
# APIのインスタンスを作成する
convert_api = groupdocs_conversion_cloud.ConvertApi.from_keys(client_id, client_secret)
# HTML変換設定を準備する
settings = groupdocs_conversion_cloud.ConvertSettings()
settings.storage_name = your_storage
settings.file_path = "python-testing/sample-pdf-file.pdf"
settings.format = "html"
# PDF 変換オプション: 開始ページ番号と変換する総ページ数
convertOptions = groupdocs_conversion_cloud.HtmlConvertOptions()
convertOptions.from_page = 1
convertOptions.pages_count = 1
settings.convert_options = convertOptions
settings.output_path = "python-testing"
# 変換ドキュメントリクエストの作成
request = groupdocs_conversion_cloud.ConvertDocumentRequest(settings)
# PDFのページをHTMLファイルに変換します
result = convert_api.convert_document(request)
print("Converted range of pages from PDF to HTML web page: " + result[0].path)
最後に、上記のコード サンプルは、クラウド上でオンラインで PDF から HTML に変換した後、ドキュメントを保存します。
Python で特定のページを PDF から HTML 形式に変換する
以下の手順に従って、オンラインで画像付きの最高の PDF から HTML へのコンバーターを使用して、PDF ドキュメントの特定のページを HTML に変換できます。
- まず、ConvertApiのインスタンスを作成します。
- 次に、ConvertSettings を使用して変換設定インスタンスを作成します。
- 次に、クラウド ストレージ名を入力します。
- 入力PDFファイルのパスと出力形式を「html」に設定します。
- 次に、HtmlConvertOptions のインスタンスを作成します。
- 配列形式に変換するページ番号を追加します。
- 次に、出力パスとconvertOptionsを設定します。
- 次に、ConvertSettings を引数として ConvertDocumentRequest を作成します。
- 最後に、ConvertDocumentRequest で convert\document() メソッドを呼び出して、オンラインで PDF を HTML コードに変換します。
次のコード サンプルは、Python を使用して PDF ドキュメントの特定のページを HTML ファイルにエクスポートする方法を示しています。
# Python で PDF ファイルの特定のページを HTML Web ページ形式に変換する方法
# APIのインスタンスを作成する
convert_api = groupdocs_conversion_cloud.ConvertApi.from_keys(client_id, client_secret)
# 変換設定を定義する
settings = groupdocs_conversion_cloud.ConvertSettings()
settings.storage_name = your_storage
settings.file_path = "python-testing/sample-pdf-file.pdf"
settings.format = "html"
# PDF 変換オプション: 変換するページ番号
convertOptions = groupdocs_conversion_cloud.HtmlConvertOptions()
convertOptions.pages = [1, 3, 5]
settings.convert_options = convertOptions
settings.output_path = "python-testing"
# 変換ドキュメントリクエストの作成
request = groupdocs_conversion_cloud.ConvertDocumentRequest(settings)
# PDFファイルをHTMLファイルに変換
result = convert_api.convert_document(request)
print("Successfully converted PDF file to HTML document: " + result[0].path)
最後に、上記のコード サンプルは、クラウド上の画像を含む PDF を HTML に変換します。以下で説明するように、オンラインの PDF から HTML コードへのコンバーターがあります。
無料のオンライン PDF から HTML コンバーター
最高の PDF から HTML へのコンバーターは何ですか? Groupdocs.Conversion は、PDF を HTML 形式に変換するための オンラインで無料の最高の PDF から HTML コンバーター を提供します。これは、Groupdocs.Conversion オンライン PDF to HTML API を使用して開発されました。
結論
この記事では、次のことを学びました。
- Python で書式を失わずに PDF を HTML に変換する方法;
- Pythonを使用して範囲ごとにPDFをHTMLファイルに変換する方法;
- Python で特定の PDF ページを HTML 形式に変換します。
- 無料のオンライン PDF から HTML コンバーター。
さらに、GroupDocs.Conversion ファイル形式変換 API の詳細については、ドキュメント を使用して学習できます。
質問する
PDF ファイルを HTML 形式に変換する方法に関する質問は、無料サポート フォーラム から行うことができます。