PDF は、文書を表示するために最も一般的に使用される多用途文書形式の 1 つです。しかし、PDF文書を編集するのは難しいです。表を簡単に抽出したり、スプレッドシート形式でテキストを編集したりするには、PDF を編集可能な Excel スプレッドシートに変換する必要があります。したがって、テキストを手動でコピーして編集するために時間を無駄にする必要はありません。 PDF から XLS または PDF から XLSX コンバーター API を使用すると、PDF を Excel スプレッドシート形式にすばやく変換できます。この記事では、REST API を使用して Python で PDF を Excel に変換する方法を学びます。
この記事では次のトピックについて説明します。
- Python PDF to Excel Converter API – インストール
- REST APIを使用してPythonでPDFをXLSXに変換する方法
- Python でページ範囲を PDF から Excel ファイルに変換する
- Python で PDF の特定のページを Excel 形式に変換
Python PDF to Excel Converter API – インストール
PDF ファイルを Excel 形式に変換するには、GroupDocs.Conversion Cloud の Python SDK API を使用します。これは、機能が豊富でプラットフォームに依存しないドキュメントと画像の変換 Python ライブラリです。 サポートされているファイル形式 の画像とドキュメントを、高品質であらゆる形式に迅速に変換できます。
コンソールで次のコマンドを使用して、PDF から XLSX への変換 Python ライブラリを Python アプリケーションにインストールできます。
pip install groupdocs_conversion_cloud
上記の手順に従う前に、ダッシュボードからクライアント ID とシークレットを取得してください。 ID とシークレットを取得したら、Python アプリケーションにコードを追加します。
# Python アプリケーションで PDF を Excel に変換するための Python ライブラリ
import groupdocs_conversion_cloud
# 無料登録後、https://dashboard.groupdocs.cloud から client_id と client_secret を取得します。
client_id = "xxxxxxx-xxxx-xxxx-xxxx-xxxxxxxxxxxx"
client_secret = "xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx"
# さまざまな構成を取得する
configuration = groupdocs_conversion_cloud.Configuration(client_id, client_secret)
configuration.api_base_url = "https://api.groupdocs.cloud"
your_storage = "local-storage-name"
ここで、Python の REST API を使用して pdf を xlsx 形式に変換する方法を段階的に説明します。
REST APIを使用してPythonでPDFをXLSXに変換する方法
以下に示す簡単な手順に従って、PDF ファイルをプログラムで Excel 形式に変換できます。
- まず、ConvertApiのインスタンスを作成します。
- 次に、ConvertSettings を使用して変換設定インスタンスを作成します。
- 次に、ファイルストレージ名を指定します。
- 入力 PDF ファイルのパスと出力形式を「xlsx」に設定します
- 次に、PdfLoadOptions のインスタンスを作成します。
- PDF ファイルのパスワードを入力します
- 次に、出力\パスとロード\オプションを設定します。
- その後、ConvertSettings を引数として ConvertDocumentRequest を作成します。
- 最後に、ConvertDocumentRequest で convert\document() を呼び出して PDF を Excel に変換します。
次のコード サンプルは、Python で PDF を Excel 形式に変更する方法を示しています。
# Python で PDF を Excel にオンラインで変換する方法
try:
# APIのインスタンスを作成する
convert_api = groupdocs_conversion_cloud.ConvertApi.from_keys(client_id, client_secret)
# 変換設定を定義する
settings = groupdocs_conversion_cloud.ConvertSettings()
settings.storage_name = your_storage
settings.file_path = "python-testing/sample-pdf-file.pdf"
settings.format = "xlsx"
loadOptions = groupdocs_conversion_cloud.PdfLoadOptions()
loadOptions.password = "password"
settings.load_options = loadOptions
settings.output_path = "python-testing"
# 変換ドキュメントリクエストの作成
request = groupdocs_conversion_cloud.ConvertDocumentRequest(settings)
# .pdf ファイルを .xlsx 形式に変換する
result = convert_api.convert_document(request)
print("pdf File converted to xlsx successfully: " + result[0].path)
except groupdocs_conversion_cloud.ApiException as e:
print("Exception when calling convert_document: {0}".format(e.message))
最後に、上記のコード サンプルは、xlsx ファイルをクラウドに保存します。これはPDFをExcelドキュメントに変換する最良の方法です。
Pythonでページ範囲をPDFからExcelファイルに変換する
以下の手順に従って、PDF ドキュメントの範囲のページを Excel に変換できます。
- まず、ConvertApiのインスタンスを作成します。
- 次に、ConvertSettings を使用して変換設定インスタンスを作成します。
- 次に、クラウド ストレージ名を入力します。
- 入力 PDF ファイルのパスと出力形式を「xlsx」に設定します
- 次に、XlsConvertOptions のインスタンスを作成します。
- from\page および pages\count オプションを設定する
- 次に、出力パスとconvertOptionsを設定します。
- 次に、ConvertSettings を引数として ConvertDocumentRequest を作成します。
- 最後に、ConvertDocumentRequest で convert\document() メソッドを呼び出して、オンラインで PDF を Excel コードに変換します。
次のコード サンプルは、Python を使用して PDF ドキュメントから Excel ファイルに一連のページを変換する方法を示しています。
# Python でページ範囲を PDF から Excel に変換する方法
# APIのインスタンスを作成する
convert_api = groupdocs_conversion_cloud.ConvertApi.from_keys(client_id, client_secret)
# Excel変換設定を準備する
settings = groupdocs_conversion_cloud.ConvertSettings()
settings.file_path = "python-testing/sample-pdf-file.pdf"
settings.format = "xlsx"
# PDF 変換オプション: 開始ページ番号と変換する総ページ数
convertOptions = groupdocs_conversion_cloud.XlsConvertOptions()
convertOptions.from_page = 2
convertOptions.pages_count = 3
settings.convert_options = convertOptions
settings.output_path = "python-testing"
# ドキュメント変換リクエストの作成
request = groupdocs_conversion_cloud.ConvertDocumentRequest(settings)
# PDF のページを Excel ファイルに変換する
result = convert_api.convert_document(request)
print("Converted range of pages from PDF to Excel file: " + result[0].path)
最後に、上記のコード サンプルは、クラウド上でオンラインで PDF から Excel に変換した後、ドキュメントを保存します。
Python で PDF の特定のページを Excel 形式に変換する
以下の手順に従って、画像付きのオンラインで最高の pdf から xlsx へのコンバーターを使用して、PDF ドキュメントの特定のページを Excel に変換できます。
- まず、ConvertApiのインスタンスを作成します。
- 次に、ConvertSettings を使用して変換設定インスタンスを作成します。
- 次に、クラウド ストレージ名を入力します。
- 入力 PDF ファイルのパスと出力形式を「xlsx」に設定します
- 次に、XlsConvertOptions のインスタンスを作成します。
- 配列形式に変換するページ番号を追加します。
- 次に、出力パスとconvertOptionsを設定します。
- 次に、ConvertSettings を引数として ConvertDocumentRequest を作成します。
- 最後に、ConvertDocumentRequest で convert\document() メソッドを呼び出して、オンラインで PDF を Excel コードに変換します。
次のコード サンプルは、Python を使用して PDF ドキュメントの特定のページを Excel ファイルにエクスポートする方法を示しています。
# Python で PDF ファイルの特定のページを Excel 形式に変換する方法
# APIのインスタンスを作成する
convert_api = groupdocs_conversion_cloud.ConvertApi.from_keys(client_id, client_secret)
# 変換設定を定義する
settings = groupdocs_conversion_cloud.ConvertSettings()
settings.file_path = "python-testing/sample-pdf-file.pdf"
settings.format = "xlsx"
# PDF 変換オプション: 変換するページ番号
convertOptions = groupdocs_conversion_cloud.XlsConvertOptions()
convertOptions.pages = [1, 3, 5]
settings.convert_options = convertOptions
settings.output_path = "python-testing"
# ドキュメント変換リクエストの作成
request = groupdocs_conversion_cloud.ConvertDocumentRequest(settings)
# PDFファイルをExcelファイルに変換
result = convert_api.convert_document(request)
print("Successfully converted PDF file to XLSX document: " + result[0].path)
最後に、上記のコード サンプルは、クラウド上の画像を含む pdf を xlsx に変換します。以下で説明するように、オンラインの PDF から XLSX コードへのコンバーターがあります。
無料のオンラインPDFからExcelへのコンバーター
最高の PDF から Excel へのコンバーターは何ですか? Groupdocs.Conversion は、PDF を Excel 形式に変換するための最高の PDF から xlsx へのコンバーターをオンラインで無料で提供します。これは、Groupdocs.Conversion オンライン pdf to xlsx API を使用して開発されました。
結論
この記事では、次のことを学びました。
- Python で書式設定を失わずに PDF を xls/xlsx に変換する方法;
- Pythonを使用して範囲ごとにPDFをExcelファイルに変換する方法;
- Python で特定の PDF ページを XLSX 形式に変換します。
さらに、ドキュメント を使用して、GroupDocs.Conversion ファイル形式変換 API の詳細を学ぶことができます。
質問する
PDF ファイルを xlsx 形式に変換する方法についての質問は、無料サポート フォーラム から行うことができます。