REST APIを使用してPythonでPDFをExcelに変換する方法

REST APIを使用してPythonでPDFをExcelに変換する

PDF は、文書を表示するために最も一般的に使用される多用途文書形式の 1 つです。しかし、PDF文書を編集するのは難しいです。表を簡単に抽出したり、スプレッドシート形式でテキストを編集したりするには、PDF を編集可能な Excel スプレッドシートに変換する必要があります。したがって、テキストを手動でコピーして編集するために時間を無駄にする必要はありません。 PDF から XLS または PDF から XLSX コンバーター API を使用すると、PDF を Excel スプレッドシート形式にすばやく変換できます。この記事では、REST API を使用して Python で PDF を Excel に変換する方法を学びます。

この記事では次のトピックについて説明します。

Python PDF to Excel Converter API – インストール

PDF ファイルを Excel 形式に変換するには、GroupDocs.Conversion Cloud の Python SDK API を使用します。これは、機能が豊富でプラットフォームに依存しないドキュメントと画像の変換 Python ライブラリです。 サポートされているファイル形式 の画像とドキュメントを、高品質であらゆる形式に迅速に変換できます。

コンソールで次のコマンドを使用して、PDF から XLSX への変換 Python ライブラリを Python アプリケーションにインストールできます。

pip install groupdocs_conversion_cloud

上記の手順に従う前に、ダッシュボードからクライアント ID とシークレットを取得してください。 ID とシークレットを取得したら、Python アプリケーションにコードを追加します。

# Python アプリケーションで PDF を Excel に変換するための Python ライブラリ
import groupdocs_conversion_cloud

# 無料登録後、https://dashboard.groupdocs.cloud から client_id と client_secret を取得します。
client_id = "xxxxxxx-xxxx-xxxx-xxxx-xxxxxxxxxxxx"
client_secret = "xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx"

# さまざまな構成を取得する
configuration = groupdocs_conversion_cloud.Configuration(client_id, client_secret)
configuration.api_base_url = "https://api.groupdocs.cloud"
your_storage = "local-storage-name"

ここで、Python の REST API を使用して pdf を xlsx 形式に変換する方法を段階的に説明します。

REST APIを使用してPythonでPDFをXLSXに変換する方法

以下に示す簡単な手順に従って、PDF ファイルをプログラムで Excel 形式に変換できます。

  • まず、ConvertApiのインスタンスを作成します。
  • 次に、ConvertSettings を使用して変換設定インスタンスを作成します。
  • 次に、ファイルストレージ名を指定します。
  • 入力 PDF ファイルのパスと出力形式を「xlsx」に設定します
  • 次に、PdfLoadOptions のインスタンスを作成します。
  • PDF ファイルのパスワードを入力します
  • 次に、出力\パスとロード\オプションを設定します。
  • その後、ConvertSettings を引数として ConvertDocumentRequest を作成します。
  • 最後に、ConvertDocumentRequest で convert\document() を呼び出して PDF を Excel に変換します。

次のコード サンプルは、Python で PDF を Excel 形式に変更する方法を示しています。

# Python で PDF を Excel にオンラインで変換する方法
try:
  # APIのインスタンスを作成する
  convert_api = groupdocs_conversion_cloud.ConvertApi.from_keys(client_id, client_secret)

  # 変換設定を定義する
  settings = groupdocs_conversion_cloud.ConvertSettings()
  settings.storage_name = your_storage
  settings.file_path = "python-testing/sample-pdf-file.pdf"
  settings.format = "xlsx"

  loadOptions = groupdocs_conversion_cloud.PdfLoadOptions()
  loadOptions.password = "password"

  settings.load_options = loadOptions
  settings.output_path = "python-testing"

  # 変換ドキュメントリクエストの作成
  request = groupdocs_conversion_cloud.ConvertDocumentRequest(settings)

  # .pdf ファイルを .xlsx 形式に変換する
  result = convert_api.convert_document(request)
  print("pdf File converted to xlsx successfully: " + result[0].path)

except groupdocs_conversion_cloud.ApiException as e:
  print("Exception when calling convert_document: {0}".format(e.message))

最後に、上記のコード サンプルは、xlsx ファイルをクラウドに保存します。これはPDFをExcelドキュメントに変換する最良の方法です。

REST APIを使用してPythonでPDFをXLSXに変換する方法

REST APIを使用してPythonでPDFをXLSXに変換する方法

Pythonでページ範囲をPDFからExcelファイルに変換する

以下の手順に従って、PDF ドキュメントの範囲のページを Excel に変換できます。

  • まず、ConvertApiのインスタンスを作成します。
  • 次に、ConvertSettings を使用して変換設定インスタンスを作成します。
  • 次に、クラウド ストレージ名を入力します。
  • 入力 PDF ファイルのパスと出力形式を「xlsx」に設定します
  • 次に、XlsConvertOptions のインスタンスを作成します。
  • from\page および pages\count オプションを設定する
  • 次に、出力パスとconvertOptionsを設定します。
  • 次に、ConvertSettings を引数として ConvertDocumentRequest を作成します。
  • 最後に、ConvertDocumentRequest で convert\document() メソッドを呼び出して、オンラインで PDF を Excel コードに変換します。

次のコード サンプルは、Python を使用して PDF ドキュメントから Excel ファイルに一連のページを変換する方法を示しています。

# Python でページ範囲を PDF から Excel に変換する方法
# APIのインスタンスを作成する
convert_api = groupdocs_conversion_cloud.ConvertApi.from_keys(client_id, client_secret)

# Excel変換設定を準備する
settings = groupdocs_conversion_cloud.ConvertSettings()
settings.file_path = "python-testing/sample-pdf-file.pdf"
settings.format = "xlsx"

# PDF 変換オプション: 開始ページ番号と変換する総ページ数
convertOptions = groupdocs_conversion_cloud.XlsConvertOptions()
convertOptions.from_page = 2 
convertOptions.pages_count = 3

settings.convert_options = convertOptions
settings.output_path = "python-testing"

# ドキュメント変換リクエストの作成
request = groupdocs_conversion_cloud.ConvertDocumentRequest(settings)

# PDF のページを Excel ファイルに変換する
result = convert_api.convert_document(request)
print("Converted range of pages from PDF to Excel file: " + result[0].path)

最後に、上記のコード サンプルは、クラウド上でオンラインで PDF から Excel に変換した後、ドキュメントを保存します。

Python で PDF の特定のページを Excel 形式に変換する

以下の手順に従って、画像付きのオンラインで最高の pdf から xlsx へのコンバーターを使用して、PDF ドキュメントの特定のページを Excel に変換できます。

  • まず、ConvertApiのインスタンスを作成します。
  • 次に、ConvertSettings を使用して変換設定インスタンスを作成します。
  • 次に、クラウド ストレージ名を入力します。
  • 入力 PDF ファイルのパスと出力形式を「xlsx」に設定します
  • 次に、XlsConvertOptions のインスタンスを作成します。
  • 配列形式に変換するページ番号を追加します。
  • 次に、出力パスとconvertOptionsを設定します。
  • 次に、ConvertSettings を引数として ConvertDocumentRequest を作成します。
  • 最後に、ConvertDocumentRequest で convert\document() メソッドを呼び出して、オンラインで PDF を Excel コードに変換します。

次のコード サンプルは、Python を使用して PDF ドキュメントの特定のページを Excel ファイルにエクスポートする方法を示しています。

# Python で PDF ファイルの特定のページを Excel 形式に変換する方法
# APIのインスタンスを作成する
convert_api = groupdocs_conversion_cloud.ConvertApi.from_keys(client_id, client_secret)

# 変換設定を定義する
settings = groupdocs_conversion_cloud.ConvertSettings()
settings.file_path = "python-testing/sample-pdf-file.pdf"
settings.format = "xlsx"

# PDF 変換オプション: 変換するページ番号
convertOptions = groupdocs_conversion_cloud.XlsConvertOptions()
convertOptions.pages = [1, 3, 5]

settings.convert_options = convertOptions
settings.output_path = "python-testing"

# ドキュメント変換リクエストの作成
request = groupdocs_conversion_cloud.ConvertDocumentRequest(settings)

# PDFファイルをExcelファイルに変換
result = convert_api.convert_document(request)
print("Successfully converted PDF file to XLSX document: " + result[0].path)

最後に、上記のコード サンプルは、クラウド上の画像を含む pdf を xlsx に変換します。以下で説明するように、オンラインの PDF から XLSX コードへのコンバーターがあります。

無料のオンラインPDFからExcelへのコンバーター

最高の PDF から Excel へのコンバーターは何ですか? Groupdocs.Conversion は、PDF を Excel 形式に変換するための最高の PDF から xlsx へのコンバーターをオンラインで無料で提供します。これは、Groupdocs.Conversion オンライン pdf to xlsx API を使用して開発されました。

結論

この記事では、次のことを学びました。

  • Python で書式設定を失わずに PDF を xls/xlsx に変換する方法;
  • Pythonを使用して範囲ごとにPDFをExcelファイルに変換する方法;
  • Python で特定の PDF ページを XLSX 形式に変換します。

さらに、ドキュメント を使用して、GroupDocs.Conversion ファイル形式変換 API の詳細を学ぶことができます。

質問する

PDF ファイルを xlsx 形式に変換する方法についての質問は、無料サポート フォーラム から行うことができます。

関連項目