如何使用 REST API 在 Python 中將 PDF 轉換為 Excel

使用 REST API 在 Python 中將 PDF 轉換為 Excel

PDF 是最常用的通用文檔格式之一來呈現文檔。但是很難編輯 PDF 文檔。要輕鬆提取表格或編輯電子表格格式的文本,您需要將 PDF 轉換為可編輯的 Excel 電子表格。因此,您無需浪費時間手動複製文本然後進行編輯。我們的 PDF 到 XLS 或 PDF 到 XLSX 轉換器 API 允許您快速將 PDF 轉換為 Excel 電子表格格式。在本文中,我們將學習如何使用 REST API 在 Python 中將 PDF 轉換為 Excel。

本文應涵蓋以下主題:

Python PDF to Excel Converter API – 安裝

為了將 PDF 文件轉換為 Excel 格式,我們將使用 GroupDocs.Conversion Cloud 的 Python SDK API。它是一個功能豐富、獨立於平台的文檔和圖像轉換 Python 庫。它提供了將任何支持的文件格式 的圖像和文檔快速轉換為任何高質量格式的功能。

您可以在控制台中使用以下命令將 PDF 到 XLSX 轉換 Python 庫安裝到您的 Python 應用程序中:

pip install groupdocs_conversion_cloud

在執行上述步驟之前,請從儀表板獲取您的客戶端 ID 和密碼。獲得 ID 和密碼後,在 Python 應用程序中添加代碼:

# 用於在 python 應用程序中將 PDF 轉換為 Excel 的 Python 庫
import groupdocs_conversion_cloud

# 免費註冊後,從 https://dashboard.groupdocs.cloud 獲取 client_id 和 client_secret。
client_id = "xxxxxxx-xxxx-xxxx-xxxx-xxxxxxxxxxxx"
client_secret = "xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx"

# 獲取不同的配置
configuration = groupdocs_conversion_cloud.Configuration(client_id, client_secret)
configuration.api_base_url = "https://api.groupdocs.cloud"
your_storage = "local-storage-name"

現在,讓我們演示如何在 Python 中使用 REST API 逐步將 pdf 轉換為 xlsx 格式。

如何使用 REST API 在 Python 中將 PDF 轉換為 XLSX

我們可以按照下面給出的簡單步驟以編程方式將 pdf 文件轉換為 excel 格式:

  • 首先,創建 ConvertApi 的實例
  • 然後,使用 ConvertSettings 創建轉換設置實例
  • 接下來,提供文件存儲名稱
  • 設置輸入PDF文件路徑和輸出格式為“xlsx”
  • 接下來,創建 PdfLoadOptions 的實例。
  • 提供PDF文件密碼
  • 然後,設置 output\path 和 load\options
  • 之後,使用 ConvertSettings 作為參數創建 ConvertDocumentRequest
  • 最後,通過使用 ConvertDocumentRequest 調用 convert\document() 將 pdf 轉換為 excel

以下代碼示例顯示瞭如何在 Python 中將 pdf 格式更改為 excel 格式:

# 如何使用 Python 在線將 PDF 轉換為 Excel
try:
  # 創建 API 實例
  convert_api = groupdocs_conversion_cloud.ConvertApi.from_keys(client_id, client_secret)

  # 定義轉換設置
  settings = groupdocs_conversion_cloud.ConvertSettings()
  settings.storage_name = your_storage
  settings.file_path = "python-testing/sample-pdf-file.pdf"
  settings.format = "xlsx"

  loadOptions = groupdocs_conversion_cloud.PdfLoadOptions()
  loadOptions.password = "password"

  settings.load_options = loadOptions
  settings.output_path = "python-testing"

  # 創建轉換文檔請求
  request = groupdocs_conversion_cloud.ConvertDocumentRequest(settings)

  # 將 .pdf 文件轉換為 .xlsx 格式
  result = convert_api.convert_document(request)
  print("pdf File converted to xlsx successfully: " + result[0].path)

except groupdocs_conversion_cloud.ApiException as e:
  print("Exception when calling convert_document: {0}".format(e.message))

最後,上面的代碼示例會將 xlsx 文件保存在雲端。這是將 pdf 轉換為 excel 文檔的最佳方式。

如何使用 REST API 在 Python 中將 PDF 轉換為 XLSX

如何使用 REST API 在 Python 中將 PDF 轉換為 XLSX

在 Python 中將頁面範圍從 PDF 轉換為 Excel 文件

我們可以按照以下步驟將 PDF 文檔的頁面範圍轉換為 excel:

  • 首先,創建 ConvertApi 的實例
  • 然後,使用 ConvertSettings 創建轉換設置實例
  • 接下來,提供您的雲存儲名稱
  • 設置輸入PDF文件路徑和輸出格式為“xlsx”
  • 接下來,創建 XlsConvertOptions 的實例
  • 設置 from\page 和 pages\count 選項
  • 然後,設置輸出路徑和convertOptions
  • 現在,使用 ConvertSettings 作為參數創建 ConvertDocumentRequest
  • 最後通過ConvertDocumentRequest調用convert\document()方法將pdf在線轉換為excel代碼

以下代碼示例顯示瞭如何使用 Python 將一系列頁面從 PDF 文檔轉換為 excel 文件:

# 如何在 Python 中將頁面範圍從 PDF 轉換為 Excel
# 創建 API 實例
convert_api = groupdocs_conversion_cloud.ConvertApi.from_keys(client_id, client_secret)

# 準備 excel 轉換設置
settings = groupdocs_conversion_cloud.ConvertSettings()
settings.file_path = "python-testing/sample-pdf-file.pdf"
settings.format = "xlsx"

# PDF 轉換選項:要轉換的起始頁碼和總頁數
convertOptions = groupdocs_conversion_cloud.XlsConvertOptions()
convertOptions.from_page = 2 
convertOptions.pages_count = 3

settings.convert_options = convertOptions
settings.output_path = "python-testing"

# 創建轉換文檔請求
request = groupdocs_conversion_cloud.ConvertDocumentRequest(settings)

# 將 PDF 頁面轉換為 Excel 文件
result = convert_api.convert_document(request)
print("Converted range of pages from PDF to Excel file: " + result[0].path)

最後,上述代碼示例將文檔從pdf在線轉換為excel後保存在雲端。

在 Python 中將 PDF 的特定頁面轉換為 Excel 格式

我們可以按照以下步驟使用帶圖像的在線最佳 pdf 到 xlsx 轉換器將 PDF 文檔的特定頁面轉換為 Excel:

  • 首先,創建 ConvertApi 的實例
  • 然後,使用 ConvertSettings 創建轉換設置實例
  • 接下來,提供您的雲存儲名稱
  • 設置輸入PDF文件路徑和輸出格式為“xlsx”
  • 接下來,創建 XlsConvertOptions 的實例
  • 添加要轉換為數組格式的頁碼
  • 然後,設置輸出路徑和convertOptions
  • 現在,使用 ConvertSettings 作為參數創建 ConvertDocumentRequest
  • 最後通過ConvertDocumentRequest調用convert\document()方法將pdf在線轉換為excel代碼

以下代碼示例顯示瞭如何使用 Python 將 PDF 文檔的某些頁面導出到 Excel 文件:

# 如何在 Python 中將 PDF 文件的特定頁面轉換為 Excel 格式
# 創建 API 實例
convert_api = groupdocs_conversion_cloud.ConvertApi.from_keys(client_id, client_secret)

# 定義轉換設置
settings = groupdocs_conversion_cloud.ConvertSettings()
settings.file_path = "python-testing/sample-pdf-file.pdf"
settings.format = "xlsx"

# PDF 轉換選項:要轉換的頁碼
convertOptions = groupdocs_conversion_cloud.XlsConvertOptions()
convertOptions.pages = [1, 3, 5]

settings.convert_options = convertOptions
settings.output_path = "python-testing"

# 創建轉換文檔請求
request = groupdocs_conversion_cloud.ConvertDocumentRequest(settings)

# 將 PDF 文件轉換為 Excel 文件
result = convert_api.convert_document(request)
print("Successfully converted PDF file to XLSX document: " + result[0].path)

最後,上面的代碼示例將 pdf 轉換為帶有云端圖像的 xlsx。有一個在線 pdf 到 xlsx 代碼轉換器,如下所述。

免費在線 PDF 到 Excel 轉換器

什麼是最好的 PDF 到 Excel 轉換器? Groupdocs.Conversion 為您免費提供最好的 pdf 到 xlsx 在線轉換器,將 PDF 轉換為 Excel 格式。它是使用 Groupdocs.Conversion online pdf to xlsx API 開發的。

結論

在本文中,您已了解:

  • 如何在不丟失 Python 格式的情況下將 pdf 轉換為 xls/xlsx;
  • 如何使用 Python 按範圍將 pdf 轉換為 excel 文件;
  • 在 Python 中將特定的 PDF 頁面轉換為 XLSX 格式;

此外,您可以使用 文檔 了解有關 GroupDocs.Conversion 文件格式轉換 API 的更多信息。

問一個問題

您可以通過我們的 免費支持論壇 詢問有關如何將 pdf 文件轉換為 xlsx 格式的問題

也可以看看