PDF 是最常用的通用文檔格式之一來呈現文檔。但是很難編輯 PDF 文檔。要輕鬆提取表格或編輯電子表格格式的文本,您需要將 PDF 轉換為可編輯的 Excel 電子表格。因此,您無需浪費時間手動複製文本然後進行編輯。我們的 PDF 到 XLS 或 PDF 到 XLSX 轉換器 API 允許您快速將 PDF 轉換為 Excel 電子表格格式。在本文中,我們將學習如何使用 REST API 在 Python 中將 PDF 轉換為 Excel。
本文應涵蓋以下主題:
- Python PDF to Excel Converter API – 安裝
- 如何使用 REST API 在 Python 中將 PDF 轉換為 XLSX
- 在 Python 中將頁面範圍從 PDF 轉換為 Excel 文件
- 在Python中將PDF的特定頁面轉換為Excel格式
Python PDF to Excel Converter API – 安裝
為了將 PDF 文件轉換為 Excel 格式,我們將使用 GroupDocs.Conversion Cloud 的 Python SDK API。它是一個功能豐富、獨立於平台的文檔和圖像轉換 Python 庫。它提供了將任何支持的文件格式 的圖像和文檔快速轉換為任何高質量格式的功能。
您可以在控制台中使用以下命令將 PDF 到 XLSX 轉換 Python 庫安裝到您的 Python 應用程序中:
pip install groupdocs_conversion_cloud
在執行上述步驟之前,請從儀表板獲取您的客戶端 ID 和密碼。獲得 ID 和密碼後,在 Python 應用程序中添加代碼:
# 用於在 python 應用程序中將 PDF 轉換為 Excel 的 Python 庫
import groupdocs_conversion_cloud
# 免費註冊後,從 https://dashboard.groupdocs.cloud 獲取 client_id 和 client_secret。
client_id = "xxxxxxx-xxxx-xxxx-xxxx-xxxxxxxxxxxx"
client_secret = "xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx"
# 獲取不同的配置
configuration = groupdocs_conversion_cloud.Configuration(client_id, client_secret)
configuration.api_base_url = "https://api.groupdocs.cloud"
your_storage = "local-storage-name"
現在,讓我們演示如何在 Python 中使用 REST API 逐步將 pdf 轉換為 xlsx 格式。
如何使用 REST API 在 Python 中將 PDF 轉換為 XLSX
我們可以按照下面給出的簡單步驟以編程方式將 pdf 文件轉換為 excel 格式:
- 首先,創建 ConvertApi 的實例
- 然後,使用 ConvertSettings 創建轉換設置實例
- 接下來,提供文件存儲名稱
- 設置輸入PDF文件路徑和輸出格式為“xlsx”
- 接下來,創建 PdfLoadOptions 的實例。
- 提供PDF文件密碼
- 然後,設置 output\path 和 load\options
- 之後,使用 ConvertSettings 作為參數創建 ConvertDocumentRequest
- 最後,通過使用 ConvertDocumentRequest 調用 convert\document() 將 pdf 轉換為 excel
以下代碼示例顯示瞭如何在 Python 中將 pdf 格式更改為 excel 格式:
# 如何使用 Python 在線將 PDF 轉換為 Excel
try:
# 創建 API 實例
convert_api = groupdocs_conversion_cloud.ConvertApi.from_keys(client_id, client_secret)
# 定義轉換設置
settings = groupdocs_conversion_cloud.ConvertSettings()
settings.storage_name = your_storage
settings.file_path = "python-testing/sample-pdf-file.pdf"
settings.format = "xlsx"
loadOptions = groupdocs_conversion_cloud.PdfLoadOptions()
loadOptions.password = "password"
settings.load_options = loadOptions
settings.output_path = "python-testing"
# 創建轉換文檔請求
request = groupdocs_conversion_cloud.ConvertDocumentRequest(settings)
# 將 .pdf 文件轉換為 .xlsx 格式
result = convert_api.convert_document(request)
print("pdf File converted to xlsx successfully: " + result[0].path)
except groupdocs_conversion_cloud.ApiException as e:
print("Exception when calling convert_document: {0}".format(e.message))
最後,上面的代碼示例會將 xlsx 文件保存在雲端。這是將 pdf 轉換為 excel 文檔的最佳方式。
在 Python 中將頁面範圍從 PDF 轉換為 Excel 文件
我們可以按照以下步驟將 PDF 文檔的頁面範圍轉換為 excel:
- 首先,創建 ConvertApi 的實例
- 然後,使用 ConvertSettings 創建轉換設置實例
- 接下來,提供您的雲存儲名稱
- 設置輸入PDF文件路徑和輸出格式為“xlsx”
- 接下來,創建 XlsConvertOptions 的實例
- 設置 from\page 和 pages\count 選項
- 然後,設置輸出路徑和convertOptions
- 現在,使用 ConvertSettings 作為參數創建 ConvertDocumentRequest
- 最後通過ConvertDocumentRequest調用convert\document()方法將pdf在線轉換為excel代碼
以下代碼示例顯示瞭如何使用 Python 將一系列頁面從 PDF 文檔轉換為 excel 文件:
# 如何在 Python 中將頁面範圍從 PDF 轉換為 Excel
# 創建 API 實例
convert_api = groupdocs_conversion_cloud.ConvertApi.from_keys(client_id, client_secret)
# 準備 excel 轉換設置
settings = groupdocs_conversion_cloud.ConvertSettings()
settings.file_path = "python-testing/sample-pdf-file.pdf"
settings.format = "xlsx"
# PDF 轉換選項:要轉換的起始頁碼和總頁數
convertOptions = groupdocs_conversion_cloud.XlsConvertOptions()
convertOptions.from_page = 2
convertOptions.pages_count = 3
settings.convert_options = convertOptions
settings.output_path = "python-testing"
# 創建轉換文檔請求
request = groupdocs_conversion_cloud.ConvertDocumentRequest(settings)
# 將 PDF 頁面轉換為 Excel 文件
result = convert_api.convert_document(request)
print("Converted range of pages from PDF to Excel file: " + result[0].path)
最後,上述代碼示例將文檔從pdf在線轉換為excel後保存在雲端。
在 Python 中將 PDF 的特定頁面轉換為 Excel 格式
我們可以按照以下步驟使用帶圖像的在線最佳 pdf 到 xlsx 轉換器將 PDF 文檔的特定頁面轉換為 Excel:
- 首先,創建 ConvertApi 的實例
- 然後,使用 ConvertSettings 創建轉換設置實例
- 接下來,提供您的雲存儲名稱
- 設置輸入PDF文件路徑和輸出格式為“xlsx”
- 接下來,創建 XlsConvertOptions 的實例
- 添加要轉換為數組格式的頁碼
- 然後,設置輸出路徑和convertOptions
- 現在,使用 ConvertSettings 作為參數創建 ConvertDocumentRequest
- 最後通過ConvertDocumentRequest調用convert\document()方法將pdf在線轉換為excel代碼
以下代碼示例顯示瞭如何使用 Python 將 PDF 文檔的某些頁面導出到 Excel 文件:
# 如何在 Python 中將 PDF 文件的特定頁面轉換為 Excel 格式
# 創建 API 實例
convert_api = groupdocs_conversion_cloud.ConvertApi.from_keys(client_id, client_secret)
# 定義轉換設置
settings = groupdocs_conversion_cloud.ConvertSettings()
settings.file_path = "python-testing/sample-pdf-file.pdf"
settings.format = "xlsx"
# PDF 轉換選項:要轉換的頁碼
convertOptions = groupdocs_conversion_cloud.XlsConvertOptions()
convertOptions.pages = [1, 3, 5]
settings.convert_options = convertOptions
settings.output_path = "python-testing"
# 創建轉換文檔請求
request = groupdocs_conversion_cloud.ConvertDocumentRequest(settings)
# 將 PDF 文件轉換為 Excel 文件
result = convert_api.convert_document(request)
print("Successfully converted PDF file to XLSX document: " + result[0].path)
最後,上面的代碼示例將 pdf 轉換為帶有云端圖像的 xlsx。有一個在線 pdf 到 xlsx 代碼轉換器,如下所述。
免費在線 PDF 到 Excel 轉換器
什麼是最好的 PDF 到 Excel 轉換器? Groupdocs.Conversion 為您免費提供最好的 pdf 到 xlsx 在線轉換器,將 PDF 轉換為 Excel 格式。它是使用 Groupdocs.Conversion online pdf to xlsx API 開發的。
結論
在本文中,您已了解:
- 如何在不丟失 Python 格式的情況下將 pdf 轉換為 xls/xlsx;
- 如何使用 Python 按範圍將 pdf 轉換為 excel 文件;
- 在 Python 中將特定的 PDF 頁面轉換為 XLSX 格式;
此外,您可以使用 文檔 了解有關 GroupDocs.Conversion 文件格式轉換 API 的更多信息。
問一個問題
您可以通過我們的 免費支持論壇 詢問有關如何將 pdf 文件轉換為 xlsx 格式的問題