如何使用 REST API 在 Python 中将 PDF 转换为 Excel

使用 REST API 在 Python 中将 PDF 转换为 Excel

PDF 是最常用的通用文档格式之一来呈现文档。但是很难编辑 PDF 文档。要轻松提取表格或编辑电子表格格式的文本,您需要将 PDF 转换为可编辑的 Excel 电子表格。因此,您无需浪费时间手动复制文本然后进行编辑。我们的 PDF 到 XLS 或 PDF 到 XLSX 转换器 API 允许您快速将 PDF 转换为 Excel 电子表格格式。在本文中,我们将学习如何使用 REST API 在 Python 中将 PDF 转换为 Excel。

本文应涵盖以下主题:

Python PDF to Excel Converter API – 安装

为了将 PDF 文件转换为 Excel 格式,我们将使用 GroupDocs.Conversion Cloud 的 Python SDK API。它是一个功能丰富、独立于平台的文档和图像转换 Python 库。它提供了将任何支持的文件格式 的图像和文档快速转换为任何高质量格式的功能。

您可以在控制台中使用以下命令将 PDF 到 XLSX 转换 Python 库安装到您的 Python 应用程序中:

pip install groupdocs_conversion_cloud

在执行上述步骤之前,请从仪表板获取您的客户端 ID 和密码。获得 ID 和密码后,在 Python 应用程序中添加代码:

# 用于在 python 应用程序中将 PDF 转换为 Excel 的 Python 库
import groupdocs_conversion_cloud

# 免费注册后,从 https://dashboard.groupdocs.cloud 获取 client_id 和 client_secret。
client_id = "xxxxxxx-xxxx-xxxx-xxxx-xxxxxxxxxxxx"
client_secret = "xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx"

# 获取不同的配置
configuration = groupdocs_conversion_cloud.Configuration(client_id, client_secret)
configuration.api_base_url = "https://api.groupdocs.cloud"
your_storage = "local-storage-name"

现在,让我们演示如何在 Python 中使用 REST API 逐步将 pdf 转换为 xlsx 格式。

如何使用 REST API 在 Python 中将 PDF 转换为 XLSX

我们可以按照下面给出的简单步骤以编程方式将 pdf 文件转换为 excel 格式:

  • 首先,创建 ConvertApi 的实例
  • 然后,使用 ConvertSettings 创建转换设置实例
  • 接下来,提供文件存储名称
  • 设置输入PDF文件路径和输出格式为“xlsx”
  • 接下来,创建 PdfLoadOptions 的实例。
  • 提供PDF文件密码
  • 然后,设置 output\path 和 load\options
  • 之后,使用 ConvertSettings 作为参数创建 ConvertDocumentRequest
  • 最后,通过使用 ConvertDocumentRequest 调用 convert\document() 将 pdf 转换为 excel

以下代码示例显示了如何在 Python 中将 pdf 格式更改为 excel 格式:

# 如何使用 Python 在线将 PDF 转换为 Excel
try:
  # 创建 API 实例
  convert_api = groupdocs_conversion_cloud.ConvertApi.from_keys(client_id, client_secret)

  # 定义转换设置
  settings = groupdocs_conversion_cloud.ConvertSettings()
  settings.storage_name = your_storage
  settings.file_path = "python-testing/sample-pdf-file.pdf"
  settings.format = "xlsx"

  loadOptions = groupdocs_conversion_cloud.PdfLoadOptions()
  loadOptions.password = "password"

  settings.load_options = loadOptions
  settings.output_path = "python-testing"

  # 创建转换文档请求
  request = groupdocs_conversion_cloud.ConvertDocumentRequest(settings)

  # 将 .pdf 文件转换为 .xlsx 格式
  result = convert_api.convert_document(request)
  print("pdf File converted to xlsx successfully: " + result[0].path)

except groupdocs_conversion_cloud.ApiException as e:
  print("Exception when calling convert_document: {0}".format(e.message))

最后,上面的代码示例会将 xlsx 文件保存在云端。这是将 pdf 转换为 excel 文档的最佳方式。

如何使用 REST API 在 Python 中将 PDF 转换为 XLSX

如何使用 REST API 在 Python 中将 PDF 转换为 XLSX

在 Python 中将页面范围从 PDF 转换为 Excel 文件

我们可以按照以下步骤将 PDF 文档的页面范围转换为 excel:

  • 首先,创建 ConvertApi 的实例
  • 然后,使用 ConvertSettings 创建转换设置实例
  • 接下来,提供您的云存储名称
  • 设置输入PDF文件路径和输出格式为“xlsx”
  • 接下来,创建 XlsConvertOptions 的实例
  • 设置 from\page 和 pages\count 选项
  • 然后,设置输出路径和convertOptions
  • 现在,使用 ConvertSettings 作为参数创建 ConvertDocumentRequest
  • 最后通过ConvertDocumentRequest调用convert\document()方法将pdf在线转换为excel代码

以下代码示例显示了如何使用 Python 将一系列页面从 PDF 文档转换为 excel 文件:

# 如何在 Python 中将页面范围从 PDF 转换为 Excel
# 创建 API 实例
convert_api = groupdocs_conversion_cloud.ConvertApi.from_keys(client_id, client_secret)

# 准备 excel 转换设置
settings = groupdocs_conversion_cloud.ConvertSettings()
settings.file_path = "python-testing/sample-pdf-file.pdf"
settings.format = "xlsx"

# PDF 转换选项:要转换的起始页码和总页数
convertOptions = groupdocs_conversion_cloud.XlsConvertOptions()
convertOptions.from_page = 2 
convertOptions.pages_count = 3

settings.convert_options = convertOptions
settings.output_path = "python-testing"

# 创建转换文档请求
request = groupdocs_conversion_cloud.ConvertDocumentRequest(settings)

# 将 PDF 页面转换为 Excel 文件
result = convert_api.convert_document(request)
print("Converted range of pages from PDF to Excel file: " + result[0].path)

最后,上述代码示例将文档从pdf在线转换为excel后保存在云端。

在 Python 中将 PDF 的特定页面转换为 Excel 格式

我们可以按照以下步骤使用带图像的在线最佳 pdf 到 xlsx 转换器将 PDF 文档的特定页面转换为 Excel:

  • 首先,创建 ConvertApi 的实例
  • 然后,使用 ConvertSettings 创建转换设置实例
  • 接下来,提供您的云存储名称
  • 设置输入PDF文件路径和输出格式为“xlsx”
  • 接下来,创建 XlsConvertOptions 的实例
  • 添加要转换为数组格式的页码
  • 然后,设置输出路径和convertOptions
  • 现在,使用 ConvertSettings 作为参数创建 ConvertDocumentRequest
  • 最后通过ConvertDocumentRequest调用convert\document()方法将pdf在线转换为excel代码

以下代码示例显示了如何使用 Python 将 PDF 文档的某些页面导出到 Excel 文件:

# 如何在 Python 中将 PDF 文件的特定页面转换为 Excel 格式
# 创建 API 实例
convert_api = groupdocs_conversion_cloud.ConvertApi.from_keys(client_id, client_secret)

# 定义转换设置
settings = groupdocs_conversion_cloud.ConvertSettings()
settings.file_path = "python-testing/sample-pdf-file.pdf"
settings.format = "xlsx"

# PDF 转换选项:要转换的页码
convertOptions = groupdocs_conversion_cloud.XlsConvertOptions()
convertOptions.pages = [1, 3, 5]

settings.convert_options = convertOptions
settings.output_path = "python-testing"

# 创建转换文档请求
request = groupdocs_conversion_cloud.ConvertDocumentRequest(settings)

# 将 PDF 文件转换为 Excel 文件
result = convert_api.convert_document(request)
print("Successfully converted PDF file to XLSX document: " + result[0].path)

最后,上面的代码示例将 pdf 转换为带有云端图像的 xlsx。有一个在线 pdf 到 xlsx 代码转换器,如下所述。

免费在线 PDF 到 Excel 转换器

什么是最好的 PDF 到 Excel 转换器? Groupdocs.Conversion 为您免费提供最好的 pdf 到 xlsx 在线转换器,将 PDF 转换为 Excel 格式。它是使用 Groupdocs.Conversion online pdf to xlsx API 开发的。

结论

在本文中,您已了解:

  • 如何在不丢失 Python 格式的情况下将 pdf 转换为 xls/xlsx;
  • 如何使用 Python 按范围将 pdf 转换为 excel 文件;
  • 在 Python 中将特定的 PDF 页面转换为 XLSX 格式;

此外,您可以使用 文档 了解有关 GroupDocs.Conversion 文件格式转换 API 的更多信息。

问一个问题

您可以通过我们的 免费支持论坛 询问有关如何将 pdf 文件转换为 xlsx 格式的问题

也可以看看