如何在 Python 中将 PDF 文件转换为多个 PDF

Python 文档拆分 - 使用 Python 将 PDF 文件拆分为多个 PDF 文件。

PDF(便携式文档格式)是一种广泛使用的文件格式,适用于需要共享、打印或存档的文档。您是否厌倦了处理包含多个文档或部分的大型 PDF 文件?您是否发现很难从单个 PDF 文件中提取特定页面或部分作为单独的文档?将 PDF 文件拆分为多个较小的文件可以大大简化您的文档管理任务。在本文中,我们将探讨如何使用适用于 Python 的 GroupDocs.Merger Cloud SDK 在 Python 中将 PDF 文件拆分为多个 PDF 文件。

本文将涵盖以下主题:

用于将 PDF 拆分为页面的 Python REST API 和 SDK 安装

GroupDocs.Merger Cloud SDK for Python 是一个功能强大且功能丰富的软件开发套件,可让您以编程方式操作 PDF 文件。它提供各种功能,包括拆分、合并、旋转和重新排列支持的文档格式的页面集合。 SDK 可以集成到基于 Python 的应用程序中,以简化您的开发过程并提高生产力。

您可以通过在终端中运行以下命令,使用 PyPI 中的 PIP 在 Python 应用程序中安装 Merger API:

pip install groupdocs-merger-cloud

接下来,您需要在 GroupDocs 网站上注册免费试用帐户或购买订阅计划获取您的 API 密钥。获得客户端 ID 和客户端密钥后,将以下代码片段添加到基于 Python 的应用程序中:

# 导入groupdocs合并SDK
import groupdocs_merger_cloud

# 免费注册后从 https://dashboard.groupdocs.cloud 获取 app_sid 和 app_key。
app_sid = "xxxxxxx-xxxx-xxxx-xxxx-xxxxxxxxxxxx"
app_key = "xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx"

# 获取文件 API 配置 
configuration = groupdocs_merger_cloud.Configuration(app_sid, app_key)
configuration.api_base_url = "https://api.groupdocs.cloud"
storage_name = "LocalStorage"

如何在 Python 中将 PDF 页面拆分为单独的 PDF 文件

要使用适用于 Python 的 GroupDocs.Merger Cloud SDK 将一个 PDF 文件拆分为多个 PDF 文件,请按照以下步骤操作:

上传文件

首先,使用下面给出的代码示例将 PDF 文件上传到云端:

# 创建文件 API 的实例
file_api = groupdocs_merger_cloud.FileApi.from_config(configuration)

# 调用上传文件请求
request = groupdocs_merger_cloud.UploadFileRequest("python-testing\input-sample-file.pdf", "H:\\groupdocs-cloud-data\\input-sample-file.pdf", storage_name)

# 将文件上传至云端
response = file_api.upload_file(request)
print(response.uploaded)

因此,上传的文件将在云上仪表板的文件部分中可用。

在 Python 中将 PDF 拆分为单独的页面

在本节中,我们将编写步骤和示例代码片段,以编程方式将 PDF 页面拆分为单独的 PDF 文件,如下所示:

  • 首先,创建 DocumentApi 类的实例。
  • 其次,创建 SplitOptions 类的实例。
  • 第三,创建 FileInfo 类的实例。
  • 提供输入文件路径作为 FileInfo 的参数。
  • 接下来,提供输出目录路径。
  • 在逗号分隔的数组中设置特定页码。
  • 现在,将 PDF 分割模式设置为“页面”以分割页码。
  • 然后,创建 SplitRequest 类的实例并传递 SplitOptions 参数。
  • 最后调用DocumentAPI.split()方法并传入SplitRequest参数即可获取结果。

以下代码片段展示了如何使用 REST API 在 Python 中拆分 PDF 文件:

# 如何在 Python 中将 PDF 文件拆分为多个单个 PDF 文件
try:
	# 创建文档 API 的实例
	documentApi = groupdocs_merger_cloud.DocumentApi.from_keys(app_sid, app_key)
	 
	options = groupdocs_merger_cloud.SplitOptions()
	options.file_info = groupdocs_merger_cloud.FileInfo("python-testing\input-sample-file.pdf")
	options.output_path = "python-testing"
	options.pages = [1, 3]
	options.mode = "Pages"

	result = documentApi.split(groupdocs_merger_cloud.SplitRequest(options))
	print("Successfully split PDF to single page PDF files: " + result[0].path)
except groupdocs_merger_cloud.ApiException as e:
  print("Exception while calling API: {0}".format(e.message))

下载文件

上面的代码示例将分离的文件保存在云端。您可以使用以下代码示例下载它:

# API初始化下载文件
import shutil
file_api = groupdocs_merger_cloud.FileApi.from_config(configuration)

# 创建下载文件请求
request = groupdocs_merger_cloud.DownloadFileRequest("python-testing\input-sample-file.pdf", storage_name)

# 下载文件
response = file_api.download_file(request)

# 将下载的文件移至您的目录
shutil.move(response, "H:\\groupdocs-cloud-data\\")

就是这样!

通过应用范围过滤器将 PDF 文档拆分为单独的文件

您可以通过提供页面范围模式来分离 PDF 文件,并按照以下步骤以编程方式进行过滤:

  • 首先,创建 DocumentApi 类的实例。
  • 其次,创建 SplitOptions 类的实例。
  • 第三,创建 FileInfo 类的实例。
  • 提供输入文件路径作为 FileInfo 的参数。
  • 接下来,提供输出目录路径“python-testing”。
  • 设置起始页码和结束页码值。
  • 接下来,将页面范围模式设置为 OddPages。
  • 现在,将 PDF 分割模式设置为“页面”以分割页码。
  • 然后,创建 SplitRequest 类的实例并传递 SplitOptions 参数。
  • 最后调用DocumentAPI.split()方法并传入SplitRequest参数即可获取结果。

以下代码片段展示了如何使用 REST API 在 Python 中应用过滤器来拆分 PDF 文件:

# 如何通过应用过滤器将 PDF 文件拆分为多个单个 PDF
try:
	# 创建文档 API 的实例
	documentApi = groupdocs_merger_cloud.DocumentApi.from_keys(app_sid, app_key)
	 
	options = groupdocs_merger_cloud.SplitOptions()
	options.file_info = groupdocs_merger_cloud.FileInfo("python-testing\input-sample-file.pdf")
	options.output_path = "python-testing"
	options.start_page_number = 3
	options.end_page_number = 9
	options.range_mode = "OddPages"
	options.mode = "Pages" # mode Intervals

	result = documentApi.split(groupdocs_merger_cloud.SplitRequest(options))
	print("Successfully split PDF file using pages range filter: " + result[0].path)
except groupdocs_merger_cloud.ApiException as e:
  print("Exception while calling API: {0}".format(e.message))

通过应用数组过滤器在 Python 中将 PDF 页面拆分为多个文件

在本节中,我们将编写步骤和示例代码片段,以编程方式将 PDF 文件拆分为多页 PDF 文件:

  • 首先,创建 DocumentApi 类的实例。
  • 其次,创建 SplitOptions 类的实例。
  • 第三,创建 FileInfo 类的实例。
  • 提供输入文件路径作为 FileInfo 的参数。
  • 接下来,提供输出目录路径“python-testing”。
  • 然后,以数组格式设置页面集合。
  • 将 PDF 分割模式设置为间隔来分割 PDF 文件。
  • 然后,创建 SplitRequest 类的实例并传递 SplitOptions 参数。
  • 最后调用DocumentAPI.split()方法并传入SplitRequest参数即可获取结果。

以下代码片段展示了如何使用 REST API 在 Python 中将 PDF 文件拆分为多个 PDF 文件:

# 如何在Python中将PDF文件拆分为多个多页文件
try:
	# 创建文档 API 的实例
	documentApi = groupdocs_merger_cloud.DocumentApi.from_keys(app_sid, app_key)
	 
	options = groupdocs_merger_cloud.SplitOptions()
	options.file_info = groupdocs_merger_cloud.FileInfo("python-testing\input-sample-file.pdf")
	options.output_path = "python-testing"
	options.pages = [3, 6, 8]
	options.mode = "Intervals"

	result = documentApi.split(groupdocs_merger_cloud.SplitRequest(options))
	print("Successfully split PDF file to multiple PDF files: " + result[0].path)
except groupdocs_merger_cloud.ApiException as e:
  print("Exception while calling API: {0}".format(e.message))

免费在线 PDF 分割器

如何免费在线分割PDF文件?请尝试以下在线PDF分割器免费分割PDF文档的工具。该文档分割在线工具是使用上述REST API开发的。

结论

总之,使用 GroupDocs.Merger Cloud SDK for Python 将一个 PDF 文件拆分为多个 PDF 文件提供了一种管理和操作 PDF 文档的便捷方法。以下是您在本文中学到的内容:

  • 如何在云端使用Python将一个PDF文件拆分为多个文件;
  • 以编程方式在云端上传和下载Python文件;
  • 在Python中使用页面范围过滤器将PDF文件分割成多个文件;
  • 并使用在线 PDF 分割器免费分割 PDF 文件。

此外,我们还提供了 API 参考部分,让您可以直接通过浏览器可视化我们的 API 并与其进行通信。 Python SDK 的完整源代码可以在 GitHub 上免费获得。请查看适用于 Python 的 GroupDocs.Merger Cloud SDK 此处的示例

此外,我们建议您按照我们的入门指南了解详细步骤和 API 使用方法。

最后,我们继续使用 REST API 编写有关不同文档操作的新博客文章。因此,请联系我们以获取定期更新。

问一个问题

如果您对 PDF 文档分割器 API 有任何疑问,请随时在 免费支持论坛 上向我们提问。

常见问题解答

我可以根据特定页面将 PDF 文件拆分为多个文件吗?

是的,使用 GroupDocs.Merger Cloud SDK for Python,您可以定义页面范围以提取 PDF 并将其拆分为单独的 PDF 文件。

GroupDocs.Merger Cloud SDK for Python 是否支持除 PDF 之外的其他文档格式?

是的,GroupDocs.Merger Cloud SDK for Python支持各种文档格式,包括 DOCX、XLSX、PPTX 等。您也可以对这些文件类型执行类似的操作。

如果需要,是否可以将分割的 PDF 文件合并回单个文件?

是的,GroupDocs.Merger Cloud SDK for Python也支持合并 PDF 文件。需要时,您可以轻松地将分割的 PDF 文件合并为单个文档。

适用于 Python 的 GroupDocs.Merger Cloud SDK 在拆分过程中是否保留 PDF 文件的原始格式?

是的,SDK 保留 PDF 文件的原始格式和布局,同时将它们拆分为多个文件。

也可以看看

有关相关主题的更多信息,我们建议您查看以下文章: