如何在 Python 中將 PDF 文件轉換為多個 PDF

Python 文檔拆分 - 使用 Python 將 PDF 文件拆分為多個 PDF 文件。

PDF(便攜式文檔格式)是一種廣泛使用的文件格式,適用於需要共享、打印或存檔的文檔。您是否厭倦了處理包含多個文檔或部分的大型 PDF 文件?您是否發現很難從單個 PDF 文件中提取特定頁面或部分作為單獨的文檔?將 PDF 文件拆分為多個較小的文件可以大大簡化您的文檔管理任務。在本文中,我們將探討如何使用適用於 Python 的 GroupDocs.Merger Cloud SDK 在 Python 中將 PDF 文件拆分為多個 PDF 文件。

本文將涵蓋以下主題:

用於將 PDF 拆分為頁面的 Python REST API 和 SDK 安裝

GroupDocs.Merger Cloud SDK for Python 是一個功能強大且功能豐富的軟件開發套件,可讓您以編程方式操作 PDF 文件。它提供各種功能,包括拆分、合併、旋轉和重新排列支持的文檔格式的頁面集合。 SDK 可以集成到基於 Python 的應用程序中,以簡化您的開發過程並提高生產力。

您可以通過在終端中運行以下命令,使用 PyPI 中的 PIP 在 Python 應用程序中安裝 Merger API:

pip install groupdocs-merger-cloud

接下來,您需要在 GroupDocs 網站上註冊免費試用帳戶或購買訂閱計劃獲取您的 API 密鑰。獲得客戶端 ID 和客戶端密鑰後,將以下代碼片段添加到基於 Python 的應用程序中:

# 導入groupdocs合併SDK
import groupdocs_merger_cloud

# 免費註冊後從 https://dashboard.groupdocs.cloud 獲取 app_sid 和 app_key。
app_sid = "xxxxxxx-xxxx-xxxx-xxxx-xxxxxxxxxxxx"
app_key = "xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx"

# 獲取文件 API 配置 
configuration = groupdocs_merger_cloud.Configuration(app_sid, app_key)
configuration.api_base_url = "https://api.groupdocs.cloud"
storage_name = "LocalStorage"

如何在 Python 中將 PDF 頁面拆分為單獨的 PDF 文件

要使用適用於 Python 的 GroupDocs.Merger Cloud SDK 將一個 PDF 文件拆分為多個 PDF 文件,請按照以下步驟操作:

上傳文件

首先,使用下面給出的代碼示例將 PDF 文件上傳到雲端:

# 創建文件 API 的實例
file_api = groupdocs_merger_cloud.FileApi.from_config(configuration)

# 調用上傳文件請求
request = groupdocs_merger_cloud.UploadFileRequest("python-testing\input-sample-file.pdf", "H:\\groupdocs-cloud-data\\input-sample-file.pdf", storage_name)

# 將文件上傳至雲端
response = file_api.upload_file(request)
print(response.uploaded)

因此,上傳的文件將在雲上儀表板的文件部分中可用。

在 Python 中將 PDF 拆分為單獨的頁面

在本節中,我們將編寫步驟和示例代碼片段,以編程方式將 PDF 頁面拆分為單獨的 PDF 文件,如下所示:

  • 首先,創建 DocumentApi 類的實例。
  • 其次,創建 SplitOptions 類的實例。
  • 第三,創建 FileInfo 類的實例。
  • 提供輸入文件路徑作為 FileInfo 的參數。
  • 接下來,提供輸出目錄路徑。
  • 在逗號分隔的數組中設置特定頁碼。
  • 現在,將 PDF 分割模式設置為“頁面”以分割頁碼。
  • 然後,創建 SplitRequest 類的實例並傳遞 SplitOptions 參數。
  • 最後調用DocumentAPI.split()方法並傳入SplitRequest參數即可獲取結果。

以下代碼片段展示瞭如何使用 REST API 在 Python 中拆分 PDF 文件:

# 如何在 Python 中將 PDF 文件拆分為多個單個 PDF 文件
try:
	# 創建文檔 API 的實例
	documentApi = groupdocs_merger_cloud.DocumentApi.from_keys(app_sid, app_key)
	 
	options = groupdocs_merger_cloud.SplitOptions()
	options.file_info = groupdocs_merger_cloud.FileInfo("python-testing\input-sample-file.pdf")
	options.output_path = "python-testing"
	options.pages = [1, 3]
	options.mode = "Pages"

	result = documentApi.split(groupdocs_merger_cloud.SplitRequest(options))
	print("Successfully split PDF to single page PDF files: " + result[0].path)
except groupdocs_merger_cloud.ApiException as e:
  print("Exception while calling API: {0}".format(e.message))

下載文件

上面的代碼示例將分離的文件保存在雲端。您可以使用以下代碼示例下載它:

# API初始化下載文件
import shutil
file_api = groupdocs_merger_cloud.FileApi.from_config(configuration)

# 創建下載文件請求
request = groupdocs_merger_cloud.DownloadFileRequest("python-testing\input-sample-file.pdf", storage_name)

# 下載文件
response = file_api.download_file(request)

# 將下載的文件移至您的目錄
shutil.move(response, "H:\\groupdocs-cloud-data\\")

就是這樣!

通過應用範圍過濾器將 PDF 文檔拆分為單獨的文件

您可以通過提供頁面範圍模式來分離 PDF 文件,並按照以下步驟以編程方式進行過濾:

  • 首先,創建 DocumentApi 類的實例。
  • 其次,創建 SplitOptions 類的實例。
  • 第三,創建 FileInfo 類的實例。
  • 提供輸入文件路徑作為 FileInfo 的參數。
  • 接下來,提供輸出目錄路徑“python-testing”。
  • 設置起始頁碼和結束頁碼值。
  • 接下來,將頁面範圍模式設置為 OddPages。
  • 現在,將 PDF 分割模式設置為“頁面”以分割頁碼。
  • 然後,創建 SplitRequest 類的實例並傳遞 SplitOptions 參數。
  • 最後調用DocumentAPI.split()方法並傳入SplitRequest參數即可獲取結果。

以下代碼片段展示瞭如何使用 REST API 在 Python 中應用過濾器來拆分 PDF 文件:

# 如何通過應用過濾器將 PDF 文件拆分為多個單個 PDF
try:
	# 創建文檔 API 的實例
	documentApi = groupdocs_merger_cloud.DocumentApi.from_keys(app_sid, app_key)
	 
	options = groupdocs_merger_cloud.SplitOptions()
	options.file_info = groupdocs_merger_cloud.FileInfo("python-testing\input-sample-file.pdf")
	options.output_path = "python-testing"
	options.start_page_number = 3
	options.end_page_number = 9
	options.range_mode = "OddPages"
	options.mode = "Pages" # mode Intervals

	result = documentApi.split(groupdocs_merger_cloud.SplitRequest(options))
	print("Successfully split PDF file using pages range filter: " + result[0].path)
except groupdocs_merger_cloud.ApiException as e:
  print("Exception while calling API: {0}".format(e.message))

通過應用數組過濾器在 Python 中將 PDF 頁面拆分為多個文件

在本節中,我們將編寫步驟和示例代碼片段,以編程方式將 PDF 文件拆分為多頁 PDF 文件:

  • 首先,創建 DocumentApi 類的實例。
  • 其次,創建 SplitOptions 類的實例。
  • 第三,創建 FileInfo 類的實例。
  • 提供輸入文件路徑作為 FileInfo 的參數。
  • 接下來,提供輸出目錄路徑“python-testing”。
  • 然後,以數組格式設置頁面集合。
  • 將 PDF 分割模式設置為間隔來分割 PDF 文件。
  • 然後,創建 SplitRequest 類的實例並傳遞 SplitOptions 參數。
  • 最後調用DocumentAPI.split()方法並傳入SplitRequest參數即可獲取結果。

以下代碼片段展示瞭如何使用 REST API 在 Python 中將 PDF 文件拆分為多個 PDF 文件:

# 如何在Python中將PDF文件拆分為多個多頁文件
try:
	# 創建文檔 API 的實例
	documentApi = groupdocs_merger_cloud.DocumentApi.from_keys(app_sid, app_key)
	 
	options = groupdocs_merger_cloud.SplitOptions()
	options.file_info = groupdocs_merger_cloud.FileInfo("python-testing\input-sample-file.pdf")
	options.output_path = "python-testing"
	options.pages = [3, 6, 8]
	options.mode = "Intervals"

	result = documentApi.split(groupdocs_merger_cloud.SplitRequest(options))
	print("Successfully split PDF file to multiple PDF files: " + result[0].path)
except groupdocs_merger_cloud.ApiException as e:
  print("Exception while calling API: {0}".format(e.message))

免費在線 PDF 分割器

如何免費在線分割PDF文件?請嘗試以下在線PDF分割器免費分割PDF文檔的工具。該文檔分割在線工具是使用上述REST API開發的。

結論

總之,使用 GroupDocs.Merger Cloud SDK for Python 將一個 PDF 文件拆分為多個 PDF 文件提供了一種管理和操作 PDF 文檔的便捷方法。以下是您在本文中學到的內容:

  • 如何在雲端使用Python將一個PDF文件拆分為多個文件;
  • 以編程方式在雲端上傳和下載Python文件;
  • 在Python中使用頁面範圍過濾器將PDF文件分割成多個文件;
  • 並使用在線 PDF 分割器免費分割 PDF 文件。

此外,我們還提供了 API 參考部分,讓您可以直接通過瀏覽器可視化我們的 API 並與其進行通信。 Python SDK 的完整源代碼可以在 GitHub 上免費獲得。請查看適用於 Python 的 GroupDocs.Merger Cloud SDK 此處的示例

此外,我們建議您按照我們的入門指南了解詳細步驟和 API 使用方法。

最後,我們繼續使用 REST API 編寫有關不同文檔操作的新博客文章。因此,請聯繫我們以獲取定期更新。

問一個問題

如果您對 PDF 文檔分割器 API 有任何疑問,請隨時在 免費支持論壇 上向我們提問。

常見問題解答

我可以根據特定頁面將 PDF 文件拆分為多個文件嗎?

是的,使用 GroupDocs.Merger Cloud SDK for Python,您可以定義頁面範圍以提取 PDF 並將其拆分為單獨的 PDF 文件。

GroupDocs.Merger Cloud SDK for Python 是否支持除 PDF 之外的其他文檔格式?

是的,GroupDocs.Merger Cloud SDK for Python支持各種文檔格式,包括 DOCX、XLSX、PPTX 等。您也可以對這些文件類型執行類似的操作。

如果需要,是否可以將分割的 PDF 文件合併回單個文件?

是的,GroupDocs.Merger Cloud SDK for Python也支持合併 PDF 文件。需要時,您可以輕鬆地將分割的 PDF 文件合併為單個文檔。

適用於 Python 的 GroupDocs.Merger Cloud SDK 在拆分過程中是否保留 PDF 文件的原始格式?

是的,SDK 保留 PDF 文件的原始格式和佈局,同時將它們拆分為多個文件。

也可以看看

有關相關主題的更多信息,我們建議您查看以下文章: