您可能需要以編程方式將 word 文檔按頁拆分為多個文檔。通過拆分 word 文檔,您可以輕鬆地從 word 文檔中提取頁面,並與利益相關者共享特定的信息或數據。作為 Python 開發人員,您可以在線將 word 文檔拆分成單獨的文件,放在雲端。在本文中,您將學習如何使用 Python 從 word 文檔中提取頁面。
本分頁器文章應涵蓋以下主題:
- Word 文檔拆分器 REST API - Python SDK
- 如何在 Python 中將 Word 文檔拆分為單個文檔
- 在 Python 中按頁面範圍將 Word 文檔拆分為單個文檔
- 通過應用過濾器將 Word 文檔拆分為單獨的文件
- 如何使用Python將Word Doc拆分為多個文件
Word 文檔拆分器 REST API - Python SDK
要將 word 文件拆分為多個文件,我將使用 GroupDocs.Merger Cloud API 的 Python SDK。它允許您從 Word、Excel、[Visio 繪圖]支持的文檔格式 中旋轉、拆分、合併、刪除和重新排列單個頁面或頁面集合 6、PDF 和 HTML。 Python 源代碼存儲庫 在 GitHub 上免費提供。
可以免費下載 Word 文件拆分器。您可以使用 PyPI 中的 PIP 將 word doc splitter 安裝到您的 Python 應用程序,方法是在終端中使用以下命令:
pip install groupdocs-merger-cloud
在執行下面提到的步驟之前,請從儀表板獲取您的客戶端 ID 和密碼。獲得 ID 和 Secret 後,將以下代碼添加到您的應用程序中,以將 word 文檔拆分為單獨的文件,如下所示:
# 導入groupdocs合併SDK
import groupdocs_merger_cloud
# 免費註冊後,從 https://dashboard.groupdocs.cloud 獲取 app_sid 和 app_key。
app_sid = "xxxxxxx-xxxx-xxxx-xxxx-xxxxxxxxxxxx"
app_key = "xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx"
# 獲取文件 API 配置
configuration = groupdocs_merger_cloud.Configuration(app_sid, app_key)
configuration.api_base_url = "https://api.groupdocs.cloud"
storage_name = "LocalStorage"
如何在 Python 中將 Word 文檔拆分為單個文檔
您可以按照下面提到的步驟在雲上以編程方式拆分 docx。
上傳Word文檔
首先,我們將word文件上傳到雲端,使用下面給出的代碼示例從word online中提取頁面:
# 將Word文件上傳到雲存儲
# 創建文件 API 的實例
file_api = groupdocs_merger_cloud.FileApi.from_config(configuration)
# 調用上傳文件請求
request = groupdocs_merger_cloud.UploadFileRequest("python-testing\word-file.docx", "H:\\groupdocs-cloud-data\\word-file.docx", storage_name)
# 上傳word文件到雲端
response = file_api.upload_file(request)
print(response.uploaded)
因此,上傳的文件將在雲端儀表板的 文件部分 中可用。
在 Python 中拆分 Word 文檔頁面
您可以按照以下步驟以編程方式將單詞頁面拆分為單獨的文件:
- 首先,創建 DocumentApi 的實例。
- 然後,創建 SplitOptions 的實例
- 現在,創建 FileInfo 的一個實例
- 將輸入文件路徑作為參數傳遞給 FileInfo
- 接下來,提供輸出文件路徑
- 在逗號分隔數組中設置特定頁碼
- 現在,將 docx 拆分模式設置為頁面。它允許在逗號分隔的數組中拆分頁碼
- 使用 SplitOptions 創建 SplitRequest
- 最後,以 SplitRequest 作為參數調用 DocumentAPI.split() 方法並獲得結果
以下代碼片段顯示瞭如何在 Python 中使用 REST API 將 word 文件拆分為單獨的頁面:
# 如何在 Python 中將 Word 文檔拆分為單個文檔
try:
# 創建文檔 API 的實例
documentApi = groupdocs_merger_cloud.DocumentApi.from_keys(app_sid, app_key)
options = groupdocs_merger_cloud.SplitOptions()
options.file_info = groupdocs_merger_cloud.FileInfo("python-testing\word-file.docx")
options.output_path = "python-testing"
options.pages = [1, 3]
options.mode = "Pages"
result = documentApi.split(groupdocs_merger_cloud.SplitRequest(options))
print("Successfully split word docx to single page document: " + result[0].path)
except groupdocs_merger_cloud.ApiException as e:
print("Exception while calling API: {0}".format(e.message))
下載單個文件
最後,上面的代碼示例將使用 python 將分離的文件保存在雲端。可以使用以下代碼示例下載它:
# API初始化下載分離文件
import shutil
file_api = groupdocs_merger_cloud.FileApi.from_config(configuration)
# 創建下載文件請求
request = groupdocs_merger_cloud.DownloadFileRequest("python-testing\word-file.docx", storage_name)
# 下載分離文件
response = file_api.download_file(request)
# 將下載的文件移動到您的目錄
shutil.move(response, "H:\\groupdocs-cloud-data\\")
在 Python 中按頁面範圍將 Word 文檔拆分為單個文檔
您可以使用以下步驟在線將 word 文檔拆分為多個文檔:
- 創建 DocumentApi 的實例
- 然後,創建 SplitOptions 的實例
- 現在,創建 FileInfo 的一個實例
- 將輸入文件路徑作為參數傳遞給 FileInfo
- 接下來,提供輸出文件路徑 as “python-testing”
- 設置 start\page\number 和 end\page\number 值
- 將 docx 拆分模式設置為 Pages 以拆分單詞
- 使用 SplitOptions 創建 SplitRequest
- 最後,以 SplitRequest 作為參數調用 DocumentAPI.split() 方法
以下代碼片段顯示瞭如何使用 REST API 從 Python 中的 Word 文檔中提取頁面:
# 如何在 Python 中按頁面範圍將 Word 文檔拆分為單個文檔
try:
# 創建文檔 API 的實例
documentApi = groupdocs_merger_cloud.DocumentApi.from_keys(app_sid, app_key)
options = groupdocs_merger_cloud.SplitOptions()
options.file_info = groupdocs_merger_cloud.FileInfo("python-testing\word-file.docx")
options.output_path = "python-testing"
options.start_page_number = 3
options.end_page_number = 7
options.mode = "Pages"
result = documentApi.split(groupdocs_merger_cloud.SplitRequest(options))
print("Successfully split Word to single files by page range: " + result[0].path)
except groupdocs_merger_cloud.ApiException as e:
print("Exception while calling API: {0}".format(e.message))
通過應用過濾器將 Word 文檔拆分為單獨的文件
您可以使用範圍模式在線將 word 文檔按頁拆分為多個文檔,並以編程方式進行過濾,如下所示:
- 創建 DocumentApi 的實例
- 然後,創建 SplitOptions 的實例
- 現在,創建 FileInfo 的一個實例
- 將輸入文件路徑作為參數傳遞給 FileInfo
- 接下來,提供輸出文件路徑 as “python-testing”
- 設置 start\page\number 和 end\page\number 值
- 接下來,將 range\mode 設置為“OddPages”
- 將 docx 拆分模式設置為 Pages 以拆分單詞
- 使用 SplitOptions 創建 SplitRequest
- 最後,以 SplitRequest 作為參數調用 DocumentAPI.split() 方法
以下代碼片段顯示瞭如何在 Python 中使用 REST API 應用過濾器來提取 word 文檔頁面:
# 如何通過應用過濾器將 Word 文檔拆分為單獨的文件
try:
# 創建文檔 API 的實例
documentApi = groupdocs_merger_cloud.DocumentApi.from_keys(app_sid, app_key)
options = groupdocs_merger_cloud.SplitOptions()
options.file_info = groupdocs_merger_cloud.FileInfo("python-testing\word-file.docx")
options.output_path = "python-testing"
options.start_page_number = 3
options.end_page_number = 7
options.range_mode = "OddPages"
options.mode = "Pages" # mode Intervals
result = documentApi.split(groupdocs_merger_cloud.SplitRequest(options))
print("Successfully split Word by range of pages and using filter: " + result[0].path)
except groupdocs_merger_cloud.ApiException as e:
print("Exception while calling API: {0}".format(e.message))
如何使用 Python 將 Word Doc 拆分為多個文件
您可以按照以下步驟以編程方式將 word 文件拆分為多個文檔:
- 創建 DocumentApi 的實例
- 然後,創建 SplitOptions 的實例
- 現在,創建 FileInfo 的一個實例
- 將輸入文件路徑作為參數傳遞給 FileInfo
- 接下來,提供輸出文件路徑 as “python-testing”
- 然後,以數組格式設置頁面集合
- 將 docx 拆分模式設置為間隔以拆分單詞
- 使用 SplitOptions 創建 SplitRequest
- 最後,以 SplitRequest 作為參數調用 DocumentAPI.split() 方法
以下代碼片段顯示瞭如何在 Python 中使用 REST API 將 docx 拆分為多個文件:
# 如何使用 Python 將 Docx 文件拆分為多個文件
try:
# 創建文檔 API 的實例
documentApi = groupdocs_merger_cloud.DocumentApi.from_keys(app_sid, app_key)
options = groupdocs_merger_cloud.SplitOptions()
options.file_info = groupdocs_merger_cloud.FileInfo("python-testing\word-file.docx")
options.output_path = "python-testing"
options.pages = [3, 6, 8]
options.mode = "Intervals"
result = documentApi.split(groupdocs_merger_cloud.SplitRequest(options))
print("Successfully split Word file to multiple files: " + result[0].path)
except groupdocs_merger_cloud.ApiException as e:
print("Exception while calling API: {0}".format(e.message))
在線拆分 Word 文件
如何免費在線將word文檔拆分成多個文件?您可以嘗試我們的在線 word 文檔拆分器 將 word 文檔按固定頁數或不同的頁面範圍免費在線拆分為多個文件。多頁word文檔被分成多個word文件,保持原始文檔的格式。
結論
在本教程中,我們學習了:
- 雲端Python如何將word文件一分為二;
- 如何在 Python 中將 docx 文件拆分為單獨的文件;
- 如何以編程方式在 Python 中按頁拆分 word 文檔;
- 如何以編程方式在 Python 中在線將 word 文檔拆分為多個文檔;
- 如何使用在線Word頁面拆分器免費在線拆分Word文件;
此外,您可以使用 文檔 了解有關 GroupDocs.Merger Cloud API 的更多信息。我們還提供了一個 API 參考 部分,讓您可以直接通過瀏覽器可視化我們的 API 並與之通信。此外,請參閱適用於 Python 的 GroupDocs.Merger Cloud SDK 此處示例。
問一個問題
如果您對如何在線從word文檔中提取頁面有任何疑問,請隨時在論壇上向我們提問
常見問題
如何使用 docx 拆分器 API 在線從 word 文檔中提取頁面?
安裝文檔拆分器免費下載Python庫在線提取word頁面。您可以訪問 文檔 以獲取完整的 API 詳細信息。
在線免費拆分 word 文檔的最快方法是什麼?
Word page extractor online 運行速度非常快,你可以在幾秒鐘內在線拆分 docx。
如何免費從word online中提取頁面?
- 打開在線單詞頁面提取器。
- 在文件放置區內單擊以上傳 word docx 文件或拖放 word 文件。
- 單擊“轉換”按鈕。您的文檔將被上傳並轉換為 DOC 格式。
- 拆分後將立即提供輸出文件的下載鏈接。
使用免費的在線文檔拆分器安全嗎?
是的,document splitter word 是安全的,沒有人可以訪問您上傳的文件。我們會在 24 小時後刪除上傳的文件。