如何在 Python 中從 Word 文檔中提取頁面

如何在 Python 中從 Word 文檔中提取頁面

您可能需要以編程方式將 word 文檔按頁拆分為多個文檔。通過拆分 word 文檔,您可以輕鬆地從 word 文檔中提取頁面,並與利益相關者共享特定的信息或數據。作為 Python 開發人員,您可以在線將 word 文檔拆分成單獨的文件,放在雲端。在本文中,您將學習如何使用 Python 從 word 文檔中提取頁面。

本分頁器文章應涵蓋以下主題:

Word 文檔拆分器 REST API - Python SDK

要將 word 文件拆分為多個文件,我將使用 GroupDocs.Merger Cloud API 的 Python SDK。它允許您從 WordExcel、[Visio 繪圖]支持的文檔格式 中旋轉、拆分、合併、刪除和重新排列單個頁面或頁面集合 6PDFHTML。 Python 源代碼存儲庫 在 GitHub 上免費提供。

可以免費下載 Word 文件拆分器。您可以使用 PyPI 中的 PIP 將 word doc splitter 安裝到您的 Python 應用程序,方法是在終端中使用以下命令:

pip install groupdocs-merger-cloud

在執行下面提到的步驟之前,請從儀表板獲取您的客戶端 ID 和密碼。獲得 ID 和 Secret 後,將以下代碼添加到您的應用程序中,以將 word 文檔拆分為單獨的文件,如下所示:

# 導入groupdocs合併SDK
import groupdocs_merger_cloud

# 免費註冊後,從 https://dashboard.groupdocs.cloud 獲取 app_sid 和 app_key。
app_sid = "xxxxxxx-xxxx-xxxx-xxxx-xxxxxxxxxxxx"
app_key = "xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx"

# 獲取文件 API 配置 
configuration = groupdocs_merger_cloud.Configuration(app_sid, app_key)
configuration.api_base_url = "https://api.groupdocs.cloud"
storage_name = "LocalStorage"

如何在 Python 中將 Word 文檔拆分為單個文檔

您可以按照下面提到的步驟在雲上以編程方式拆分 docx。

上傳Word文檔

首先,我們將word文件上傳到雲端,使用下面給出的代碼示例從word online中提取頁面:

# 將Word文件上傳到雲存儲
# 創建文件 API 的實例
file_api = groupdocs_merger_cloud.FileApi.from_config(configuration)

# 調用上傳文件請求
request = groupdocs_merger_cloud.UploadFileRequest("python-testing\word-file.docx", "H:\\groupdocs-cloud-data\\word-file.docx", storage_name)

# 上傳word文件到雲端
response = file_api.upload_file(request)
print(response.uploaded)

因此,上傳的文件將在雲端儀表板的 文件部分 中可用。

在 Python 中拆分 Word 文檔頁面

您可以按照以下步驟以編程方式將單詞頁面拆分為單獨的文件:

  • 首先,創建 DocumentApi 的實例。
  • 然後,創建 SplitOptions 的實例
  • 現在,創建 FileInfo 的一個實例
  • 將輸入文件路徑作為參數傳遞給 FileInfo
  • 接下來,提供輸出文件路徑
  • 在逗號分隔數組中設置特定頁碼
  • 現在,將 docx 拆分模式設置為頁面。它允許在逗號分隔的數組中拆分頁碼
  • 使用 SplitOptions 創建 SplitRequest
  • 最後,以 SplitRequest 作為參數調用 DocumentAPI.split() 方法並獲得結果

以下代碼片段顯示瞭如何在 Python 中使用 REST API 將 word 文件拆分為單獨的頁面:

# 如何在 Python 中將 Word 文檔拆分為單個文檔
try:
    # 創建文檔 API 的實例
    documentApi = groupdocs_merger_cloud.DocumentApi.from_keys(app_sid, app_key)
     
    options = groupdocs_merger_cloud.SplitOptions()
    options.file_info = groupdocs_merger_cloud.FileInfo("python-testing\word-file.docx")
    options.output_path = "python-testing"
    options.pages = [1, 3]
    options.mode = "Pages"

    result = documentApi.split(groupdocs_merger_cloud.SplitRequest(options))
    print("Successfully split word docx to single page document: " + result[0].path)
except groupdocs_merger_cloud.ApiException as e:
  print("Exception while calling API: {0}".format(e.message))
如何在 Python 中將 Word 文件拆分為單獨的頁面

如何在 Python 中將 Word 文件拆分為單獨的頁面

下載單個文件

最後,上面的代碼示例將使用 python 將分離的文件保存在雲端。可以使用以下代碼示例下載它:

# API初始化下載分離文件
import shutil
file_api = groupdocs_merger_cloud.FileApi.from_config(configuration)

# 創建下載文件請求
request = groupdocs_merger_cloud.DownloadFileRequest("python-testing\word-file.docx", storage_name)

# 下載分離文件
response = file_api.download_file(request)

# 將下載的文件移動到您的目錄
shutil.move(response, "H:\\groupdocs-cloud-data\\")

在 Python 中按頁面範圍將 Word 文檔拆分為單個文檔

您可以使用以下步驟在線將 word 文檔拆分為多個文檔:

  • 創建 DocumentApi 的實例
  • 然後,創建 SplitOptions 的實例
  • 現在,創建 FileInfo 的一個實例
  • 將輸入文件路徑作為參數傳遞給 FileInfo
  • 接下來,提供輸出文件路徑 as “python-testing”
  • 設置 start\page\number 和 end\page\number 值
  • 將 docx 拆分模式設置為 Pages 以拆分單詞
  • 使用 SplitOptions 創建 SplitRequest
  • 最後,以 SplitRequest 作為參數調用 DocumentAPI.split() 方法

以下代碼片段顯示瞭如何使用 REST API 從 Python 中的 Word 文檔中提取頁面:

# 如何在 Python 中按頁面範圍將 Word 文檔拆分為單個文檔
try:
    # 創建文檔 API 的實例
    documentApi = groupdocs_merger_cloud.DocumentApi.from_keys(app_sid, app_key)
     
    options = groupdocs_merger_cloud.SplitOptions()
    options.file_info = groupdocs_merger_cloud.FileInfo("python-testing\word-file.docx")
    options.output_path = "python-testing"
    options.start_page_number = 3
    options.end_page_number = 7
    options.mode = "Pages"

    result = documentApi.split(groupdocs_merger_cloud.SplitRequest(options))
    print("Successfully split Word to single files by page range: " + result[0].path)
except groupdocs_merger_cloud.ApiException as e:
  print("Exception while calling API: {0}".format(e.message))

通過應用過濾器將 Word 文檔拆分為單獨的文件

您可以使用範圍模式在線將 word 文檔按頁拆分為多個文檔,並以編程方式進行過濾,如下所示:

  • 創建 DocumentApi 的實例
  • 然後,創建 SplitOptions 的實例
  • 現在,創建 FileInfo 的一個實例
  • 將輸入文件路徑作為參數傳遞給 FileInfo
  • 接下來,提供輸出文件路徑 as “python-testing”
  • 設置 start\page\number 和 end\page\number 值
  • 接下來,將 range\mode 設置為“OddPages”
  • 將 docx 拆分模式設置為 Pages 以拆分單詞
  • 使用 SplitOptions 創建 SplitRequest
  • 最後,以 SplitRequest 作為參數調用 DocumentAPI.split() 方法

以下代碼片段顯示瞭如何在 Python 中使用 REST API 應用過濾器來提取 word 文檔頁面:

# 如何通過應用過濾器將 Word 文檔拆分為單獨的文件
try:
    # 創建文檔 API 的實例
    documentApi = groupdocs_merger_cloud.DocumentApi.from_keys(app_sid, app_key)
     
    options = groupdocs_merger_cloud.SplitOptions()
    options.file_info = groupdocs_merger_cloud.FileInfo("python-testing\word-file.docx")
    options.output_path = "python-testing"
    options.start_page_number = 3
    options.end_page_number = 7
    options.range_mode = "OddPages"
    options.mode = "Pages" # mode Intervals

    result = documentApi.split(groupdocs_merger_cloud.SplitRequest(options))
    print("Successfully split Word by range of pages and using filter: " + result[0].path)
except groupdocs_merger_cloud.ApiException as e:
  print("Exception while calling API: {0}".format(e.message))

如何使用 Python 將 Word Doc 拆分為多個文件

您可以按照以下步驟以編程方式將 word 文件拆分為多個文檔:

  • 創建 DocumentApi 的實例
  • 然後,創建 SplitOptions 的實例
  • 現在,創建 FileInfo 的一個實例
  • 將輸入文件路徑作為參數傳遞給 FileInfo
  • 接下來,提供輸出文件路徑 as “python-testing”
  • 然後,以數組格式設置頁面集合
  • 將 docx 拆分模式設置為間隔以拆分單詞
  • 使用 SplitOptions 創建 SplitRequest
  • 最後,以 SplitRequest 作為參數調用 DocumentAPI.split() 方法

以下代碼片段顯示瞭如何在 Python 中使用 REST API 將 docx 拆分為多個文件:

# 如何使用 Python 將 Docx 文件拆分為多個文件
try:
    # 創建文檔 API 的實例
    documentApi = groupdocs_merger_cloud.DocumentApi.from_keys(app_sid, app_key)
     
    options = groupdocs_merger_cloud.SplitOptions()
    options.file_info = groupdocs_merger_cloud.FileInfo("python-testing\word-file.docx")
    options.output_path = "python-testing"
    options.pages = [3, 6, 8]
    options.mode = "Intervals"

    result = documentApi.split(groupdocs_merger_cloud.SplitRequest(options))
    print("Successfully split Word file to multiple files: " + result[0].path)
except groupdocs_merger_cloud.ApiException as e:
  print("Exception while calling API: {0}".format(e.message))

在線拆分 Word 文件

如何免費在線將word文檔拆分成多個文件?您可以嘗試我們的在線 word 文檔拆分器 將 word 文檔按固定頁數或不同的頁面範圍免費在線拆分為多個文件。多頁word文檔被分成多個word文件,保持原始文檔的格式。

結論

在本教程中,我們學習了:

  • 雲端Python如何將word文件一分為二;
  • 如何在 Python 中將 docx 文件拆分為單獨的文件;
  • 如何以編程方式在 Python 中按頁拆分 word 文檔;
  • 如何以編程方式在 Python 中在線將 word 文檔拆分為多個文檔;
  • 如何使用在線Word頁面拆分器免費在線拆分Word文件;

此外,您可以使用 文檔 了解有關 GroupDocs.Merger Cloud API 的更多信息。我們還提供了一個 API 參考 部分,讓您可以直接通過瀏覽器可視化我們的 API 並與之通信。此外,請參閱適用於 Python 的 GroupDocs.Merger Cloud SDK 此處示例

問一個問題

如果您對如何在線從word文檔中提取頁面有任何疑問,請隨時在論壇上向我們提問

常見問題

如何使用 docx 拆分器 API 在線從 word 文檔中提取頁面?

安裝文檔拆分器免費下載Python庫在線提取word頁面。您可以訪問 文檔 以獲取完整的 API 詳細信息。

在線免費拆分 word 文檔的最快方法是什麼?

Word page extractor online 運行速度非常快,你可以在幾秒鐘內在線拆分 docx。

如何免費從word online中提取頁面?

  • 打開在線單詞頁面提取器
  • 在文件放置區內單擊以上傳 word docx 文件或拖放 word 文件。
  • 單擊“轉換”按鈕。您的文檔將被上傳並轉換為 DOC 格式。
  • 拆分後將立即提供輸出文件的下載鏈接。

使用免費的在線文檔拆分器安全嗎?

是的,document splitter word 是安全的,沒有人可以訪問您上傳的文件。我們會在 24 小時後刪除上傳的文件。

也可以看看