如何在 Python 中在線將 Word 轉換為 HTML

在 Python 中在線將 Word 轉換為 HTML

作為 Python 開發人員,您可以在雲端以編程方式輕鬆地將 Word 文檔轉換為 HTML 文件。 Word文件主要用於官方和個人數據共享。但是,如果您想在 Web 瀏覽器中查看或顯示文檔,那麼一個聰明的解決方案是使用 Python 將 Word 在線轉換為 HTML。 Word 到 Html 的轉換很有幫助,因此可以輕鬆地將 html 文件上傳到 Internet。在本文中,您將學習如何使用 Python 在線將 Word 轉換為 HTML。

本文應涵蓋以下主題:

Word 到 HTML 轉換 REST API 和 Python SDK

為了將 Word 轉換為 HTML 文件,我將使用 GroupDocs.Conversion Cloud 的 Python SDK API。此 API 允許您將任何 支持的文件格式 的文檔和圖像轉換為您需要的任何格式。您可以輕鬆地在 Word、PowerPoint, Excel、PDF、HTML、CAD、光柵圖像等 50 多種文檔和圖像之間進行轉換。

您可以在控制台中使用以下命令將 GroupDocs.Conversion Cloud 安裝到您的 Python 項目:

pip install groupdocs_conversion_cloud

在開始執行步驟和可用代碼示例之前,請從 儀表板 獲取您的客戶端 ID 和客戶端密碼。獲得 ID 和密碼後,請添加如下所示的代碼:

# 從 http://api.groupdocs.cloud 在你的 python 應用程序中導入 Python SDK
import groupdocs_conversion_cloud

# 免費註冊後,從 https://dashboard.groupdocs.cloud 獲取 client_id 和 client_secret。
client_id = "xxxxxxx-xxxx-xxxx-xxxx-xxxxxxxxxxxx"
client_secret = "xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx"

# 獲取文件 API 配置 
configuration = groupdocs_conversion_cloud.Configuration(client_id, client_secret)
configuration.api_base_url = "https://api.groupdocs.cloud"
storage_name = "LocalStorage"

在 Python 中使用 REST API 將 Word 轉換為 HTML

您可以按照下面提到的簡單步驟將 Word 轉換為 HTML 文件:

上傳文件

首先,使用下面給出的代碼示例將 Word 文件上傳到雲端:

# 上傳word文件到雲存儲
# 創建文件 API 的實例
file_api = groupdocs_conversion_cloud.FileApi.from_config(configuration)

# 調用上傳文件請求
request = groupdocs_conversion_cloud.UploadFileRequest("python-testing\sample-word.docx", "H:\\groupdocs-cloud-data\\word-file.docx", storage_name)

# 上傳docx文件到雲端
response = file_api.upload_file(request)
print(response.uploaded)

因此,上傳的 Word 文件將在雲端儀表板的 文件部分 中可用。

在 Python 中將 Word 轉換為 HTML

您可以按照以下步驟輕鬆地將 Word 以編程方式轉換為 HTML:

  • 創建一個 ConvertApi 的實例
  • 創建 ConvertSettings 的實例
  • 設置Word文件路徑
  • 將“html”分配給格式
  • 提供輸出文件路徑
  • 如果需要,定義 HtmlConvertOptions
  • 設置from\page和pages\count等各種屬性。
  • 使用 ConvertSettings 創建 ConvertDocumentRequest
  • 使用 ConvertDocumentRequest 調用 convert\document() 方法獲取結果

以下代碼示例顯示瞭如何使用 REST API 將 Word 轉換為 HTML 而不會丟失格式:

# 如何在 Python 中將 Word 轉換為 HTML
# 創建必要的 API 實例
convert_api = groupdocs_conversion_cloud.ConvertApi.from_keys(client_id, client_secret)

# 準備轉換設置
settings = groupdocs_conversion_cloud.ConvertSettings()
settings.file_path = "python-testing/sample-word.docx"
settings.format = "html"
settings.output_path = "python-testing"

# HTML 轉換選項
convertOptions = groupdocs_conversion_cloud.HtmlConvertOptions()
convertOptions.from_page = 1 
convertOptions.pages_count = 1

settings.convert_options = convertOptions

# 創建轉換文檔請求
request = groupdocs_conversion_cloud.ConvertDocumentRequest(settings)

# 將 Word 頁面轉換為 HTML 文件
result = convert_api.convert_document(request)
print("Converted range of pages from Word to HTML web page: " + result[0].path)

下載轉換後的文件

上面的代碼示例會將轉換後的 html 文件保存在雲端。您可以使用以下代碼示例下載它:

# API初始化以下載轉換後的文件
import shutil
file_api = groupdocs_conversion_cloud.FileApi.from_config(configuration)

# 創建下載文件請求
request = groupdocs_conversion_cloud.DownloadFileRequest("python-testing\\sample-word.html", storage_name)

# 下載轉換後的文件
response = file_api.download_file(request)

# 將下載的文件移動到您的目錄
shutil.move(response, "H:\\groupdocs-cloud-data\\")

不使用雲存儲的 Word 到 HTML 轉換

您可以按照以下步驟在不使用雲存儲的情況下將 Word 轉換為 HTML 文檔:

  • 創建 ConvertApi 的實例
  • 創建 ConvertDocumentDirectRequest 並傳遞請求的文檔格式和輸入文件路徑
  • 使用 ConvertDocumentDirectRequest 調用 convert\document\direct() 方法獲取結果
  • 或者,使用 shutil.move() 方法將輸出文件保存到本地路徑

以下代碼示例顯示瞭如何在不使用雲存儲的情況下將 Word 轉換為 HTML:

# 不使用雲存儲的 Word 到 HTML 轉換
# 創建必要的 API 實例
import shutil
convert_api = groupdocs_conversion_cloud.ConvertApi.from_keys(client_id, client_secret)

# 準備轉換請求
request = groupdocs_conversion_cloud.ConvertDocumentDirectRequest("html", "H:\\groupdocs-cloud-data\\word-file.docx")

# 無需雲存儲即可將 Word 轉換為 HTML
response = convert_api.convert_document_direct(request)

# 將下載的文件移動到您的工作目錄
shutil.move(response, "H:\\groupdocs-cloud-data\\")

您將在請求正文中傳遞輸入文件,並在 API 響應中接收輸出文件。

如何將Word轉換為HTML並直接下載

您可以按照以下步驟輕鬆地將 Word 以編程方式轉換為 HTML 文件:

  • 創建一個 ConvertApi 的實例
  • 創建 ConvertSettings 的實例
  • 設置Word文件路徑
  • 將“html”分配給格式
  • 將“無”設置為輸出路徑
  • 使用 ConvertSettings 創建 ConvertDocumentRequest
  • 調用convert\document\download()方法獲取結果
  • 或者,使用 shutil.move() 方法將輸出文件保存到本地路徑

以下代碼示例顯示瞭如何將 Word 轉換為 HTML 並使用 Python 中的 REST API 直接下載它:

# 如何將Word轉換為HTML並直接下載
# 創建必要的 API 實例
import shutil
convert_api = groupdocs_conversion_cloud.ConvertApi.from_keys(client_id, client_secret)

# 準備轉換設置
settings = groupdocs_conversion_cloud.ConvertSettings()
settings.file_path = "python-testing/sample-word.docx"
settings.format = "html"

# 輸出為文件 IOStream
settings.output_path = None    

# 準備轉換請求
request = groupdocs_conversion_cloud.ConvertDocumentRequest(settings)

# 直接將 Word 轉換為 HTML 文件
response = convert_api.convert_document_download(request)

# 將下載的文件移動到您的工作目錄
shutil.move(response, "H:\\groupdocs-cloud-data\\")

API 應返迴轉換後的 html 文件作為響應。請按照前面提到的步驟上傳文件。

在線 Word 到 HTML 轉換器

請試用以下使用上述API開發的在線Word到HTML免費轉換工具

結論

在本文中,您已了解:

  • 如何在雲端使用Python將word doc轉成HTML文件;
  • 將HTML文件上傳到雲端,然後從雲端下載轉換後的html文件;
  • 如何在不以編程方式使用雲存儲的情況下將 word 轉換為 HTML 文件;
  • 如何將word轉成HTML文件並直接下載;

您可以使用 文檔 了解有關 GroupDocs.Conversion Cloud API 的更多信息。我們還提供了一個 API 參考 部分,讓您可以直接通過瀏覽器可視化我們的 API 並與之交互。

問一個問題

如果您對 Word 到 HTML 轉換器有任何疑問,請隨時在 免費支持論壇 上向我們提問。

也可以看看

我們建議您訪問以下文章以了解: