作為 Python 開發人員,您可以在雲端以編程方式輕鬆地將 Word 文檔轉換為 HTML 文件。 Word文件主要用於官方和個人數據共享。但是,如果您想在 Web 瀏覽器中查看或顯示文檔,那麼一個聰明的解決方案是使用 Python 將 Word 在線轉換為 HTML。 Word 到 Html 的轉換很有幫助,因此可以輕鬆地將 html 文件上傳到 Internet。在本文中,您將學習如何使用 Python 在線將 Word 轉換為 HTML。
本文應涵蓋以下主題:
- Word 到 HTML 轉換 REST API 和 Python SDK
- 在 Python 中使用 REST API 將 Word 轉換為 HTML
- 不使用雲存儲的 Word 到 HTML 轉換
- 如何將Word轉成HTML並直接下載
Word 到 HTML 轉換 REST API 和 Python SDK
為了將 Word 轉換為 HTML 文件,我將使用 GroupDocs.Conversion Cloud 的 Python SDK API。此 API 允許您將任何 支持的文件格式 的文檔和圖像轉換為您需要的任何格式。您可以輕鬆地在 Word、PowerPoint, Excel、PDF、HTML、CAD、光柵圖像等 50 多種文檔和圖像之間進行轉換。
您可以在控制台中使用以下命令將 GroupDocs.Conversion Cloud 安裝到您的 Python 項目:
pip install groupdocs_conversion_cloud
在開始執行步驟和可用代碼示例之前,請從 儀表板 獲取您的客戶端 ID 和客戶端密碼。獲得 ID 和密碼後,請添加如下所示的代碼:
# 從 http://api.groupdocs.cloud 在你的 python 應用程序中導入 Python SDK
import groupdocs_conversion_cloud
# 免費註冊後,從 https://dashboard.groupdocs.cloud 獲取 client_id 和 client_secret。
client_id = "xxxxxxx-xxxx-xxxx-xxxx-xxxxxxxxxxxx"
client_secret = "xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx"
# 獲取文件 API 配置
configuration = groupdocs_conversion_cloud.Configuration(client_id, client_secret)
configuration.api_base_url = "https://api.groupdocs.cloud"
storage_name = "LocalStorage"
在 Python 中使用 REST API 將 Word 轉換為 HTML
您可以按照下面提到的簡單步驟將 Word 轉換為 HTML 文件:
上傳文件
首先,使用下面給出的代碼示例將 Word 文件上傳到雲端:
# 上傳word文件到雲存儲
# 創建文件 API 的實例
file_api = groupdocs_conversion_cloud.FileApi.from_config(configuration)
# 調用上傳文件請求
request = groupdocs_conversion_cloud.UploadFileRequest("python-testing\sample-word.docx", "H:\\groupdocs-cloud-data\\word-file.docx", storage_name)
# 上傳docx文件到雲端
response = file_api.upload_file(request)
print(response.uploaded)
因此,上傳的 Word 文件將在雲端儀表板的 文件部分 中可用。
在 Python 中將 Word 轉換為 HTML
您可以按照以下步驟輕鬆地將 Word 以編程方式轉換為 HTML:
- 創建一個 ConvertApi 的實例
- 創建 ConvertSettings 的實例
- 設置Word文件路徑
- 將“html”分配給格式
- 提供輸出文件路徑
- 如果需要,定義 HtmlConvertOptions
- 設置from\page和pages\count等各種屬性。
- 使用 ConvertSettings 創建 ConvertDocumentRequest
- 使用 ConvertDocumentRequest 調用 convert\document() 方法獲取結果
以下代碼示例顯示瞭如何使用 REST API 將 Word 轉換為 HTML 而不會丟失格式:
# 如何在 Python 中將 Word 轉換為 HTML
# 創建必要的 API 實例
convert_api = groupdocs_conversion_cloud.ConvertApi.from_keys(client_id, client_secret)
# 準備轉換設置
settings = groupdocs_conversion_cloud.ConvertSettings()
settings.file_path = "python-testing/sample-word.docx"
settings.format = "html"
settings.output_path = "python-testing"
# HTML 轉換選項
convertOptions = groupdocs_conversion_cloud.HtmlConvertOptions()
convertOptions.from_page = 1
convertOptions.pages_count = 1
settings.convert_options = convertOptions
# 創建轉換文檔請求
request = groupdocs_conversion_cloud.ConvertDocumentRequest(settings)
# 將 Word 頁面轉換為 HTML 文件
result = convert_api.convert_document(request)
print("Converted range of pages from Word to HTML web page: " + result[0].path)
下載轉換後的文件
上面的代碼示例會將轉換後的 html 文件保存在雲端。您可以使用以下代碼示例下載它:
# API初始化以下載轉換後的文件
import shutil
file_api = groupdocs_conversion_cloud.FileApi.from_config(configuration)
# 創建下載文件請求
request = groupdocs_conversion_cloud.DownloadFileRequest("python-testing\\sample-word.html", storage_name)
# 下載轉換後的文件
response = file_api.download_file(request)
# 將下載的文件移動到您的目錄
shutil.move(response, "H:\\groupdocs-cloud-data\\")
不使用雲存儲的 Word 到 HTML 轉換
您可以按照以下步驟在不使用雲存儲的情況下將 Word 轉換為 HTML 文檔:
- 創建 ConvertApi 的實例
- 創建 ConvertDocumentDirectRequest 並傳遞請求的文檔格式和輸入文件路徑
- 使用 ConvertDocumentDirectRequest 調用 convert\document\direct() 方法獲取結果
- 或者,使用 shutil.move() 方法將輸出文件保存到本地路徑
以下代碼示例顯示瞭如何在不使用雲存儲的情況下將 Word 轉換為 HTML:
# 不使用雲存儲的 Word 到 HTML 轉換
# 創建必要的 API 實例
import shutil
convert_api = groupdocs_conversion_cloud.ConvertApi.from_keys(client_id, client_secret)
# 準備轉換請求
request = groupdocs_conversion_cloud.ConvertDocumentDirectRequest("html", "H:\\groupdocs-cloud-data\\word-file.docx")
# 無需雲存儲即可將 Word 轉換為 HTML
response = convert_api.convert_document_direct(request)
# 將下載的文件移動到您的工作目錄
shutil.move(response, "H:\\groupdocs-cloud-data\\")
您將在請求正文中傳遞輸入文件,並在 API 響應中接收輸出文件。
如何將Word轉換為HTML並直接下載
您可以按照以下步驟輕鬆地將 Word 以編程方式轉換為 HTML 文件:
- 創建一個 ConvertApi 的實例
- 創建 ConvertSettings 的實例
- 設置Word文件路徑
- 將“html”分配給格式
- 將“無”設置為輸出路徑
- 使用 ConvertSettings 創建 ConvertDocumentRequest
- 調用convert\document\download()方法獲取結果
- 或者,使用 shutil.move() 方法將輸出文件保存到本地路徑
以下代碼示例顯示瞭如何將 Word 轉換為 HTML 並使用 Python 中的 REST API 直接下載它:
# 如何將Word轉換為HTML並直接下載
# 創建必要的 API 實例
import shutil
convert_api = groupdocs_conversion_cloud.ConvertApi.from_keys(client_id, client_secret)
# 準備轉換設置
settings = groupdocs_conversion_cloud.ConvertSettings()
settings.file_path = "python-testing/sample-word.docx"
settings.format = "html"
# 輸出為文件 IOStream
settings.output_path = None
# 準備轉換請求
request = groupdocs_conversion_cloud.ConvertDocumentRequest(settings)
# 直接將 Word 轉換為 HTML 文件
response = convert_api.convert_document_download(request)
# 將下載的文件移動到您的工作目錄
shutil.move(response, "H:\\groupdocs-cloud-data\\")
API 應返迴轉換後的 html 文件作為響應。請按照前面提到的步驟上傳文件。
在線 Word 到 HTML 轉換器
請試用以下使用上述API開發的在線Word到HTML免費轉換工具。
結論
在本文中,您已了解:
- 如何在雲端使用Python將word doc轉成HTML文件;
- 將HTML文件上傳到雲端,然後從雲端下載轉換後的html文件;
- 如何在不以編程方式使用雲存儲的情況下將 word 轉換為 HTML 文件;
- 如何將word轉成HTML文件並直接下載;
您可以使用 文檔 了解有關 GroupDocs.Conversion Cloud API 的更多信息。我們還提供了一個 API 參考 部分,讓您可以直接通過瀏覽器可視化我們的 API 並與之交互。
問一個問題
如果您對 Word 到 HTML 轉換器有任何疑問,請隨時在 免費支持論壇 上向我們提問。
也可以看看
我們建議您訪問以下文章以了解: