如何在 Python 中在线将 Word 转换为 HTML

在 Python 中在线将 Word 转换为 HTML

作为 Python 开发人员,您可以在云端以编程方式轻松地将 Word 文档转换为 HTML 文件。 Word文件主要用于官方和个人数据共享。但是,如果您想在 Web 浏览器中查看或显示文档,那么一个聪明的解决方案是使用 Python 将 Word 在线转换为 HTML。 Word 到 Html 的转换很有帮助,因此可以轻松地将 html 文件上传到 Internet。在本文中,您将学习如何使用 Python 在线将 Word 转换为 HTML。

本文应涵盖以下主题:

Word 到 HTML 转换 REST API 和 Python SDK

为了将 Word 转换为 HTML 文件,我将使用 GroupDocs.Conversion Cloud 的 Python SDK API。此 API 允许您将任何 支持的文件格式 的文档和图像转换为您需要的任何格式。您可以轻松地在 Word、PowerPoint, Excel、PDF、HTML、CAD、光栅图像等 50 多种文档和图像之间进行转换。

您可以在控制台中使用以下命令将 GroupDocs.Conversion Cloud 安装到您的 Python 项目:

pip install groupdocs_conversion_cloud

在开始执行步骤和可用代码示例之前,请从 仪表板 获取您的客户端 ID 和客户端密码。获得 ID 和密码后,请添加如下所示的代码:

# 从 http://api.groupdocs.cloud 在你的 python 应用程序中导入 Python SDK
import groupdocs_conversion_cloud

# 免费注册后,从 https://dashboard.groupdocs.cloud 获取 client_id 和 client_secret。
client_id = "xxxxxxx-xxxx-xxxx-xxxx-xxxxxxxxxxxx"
client_secret = "xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx"

# 获取文件 API 配置 
configuration = groupdocs_conversion_cloud.Configuration(client_id, client_secret)
configuration.api_base_url = "https://api.groupdocs.cloud"
storage_name = "LocalStorage"

在 Python 中使用 REST API 将 Word 转换为 HTML

您可以按照下面提到的简单步骤将 Word 转换为 HTML 文件:

上传文件

首先,使用下面给出的代码示例将 Word 文件上传到云端:

# 上传word文件到云存储
# 创建文件 API 的实例
file_api = groupdocs_conversion_cloud.FileApi.from_config(configuration)

# 调用上传文件请求
request = groupdocs_conversion_cloud.UploadFileRequest("python-testing\sample-word.docx", "H:\\groupdocs-cloud-data\\word-file.docx", storage_name)

# 上传docx文件到云端
response = file_api.upload_file(request)
print(response.uploaded)

因此,上传的 Word 文件将在云端仪表板的 文件部分 中可用。

在 Python 中将 Word 转换为 HTML

您可以按照以下步骤轻松地将 Word 以编程方式转换为 HTML:

  • 创建一个 ConvertApi 的实例
  • 创建 ConvertSettings 的实例
  • 设置Word文件路径
  • 将“html”分配给格式
  • 提供输出文件路径
  • 如果需要,定义 HtmlConvertOptions
  • 设置from\page和pages\count等各种属性。
  • 使用 ConvertSettings 创建 ConvertDocumentRequest
  • 使用 ConvertDocumentRequest 调用 convert\document() 方法获取结果

以下代码示例显示了如何使用 REST API 将 Word 转换为 HTML 而不会丢失格式:

# 如何在 Python 中将 Word 转换为 HTML
# 创建必要的 API 实例
convert_api = groupdocs_conversion_cloud.ConvertApi.from_keys(client_id, client_secret)

# 准备转换设置
settings = groupdocs_conversion_cloud.ConvertSettings()
settings.file_path = "python-testing/sample-word.docx"
settings.format = "html"
settings.output_path = "python-testing"

# HTML 转换选项
convertOptions = groupdocs_conversion_cloud.HtmlConvertOptions()
convertOptions.from_page = 1 
convertOptions.pages_count = 1

settings.convert_options = convertOptions

# 创建转换文档请求
request = groupdocs_conversion_cloud.ConvertDocumentRequest(settings)

# 将 Word 页面转换为 HTML 文件
result = convert_api.convert_document(request)
print("Converted range of pages from Word to HTML web page: " + result[0].path)

下载转换后的文件

上面的代码示例会将转换后的 html 文件保存在云端。您可以使用以下代码示例下载它:

# API初始化以下载转换后的文件
import shutil
file_api = groupdocs_conversion_cloud.FileApi.from_config(configuration)

# 创建下载文件请求
request = groupdocs_conversion_cloud.DownloadFileRequest("python-testing\\sample-word.html", storage_name)

# 下载转换后的文件
response = file_api.download_file(request)

# 将下载的文件移动到您的目录
shutil.move(response, "H:\\groupdocs-cloud-data\\")

不使用云存储的 Word 到 HTML 转换

您可以按照以下步骤在不使用云存储的情况下将 Word 转换为 HTML 文档:

  • 创建 ConvertApi 的实例
  • 创建 ConvertDocumentDirectRequest 并传递请求的文档格式和输入文件路径
  • 使用 ConvertDocumentDirectRequest 调用 convert\document\direct() 方法获取结果
  • 或者,使用 shutil.move() 方法将输出文件保存到本地路径

以下代码示例显示了如何在不使用云存储的情况下将 Word 转换为 HTML:

# 不使用云存储的 Word 到 HTML 转换
# 创建必要的 API 实例
import shutil
convert_api = groupdocs_conversion_cloud.ConvertApi.from_keys(client_id, client_secret)

# 准备转换请求
request = groupdocs_conversion_cloud.ConvertDocumentDirectRequest("html", "H:\\groupdocs-cloud-data\\word-file.docx")

# 无需云存储即可将 Word 转换为 HTML
response = convert_api.convert_document_direct(request)

# 将下载的文件移动到您的工作目录
shutil.move(response, "H:\\groupdocs-cloud-data\\")

您将在请求正文中传递输入文件,并在 API 响应中接收输出文件。

如何将Word转换为HTML并直接下载

您可以按照以下步骤轻松地将 Word 以编程方式转换为 HTML 文件:

  • 创建一个 ConvertApi 的实例
  • 创建 ConvertSettings 的实例
  • 设置Word文件路径
  • 将“html”分配给格式
  • 将“无”设置为输出路径
  • 使用 ConvertSettings 创建 ConvertDocumentRequest
  • 调用convert\document\download()方法获取结果
  • 或者,使用 shutil.move() 方法将输出文件保存到本地路径

以下代码示例显示了如何将 Word 转换为 HTML 并使用 Python 中的 REST API 直接下载它:

# 如何将Word转换为HTML并直接下载
# 创建必要的 API 实例
import shutil
convert_api = groupdocs_conversion_cloud.ConvertApi.from_keys(client_id, client_secret)

# 准备转换设置
settings = groupdocs_conversion_cloud.ConvertSettings()
settings.file_path = "python-testing/sample-word.docx"
settings.format = "html"

# 输出为文件 IOStream
settings.output_path = None    

# 准备转换请求
request = groupdocs_conversion_cloud.ConvertDocumentRequest(settings)

# 直接将 Word 转换为 HTML 文件
response = convert_api.convert_document_download(request)

# 将下载的文件移动到您的工作目录
shutil.move(response, "H:\\groupdocs-cloud-data\\")

API 应返回转换后的 html 文件作为响应。请按照前面提到的步骤上传文件。

在线 Word 到 HTML 转换器

请试用以下使用上述API开发的在线Word到HTML免费转换工具

结论

在本文中,您已了解:

  • 如何在云端使用Python将word doc转成HTML文件;
  • 将HTML文件上传到云端,然后从云端下载转换后的html文件;
  • 如何在不以编程方式使用云存储的情况下将 word 转换为 HTML 文件;
  • 如何将word转成HTML文件并直接下载;

您可以使用 文档 了解有关 GroupDocs.Conversion Cloud API 的更多信息。我们还提供了一个 API 参考 部分,让您可以直接通过浏览器可视化我们的 API 并与之交互。

问一个问题

如果您对 Word 到 HTML 转换器有任何疑问,请随时在 免费支持论坛 上向我们提问。

也可以看看

我们建议您访问以下文章以了解: