Cách chuyển đổi Word sang HTML trực tuyến bằng Python

Chuyển đổi Word sang HTML trực tuyến bằng Python

Là nhà phát triển Python, bạn có thể dễ dàng chuyển đổi tài liệu Word thành tệp HTML theo chương trình trên đám mây. Các tệp Word chủ yếu được sử dụng để chia sẻ dữ liệu cá nhân và chính thức. Tuy nhiên, nếu bạn muốn xem hoặc hiển thị tài liệu trong trình duyệt web thì một giải pháp thông minh là chuyển đổi Word sang HTML Online bằng Python. Chuyển đổi Word sang Html rất hữu ích để có thể dễ dàng tải các tệp html lên Internet. Trong bài viết này, bạn sẽ tìm hiểu cách chuyển đổi Word sang HTML trực tuyến bằng Python.

Các chủ đề sau đây sẽ được đề cập trong bài viết này:

API REST chuyển đổi từ Word sang HTML và SDK Python

Để chuyển đổi tệp Word sang HTML, tôi sẽ sử dụng Python SDK của GroupDocs.Conversion Cloud API. API này cho phép bạn chuyển đổi tài liệu và hình ảnh của bất kỳ định dạng tệp được hỗ trợ nào sang bất kỳ định dạng nào bạn cần. Bạn có thể dễ dàng chuyển đổi giữa hơn 50 loại tài liệu và hình ảnh như Word, PowerPoint, Excel, PDF, HTML, CAD, hình ảnh raster, v.v.

Bạn có thể cài đặt GroupDocs.Conversion Cloud cho dự án Python của mình bằng lệnh sau trong bảng điều khiển:

pip install groupdocs_conversion_cloud

Vui lòng lấy ID khách hàng và Bí mật khách hàng của bạn từ bảng điều khiển trước khi bạn bắt đầu làm theo các bước và ví dụ về mã có sẵn. Khi bạn có ID và bí mật của mình, vui lòng thêm mã như hình bên dưới:

# Nhập Python SDK vào ứng dụng python của bạn từ http://api.groupdocs.cloud
import groupdocs_conversion_cloud

# Nhận client_id và client_secret từ https://dashboard.groupdocs.cloud sau khi đăng ký miễn phí.
client_id = "xxxxxxx-xxxx-xxxx-xxxx-xxxxxxxxxxxx"
client_secret = "xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx"

# Nhận cấu hình API tệp 
configuration = groupdocs_conversion_cloud.Configuration(client_id, client_secret)
configuration.api_base_url = "https://api.groupdocs.cloud"
storage_name = "LocalStorage"

Chuyển đổi Word sang HTML bằng API REST trong Python

Bạn có thể chuyển đổi tệp Word sang HTML bằng cách thực hiện theo các bước đơn giản được đề cập bên dưới:

Tải lên tài liệu

Đầu tiên, tải tệp Word lên đám mây bằng ví dụ mã được cung cấp bên dưới:

# Tải tệp từ lên bộ nhớ đám mây
# Tạo một phiên bản của tệp API
file_api = groupdocs_conversion_cloud.FileApi.from_config(configuration)

# Yêu cầu tệp tải lên cuộc gọi
request = groupdocs_conversion_cloud.UploadFileRequest("python-testing\sample-word.docx", "H:\\groupdocs-cloud-data\\word-file.docx", storage_name)

# Tải tệp docx lên đám mây
response = file_api.upload_file(request)
print(response.uploaded)

Do đó, tệp Word đã tải lên sẽ có sẵn trong phần tệp của trang tổng quan của bạn trên đám mây.

Chuyển Word sang HTML bằng Python

Bạn có thể dễ dàng chuyển đổi Word sang HTML theo chương trình bằng cách thực hiện theo các bước dưới đây:

  • Tạo một phiên bản ConvertApi
  • Tạo một phiên bản của ConvertSettings
  • Đặt đường dẫn file Word
  • Gán “html” cho định dạng
  • Cung cấp đường dẫn tệp đầu ra
  • Xác định HtmlConvertOptions nếu cần
  • Đặt các thuộc tính khác nhau, chẳng hạn như from\page và pages\count, v.v.
  • Tạo ConvertDocumentRequest với ConvertSettings
  • Nhận kết quả bằng cách gọi phương thức convert\document() với ConvertDocumentRequest

Ví dụ mã sau đây cho thấy cách chuyển đổi Word sang HTML mà không làm mất định dạng bằng API REST:

# Cách chuyển đổi Word sang HTML bằng Python
# Tạo các phiên bản API cần thiết
convert_api = groupdocs_conversion_cloud.ConvertApi.from_keys(client_id, client_secret)

# Chuẩn bị cài đặt chuyển đổi
settings = groupdocs_conversion_cloud.ConvertSettings()
settings.file_path = "python-testing/sample-word.docx"
settings.format = "html"
settings.output_path = "python-testing"

# Tùy chọn chuyển đổi Html
convertOptions = groupdocs_conversion_cloud.HtmlConvertOptions()
convertOptions.from_page = 1 
convertOptions.pages_count = 1

settings.convert_options = convertOptions

# Tạo yêu cầu tài liệu chuyển đổi
request = groupdocs_conversion_cloud.ConvertDocumentRequest(settings)

# Chuyển đổi các trang của Word sang tệp HTML
result = convert_api.convert_document(request)
print("Converted range of pages from Word to HTML web page: " + result[0].path)

Tải xuống tệp đã chuyển đổi

Mẫu mã trên sẽ lưu tệp html đã chuyển đổi trên đám mây. Bạn có thể tải xuống bằng mẫu mã sau:

# Khởi tạo API để tải xuống tệp đã chuyển đổi
import shutil
file_api = groupdocs_conversion_cloud.FileApi.from_config(configuration)

# Tạo yêu cầu tệp tải xuống
request = groupdocs_conversion_cloud.DownloadFileRequest("python-testing\\sample-word.html", storage_name)

# Tải xuống tệp đã chuyển đổi
response = file_api.download_file(request)

# Di chuyển tệp đã tải xuống vào thư mục của bạn
shutil.move(response, "H:\\groupdocs-cloud-data\\")

Chuyển đổi Word sang HTML mà không cần sử dụng Cloud Storage

Bạn có thể chuyển đổi tài liệu Word sang HTML mà không cần sử dụng bộ nhớ đám mây bằng cách thực hiện theo các bước dưới đây:

  • Tạo một phiên bản của ConvertApi
  • Tạo ConvertDocumentDirectRequest và chuyển định dạng tài liệu được yêu cầu và đường dẫn tệp đầu vào
  • Nhận kết quả bằng cách gọi phương thức convert\document\direct() với ConvertDocumentDirectRequest
  • Tùy chọn, lưu tệp đầu ra vào đường dẫn cục bộ bằng phương thức Shutil.move()

Ví dụ mã sau đây cho thấy cách chuyển đổi Word sang HTML mà không cần sử dụng lưu trữ đám mây:

# Chuyển đổi Word sang HTML mà không cần sử dụng bộ nhớ đám mây
# Tạo các phiên bản API cần thiết
import shutil
convert_api = groupdocs_conversion_cloud.ConvertApi.from_keys(client_id, client_secret)

# Chuẩn bị yêu cầu chuyển đổi
request = groupdocs_conversion_cloud.ConvertDocumentDirectRequest("html", "H:\\groupdocs-cloud-data\\word-file.docx")

# Chuyển đổi Word sang HTML mà không cần lưu trữ đám mây
response = convert_api.convert_document_direct(request)

# Di chuyển tệp đã tải xuống vào thư mục làm việc của bạn
shutil.move(response, "H:\\groupdocs-cloud-data\\")

Bạn sẽ chuyển tệp đầu vào trong phần thân yêu cầu và nhận tệp đầu ra trong phản hồi API.

Cách chuyển đổi Word sang HTML và tải xuống trực tiếp

Bạn có thể dễ dàng chuyển đổi tệp Word sang HTML theo chương trình bằng cách thực hiện theo các bước dưới đây:

  • Tạo một phiên bản ConvertApi
  • Tạo một phiên bản của ConvertSettings
  • Đặt đường dẫn file Word
  • Gán “html” cho định dạng
  • Đặt “Không” cho đường dẫn đầu ra
  • Tạo ConvertDocumentRequest với ConvertSettings
  • Nhận kết quả bằng cách gọi phương thức convert\document\download()
  • Tùy chọn, lưu tệp đầu ra vào đường dẫn cục bộ bằng phương thức Shutil.move()

Ví dụ mã sau đây cho thấy cách chuyển đổi Word sang HTML và tải xuống trực tiếp bằng API REST trong Python:

# Cách chuyển đổi Word sang HTML và tải xuống trực tiếp
# Tạo các phiên bản API cần thiết
import shutil
convert_api = groupdocs_conversion_cloud.ConvertApi.from_keys(client_id, client_secret)

# Chuẩn bị cài đặt chuyển đổi
settings = groupdocs_conversion_cloud.ConvertSettings()
settings.file_path = "python-testing/sample-word.docx"
settings.format = "html"

# đầu ra dưới dạng tài liệu IOStream
settings.output_path = None    

# Chuẩn bị yêu cầu chuyển đổi
request = groupdocs_conversion_cloud.ConvertDocumentRequest(settings)

# Chuyển trực tiếp file Word sang HTML
response = convert_api.convert_document_download(request)

# Di chuyển tệp đã tải xuống vào thư mục làm việc của bạn
shutil.move(response, "H:\\groupdocs-cloud-data\\")

API sẽ trả lại tệp html đã chuyển đổi để phản hồi. Vui lòng làm theo các bước được đề cập trước đó để tải tệp lên.

Trình chuyển đổi Word sang HTML trực tuyến

Vui lòng thử [công cụ chuyển đổi Word sang HTML miễn phí trực tuyến] sau 14, được phát triển bằng API trên.

Phần kết luận

Trong bài viết này, bạn đã học được:

  • cách chuyển đổi từ tài liệu sang tệp HTML bằng Python trên đám mây;
  • tải tệp HTML lên đám mây và sau đó tải xuống tệp html đã chuyển đổi từ đám mây;
  • cách chuyển đổi từ sang tệp HTML mà không cần sử dụng lưu trữ đám mây theo lập trình;
  • cách chuyển file word sang HTML và tải trực tiếp;

Bạn có thể tìm hiểu thêm về GroupDocs.Conversion Cloud API bằng cách sử dụng tài liệu. Chúng tôi cũng cung cấp phần Tham khảo API cho phép bạn hình dung và tương tác trực tiếp với các API của chúng tôi thông qua trình duyệt.

Đặt một câu hỏi

Nếu bạn có bất kỳ câu hỏi nào về trình chuyển đổi Word sang HTML, vui lòng hỏi chúng tôi trên Diễn đàn hỗ trợ miễn phí.

Xem thêm

Chúng tôi khuyên bạn nên truy cập các bài viết sau để tìm hiểu về: