PDF là một trong những định dạng tệp được sử dụng phổ biến nhất hiện nay, hỗ trợ nhiều nền tảng. Nhưng rất khó để liên kết đến một trang cụ thể trong tài liệu PDF và các tệp PDF không dễ dàng chia sẻ trên mạng xã hội. Bạn có thể giữ giao diện của tài liệu PDF ở định dạng HTML để có thể thao tác nhanh chóng. Trong bài viết này, chúng ta sẽ tìm hiểu cách chuyển đổi tệp PDF sang HTML bằng Python.

Các chủ đề sau đây sẽ được đề cập trong bài viết này:

API chuyển đổi PDF sang HTML của Python – Cài đặt

Để chuyển đổi tệp PDF thành các trang web HTML, chúng tôi sẽ sử dụng Python SDK của GroupDocs.Conversion Cloud API. Nó là một thư viện Python chuyển đổi hình ảnh và tài liệu độc lập với nền tảng, giàu tính năng. Nó cung cấp khả năng chuyển đổi nhanh chóng hình ảnh và tài liệu của bất kỳ định dạng tệp được hỗ trợ nào sang bất kỳ định dạng nào với chất lượng cao.

Bạn có thể cài đặt và tích hợp thư viện Python chuyển đổi PDF sang HTML vào các ứng dụng Python của mình bằng lệnh sau trong bảng điều khiển:

pip install groupdocs_conversion_cloud

Vui lòng lấy Client ID và Secret của bạn từ bảng điều khiển trước khi làm theo các bước được đề cập. Khi bạn có ID và bí mật của mình, hãy thêm mã vào ứng dụng python của bạn:

# Tải thư viện Python để chuyển đổi PDF sang HTML trong ứng dụng python
import groupdocs_conversion_cloud

# Nhận client_id và client_secret từ https://dashboard.groupdocs.cloud sau khi đăng ký miễn phí.
client_id = "xxxxxxx-xxxx-xxxx-xxxx-xxxxxxxxxxxx"
client_secret = "xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx"

# Nhận các cấu hình khác nhau
configuration = groupdocs_conversion_cloud.Configuration(client_id, client_secret)
configuration.api_base_url = "https://api.groupdocs.cloud"
your_storage = "groupdocs-storage-name"

Bây giờ, hãy trình bày cách từng bước chuyển đổi định dạng pdf sang html bằng API REST trong Python.

Cách chuyển đổi PDF sang HTML trực tuyến bằng Python bằng API REST

Chúng tôi có thể chuyển đổi tệp pdf sang định dạng html theo chương trình bằng cách thực hiện theo các bước đơn giản dưới đây:

  • Đầu tiên, tạo một phiên bản của ConvertApi
  • Sau đó, tạo phiên bản cài đặt chuyển đổi bằng ConvertSettings
  • Tiếp theo, cung cấp tên lưu trữ tệp
  • Đặt đường dẫn tệp PDF đầu vào và định dạng đầu ra là “html”
  • Tiếp theo, tạo một phiên bản của PdfLoadOptions.
  • Cung cấp mật khẩu tệp PDF
  • Sau đó, đặt đầu ra\đường dẫn và tải\tùy chọn
  • Sau đó, tạo ConvertDocumentRequest với ConvertSettings làm đối số
  • Cuối cùng, chuyển đổi pdf sang html bằng cách gọi convert\document() với ConvertDocumentRequest

Mẫu mã sau đây cho biết cách thay đổi định dạng pdf thành html trong Python:

# Cách Python Chuyển đổi PDF sang HTML trực tuyến
try:
  # Tạo một phiên bản của API
  convert_api = groupdocs_conversion_cloud.ConvertApi.from_keys(client_id, client_secret)

  # Xác định cài đặt chuyển đổi
  settings = groupdocs_conversion_cloud.ConvertSettings()
  settings.storage_name = your_storage
  settings.file_path = "python-testing/sample-pdf-file.pdf"
  settings.format = "html"

  loadOptions = groupdocs_conversion_cloud.PdfLoadOptions()
  loadOptions.password = "password"

  settings.load_options = loadOptions
  settings.output_path = "python-testing"

  # Tạo yêu cầu tài liệu chuyển đổi
  request = groupdocs_conversion_cloud.ConvertDocumentRequest(settings)

  # Chuyển đổi tệp .pdf sang trang web HTML
  result = convert_api.convert_document(request)
  print("pdf File converted to html successfully: " + result[0].path)

except groupdocs_conversion_cloud.ApiException as e:
  print("Exception when calling convert_document: {0}".format(e.message))

Cuối cùng, mẫu mã trên sẽ lưu tệp HTML trên đám mây. Đây là cách tốt nhất để chuyển đổi tài liệu pdf sang html.

Cách chuyển đổi tệp PDF sang HTML bằng Python

Cách chuyển đổi tệp PDF sang HTML bằng Python

Chuyển đổi phạm vi trang từ tệp PDF sang tệp HTML bằng Python

Chúng tôi có thể chuyển đổi nhiều trang của tài liệu PDF sang HTML bằng cách làm theo các bước dưới đây:

  • Đầu tiên, tạo một phiên bản của ConvertApi
  • Sau đó, tạo phiên bản cài đặt chuyển đổi bằng ConvertSettings
  • Tiếp theo, cung cấp tên lưu trữ đám mây của bạn
  • Đặt đường dẫn tệp PDF đầu vào và định dạng đầu ra là “html”
  • Tiếp theo, tạo một phiên bản của HtmlConvertOptions
  • Đặt tùy chọn from\page và pages\count
  • Sau đó, đặt đường dẫn đầu ra và convertOptions
  • Bây giờ, hãy tạo ConvertDocumentRequest với ConvertSettings làm đối số
  • Cuối cùng, chuyển đổi mã pdf sang html trực tuyến bằng cách gọi phương thức convert\document() với ConvertDocumentRequest

Mẫu mã sau đây cho biết cách chuyển đổi một loạt các trang từ tài liệu PDF sang tệp HTML bằng Python:

# Cách chuyển đổi phạm vi trang từ PDF sang HTML bằng Python
# Tạo một phiên bản API
convert_api = groupdocs_conversion_cloud.ConvertApi.from_keys(client_id, client_secret)

# Chuẩn bị cài đặt chuyển đổi html
settings = groupdocs_conversion_cloud.ConvertSettings()
settings.storage_name = your_storage
settings.file_path = "python-testing/sample-pdf-file.pdf"
settings.format = "html"

# Tùy chọn chuyển đổi PDF: số trang bắt đầu và tổng số trang để chuyển đổi
convertOptions = groupdocs_conversion_cloud.HtmlConvertOptions()
convertOptions.from_page = 1 
convertOptions.pages_count = 1

settings.convert_options = convertOptions
settings.output_path = "python-testing"

# Tạo yêu cầu tài liệu chuyển đổi
request = groupdocs_conversion_cloud.ConvertDocumentRequest(settings)

# Chuyển đổi các trang của tệp PDF sang tệp HTML
result = convert_api.convert_document(request)
print("Converted range of pages from PDF to HTML web page: " + result[0].path)

Cuối cùng, mẫu mã trên sẽ lưu tài liệu sau khi chuyển đổi từ pdf sang html trực tuyến trên đám mây.

Chuyển đổi các trang cụ thể từ định dạng PDF sang HTML bằng Python

Chúng tôi có thể chuyển đổi các trang cụ thể của tài liệu PDF sang HTML bằng cách sử dụng trình chuyển đổi pdf sang html trực tuyến tốt nhất bằng hình ảnh bằng cách thực hiện theo các bước dưới đây:

  • Đầu tiên, tạo một phiên bản của ConvertApi
  • Sau đó, tạo phiên bản cài đặt chuyển đổi bằng ConvertSettings
  • Tiếp theo, cung cấp tên lưu trữ đám mây của bạn
  • Đặt đường dẫn tệp PDF đầu vào và định dạng đầu ra là “html”
  • Tiếp theo, tạo một phiên bản của HtmlConvertOptions
  • Thêm số trang để chuyển đổi ở định dạng mảng
  • Sau đó, đặt đường dẫn đầu ra và convertOptions
  • Bây giờ, hãy tạo ConvertDocumentRequest với ConvertSettings làm đối số
  • Cuối cùng, chuyển đổi mã pdf sang html trực tuyến bằng cách gọi phương thức convert\document() với ConvertDocumentRequest

Mẫu mã sau đây cho biết cách xuất các trang nhất định của tài liệu PDF sang tệp HTML bằng Python:

# Cách chuyển đổi các trang cụ thể của tệp PDF sang định dạng trang web HTML bằng Python
# Tạo một phiên bản API
convert_api = groupdocs_conversion_cloud.ConvertApi.from_keys(client_id, client_secret)

# Xác định cài đặt chuyển đổi
settings = groupdocs_conversion_cloud.ConvertSettings()
settings.storage_name = your_storage
settings.file_path = "python-testing/sample-pdf-file.pdf"
settings.format = "html"

# Tùy chọn chuyển đổi PDF: số trang để chuyển đổi
convertOptions = groupdocs_conversion_cloud.HtmlConvertOptions()
convertOptions.pages = [1, 3, 5]

settings.convert_options = convertOptions
settings.output_path = "python-testing"

# Tạo yêu cầu tài liệu chuyển đổi
request = groupdocs_conversion_cloud.ConvertDocumentRequest(settings)

# Chuyển đổi tệp PDF sang tệp HTML
result = convert_api.convert_document(request)
print("Successfully converted PDF file to HTML document: " + result[0].path)

Cuối cùng, mẫu mã trên sẽ chuyển đổi pdf sang html với hình ảnh trên đám mây. Có một công cụ chuyển đổi mã pdf sang html trực tuyến như được giải thích bên dưới.

Trình chuyển đổi PDF sang HTML trực tuyến miễn phí

Trình chuyển đổi PDF sang HTML tốt nhất là gì? Groupdocs.Conversion cung cấp trình chuyển đổi pdf sang html trực tuyến miễn phí tốt nhất để bạn chuyển đổi định dạng PDF sang HTML. Nó đã được phát triển bằng API Groupdocs.Conversion trực tuyến từ pdf sang html.

Phần kết luận

Trong bài viết này, bạn đã học được:

  • cách chuyển pdf sang html không mất định dạng trong Python;
  • cách chuyển đổi tệp pdf sang html theo phạm vi bằng Python;
  • chuyển đổi các trang PDF cụ thể sang định dạng HTML bằng Python;
  • trình chuyển đổi pdf sang html trực tuyến miễn phí;

Ngoài ra, bạn có thể tìm hiểu thêm về API chuyển đổi định dạng tệp GroupDocs.Conversion bằng cách sử dụng tài liệu.

Đặt một câu hỏi

Bạn có thể đặt câu hỏi về cách chuyển đổi tệp pdf sang định dạng html thông qua Diễn đàn hỗ trợ miễn phí của chúng tôi

Xem thêm