Chuyển đổi PDF sang HTML bằng API REST trong Ruby

Chuyển đổi PDF sang HTML bằng API REST trong Ruby

Bạn có thể cần chuyển đổi tệp PDF thành HTML vì HTML thường tốt hơn nhiều để cung cấp thông tin qua web. Để thực hiện chuyển đổi pdf sang html này bằng cách giữ nguyên định dạng theo lập trình, bài viết này sẽ đề cập đến cách chuyển đổi PDF sang HTML bằng API REST trong Ruby. Hơn nữa, bạn cũng sẽ học cách sử dụng các tùy chọn bổ sung để chuyển đổi PDF sang HTML bằng cách sử dụng thư viện tải xuống miễn phí trình chuyển đổi pdf sang html trực tuyến.

PDF cho phép chia sẻ và in tài liệu chỉ đọc mà không làm mất định dạng tài liệu. Chúng tôi có thể dễ dàng chuyển đổi tài liệu PDF sang trang web HTML và xem chúng trong bất kỳ trình duyệt nào. Hãy tìm hiểu cách chuyển đổi định dạng pdf sang html bằng Ruby.

Các chủ đề sau đây sẽ được đề cập trong bài viết này:

API REST chuyển đổi PDF sang HTML - Cài đặt

Để chuyển đổi định dạng pdf sang html, chúng tôi sẽ sử dụng Ruby SDK của GroupDocs.Conversion Cloud API. Bạn có thể cài đặt thư viện tải xuống miễn phí tài liệu PDF sang trình chuyển đổi HTML, sử dụng lệnh sau trong bảng điều khiển:

gem install groupdocs_conversion_cloud

Phần mềm chuyển đổi PDF sang HTML này có sẵn để tải xuống miễn phí. Bây giờ, vui lòng lấy ID khách hàng và Bí mật của bạn từ GroupDocs Dashboard trước khi làm theo các bước được đề cập bên dưới. Khi bạn có Client ID và Client Secret, hãy thêm những mã này vào mã ứng dụng ruby như bên dưới:

# Nhận client_id và client_secret của bạn từ https://dashboard.groupdocs.cloud sau khi đăng ký miễn phí.
# Tải đá quý trong ứng dụng ruby của bạn cho http://api.groupdocs.cloud
require 'groupdocs_conversion_cloud'

@client_id = "xxxxxxx-xxxx-xxxx-xxxx-xxxxxxxxxxxx"
@client_secret = "xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx"
# Đặt tên lưu trữ của bạn
@storage_name = "test-internal-storage"

Tiếp theo, hãy khám phá cách từng bước chuyển đổi định dạng pdf sang html bằng API REST trong Ruby.

Chuyển đổi PDF sang HTML bằng API REST trong Ruby

Chúng tôi có thể chuyển đổi tệp pdf sang định dạng html theo chương trình bằng cách thực hiện theo các bước đơn giản dưới đây:

  • Đầu tiên, tạo một phiên bản của ConvertApi
  • Bây giờ, hãy tạo phiên bản cài đặt chuyển đổi bằng ConvertSettings
  • Tiếp theo, cung cấp tên lưu trữ tệp
  • Đặt đường dẫn tệp PDF đầu vào và định dạng tệp đầu ra là “html”
  • Sau đó, cung cấp tên đường dẫn đầu ra
  • Sau đó, tạo ConvertDocumentRequest với ConvertSettings làm đối số
  • Cuối cùng, chuyển pdf sang html bằng cách gọi phương thức convert\document() với ConvertDocumentRequest

Mẫu mã sau đây cho thấy cách thay đổi định dạng pdf thành html trong Ruby.

# Ví dụ mã này trình bày cách chuyển đổi tài liệu pdf sang trang web html.
# Tạo phiên bản ConvertApi
@convert_api = GroupDocsConversionCloud::ConvertApi.from_keys(@client_id, @client_secret)

# Chuẩn bị cài đặt chuyển đổi
@settings = GroupDocsConversionCloud::ConvertSettings.new
@settings.storage_name = @storage_name
@settings.file_path = "pdf-to-html/pdf-pages.pdf"
@settings.format = "html"
@settings.output_path = "pdf-to-html"

# Chuyển đổi pdf sang html
@result = @convert_api.convert_document(GroupDocsConversionCloud::ConvertDocumentRequest.new(@settings))
puts("PDF file successfully converted to HTML.")

Cuối cùng, mẫu mã trên sẽ lưu tệp HTML trên đám mây. Đây là cách tốt nhất để chuyển đổi tài liệu pdf sang html.

Cách chuyển đổi phạm vi trang từ PDF sang HTML

Chúng tôi có thể chuyển đổi nhiều trang của tài liệu PDF sang HTML bằng cách làm theo các bước dưới đây:

  • Đầu tiên, tạo một phiên bản của ConvertApi
  • Bây giờ, hãy tạo phiên bản cài đặt chuyển đổi bằng ConvertSettings
  • Tiếp theo, cung cấp tên lưu trữ tệp
  • Đặt đường dẫn tệp PDF đầu vào và định dạng tệp đầu ra là “html”
  • Tạo một phiên bản của HtmlConvertOptions
  • Đặt các tùy chọn chuyển đổi from\page, pages\count và fixed\layout
  • Sau đó, đặt giá trị convert\options và output\path
  • Sau đó, tạo ConvertDocumentRequest với ConvertSettings làm đối số
  • Cuối cùng, chuyển đổi mã pdf sang html trực tuyến bằng cách gọi phương thức convert\document() với ConvertDocumentRequest

Mẫu mã sau đây cho biết cách chuyển đổi một loạt các trang từ tài liệu PDF sang tệp HTML bằng Ruby.

# Ví dụ mã này trình bày cách chuyển đổi phạm vi trang từ PDF sang HTML trong Ruby
# Tạo phiên bản Api chuyển đổi
@convert_api = GroupDocsConversionCloud::ConvertApi.from_keys(@client_id, @client_secret)
 
# Tạo cài đặt chuyển đổi
@settings = GroupDocsConversionCloud::ConvertSettings.new
@settings.storage_name = @storage_name
@settings.file_path = "pdf-to-html/pdf-pages.pdf"
@settings.format = "html"
@convertOptions = GroupDocsConversionCloud::HtmlConvertOptions.new
@convertOptions.from_page = 1
# Số trang để chuyển đổi
@convertOptions.pages_count = 3
@convertOptions.fixed_layout = true
@settings.convert_options = @convertOptions
@settings.output_path = "pdf-to-html"
 
# Chuyển đổi pdf sang html bằng các tùy chọn nâng cao
@result = @convert_api.convert_document(GroupDocsConversionCloud::ConvertDocumentRequest.new(@settings))
puts("PDF file converted to HTML using advance options.")

Cuối cùng, mẫu mã trên sẽ lưu tài liệu sau khi chuyển đổi từ pdf sang html trực tuyến trên đám mây.

Cách chuyển đổi các trang cụ thể của PDF sang HTML

Chúng tôi có thể chuyển đổi các trang cụ thể của tài liệu PDF sang HTML bằng cách sử dụng trình chuyển đổi pdf sang html trực tuyến tốt nhất bằng hình ảnh bằng cách thực hiện theo các bước dưới đây:

  • Đầu tiên, tạo một phiên bản của ConvertApi
  • Bây giờ, hãy tạo phiên bản cài đặt chuyển đổi bằng ConvertSettings
  • Tiếp theo, cung cấp tên lưu trữ tệp
  • Đặt đường dẫn tệp PDF đầu vào và định dạng tệp đầu ra là “html”
  • Tạo một phiên bản của HtmlConvertOptions
  • Cung cấp tùy chọn chuyển đổi html của bộ sưu tập trang
  • Sau đó, đặt giá trị convert\options và output\path
  • Sau đó, tạo ConvertDocumentRequest với ConvertSettings làm đối số
  • Cuối cùng, chuyển đổi tệp pdf sang tệp html bằng cách gọi phương thức convert\document() với ConvertDocumentRequest

Mẫu mã sau đây cho biết cách xuất các trang nhất định của tài liệu PDF sang tệp HTML bằng Ruby.

# Ví dụ mã này trình bày cách chuyển đổi các trang cụ thể của PDF sang HTML trong Ruby
# Tạo phiên bản api chuyển đổi
@convert_api = GroupDocsConversionCloud::ConvertApi.from_keys(@client_id, @client_secret)
 
# Tạo cài đặt chuyển đổi
@settings = GroupDocsConversionCloud::ConvertSettings.new
@settings.storage_name = @storage_name
@settings.file_path = "pdf-to-html/pdf-pages.pdf"
@settings.format = "html"
@convertOptions = GroupDocsConversionCloud::HtmlConvertOptions.new
# Chỉ mục trang của các trang cụ thể sẽ được chuyển đổi
@convertOptions.pages = [1, 5]
@settings.convert_options = @convertOptions
@settings.output_path = "pdf-to-html"
 
# PDF chuyển đổi các trang cụ thể sang HTML
@response = @convert_api.convert_document(GroupDocsConversionCloud::ConvertDocumentRequest.new(@settings))
puts("PDF certain pages converted to HTML successfully.")

Cuối cùng, mẫu mã trên sẽ chuyển đổi pdf sang html với hình ảnh trên đám mây. Có một công cụ chuyển đổi mã pdf sang html trực tuyến như được giải thích bên dưới.

Công cụ chuyển đổi trực tuyến PDF sang HTML

Làm cách nào để chuyển đổi PDF sang HTML trực tuyến miễn phí? Groupdocs.Conversion cung cấp công cụ chuyển đổi pdf sang html trực tuyến miễn phí để bạn thay đổi định dạng PDF sang HTML. Chỉ cần chọn tệp bạn muốn chuyển đổi và sử dụng trình chuyển đổi pdf sang html trực tuyến miễn phí tốt nhất để biến tệp PDF của bạn thành tệp HTML. Nó đã được phát triển bằng API Groupdocs.Conversion trực tuyến từ pdf sang html.

Phần kết luận

Trong bài viết này, bạn đã học được:

  • cách chuyển pdf sang html không mất định dạng trong Ruby;
  • cách chuyển file pdf sang html theo dãy trong Ruby;
  • chuyển đổi các trang PDF cụ thể sang định dạng HTML;
  • chuyển đổi trực tuyến pdf sang html miễn phí;

Ngoài ra, bạn có thể tìm hiểu thêm về API chuyển đổi định dạng tệp GroupDocs.Conversion bằng cách sử dụng tài liệu.

Đặt một câu hỏi

Nếu bạn có bất kỳ thắc mắc nào về cách chuyển đổi tệp pdf sang định dạng html, vui lòng hỏi chúng tôi tại Diễn đàn hỗ trợ miễn phí

Xem thêm