bộ chuyển đổi pdf sang html

Phát triển bộ chuyển đổi PDF sang HTML với Java REST API.

Chuyển đổi PDF tài liệu sang định dạng HTML là điều cần thiết cho phát triển web, quản lý nội dung và cải thiện tính truy cập. Dù bạn cần hiển thị tài liệu trực tuyến hay tái sử dụng nội dung cho các ứng dụng dựa trên web, việc chuyển đổi PDF sang HTML bằng Java REST API cung cấp một giải pháp đơn giản và hiệu quả. Trong bài viết này, chúng ta sẽ khám phá quy trình từng bước để biến đổi các tệp PDF thành định dạng HTML bằng cách sử dụng GroupDocs.Conversion Cloud SDK cho Java.

Bài viết này đề cập đến các chủ đề sau:

REST API cho Chuyển đổi PDF sang HTML

GroupDocs.Conversion Cloud SDK for Java cung cấp một giải pháp mạnh mẽ và linh hoạt để chuyển đổi tài liệu PDF sang định dạng HTML với độ chính xác cao. API bảo tồn cấu trúc tài liệu, hình ảnh và định dạng trong khi cho phép tùy chỉnh phạm vi trang, cấu trúc đầu ra và chất lượng hình ảnh.

Cài đặt

Để cài đặt GroupDocs.Conversion Cloud SDK cho Java, thêm phụ thuộc Maven sau:

<repository>
    <id>repository.groupdocs.cloud</id>
    <name>repository.groupdocs.cloud</name>
    <url>https://releases.groupdocs.cloud/java/repo/</url>
</repository>
<dependency>
    <groupId>com.groupdocs</groupId>
    <artifactId>groupdocs-conversion-cloud</artifactId>
    <version>24.2.0</version>
</dependency>

Đảm bảo rằng bạn có thông tin xác thực API hợp lệ (Client ID và Client Secret).Làm theo tutorial để có được chúng.

Chuyển đổi PDF sang HTML bằng Java

Theo các bước sau để tự động chuyển đổi PDF sang HTML trong Java:

  1. Khởi tạo Configuration với thông tin đăng nhập API:
Configuration configuration = new Configuration(clientId, clientSecret);
  1. Tạo một phiên bản của ConvertApi:
ConvertApi convertApi = new ConvertApi(configuration);
  1. Upload the input PDF file to cloud storage:
FileApi fileApi = new FileApi(configuration);
UploadFileRequest uploadRequest = new UploadFileRequest("marketing.pdf", new FileInputStream("marketing.pdf"), "internal");
fileApi.uploadFile(uploadRequest);
  1. Tạo một thể hiện của lớp ConvertSettings nơi chúng ta định nghĩa tên PDF đầu vào, định dạng đầu ra là html và tên của tệp kết quả:
ConvertSettings settings = new ConvertSettings();
settings.setStorageName("internal");
settings.setFilePath("input.pdf");
settings.setFormat("html");
settings.setOutputPath("finalOutput.html");
  1. Thực hiện chuyển đổi PDF sang PPT bằng cách sử dụng lớp ConvertDocumentRequest nơi chúng ta truyền đối tượng ConvertSettings làm tham số:
ConvertDocumentRequest request = new ConvertDocumentRequest(settings);
convertApi.convertDocument(request);
// More examples over https://github.com/groupdocs-conversion-cloud/groupdocs-conversion-cloud-dotnet
// Lấy thông tin xác thực API của bạn 
string clientId = "XXXXXX-XXXXXXXXX-4088-9ca0-55c38f4b7f22";
string clientSecret1 = "XXXXXXXXXXXXXXXXXXXX";

// Tạo một thể hiện của lớp Configuration và khởi tạo nó với Client ID & Client Secret.
Configuration configuration = new Configuration(clientId, clientSecret);
// Định nghĩa URL cơ sở API cho thao tác chuyển đổi tệp PDF sang HTML.
configuration.setApiBaseUrl("https://api.groupdocs.cloud");

// Khởi tạo một phiên bản của ConvertApi với đối tượng Configuration
ConvertApi convertApi = new ConvertApi(configuration);

ConvertSettings settings = new ConvertSettings();
settings.setStorageName("internal");
settings.setFilePath("input.pdf");
settings.setFormat("html");
settings.setOutputPath("myResultant.html");
    
// Kích hoạt API ConvertDocument để chuyển đổi PDF sang HTML
ConvertDocumentRequest request = new ConvertDocumentRequest(settings);
List<StoredConvertedResult> response = convertApi.convertDocument(request);
    
// Kiểm tra phản hồi và in thông báo thành công
if (response != null && response.equals("OK")) {
    System.out.println("The PDF to HTML file conversion completed successfully!");
}
pdf miễn phí sang html trực tuyến

Hình ảnh:- Một bản xem trước của việc chuyển đổi PDF sang HTML.

Tải xuống tệp PDF mẫu được sử dụng trong ví dụ ở trên từ input.pdf.

Chuyển đổi PDF thành Trang Web bằng lệnh cURL

Đối với người dùng dòng lệnh, GroupDocs.Conversion Cloud API cho phép chuyển đổi PDF sang HTML thông qua các lệnh cURL, giúp việc tự động hóa trở nên liền mạch.

  • Tạo mã thông báo truy cập JWT với thông tin đăng nhập của bạn.
  • Chạy lệnh cURL sau:
curl -v "https://api.groupdocs.cloud/v2.0/conversion" \
-X POST \
-H "accept: application/json" \
-H "authorization: Bearer {accessToken}" \
-H "Content-Type: application/json" \
-d "{  \"StorageName\": \"default\",  \"FilePath\": \"{sourcePDF}\",  \"Format\": \"html\",  \"OutputPath\": \"{finalOutput}\"}"

Thay thế sourceFile, resultantFile, và accessToken bằng các giá trị thực tế.

  • Nếu bạn có yêu cầu lưu tệp HTML kết quả trên ổ đĩa cục bộ, hãy thực hiện câu lệnh cURL sau:
curl -v "https://api.groupdocs.cloud/v2.0/conversion" \
-X POST \
-H "accept: application/json" \
-H "authorization: Bearer {accessToken}" \
-H "Content-Type: application/json" \
-d "{  \"StorageName\": \"default\",  \"FilePath\": \"{sourceFile}\",  \"Format\": \"html\"}" \
-o "myFinaloutput.html"

Thử Công Cụ Chuyển Đổi PDF Sang HTML Miễn Phí Của Chúng Tôi

Sử dụng PDF to HTML Converter của chúng tôi để có trải nghiệm chuyển đổi trực tuyến nhanh chóng và hiệu quả.

Chuyển đổi PDF sang PPT miễn phí trực tuyến

Liên kết hữu ích

Kết luận

Dù sử dụng GroupDocs.Conversion Cloud SDK cho Java hay lệnh cURL, cả hai phương pháp đều cung cấp một cách nhanh chóng, chính xác và linh hoạt để chuyển đổi PDF sang HTML. Với xử lý dựa trên đám mây, tùy chỉnh cao và API thân thiện với nhà phát triển, GroupDocs.Conversion Cloud đã đơn giản hóa việc chuyển đổi tài liệu. Hãy thử Java SDK của chúng tôi hôm nay để tự động hóa quy trình chuyển đổi PDF sang HTML một cách liền mạch!

Bài viết được đề xuất

Chúng tôi rất khuyến khích bạn khám phá các bài viết sau: