
Phát triển bộ chuyển đổi PDF sang HTML với Java REST API.
Chuyển đổi PDF tài liệu sang định dạng HTML là điều cần thiết cho phát triển web, quản lý nội dung và cải thiện tính truy cập. Dù bạn cần hiển thị tài liệu trực tuyến hay tái sử dụng nội dung cho các ứng dụng dựa trên web, việc chuyển đổi PDF sang HTML bằng Java REST API cung cấp một giải pháp đơn giản và hiệu quả. Trong bài viết này, chúng ta sẽ khám phá quy trình từng bước để biến đổi các tệp PDF thành định dạng HTML bằng cách sử dụng GroupDocs.Conversion Cloud SDK cho Java.
Bài viết này đề cập đến các chủ đề sau:
- REST API cho chuyển đổi PDF sang HTML
- Chuyển PDF sang HTML bằng Java
- Chuyển đổi PDF thành trang web bằng lệnh cURL
REST API cho Chuyển đổi PDF sang HTML
GroupDocs.Conversion Cloud SDK for Java cung cấp một giải pháp mạnh mẽ và linh hoạt để chuyển đổi tài liệu PDF sang định dạng HTML với độ chính xác cao. API bảo tồn cấu trúc tài liệu, hình ảnh và định dạng trong khi cho phép tùy chỉnh phạm vi trang, cấu trúc đầu ra và chất lượng hình ảnh.
Cài đặt
Để cài đặt GroupDocs.Conversion Cloud SDK cho Java, thêm phụ thuộc Maven sau:
<repository>
<id>repository.groupdocs.cloud</id>
<name>repository.groupdocs.cloud</name>
<url>https://releases.groupdocs.cloud/java/repo/</url>
</repository>
<dependency>
<groupId>com.groupdocs</groupId>
<artifactId>groupdocs-conversion-cloud</artifactId>
<version>24.2.0</version>
</dependency>
Đảm bảo rằng bạn có thông tin xác thực API hợp lệ (Client ID và Client Secret).Làm theo tutorial để có được chúng.
Chuyển đổi PDF sang HTML bằng Java
Theo các bước sau để tự động chuyển đổi PDF sang HTML trong Java:
- Khởi tạo
Configuration
với thông tin đăng nhập API:
Configuration configuration = new Configuration(clientId, clientSecret);
- Tạo một phiên bản của
ConvertApi
:
ConvertApi convertApi = new ConvertApi(configuration);
- Upload the input PDF file to cloud storage:
FileApi fileApi = new FileApi(configuration);
UploadFileRequest uploadRequest = new UploadFileRequest("marketing.pdf", new FileInputStream("marketing.pdf"), "internal");
fileApi.uploadFile(uploadRequest);
- Tạo một thể hiện của lớp
ConvertSettings
nơi chúng ta định nghĩa tên PDF đầu vào, định dạng đầu ra làhtml
và tên của tệp kết quả:
ConvertSettings settings = new ConvertSettings();
settings.setStorageName("internal");
settings.setFilePath("input.pdf");
settings.setFormat("html");
settings.setOutputPath("finalOutput.html");
- Thực hiện chuyển đổi PDF sang PPT bằng cách sử dụng lớp
ConvertDocumentRequest
nơi chúng ta truyền đối tượngConvertSettings
làm tham số:
ConvertDocumentRequest request = new ConvertDocumentRequest(settings);
convertApi.convertDocument(request);
// More examples over https://github.com/groupdocs-conversion-cloud/groupdocs-conversion-cloud-dotnet
// Lấy thông tin xác thực API của bạn
string clientId = "XXXXXX-XXXXXXXXX-4088-9ca0-55c38f4b7f22";
string clientSecret1 = "XXXXXXXXXXXXXXXXXXXX";
// Tạo một thể hiện của lớp Configuration và khởi tạo nó với Client ID & Client Secret.
Configuration configuration = new Configuration(clientId, clientSecret);
// Định nghĩa URL cơ sở API cho thao tác chuyển đổi tệp PDF sang HTML.
configuration.setApiBaseUrl("https://api.groupdocs.cloud");
// Khởi tạo một phiên bản của ConvertApi với đối tượng Configuration
ConvertApi convertApi = new ConvertApi(configuration);
ConvertSettings settings = new ConvertSettings();
settings.setStorageName("internal");
settings.setFilePath("input.pdf");
settings.setFormat("html");
settings.setOutputPath("myResultant.html");
// Kích hoạt API ConvertDocument để chuyển đổi PDF sang HTML
ConvertDocumentRequest request = new ConvertDocumentRequest(settings);
List<StoredConvertedResult> response = convertApi.convertDocument(request);
// Kiểm tra phản hồi và in thông báo thành công
if (response != null && response.equals("OK")) {
System.out.println("The PDF to HTML file conversion completed successfully!");
}
Hình ảnh:- Một bản xem trước của việc chuyển đổi PDF sang HTML.
Tải xuống tệp PDF mẫu được sử dụng trong ví dụ ở trên từ input.pdf.
Chuyển đổi PDF thành Trang Web bằng lệnh cURL
Đối với người dùng dòng lệnh, GroupDocs.Conversion Cloud API cho phép chuyển đổi PDF sang HTML thông qua các lệnh cURL, giúp việc tự động hóa trở nên liền mạch.
- Tạo mã thông báo truy cập JWT với thông tin đăng nhập của bạn.
- Chạy lệnh cURL sau:
curl -v "https://api.groupdocs.cloud/v2.0/conversion" \
-X POST \
-H "accept: application/json" \
-H "authorization: Bearer {accessToken}" \
-H "Content-Type: application/json" \
-d "{ \"StorageName\": \"default\", \"FilePath\": \"{sourcePDF}\", \"Format\": \"html\", \"OutputPath\": \"{finalOutput}\"}"
Thay thế sourceFile, resultantFile, và accessToken bằng các giá trị thực tế.
- Nếu bạn có yêu cầu lưu tệp HTML kết quả trên ổ đĩa cục bộ, hãy thực hiện câu lệnh cURL sau:
curl -v "https://api.groupdocs.cloud/v2.0/conversion" \
-X POST \
-H "accept: application/json" \
-H "authorization: Bearer {accessToken}" \
-H "Content-Type: application/json" \
-d "{ \"StorageName\": \"default\", \"FilePath\": \"{sourceFile}\", \"Format\": \"html\"}" \
-o "myFinaloutput.html"
Thử Công Cụ Chuyển Đổi PDF Sang HTML Miễn Phí Của Chúng Tôi
Sử dụng PDF to HTML Converter của chúng tôi để có trải nghiệm chuyển đổi trực tuyến nhanh chóng và hiệu quả.
Liên kết hữu ích
Kết luận
Dù sử dụng GroupDocs.Conversion Cloud SDK cho Java hay lệnh cURL, cả hai phương pháp đều cung cấp một cách nhanh chóng, chính xác và linh hoạt để chuyển đổi PDF sang HTML. Với xử lý dựa trên đám mây, tùy chỉnh cao và API thân thiện với nhà phát triển, GroupDocs.Conversion Cloud đã đơn giản hóa việc chuyển đổi tài liệu. Hãy thử Java SDK của chúng tôi hôm nay để tự động hóa quy trình chuyển đổi PDF sang HTML một cách liền mạch!
Bài viết được đề xuất
Chúng tôi rất khuyến khích bạn khám phá các bài viết sau: