Cách chuyển đổi tệp PDF sang tài liệu HTML trong Java bằng API REST

Chuyển đổi PDF sang HTML trong Java bằng API REST

Là một nhà phát triển Java, bạn có thể lập trình chuyển đổi các tài liệu PDF(Định dạng Tài liệu Di động) thành các trang web HTML(Ngôn ngữ Đánh dấu Siêu văn bản) bằng cách sử dụng API REST của GroupDocs.Conversion. Trong một số trường hợp nhất định, bạn có thể cần chuyển đổi tệp PDF sang tệp HTML. Ví dụ: bạn cần chia sẻ tài liệu PDF trên mạng xã hội hoặc xuất bản trực tuyến nội dung PDF trên web. với HTML, bạn có thể sử dụng các biểu mẫu, liên kết và các yếu tố tương tác khác và nó cho phép tài liệu có tính tương tác cao hơn. Vì vậy, trong bài viết này, tôi sẽ trình bày cách chuyển đổi PDF sang HTML trong Java bằng API REST.

Các chủ đề sau sẽ được đề cập trong hướng dẫn này:

Java PDF to HTML Converter REST API - Cài đặt Java SDK

Để chuyển đổi tệp PDF sang định dạng HTML, tôi sẽ sử dụng Java SDK của GroupDocs.Conversion Cloud API. Nó giúp bạn bao gồm GroupDocs. Chuyển đổi các dịch vụ Đám mây trong các ứng dụng Java của bạn một cách nhanh chóng và dễ dàng. Đây là API chuyển đổi PDF sang HTML tốt nhất giữ nguyên định dạng văn bản gốc và bố cục tài liệu của bạn. API chuyển đổi của Groupdocs cũng cho phép bạn chuyển đổi các tệp và hình ảnh của bất kỳ định dạng tệp được hỗ trợ nào sang bất kỳ định dạng nào bạn cần. Bạn có thể dễ dàng chuyển đổi giữa hơn 50 loại tài liệu và hình ảnh như Word, PDF, PowerPoint, Excel, HTML, CAD, hình ảnh raster, v.v.

Bạn có thể tải xuống tệp JAR của API hoặc cài đặt bằng cấu hình Maven. Thêm kho lưu trữ và phần phụ thuộc vào POM.xml của dự án của bạn. Dưới đây là hướng dẫn cho Maven:

Kho lưu trữ Maven:

<repository>
    <id>groupdocs-artifact-repository</id>
    <name>GroupDocs Artifact Repository</name>
    <url>https://repository.groupdocs.cloud/repo</url>
</repository>

Phụ thuộc Maven:

 <dependency>
    <groupId>com.groupdocs</groupId
    <artifactId>groupdocs-conversion-cloud</artifactId>
    <version>23.4</version>
    <scope>compile</scope>
</dependency>

Vui lòng lấy Client ID and Client Secret của bạn từ dashboard trước khi bạn bắt đầu làm theo các bước và các mẫu mã có sẵn. Vui lòng nhập mã được hiển thị bên dưới khi bạn có ID và bí mật của mình:

# Nhận client_id và client_secret của bạn từ https://dashboard.groupdocs.cloud sau khi đăng ký miễn phí.

String ClientId = "xxxxxxx-xxxx-xxxx-xxxx-xxxxxxxxxxxx";
String ClientSecret = "xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx";
String MyStorage = "test-internal-storage";
Configuration configuration = new Configuration(ClientId, ClientSecret);

Chuyển đổi tệp PDF thành tài liệu HTML trong Java bằng API REST

Chuyển đổi tài liệu PDF sang trang web HTML cho phép bạn làm cho nội dung dễ tiếp cận hơn, có thể tìm kiếm, tương thích, có thể chỉnh sửa và có thể chia sẻ. Sau đây là các bước để chuyển đổi tài liệu PDF sang HTML như được đề cập bên dưới:

Tải tệp lên

Đầu tiên, tải tài liệu PDF lên bộ nhớ đám mây bằng đoạn mã dưới đây:

package com.groupdocsdev.classes;

import com.groupdocs.cloud.conversion.api.*;
import com.groupdocs.cloud.conversion.model.*;
import com.groupdocs.cloud.conversion.model.requests.*;
import com.groupdocs.cloud.conversion.client.Configuration;
import com.groupdocs.cloud.conversion.client.ApiException;

import java.io.File;

// Tải tệp lên bộ nhớ đám mây bằng Java
public class App {

	public static void main(String[] args) {
				
		// Tạo một phiên bản của API chuyển đổi					
		FileApi apiInstance = new FileApi(configuration);
		try {
			File fileStream = new File("H:\\groupdocs-cloud-data\\input-sample-file.pdf");
			UploadFileRequest request = new UploadFileRequest("java-testing\\input-sample-file.pdf", fileStream, MyStorage);
			FilesUploadResult response = apiInstance.uploadFile(request);
			System.out.println("Expected response type is FilesUploadResult: " + response.getUploaded().size());
		} catch (ApiException e) {
			System.err.println("Exception while calling FileApi:");
			e.printStackTrace();
		}
		
	}
}

Do đó, tệp PDF đã tải lên sẽ có trong phần tệp của trang tổng quan trên đám mây của bạn.

Chuyển đổi PDF sang HTML trong Java

Phần này cho biết cách chuyển đổi một tệp PDF sang trang HTML theo chương trình mà không làm mất định dạng bằng cách thực hiện theo các bước bên dưới:

  • Đầu tiên, tạo một phiên bản ConvertApi
  • Thứ hai, tạo một phiên bản của ConvertSettings
  • Thứ ba, cung cấp tên lưu trữ đám mây
  • Đặt đường dẫn tệp PDF đầu vào và định dạng tệp đầu ra là “html”
  • Bây giờ, đặt đường dẫn tệp HTML đầu ra
  • Tạo ConvertDocumentRequest với ConvertSettings
  • Cuối cùng, gọi phương thức convertdocument() với ConvertDocumentRequest

Đoạn mã sau cho biết cách thay đổi tệp PDF sang định dạng HTML trực tuyến bằng API REST:

package com.groupdocsdev.classes;

import com.groupdocs.cloud.conversion.api.*;
import com.groupdocs.cloud.conversion.model.*;
import com.groupdocs.cloud.conversion.model.requests.*;
import com.groupdocs.cloud.conversion.client.Configuration;
import com.groupdocs.cloud.conversion.client.ApiException;
import java.util.List;

// Cách chuyển đổi tệp PDF sang tệp HTML trong Java.
public class App {

	public static void main(String[] args) {
		
		// Tạo một phiên bản của API chuyển đổi
		ConvertApi apiInstance = new ConvertApi(configuration);
					
		try {
			 
			// Chuẩn bị cài đặt chuyển đổi
			ConvertSettings settings = new ConvertSettings();
			settings.setStorageName(MyStorage);
			settings.setFilePath("java-testing/input-sample-file.pdf");
			settings.setFormat("html");
			
			settings.setOutputPath("java-testing/output-sample-file.html");
		
			// chuyển đổi sang định dạng được chỉ định
			List<StoredConvertedResult> response = apiInstance.convertDocument(new ConvertDocumentRequest(settings));
			System.out.println("Document converted successfully: " + response);
			
		} catch (ApiException e) {
			System.err.println("Exception while calling Java API: ");
			e.printStackTrace();
		}
	}
}

Tải xuống tệp đã chuyển đổi

Mẫu mã trên sẽ lưu trang tệp HTML đã chuyển đổi vào đám mây. Bạn có thể tải xuống bằng đoạn mã sau:

package com.groupdocsdev.classes;

import com.groupdocs.cloud.conversion.api.*;
import com.groupdocs.cloud.conversion.model.requests.*;
import com.groupdocs.cloud.conversion.client.Configuration;
import com.groupdocs.cloud.conversion.client.ApiException;

import java.io.File;

// Tải xuống tệp từ Bộ lưu trữ đám mây trong Java
public class App {

	public static void main(String[] args) {
				
		// Tạo một phiên bản của API chuyển đổi					
		FileApi apiInstance = new FileApi(configuration);
		try {
			DownloadFileRequest request = new DownloadFileRequest("java-testing\\output-sample-file.html", MyStorage, null);
			File response = apiInstance.downloadFile(request);
			System.err.println("Expected response type is File: " + response.length());
		} catch (ApiException e) {
			System.err.println("Exception while calling FileApi:");
			e.printStackTrace();
		}
		
	}
}

Đây là cách thư viện chuyển đổi PDF sang HTML trong java hoạt động. Trong phần tiếp theo, hãy cùng khám phá các cài đặt chuyển đổi nâng cao hơn bằng Java API.

Chuyển đổi trang PDF sang HTML trong Java bằng Tùy chọn nâng cao

Trong phần này, bạn sẽ tìm hiểu cách chuyển đổi tệp PDF thành tài liệu HTML bằng cách sử dụng một số tùy chọn nâng cao theo chương trình bằng cách thực hiện theo các bước và đoạn mã như hình bên dưới:

  • Đầu tiên, tạo một thể hiện của lớp ConvertApi
  • Tạo một thể hiện của lớp ConvertSettings
  • Tiếp theo, cung cấp tên lưu trữ đám mây
  • Đặt đường dẫn tệp PDF đầu vào và định dạng tệp đầu ra là “html”
  • Bây giờ, hãy tạo một thể hiện của lớp HtmlConvertOptions
  • Đặt các tùy chọn chuyển đổi khác nhau như setFromPage, setPagesCount, setFixedLayout, v.v.
  • Sau đó, đặt tùy chọn chuyển đổi và đường dẫn tệp đầu ra
  • Tiếp theo, tạo ConvertDocumentRequest với ConvertSettings
  • Cuối cùng, thực hiện chuyển đổi bằng phương thức convertdocument() với ConvertDocumentRequest

Ví dụ mã sau đây cho biết cách chuyển đổi tệp PDF sang trang HTML bằng cài đặt nâng cao.

package com.groupdocsdev.classes;

import com.groupdocs.cloud.conversion.api.*;
import com.groupdocs.cloud.conversion.model.*;
import com.groupdocs.cloud.conversion.model.requests.*;
import com.groupdocs.cloud.conversion.client.Configuration;
import com.groupdocs.cloud.conversion.client.ApiException;
import java.util.List;

// Java chuyển đổi tệp PDF sang trang HTML bằng các tùy chọn bổ sung.
public class App {

	public static void main(String[] args) {
		
		// Tạo một phiên bản của API chuyển đổi
		ConvertApi apiInstance = new ConvertApi(configuration);
					
		try {
			 
			// Chuẩn bị cài đặt chuyển đổi
			ConvertSettings settings = new ConvertSettings();
			settings.setStorageName(MyStorage);
			settings.setFilePath("java-testing/input-sample-file.pdf");
			settings.setFormat("html");
			
			HtmlConvertOptions convertOptions = new HtmlConvertOptions();
			convertOptions.setFromPage(1);
			convertOptions.setPagesCount(2);
			convertOptions.setFixedLayout(true);

			settings.setConvertOptions(convertOptions);
			settings.setOutputPath("java-testing/output-sample-file.html");
			
			// chuyển đổi sang định dạng được chỉ định
			List<StoredConvertedResult> response = apiInstance.convertDocument(new ConvertDocumentRequest(settings));
			System.out.println("Document conveted successfully: " + response);
			
		} catch (ApiException e) {
			System.err.println("Exception while calling Java API: ");
			e.printStackTrace();
		}
	}
}

Vui lòng làm theo các bước được đề cập trước đó để tải lên và tải xuống các tệp.

Chuyển đổi PDF sang HTML trực tuyến miễn phí

Làm cách nào để chuyển đổi tệp PDF sang tệp HTML trực tuyến miễn phí? Vui lòng dùng thử PDF sang HTML trực tuyến converter để tạo HTML từ PDF trực tuyến miễn phí. Nó được phát triển bằng API trên để chuyển đổi PDF sang HTML trực tuyến miễn phí.

Phần kết luận

Điều này đưa chúng ta đến cuối bài viết này. Trong bài viết này, chúng ta đã học được:

  • cách chuyển đổi tài liệu PDF sang HTML trong Java theo lập trình;
  • cách chuyển đổi tệp PDF thành tệp HTML bằng một số cài đặt nâng cao trong Java;
  • tải tệp PDF lên đám mây theo chương trình rồi tải xuống tệp HTML đã chuyển đổi từ đám mây;
  • chuyển đổi trực tuyến PDF sang HTML miễn phí bằng phần mềm chuyển đổi PDF sang HTML;

Ngoài ra, bạn có thể tìm hiểu thêm về API chuyển đổi tệp GroupDocs.Conversion bằng cách sử dụng tài liệu. Chúng tôi cũng cung cấp phần Tham khảo API cho phép bạn hình dung và giao tiếp trực tiếp với các API của chúng tôi thông qua trình duyệt. Mã nguồn hoàn chỉnh của SDK Java có sẵn miễn phí trên Github. Vui lòng kiểm tra GroupDocs.Conversion Cloud SDK dành cho Java Ví dụ tại đây.

Cuối cùng, groupdocs.cloud đang viết các bài blog mới về các chuyển đổi định dạng tệp khác nhau bằng API REST. Vì vậy, hãy giữ liên lạc để cập nhật thường xuyên.

Đặt một câu hỏi

Đối với bất kỳ truy vấn/thảo luận nào về API chuyển đổi PDF sang HTML, vui lòng liên hệ với chúng tôi trên [diễn đàn] hỗ trợ miễn phí 23.

câu hỏi thường gặp

Làm cách nào để chuyển đổi PDF sang HTML trong Java?

Vui lòng theo liên kết này để tìm hiểu đoạn mã Java về cách chuyển đổi tệp PDF sang trang HTML một cách nhanh chóng và dễ dàng.

Tôi có thể chuyển đổi PDF sang HTML trong Java bằng API REST không?

Có, bạn có thể thay đổi PDF thành HTML trong Java. Đầu tiên, tạo một phiên bản của ConvertApi, đặt các giá trị của cài đặt chuyển đổi và gọi phương thức convertDocument với ConvertDocumentRequest để chuyển đổi trang web PDF sang HTML.

Làm cách nào để chuyển đổi PDF sang HTML trực tuyến miễn phí?

Trình chuyển đổi PDF sang HTML trực tuyến miễn phí cho phép bạn chuyển đổi PDF sang HTML miễn phí, nhanh chóng và dễ dàng. Sau khi quá trình chuyển đổi trực tuyến PDF sang HTML hoàn tất, bạn có thể tải xuống ngay tệp HTML đã chuyển đổi trên PC của mình.

Làm cách nào để chuyển đổi trực tuyến PDF sang HTML?

  • Mở Trực tuyến trình chuyển PDF sang HTML miễn phí
  • Nhấp vào bên trong khu vực thả tệp để tải lên tệp PDF hoặc kéo và thả tệp PDF.
  • Nhấp vào nút Chuyển đổi ngay bây giờ, trình chuyển đổi PDF sang HTML trực tuyến miễn phí sẽ thay đổi tệp PDF thành HTML trực tuyến miễn phí.
  • Liên kết tải xuống của tệp HTML đầu ra sẽ khả dụng ngay lập tức sau khi chuyển đổi miễn phí tệp PDF sang tài liệu HTML.

Làm cách nào để cài đặt thư viện PDF sang HTML Java?

Bạn có thể tải xuống và cài đặt Thư viện chuyển đổi Java PDF sang HTML để xử lý, thao tác và tạo HTML từ PDF trong Java theo lập trình.

Làm cách nào để chuyển đổi PDF sang HTML trong windows?

Vui lòng truy cập liên kết này để tải xuống trình chuyển đổi PDF sang HTML ngoại tuyến cho windows. Phần mềm tải xuống miễn phí chuyển đổi PDF sang HTML này có thể được sử dụng để xuất PDF sang HTML trong windows một cách nhanh chóng chỉ bằng một cú nhấp chuột.

Xem thêm

Chúng tôi khuyên bạn nên truy cập các bài viết sau để tìm hiểu về: