Chuyển đổi HTML sang Word DOC hoặc DOCX trong Java.

Chuyển đổi HTML sang Word (DOC, DOCX) theo lập trình trong Java.

HTML, hoặc Ngôn ngữ đánh dấu siêu văn bản, là ngôn ngữ đánh dấu tiêu chuẩn được sử dụng để tạo và cấu trúc các trang web. Mặt khác, tài liệu Word được sử dụng để tạo và chỉnh sửa tài liệu dựa trên văn bản. Có một số lý do tại sao bạn có thể muốn chuyển đổi HTML sang Word, chẳng hạn như cho mục đích chỉnh sửa, chia sẻ hoặc in ấn. Tài liệu Word dễ chỉnh sửa hơn, phù hợp hơn cho mục đích in ấn, ổn định hơn và bảo toàn thông tin quan trọng hơn tài liệu HTML. Vì vậy, bài đăng trên blog này sẽ cung cấp hướng dẫn toàn diện về cách chuyển đổi HTML sang Word (DOC, DOCX) theo chương trình trong Java bằng cách sử dụng GroupDocs.Conversion Cloud REST API.

Các chủ đề sau đây sẽ được đề cập trong bài viết này:

API REST chuyển đổi Java HTML sang Word - Cài đặt Java SDK

Sử dụng GroupDocs.Conversion Cloud SDK cho Java, bạn có thể chuyển đổi tài liệu HTML sang Word trong Java một cách nhanh chóng và chính xác mà không tốn nhiều công sức. API này cho phép bạn tự động hóa quy trình chuyển đổi định dạng tệp, giúp dễ dàng chuyển đổi số lượng lớn tài liệu. Nó giúp bạn tiết kiệm thời gian và công sức. Nó cũng hỗ trợ chuyển đổi tài liệu và tệp của bạn ở bất kỳ định dạng tệp được hỗ trợ nào sang bất kỳ định dạng nào bạn cần. Bạn có thể nhanh chóng xử lý hơn 50 loại tệp và tài liệu như Word, PDF, PowerPoint, Excel, HTML, CAD, hình ảnh raster, v.v.

Bạn có thể tải xuống tệp JAR của API hoặc cài đặt bằng cấu hình Maven. Thêm kho lưu trữ và phần phụ thuộc vào POM.xml của dự án của bạn. Dưới đây là hướng dẫn cho Maven:

Kho lưu trữ Maven:

<repository>
    <id>groupdocs-artifact-repository</id>
    <name>GroupDocs Artifact Repository</name>
    <url>https://repository.groupdocs.cloud/repo</url>
</repository>

Phụ thuộc Maven:

 <dependency>
    <groupId>com.groupdocs</groupId
    <artifactId>groupdocs-conversion-cloud</artifactId>
    <version>23.4</version>
    <scope>compile</scope>
</dependency>

Vui lòng lấy Client ID and Client Secret của bạn từ dashboard trước khi bạn bắt đầu làm theo các bước và đoạn mã có sẵn. Vui lòng nhập mã hiển thị bên dưới khi bạn có ID và bí mật của mình:

# Nhận client_id và client_secret của bạn từ https://dashboard.groupdocs.cloud sau khi đăng ký miễn phí.

String ClientId = "xxxxxxx-xxxx-xxxx-xxxx-xxxxxxxxxxxx";
String ClientSecret = "xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx";
String MyStorage = "test-internal-storage";
Configuration configuration = new Configuration(ClientId, ClientSecret);

Bây giờ, hãy làm theo hướng dẫn Từng bước bên dưới về cách chuyển đổi HTML sang Word trong Java.

Chuyển đổi tệp HTML thành tài liệu Word trong Java bằng API REST

Chuyển đổi tệp HTML sang Word DOC hoặc DOCX có thể hữu ích theo nhiều cách, chẳng hạn như cho mục đích chỉnh sửa, chia sẻ hoặc in. Để chuyển đổi tài liệu HTML sang Word, cần thực hiện theo các bước sau:

Tải tệp lên

Đầu tiên, tải tài liệu HTML lên bộ nhớ đám mây bằng đoạn mã được cung cấp bên dưới:

package com.groupdocsdev.classes;

import com.groupdocs.cloud.conversion.api.*;
import com.groupdocs.cloud.conversion.model.*;
import com.groupdocs.cloud.conversion.model.requests.*;
import com.groupdocs.cloud.conversion.client.Configuration;
import com.groupdocs.cloud.conversion.client.ApiException;

import java.io.File;

// Tải tệp lên bộ nhớ đám mây bằng Java
public class App {

	public static void main(String[] args) {
				
		// Tạo một phiên bản của API chuyển đổi					
		FileApi apiInstance = new FileApi(configuration);
		try {
			File fileStream = new File("H:\\groupdocs-cloud-data\\input-sample-file.html");
			UploadFileRequest request = new UploadFileRequest("java-testing\\input-sample-file.html", fileStream, MyStorage);
			FilesUploadResult response = apiInstance.uploadFile(request);
			System.out.println("Expected response type is FilesUploadResult: " + response.getUploaded().size());
		} catch (ApiException e) {
			System.err.println("Exception while calling FileApi:");
			e.printStackTrace();
		}
		
	}
}

Do đó, tệp HTML đã tải lên sẽ có sẵn trong phần tệp của trang tổng quan của bạn trên đám mây.

Chuyển đổi HTML sang Word DOCX thành Java

Phần này nói về cách chuyển đổi tệp HTML sang DOCX theo lập trình trong Java bằng cách thực hiện theo các bước bên dưới:

  • Đầu tiên, tạo một thể hiện của lớp ConvertApi.
  • Thứ hai, tạo một thể hiện của lớp ConvertSettings.
  • Thứ ba, cung cấp tên lưu trữ đám mây.
  • Tiếp theo, đặt đường dẫn tệp HTML đầu vào và định dạng tệp đầu ra là “docx”.
  • Sau đó, tạo một phiên bản của lớp DocxConvertOptions.
  • Tùy chọn, đặt các tùy chọn chuyển đổi khác nhau như setFromPage, setPagesCount, setZoom, setDpi, v.v.
  • Bây giờ, hãy đặt các tùy chọn chuyển đổi và đường dẫn tệp đầu ra bằng cách sử dụng phiên bản ConvertSettings.
  • Sau đó, tạo thể hiện của lớp ConvertDocumentRequest và chuyển tham số ConvertSettings.
  • Cuối cùng, gọi phương thức convert\document() và chuyển tham số ConvertDocumentRequest.

Đoạn mã sau cho biết cách chuyển đổi tài liệu HTML sang Word trong Java bằng API REST:

package com.groupdocsdev.classes;

import com.groupdocs.cloud.conversion.api.*;
import com.groupdocs.cloud.conversion.model.*;
import com.groupdocs.cloud.conversion.model.requests.*;
import com.groupdocs.cloud.conversion.client.Configuration;
import com.groupdocs.cloud.conversion.client.ApiException;
import java.util.List;

// Chuyển đổi trang web HTML thành tài liệu Word trong Java.
public class App {

	public static void main(String[] args) {
		
		// Tạo một phiên bản của API chuyển đổi
		ConvertApi apiInstance = new ConvertApi(configuration);
					
		try {
			 
			// Chuẩn bị cài đặt chuyển đổi
			ConvertSettings settings = new ConvertSettings();
			settings.setStorageName(MyStorage);
			settings.setFilePath("java-testing/input-sample-file.html");
			settings.setFormat("docx");
			
			DocxConvertOptions convertOptions = new DocxConvertOptions();
			convertOptions.setFromPage(2);
			convertOptions.setPagesCount(4);
			convertOptions.setZoom(100);
			convertOptions.setDpi(300.0);

      settings.setConvertOptions(convertOptions);
			settings.setOutputPath("java-testing/output-sample-file.docx");
		
			// chuyển đổi sang định dạng được chỉ định
			List<StoredConvertedResult> response = apiInstance.convertDocument(new ConvertDocumentRequest(settings));
			System.out.println("Document converted successfully: " + response);
			
		} catch (ApiException e) {
			System.err.println("Exception while calling Java API: ");
			e.printStackTrace();
		}
	}
}

Tải xuống tệp đã chuyển đổi

Mẫu mã trên sẽ lưu tài liệu Word đã chuyển đổi vào đám mây. Bạn có thể tải xuống bằng đoạn mã sau:

package com.groupdocsdev.classes;

import com.groupdocs.cloud.conversion.api.*;
import com.groupdocs.cloud.conversion.model.requests.*;
import com.groupdocs.cloud.conversion.client.Configuration;
import com.groupdocs.cloud.conversion.client.ApiException;

import java.io.File;

// Tải xuống tệp từ Bộ lưu trữ đám mây trong Java
public class App {

	public static void main(String[] args) {
				
		// Tạo một phiên bản của API chuyển đổi					
		FileApi apiInstance = new FileApi(configuration);
		try {
			DownloadFileRequest request = new DownloadFileRequest("java-testing\\output-sample-file.docx", MyStorage, null);
			File response = apiInstance.downloadFile(request);
			System.err.println("Expected response type is File: " + response.length());
		} catch (ApiException e) {
			System.err.println("Exception while calling FileApi:");
			e.printStackTrace();
		}
		
	}
}

Trình chuyển đổi HTML sang Word trực tuyến miễn phí

Làm cách nào để chuyển đổi HTML sang Word trực tuyến miễn phí? Vui lòng thử trình chuyển đổi HTML sang Word miễn phí để tạo tài liệu Word từ HTML. Trình chuyển đổi này được phát triển bằng cách sử dụng API HTML sang Word REST đã đề cập ở trên.

Phần kết luận

Chúng tôi đang hoàn thiện bài viết tại đây. Sau đây là những gì bạn đã học được từ bài viết này:

  • cách chuyển đổi tài liệu HTML sang Word DOC hoặc DOCX bằng Java theo lập trình;
  • tải tệp HTML lên đám mây theo chương trình rồi tải xuống tài liệu Word đã chuyển đổi từ đám mây;
  • và chuyển đổi trực tuyến HTML sang Word bằng trình chuyển đổi HTML sang Word miễn phí.

Ngoài ra, chúng tôi cũng cung cấp phần Tham chiếu API cho phép bạn trực quan hóa và giao tiếp với các API của chúng tôi thông qua trình duyệt. Mã nguồn hoàn chỉnh của Java SDK có sẵn miễn phí trên Github. Vui lòng kiểm tra GroupDocs.Conversion Cloud SDK dành cho Java Ví dụ tại đây. Ngoài ra, chúng tôi khuyên bạn nên tham khảo Hướng dẫn bắt đầu của chúng tôi. Bắt đầu chuyển đổi tài liệu HTML của bạn sang Word ngay hôm nay và xem sự khác biệt mà nó tạo ra.

Cuối cùng, chúng tôi tiếp tục viết các bài blog mới về các chuyển đổi định dạng tệp khác nhau bằng API REST. Vì vậy, xin vui lòng liên lạc để cập nhật thường xuyên.

Đặt một câu hỏi

Đối với bất kỳ câu hỏi nào về trình chuyển đổi HTML sang Word, vui lòng liên hệ với chúng tôi trên [diễn đàn] hỗ trợ miễn phí 20.

câu hỏi thường gặp

Làm cách nào để chuyển đổi HTML sang Word bằng Java?

Quá trình chuyển đổi HTML sang Word trong Java thường bao gồm việc sử dụng thư viện Java hoặc API, chẳng hạn như GroupDocs.Conversion Cloud REST API, để thực hiện chuyển đổi. API có thể được định cấu hình để xử lý quá trình chuyển đổi, bao gồm xử lý lỗi và ngoại lệ.

Cách tốt nhất để chuyển đổi HTML sang Word trong Java là gì?

Cách tốt nhất để chuyển đổi HTML sang Word trong Java là sử dụng thư viện hoặc API hỗ trợ chuyển đổi, chẳng hạn như GroupDocs.Conversion Cloud REST API.

Làm cách nào để chuyển đổi HTML sang Word trực tuyến miễn phí?

[Trực tuyến miễn phí HTML sang DOC] Trình chuyển đổi 24 cho phép bạn chuyển đổi HTML sang Word miễn phí, nhanh chóng và dễ dàng. Sau khi quá trình chuyển đổi trực tuyến HTML sang Word DOC hoàn tất, bạn có thể tải xuống ngay tệp HTML đã chuyển đổi trên PC của mình. Vui lòng làm theo hướng dẫn từng bước dưới đây để chuyển đổi:

  • Mở trình chuyển đổi HTML sang DOC trực tuyến miễn phí
  • Nhấp vào bên trong khu vực thả tệp để tải tệp HTML lên hoặc kéo và thả tệp HTML.
  • Nhấp vào nút Chuyển đổi ngay bây giờ, trình chuyển đổi HTML sang Word trực tuyến miễn phí sẽ chuyển đổi HTML thành tệp Word.
  • Liên kết tải xuống của tệp đầu ra sẽ khả dụng ngay lập tức sau khi chuyển đổi trang web HTML.

Làm cách nào để chuyển đổi HTML sang Word trong Windows?

Vui lòng truy cập liên kết này để tải xuống trình chuyển đổi HTML sang Word ngoại tuyến cho Windows. Trình chuyển đổi tài liệu HTML sang Word ngoại tuyến có thể được sử dụng để chuyển HTML sang Word trên Windows một cách nhanh chóng chỉ bằng một cú nhấp chuột.

Xem thêm

Nếu bạn muốn tìm hiểu về các chủ đề liên quan, chúng tôi khuyên bạn nên truy cập các bài viết sau.