Chuyển đổi PDF tài liệu sang định dạng HTML là rất cần thiết, đặc biệt khi chúng ta cần hiển thị nội dung trực tuyến, cải thiện khả năng truy cập và cho phép sử dụng lại nội dung dễ dàng trong các ứng dụng web. Trong bài viết này, bạn sẽ học cách chuyển đổi PDF sang HTML bằng cách sử dụng GroupDocs.Conversion Cloud SDK cho .NET, bảo tồn bố cục tài liệu, hình ảnh và định dạng.

Bài viết này đề cập đến các chủ đề sau:

API chuyển đổi PDF sang HTML

GroupDocs.Conversion Cloud SDK for .NET cung cấp một API mạnh mẽ để chuyển đổi tài liệu PDF sang HTML với độ chính xác cao. Nó cho phép bạn tùy chỉnh HTML đầu ra, định nghĩa phạm vi trang và kiểm soát chất lượng hình ảnh, làm cho nó trở nên lý tưởng để tích hợp quy trình công việc tài liệu thành web trong các ứng dụng .NET của bạn.

Cài đặt

Cài đặt SDK qua Trình quản lý gói NuGet:

Install-Package GroupDocs.Conversion-Cloud -Version 24.2.0

Hoặc sử dụng .NET CLI:

dotnet add package GroupDocs.Conversion-Cloud --version 24.2.0

Bây giờ, bạn cần lấy Mã khách hàng và Mật khẩu khách hàng cá nhân của bạn từ Aspose Cloud Dashboard để xác thực các yêu cầu API.

Chuyển PDF thành HTML trong C# (.NET)

Dưới đây là một ví dụ từng bước bằng C# để chuyển đổi PDF sang HTML:

  1. Cấu hình thông tin xác thực API:
var config = new Configuration
{
    ClientId = "YOUR_CLIENT_ID",
    ClientSecret = "YOUR_CLIENT_SECRET"
};

var convertApi = new ConvertApi(config);
var fileApi = new FileApi(config);
  1. Tải lên tệp PDF lên Lưu trữ Cloud:
using (var fileStream = File.OpenRead("sample.pdf"))
{
    var uploadRequest = new UploadFileRequest("sample.pdf", fileStream);
    fileApi.UploadFile(uploadRequest);
}
  1. Đặt Cài đặt Chuyển đổi:
var settings = new ConvertSettings
{
    FilePath = "sample.pdf",
    Format = "html",
    OutputPath = "converted/resultant.html"
};
  1. Thực hiện chuyển đổi PDF sang HTML:
var request = new ConvertDocumentRequest(settings);
convertApi.ConvertDocument(request);
using System;
using GroupDocs.Conversion.Cloud.Sdk.Api;
using GroupDocs.Conversion.Cloud.Sdk.Client;
using GroupDocs.Conversion.Cloud.Sdk.Model.Requests;
using System.IO;
using GroupDocs.Conversion.Cloud.Sdk.Model;

namespace GroupDocs.Conversion.CSharp
{
    // Thực hiện chuyển đổi PDF sang HTML
    class PDFConversion

    {
        static void Main(string[] args)
        {

            try
            {
                // Lấy thông tin xác thực API của bạn 
                string clientId = "xxxxxxx-xxxx-xxxx-xxxx-xxxxxxxxxxxx";
                string clientSecret = "xxxxxxxxxxxxxxxxxxxxxxxxxxxxxx";
                string myStorage = "test";

                // Khởi tạo một thể hiện của lớp Configuration với Client Secret & Client ID. 
                var configuration = new Configuration(clientId, clientSecret);
                // Định nghĩa giá trị của ApiBaseUrl để thiết lập url cơ sở của API.
                configuration.ApiBaseUrl = "https://api.groupdocs.cloud";

                // Khởi tạo một đối tượng của lớp ConvertApi với đối tượng của lớp Configuration.
                var apiInstance = new ConvertApi(configuration);
                // Tạo một thể hiện của lớp ConvertSettings.
                var settings = new ConvertSettings
                {
                    FilePath = "sample.pdf",
                    Format = "html",
                    OutputPath = "converted/resultant.html"
                };

                // call the API to trigger PDF to Web page conversion.
                var response = apiInstance.ConvertDocument(new ConvertDocumentRequest(settings));
                Console.WriteLine("Successfully converted the PDF file to HTML format in C#: " + response[0].Url);
            }
            catch (Exception e)
            {
                Console.WriteLine("Exception when calling GroupDocs Api: " + e.Message);
            }

        }
    }
}
pdf miễn phí sang html trực tuyến

Hình ảnh: - Bản xem trước của việc chuyển đổi PDF sang HTML.

  • Tệp PDF mẫu được sử dụng trong ví dụ trên có thể được tải xuống từ input.pdf.

Chuyển đổi PDF thành Trang Web sử dụng cURL

Bạn cũng có thể sử dụng REST API GroupDocs.Conversion Cloud với cURL để chuyển đổi nhanh chóng qua lệnh dòng.

  • Tạo mã thông báo truy cập JWT với thông tin xác thực của bạn.
  • Chạy lệnh cURL sau đây:
curl -v "https://api.groupdocs.cloud/v2.0/conversion" \
-X POST \
-H "accept: application/json" \
-H "authorization: Bearer {accessToken}" \
-H "Content-Type: application/json" \
-d "{  \"StorageName\": \"default\",  \"FilePath\": \"{sourcePDF}\",  \"Format\": \"html\",  \"OutputPath\": \"{resultantFile}\"}"
  • Thực hiện lệnh sau để lưu HTML trên ổ đĩa cục bộ:
curl -v "https://api.groupdocs.cloud/v2.0/conversion" \
-X POST \
-H "accept: application/json" \
-H "authorization: Bearer {accessToken}" \
-H "Content-Type: application/json" \
-d "{  \"StorageName\": \"default\",  \"FilePath\": \"{sourceFile}\",  \"Format\": \"html\"}" \
-o "{resultantFile}"
  • Thay thế: sourceFile, resultantFile, và accessToken bằng giá trị thực tế.

Thử Công Cụ Chuyển Đổi PDF Sang HTML Miễn Phí Của Chúng Tôi

Hãy thử ứng dụng PDF to HTML Converter miễn phí của chúng tôi để xem chất lượng chuyển đổi trước khi tích hợp nó vào ứng dụng của bạn.

Trình chuyển đổi PDF sang HTML miễn phí trực tuyến

Liên kết hữu ích

Kết luận

Sử dụng GroupDocs.Conversion Cloud SDK cho .NET, bạn có thể dễ dàng tích hợp chuyển đổi PDF sang HTML vào các dự án .NET của mình, cho phép đầu ra chất lượng cao, tương thích với web trong khi vẫn giữ nguyên định dạng. Dù bạn sử dụng SDK trong C# hay thực hiện các cuộc gọi REST API trực tiếp qua cURL, quy trình này rất đơn giản và vô cùng tùy chỉnh.

Bài viết được đề xuất

Chúng tôi rất khuyên bạn nên khám phá các bài viết sau: