PDF sang HTM

Phát triển Trình chuyển đổi PDF sang HTML bằng C# .NET.

Khả năng chuyển đổi tài liệu PDF sang định dạng HTML là cần thiết cho nhiều mục đích khác nhau, chẳng hạn như phát triển web hoặc quản lý nội dung. Cho dù bạn là nhà phát triển đang tìm cách nâng cao khả năng truy cập trang web hay người tạo nội dung đang tìm cách sử dụng lại nội dung PDF để sử dụng trực tuyến, việc nắm vững quy trình chuyển đổi PDF sang HTML bằng C# .NET có thể hợp lý hóa đáng kể quy trình làm việc của bạn và cải thiện hiệu quả. Trong bài viết này, chúng ta sẽ khám phá tất cả chi tiết về chuyển đổi PDF sang HTML bằng .NET REST API, bao gồm mọi thứ từ các khái niệm thiết yếu đến các kỹ thuật nâng cao.

Bài viết này bao gồm các chủ đề sau:

API REST để chuyển đổi PDF sang HTML

GroupDocs.Conversion Cloud SDK for .NET cung cấp giải pháp mạnh mẽ và linh hoạt để chuyển đổi liền mạch các tài liệu PDF sang định dạng HTML. SDK cũng cung cấp các tùy chọn tùy chỉnh nâng cao, cho phép bạn chỉ định cài đặt chuyển đổi như phạm vi trang, chất lượng hình ảnh và cấu trúc tệp đầu ra theo yêu cầu cụ thể của bạn. Để sử dụng SDK, bước đầu tiên là cài đặt nó. Vì vậy, hãy tìm kiếm GroupDocs.Conversion-Cloud trong trình quản lý gói NuGet và nhấp vào nút Cài đặt. Một tùy chọn khác là thực thi lệnh sau trong bảng điều khiển trình quản lý gói.

NuGet\Install-Package GroupDocs.Conversion-Cloud -Version 24.2.0

Sau khi API REST được cài đặt thành công, hãy đảm bảo bạn có thông tin xác thực API (tức là ID ứng dụng khách và Bí mật ứng dụng khách).Bạn có thể truy cập hướng dẫn ngắn này để biết cách lấy thông tin xác thực API.

Chuyển đổi PDF sang HTML bằng C# .NET

Phần sau đây giải thích chi tiết về cách chúng tôi có thể tận dụng các khả năng mạnh mẽ của Cloud SDK và tự động hóa tác vụ chuyển đổi PDF sang HTML theo chương trình bằng cách sử dụng C# .NET.

  1. Tạo một phiên bản của lớp Cấu hình nơi chúng tôi chuyển thông tin xác thực ứng dụng khách làm đối số.
var configurations = new Configuration(clientId, clientSecret1);
  1. Khởi tạo ConvertApi nơi chúng tôi chuyển đối tượng Cấu hình làm đối số đầu vào.
var apiInstance = new ConvertApi(configurations);
  1. Tải tệp PDF đầu vào lên bộ lưu trữ đám mây đồng thời chuyển tên cho tài liệu PDF đầu vào.
fileUpload.UploadFile(new UploadFileRequest("input.pdf", stream));
  1. Tạo một phiên bản ConvertSettings trong đó chúng tôi chỉ định tên cho tệp PDF đầu vào, định dạng đầu ra là html và tên cho tệp HTML kết quả.
var settings = new ConvertSettings{...}
  1. Gọi API ConvertDocumentRequest để chuyển đổi định dạng PDF sang HTML. Sau khi chuyển đổi thành công, HTML kết quả sẽ được lưu trữ trong bộ lưu trữ đám mây.
var response = apiInstance.ConvertDocument(new ConvertDocumentRequest(settings));
// Thêm ví dụ trên https://github.com/groupdocs-conversion-cloud/groupdocs-conversion-cloud-dotnet
// Lấy thông tin xác thực API của bạn 
string clientId = "4bdefca3-f08c-4088-9ca0-55c38f4b7f22";
string clientSecret1 = "a43c8b4365246a062688a259abe5b469";

// Tạo một phiên bản của lớp Cấu hình và khởi tạo nó bằng ID khách hàng & Bí mật khách hàng. 
var configurations = new GroupDocs.Conversion.Cloud.Sdk.Client.Configuration(clientId, clientSecret1);
// Xác định giá trị của ApiBaseUrl để đặt url cơ sở của API chuyển đổi html sang PDF.
configuration.ApiBaseUrl = "https://api.groupdocs.cloud";

// Khởi tạo một phiên bản của lớp ConvertApi với đối tượng của lớp Cấu hình.
var apiInstance = new GroupDocs.Conversion.Cloud.Sdk.Api.ConvertApi(configurations);
             
// tải tệp HTML từ ổ đĩa cục bộ             
using (var stream = System.IO.File.OpenRead("input.pdf"))
{
    // tạo một phiên bản của FileApi
    var fileUpload = new FileApi(configurations);
    // tải tệp PDF đầu vào lên bộ nhớ đám mây
    fileUpload.UploadFile(new UploadFileRequest("input.pdf", stream));

    // tạo ConvertSettings nơi chúng tôi xác định tệp PDF đầu vào và tên cho HTML kết quả
    var settings = new ConvertSettings
    {
        StorageName = "internal",
        FilePath = "input.pdf",
        Format = "html",
        OutputPath = "resultant.html"
    };
    
    // Gọi phương thức ConvertDocument để chuyển đổi PDF sang HTML theo chương trình.
    var response = apiInstance.ConvertDocument(new GroupDocs.Conversion.Cloud.Sdk.Model.Requests.ConvertDocumentRequest(settings));
    if (response != null && response.Equals("OK"))
    {
        // in thông báo thành công
        Console.WriteLine("The PDF file successfully converted to HTML !");
    }
}
PDF sang HTML.

Hình ảnh: - Xem trước chuyển đổi PDF sang HTML.

Có thể tải xuống tệp PDF mẫu được sử dụng trong ví dụ trên từ input.pdf.

Chuyển đổi PDF sang trang web bằng lệnh cURL

Chuyển đổi PDF sang HTML bằng cách sử dụng các lệnh GroupDocs.Conversion Cloud và cURL cung cấp giải pháp thuận tiện và có thể lập tập lệnh để tự động hóa các tác vụ chuyển đổi tài liệu. Một trong những lợi ích chính của phương pháp này là tính đơn giản và dễ tích hợp vào quy trình công việc và quy trình tự động hóa hiện có. Chỉ với một vài lệnh đơn giản, bạn có thể bắt đầu và quản lý quá trình chuyển đổi mà không cần mã phức tạp hoặc thư viện bổ sung.

Bước đầu tiên trong phương pháp này là lấy thông tin xác thực được cá nhân hóa của bạn (Khóa ứng dụng và SID ứng dụng) và tạo mã thông báo truy cập JWT. Khi chúng ta có mã thông báo JWT, vui lòng thực hiện lệnh cURL sau để chuyển PDF sang định dạng HTML. Lệnh sau thêm chuỗi mẫu dưới dạng hình mờ nhưng tùy chọn.

curl -v "https://api.groupdocs.cloud/v2.0/conversion" \
-X POST \
-H "accept: application/json" \
-H "authorization: Bearer {accessToken}" \
-H "Content-Type: application/json" \
-d "{  \"FilePath\": \"{sourceFile}\",  \"Format\": \"html\",  \"LoadOptions\": {    \"Format\": \"pdf\"  },  \"ConvertOptions\": {    \"FromPage\": 1,    \"PagesCount\": 3,    \"Pages\": [      1,2,3    ],    \"WatermarkOptions\": {      \"Text\": \"Hello World !\",      \"FontName\": \"Arial\",      \"FontSize\": 10,      \"Bold\": true,      \"Italic\": true,      \"Color\": \"Yellow\",      \"Width\": 0,      \"Height\": 0,      \"Top\": 0,      \"Left\": 0,      \"RotationAngle\": 20,      \"Transparency\": .5,      \"Background\": true,      \"AutoAlign\": true    }  },  \"OutputPath\": \"{resultantFile}\"}" -v

Vui lòng thay thế sourceFile bằng tên của tệp PDF đầu vào có sẵn trong bộ lưu trữ đám mây, resultFile bằng tên của định dạng HTML đầu ra sẽ được tạo và accessToken bằng mã thông báo JWT được tạo ở trên. Sau khi chuyển đổi thành công, tệp kết quả sẽ được lưu trữ trên bộ lưu trữ đám mây.

Trong trường hợp bạn muốn lưu HTML kết quả vào ổ đĩa cục bộ, vui lòng sử dụng lệnh sau.

curl -v "https://api.groupdocs.cloud/v2.0/conversion" \
-X POST \
-H "accept: application/json" \
-H "authorization: Bearer {accessToken}" \
-H "Content-Type: application/json" \
-d "{  \"FilePath\": \"{sourceFile}\",  \"Format\": \"html\",  \"LoadOptions\": {    \"Format\": \"pdf\"  },  \"ConvertOptions\": {    \"FromPage\": 1,    \"PagesCount\": 3,    \"Pages\": [      1,2,3    ],    \"WatermarkOptions\": {      \"Text\": \"Hello World !\",      \"FontName\": \"Arial\",      \"FontSize\": 10,      \"Bold\": true,      \"Italic\": true,      \"Color\": \"Yellow\",      \"Width\": 0,      \"Height\": 0,      \"Top\": 0,      \"Left\": 0,      \"RotationAngle\": 20,      \"Transparency\": .5,      \"Background\": true,      \"AutoAlign\": true  }  } }" \
-o "resultant.html"

Ứng dụng chuyển đổi PDF sang HTML miễn phí

Bạn có thể cân nhắc sử dụng [Trình chuyển đổi PDF sang HTML] miễn phí, nhẹ và siêu hiệu quả của chúng tôi được phát triển dựa trên API GroupDocs.Conversion.

ứng dụng pdf sang html miễn phí

Liên kết hữu ích

Phần kết luận

Tóm lại, cho dù bạn chọn sử dụng GroupDocs.Conversion Cloud SDK cho .NET hay tích hợp GroupDocs.Conversion Cloud với các lệnh cURL, việc chuyển đổi PDF sang HTML sẽ trở thành một quy trình liền mạch và hiệu quả. Cả hai phương pháp đều cung cấp các giải pháp linh hoạt để tự động hóa các tác vụ chuyển đổi tài liệu, giúp bạn dễ dàng thu hẹp khoảng cách giữa các định dạng PDF và HTML. Nhìn chung, cho dù bạn thích sự tiện lợi của SDK hay tính linh hoạt của lệnh cURL, cả hai phương pháp đều cho phép bạn chuyển đổi PDF sang HTML một cách hiệu quả và tự tin tối ưu hóa quy trình xử lý tài liệu của mình.

Những bài viết liên quan

Chúng tôi thực sự khuyên bạn nên truy cập các liên kết sau để tìm hiểu thêm về: