Cách chuyển pdf sang html không mất định dạng

Cách chuyển đổi PDF sang HTML theo lập trình

PDF(Định dạng Tài liệu Di động) là một định dạng tài liệu an toàn chứa đồ họa, văn bản, mô hình 3D, hình ảnh, v.v. Định dạng PDF được nén và nhỏ hơn các định dạng tệp có thể chia sẻ khác. HTML là ngôn ngữ Đánh dấu nhẹ dành cho văn bản thuần túy được sử dụng rộng rãi. Nó được hỗ trợ bởi mọi trình duyệt và tải nhanh. Cả hai định dạng tệp PDF và HTML đều tốt cho khả năng truy cập, nhưng HTML nói chung tốt hơn nhiều để cung cấp thông tin qua web. Vì vậy, trong bài viết này, chúng tôi sẽ trình bày cách chuyển đổi PDF sang HTML Trực tuyến trong Node.js.

Các chủ đề sau sẽ được đề cập trong bài viết này:

API REST chuyển đổi trang PDF sang HTML và SDK Node.js

Node.js SDK của GroupDocs.Conversion là thư viện chuyển đổi NodeJS trực tuyến cho phép bạn thực hiện chuyển đổi trực tuyến từ PDF sang HTML. Nó là một giải pháp chuyển đổi tài liệu và thư viện độc lập với nền tảng. Nó cho phép bạn chuyển đổi liền mạch các tài liệu và hình ảnh của bất kỳ định dạng tệp được hỗ trợ nào sang bất kỳ định dạng nào bạn cần. Bạn có thể dễ dàng chuyển đổi hơn 50 loại tài liệu và hình ảnh như Word, PowerPoint, Excel, PDF, HTML, CAD, hình ảnh raster, v.v. Nó cũng hỗ trợ SDK .NET, Java, PHP, Ruby, Android và Python như của nó thành viên gia đình chuyển đổi tài liệu cho Cloud API.

GroupDocs.Conversion Cloud có thể được cài đặt bằng lệnh sau trong Bảng điều khiển Node.js:

npm install groupdocs-conversion-cloud

Tiếp theo, lấy ID khách hàng và Bí mật khách hàng từ bảng điều khiển trước khi bạn bắt đầu làm theo các bước và ví dụ mã có sẵn. Khi bạn có ID và bí mật của mình, vui lòng thêm mã như hình bên dưới:

# Nhập SDK Node.js trong ứng dụng nút của bạn từ http://api.groupdocs.cloud
global.groupdocs_conversion_cloud = require("groupdocs-conversion-cloud");
global.fs = require("fs");

// lấy clientId và clientSecret từ https://dashboard.groupdocs.cloud (yêu cầu đăng ký miễn phí).
global.clientId = "xxxxxxx-xxxx-xxxx-xxxx-xxxxxxxxxxxx";
global.clientSecret = "xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx";
global.myStorage = "test-internal-storage";
const config = new groupdocs_conversion_cloud.Configuration(clientId, clientSecret);
config.apiBaseUrl = "https://api.groupdocs.cloud";

Cách chuyển đổi định dạng PDF sang HTML trong Node.js bằng API REST

Các bước đưa ra dưới đây sẽ cho phép bạn chuyển đổi các tệp PDF thành HTML bằng Nodejs.

  1. Tải lên tệp PDF lên đám mây
  2. Chuyển đổi Tệp PDF sang định dạng HTML
  3. Tải xuống tệp HTML đã chuyển đổi

Tải lên tệp PDF

Có thể sử dụng mẫu mã sau để tải tệp PDF lên đám mây:

// mở tệp trong IOStream từ ổ đĩa hệ thống của bạn.
var resourcesFolder = 'H:\\groupdocs-cloud-data\\sample-file.pdf';
// Đọc tài liệu
fs.readFile(resourcesFolder, (err, fileStream) => {
  // xây dựng FileApi
  var fileApi = groupdocs_conversion_cloud.FileApi.fromConfig(config);
  // tạo yêu cầu tệp tải lên
  var request = new groupdocs_conversion_cloud.UploadFileRequest("sample-file.pdf", fileStream, myStorage);
  // cập nhật dử liệu
  fileApi.uploadFile(request)
    .then(function (response) {
      console.log("Expected response type is FilesUploadResult: " + response.uploaded.length);
    })
    .catch(function (error) {
      console.log("Error: " + error.message);
    });
});

Tệp PDF đã tải lên có sẵn trong phần tệp trên trang tổng quan của bạn.

Chuyển đổi tài liệu PDF sang HTML trong Node.js

Việc chuyển đổi PDF sang HTML bằng thư viện Node.js này chỉ cần một vài dòng mã nguồn. Bạn có thể làm theo các bước sau và đoạn mã:

  • Tạo một phiên bản của ConvertApi
  • Tạo một phiên bản của ConvertSettings
  • Đặt tên lưu trữ và đường dẫn tệp PDF đầu vào
  • Tiếp theo, gán “html” cho định dạng
  • Bây giờ, cung cấp đường dẫn tệp HTML đầu ra
  • Tạo ConvertDocumentRequest với ConvertSettings
  • Cuối cùng, chuyển đổi bằng cách gọi phương thức convertDocument() với ConvertDocumentRequest

Ví dụ mã sau đây cho thấy cách chuyển đổi PDF sang HTML trực tuyến trong Nodejs bằng API REST:

// Cách chuyển đổi định dạng PDF sang HTML trong Node.js bằng API REST
const convert = async() => {
  const convertApi = groupdocs_conversion_cloud.ConvertApi.fromKeys(clientId, clientSecret);

  const settings = new groupdocs_conversion_cloud.ConvertSettings();
  settings.storageName = myStorage;
  settings.filePath = "nodejs-testing/sample-file.pdf";
  settings.format = "html";
  settings.outputPath = "nodejs-testing/sample-file.html";

  try {
    // Tạo yêu cầu tài liệu chuyển đổi
    const request = new groupdocs_conversion_cloud.ConvertDocumentRequest(settings);
    await convertApi.convertDocument(request);
  }
  catch (err) {
    throw err;
  }
}

convert()
.then(() => {
  console.log("Successfully converted PDF to HTML file format.");
})
.catch((err) => {
  console.log("Error occurred while converting the PDF file:", err);
})

Tải xuống tệp đã chuyển đổi

Mẫu mã trên sẽ lưu tệp HTML đã chuyển đổi trên đám mây. Bây giờ bạn đã biết cách chuyển đổi định dạng PDF sang HTML bằng Node.js. Tiếp theo, tải xuống tệp HTML bằng mẫu mã sau:

// xây dựng FileApi để tải xuống tệp đã chuyển đổi
var fileApi = groupdocs_conversion_cloud.FileApi.fromConfig(config);
// tạo yêu cầu tệp donwload
let request = new groupdocs_conversion_cloud.DownloadFileRequest("nodejs-testing/sample-file.html", myStorage);
// tải xuống tệp và loại phản hồi Luồng
fileApi.downloadFile(request)
    .then(function (response) {
        // lưu tập tin trong thư mục hệ thống của bạn
        fs.writeFile("H:\\groupdocs-cloud-data\\sample-file.html", response, "binary", function (err) { });
        console.log("Expected response type is Stream: " + response.length);
    })
    .catch(function (error) {
        console.log("Error: " + error.message);
    });

Chuyển đổi các trang PDF cụ thể sang HTML trong Node.js bằng API REST

Bạn có thể làm theo các bước sau và đoạn mã để chuyển đổi PDF sang HTML trong ứng dụng Node.js của mình với một số cài đặt nâng cao:

Vui lòng làm theo các bước được đưa ra dưới đây:

  • Đầu tiên, tạo một phiên bản của ConvertApi
  • Tạo một phiên bản của ConvertSettings
  • Đặt tên lưu trữ và đường dẫn tệp PDF đầu vào
  • Tiếp theo, gán “html” cho định dạng
  • Tạo một thể hiện của lớp HtmlConvertOptions
  • Đặt các tùy chọn chuyển đổi khác nhau như fromPage, pagesCount, fixedLayout, v.v.
  • Bây giờ, cung cấp các tùy chọn chuyển đổi đầu ra và đường dẫn tệp HTML
  • Tạo ConvertDocumentRequest với ConvertSettings
  • Cuối cùng, chuyển đổi bằng cách gọi phương thức convertDocument() với ConvertDocumentRequest

Ví dụ mã sau đây cho thấy cách chuyển đổi PDF sang HTML trong Node.js bằng các tùy chọn nâng cao:

// Cách chuyển đổi các trang PDF cụ thể sang HTML trong Node.js bằng API REST
const convert = async() => {
  const convertApi = groupdocs_conversion_cloud.ConvertApi.fromKeys(clientId, clientSecret);

  const settings = new groupdocs_conversion_cloud.ConvertSettings();
  settings.storageName = myStorage;
  settings.filePath = "nodejs-testing/sample-file.pdf";
  settings.format = "html";
  
  let convertOptions = new conversion_cloud.HtmlConvertOptions();
  convertOptions.fromPage = 1;
  convertOptions.pagesCount = 1;
  convertOptions.fixedLayout = true;
 
  settings.convertOptions = convertOptions
  settings.outputPath = "nodejs-testing/sample-file.html";

  try {
    // Tạo yêu cầu tài liệu chuyển đổi
    const request = new groupdocs_conversion_cloud.ConvertDocumentRequest(settings);
    await convertApi.convertDocument(request);
  }
  catch (err) {
    throw err;
  }
}

convert()
.then(() => {
  console.log("Successfully converted PDF to HTML file format.");
})
.catch((err) => {
  console.log("Error occurred while converting the PDF file:", err);
})

Trình chuyển đổi PDF sang HTML trực tuyến miễn phí

Làm cách nào để thay đổi định dạng PDF sang HTML trực tuyến miễn phí? Vui lòng thử Trình chuyển đổi PDF sang HTML trực tuyến miễn phí sau đây. Trình chuyển đổi PDF sang HTML5 trực tuyến này được phát triển bằng cách sử dụng API ở trên và có thể nhanh chóng chuyển đổi bảng PDF sang HTML trực tuyến.

Phần kết luận

Các tệp PDF và HTML được sử dụng rộng rãi để lưu trữ và truyền dữ liệu. Vì vậy, bài viết này đã đề cập đến cách chuyển định dạng PDF sang HTML trong các ứng dụng Node.js. Bây giờ bạn biết:

  • cách chuyển đổi định dạng PDF sang HTML trong Node.js bằng API REST;
  • cách chuyển đổi các trang PDF cụ thể sang HTML trong Node.js bằng API REST
  • trình chuyển đổi trực tuyến PDF sang HTML trực tuyến miễn phí;

Ngoài ra, Bạn có thể tìm hiểu thêm về GroupDocs.Conversion Cloud API bằng cách sử dụng tài liệu hoặc các ví dụ có sẵn trên GitHub. Chúng tôi cũng cung cấp phần Tham khảo API nơi bạn có thể tương tác trực tiếp với các API bằng trình duyệt web của mình. Bạn có thể xem trang Hướng dẫn Bắt đầu của chúng tôi.

Ngoài ra, Groupdocs.cloud cũng liên tục cập nhật các chủ đề mới. Vì vậy, hãy luôn cập nhật những thông tin mới nhất.

Đặt một câu hỏi

Bạn có thể đặt câu hỏi về trình chuyển đổi PDF sang HTML Node.js thông qua Diễn đàn hỗ trợ miễn phí của chúng tôi.

câu hỏi thường gặp

Làm cách nào để chuyển đổi PDF sang HTML trong Node.js?

Vui lòng theo liên kết này để tìm hiểu đoạn mã về cách tạo PDF từ HTML bằng javascript một cách nhanh chóng và thuận tiện.

Làm cách nào để tạo PDF từ HTML Node.js bằng API REST?

Tạo một phiên bản của ConvertApi, đặt các giá trị của cài đặt chuyển đổi và gọi phương thức convertDocument với ConvertDocumentRequest để tạo PDF từ tệp HTML.

Làm cách nào để chuyển đổi PDF sang HTML trực tuyến miễn phí?

Trình chuyển đổi mã PDF sang HTML trực tuyến miễn phí cho phép bạn chuyển đổi định dạng tệp PDF sang HTML một cách nhanh chóng và dễ dàng. Khi quá trình chuyển đổi hoàn tất, bạn có thể tải xuống tệp HTML.

Làm cách nào để chuyển đổi PDF sang HTML ngoại tuyến?

Vui lòng truy cập liên kết này để tải xuống phần mềm chuyển đổi PDF sang HTML miễn phí trong windows. Phần mềm tải xuống miễn phí trình chuyển đổi PDF sang HTML trực tuyến này có thể được sử dụng để chuyển PDF sang HTML trong windows một cách nhanh chóng chỉ bằng một cú nhấp chuột.

Xem thêm

Chúng tôi khuyên bạn nên đọc các bài viết sau để tìm hiểu thêm: