Как конвертировать pdf в html без потери форматирования

Как конвертировать PDF в HTML программно

PDF(Portable Document Format) — это безопасный формат документа, который содержит графику, текст, 3D-модели, изображения и т. д. Формат PDF сжат и меньше по размеру, чем другие общедоступные форматы файлов. HTML — это широко используемый легкий текстовый язык разметки. Он поддерживается всеми браузерами и быстро загружается. PDF и HTML оба формата файлов хороши для доступности, но HTML, как правило, намного лучше подходит для предоставления информации через Интернет. Итак, в этой статье мы покажем, как конвертировать PDF в HTML онлайн в Node.js.

В этой статье будут затронуты следующие темы:

Преобразование PDF в HTML-страницу REST API и Node.js SDK

Node.js SDK для GroupDocs.Conversion — это онлайн-библиотека преобразования NodeJS, которая позволяет выполнять преобразования из PDF в HTML в режиме онлайн. Это независимая от платформы библиотека и решение для преобразования документов. Это позволяет вам легко конвертировать ваши документы и изображения любого поддерживаемого формата файла в любой формат, который вам нужен. Вы можете легко конвертировать более 50 типов документов и изображений, таких как Word, PowerPoint, Excel, PDF, HTML, CAD, растровые изображения и т. д. Он также поддерживает SDK .NET, Java, PHP, Ruby, Android и Python. члены семьи преобразования документов для Cloud API.

GroupDocs.Conversion Cloud можно установить с помощью следующей команды в консоли Node.js:

npm install groupdocs-conversion-cloud

Затем получите свой идентификатор клиента и секрет клиента из панели инструментов, прежде чем приступать к выполнению шагов и доступных примеров кода. Получив свой идентификатор и секрет, добавьте код, как показано ниже:

# Импортируйте Node.js SDK в приложение узла с http://api.groupdocs.cloud.
global.groupdocs_conversion_cloud = require("groupdocs-conversion-cloud");
global.fs = require("fs");

// получить clientId и clientSecret с https://dashboard.groupdocs.cloud (требуется бесплатная регистрация).
global.clientId = "xxxxxxx-xxxx-xxxx-xxxx-xxxxxxxxxxxx";
global.clientSecret = "xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx";
global.myStorage = "test-internal-storage";
const config = new groupdocs_conversion_cloud.Configuration(clientId, clientSecret);
config.apiBaseUrl = "https://api.groupdocs.cloud";

Как преобразовать PDF в формат HTML в Node.js с помощью REST API

Приведенные ниже шаги позволят вам конвертировать PDF-файлы в HTML с помощью Nodejs.

  1. Загрузить файл PDF в облако
  2. Конвертировать файл PDF в формат HTML
  3. Скачать преобразованный файл HTML

Загрузите PDF-файл

Следующий пример кода можно использовать для загрузки файла PDF в облако:

// откройте файл в IOStream с вашего системного диска.
var resourcesFolder = 'H:\\groupdocs-cloud-data\\sample-file.pdf';
// прочитать файл
fs.readFile(resourcesFolder, (err, fileStream) => {
  // построить FileApi
  var fileApi = groupdocs_conversion_cloud.FileApi.fromConfig(config);
  // создать запрос на загрузку файла
  var request = new groupdocs_conversion_cloud.UploadFileRequest("sample-file.pdf", fileStream, myStorage);
  // загрузить файл
  fileApi.uploadFile(request)
    .then(function (response) {
      console.log("Expected response type is FilesUploadResult: " + response.uploaded.length);
    })
    .catch(function (error) {
      console.log("Error: " + error.message);
    });
});

Загруженный PDF-файл доступен в разделе файлов вашей панели управления.

Преобразование PDF в HTML-документ в Node.js

Преобразование PDF в HTML с помощью этой библиотеки Node.js — это вопрос нескольких строк исходного кода. Вы можете выполнить следующие шаги и фрагмент кода:

  • Создайте экземпляр ConvertApi.
  • Создайте экземпляр ConvertSettings
  • Задайте имя хранилища и путь к входному PDF-файлу.
  • Затем назначьте «html» для формата
  • Теперь укажите путь к выходному файлу HTML.
  • Создайте ConvertDocumentRequest с ConvertSettings
  • Наконец, конвертируйте, вызвав метод convertDocument() с ConvertDocumentRequest.

В следующем примере кода показано, как конвертировать PDF в HTML онлайн в Nodejs с помощью REST API:

// Как преобразовать PDF в формат HTML в Node.js с помощью REST API
const convert = async () => {
  const convertApi = groupdocs_conversion_cloud.ConvertApi.fromKeys(clientId, clientSecret);

  const settings = new groupdocs_conversion_cloud.ConvertSettings();
  settings.storageName = myStorage;
  settings.filePath = "nodejs-testing/sample-file.pdf";
  settings.format = "html";
  settings.outputPath = "nodejs-testing/sample-file.html";

  try {
    // Создать запрос на преобразование документа
    const request = new groupdocs_conversion_cloud.ConvertDocumentRequest(settings);
    await convertApi.convertDocument(request);
  }
  catch (err) {
    throw err;
  }
}

convert()
.then(() => {
  console.log("Successfully converted PDF to HTML file format.");
})
.catch((err) => {
  console.log("Error occurred while converting the PDF file:", err);
})

Загрузите преобразованный файл

Приведенный выше пример кода сохранит преобразованный HTML-файл в облаке. Теперь вы знаете, как конвертировать PDF в формат HTML с помощью Node.js. Затем загрузите HTML-файл, используя следующий пример кода:

// создать FileApi для загрузки преобразованного файла
var fileApi = groupdocs_conversion_cloud.FileApi.fromConfig(config);
// создать запрос на загрузку файла
let request = new groupdocs_conversion_cloud.DownloadFileRequest("nodejs-testing/sample-file.html", myStorage);
// скачать файл и тип ответа Stream
fileApi.downloadFile(request)
    .then(function (response) {
        // сохранить файл в системном каталоге
        fs.writeFile("H:\\groupdocs-cloud-data\\sample-file.html", response, "binary", function (err) { });
        console.log("Expected response type is Stream: " + response.length);
    })
    .catch(function (error) {
        console.log("Error: " + error.message);
    });

Преобразование определенных страниц PDF в HTML в Node.js с использованием REST API

Вы можете выполнить следующие шаги и фрагмент кода, чтобы преобразовать PDF в HTML в приложении Node.js с некоторыми дополнительными настройками:

Пожалуйста, следуйте инструкциям ниже:

  • Во-первых, создайте экземпляр ConvertApi.
  • Создайте экземпляр ConvertSettings
  • Задайте имя хранилища и путь к входному PDF-файлу.
  • Затем назначьте «html» для формата
  • Создайте экземпляр класса HtmlConvertOptions.
  • Установите различные параметры преобразования, такие как fromPage, pagesCount, fixedLayout и т. д.
  • Теперь укажите параметры преобразования вывода и путь к файлу HTML.
  • Создайте ConvertDocumentRequest с ConvertSettings
  • Наконец, конвертируйте, вызвав метод convertDocument() с ConvertDocumentRequest.

В следующем примере кода показано, как преобразовать PDF в HTML в Node.js с помощью дополнительных параметров.

// Как преобразовать определенные страницы PDF в HTML в Node.js с помощью REST API
const convert = async () => {
  const convertApi = groupdocs_conversion_cloud.ConvertApi.fromKeys(clientId, clientSecret);

  const settings = new groupdocs_conversion_cloud.ConvertSettings();
  settings.storageName = myStorage;
  settings.filePath = "nodejs-testing/sample-file.pdf";
  settings.format = "html";
  
  let convertOptions = new conversion_cloud.HtmlConvertOptions();
  convertOptions.fromPage = 1;
  convertOptions.pagesCount = 1;
  convertOptions.fixedLayout = true;
 
  settings.convertOptions = convertOptions
  settings.outputPath = "nodejs-testing/sample-file.html";

  try {
    // Создать запрос на преобразование документа
    const request = new groupdocs_conversion_cloud.ConvertDocumentRequest(settings);
    await convertApi.convertDocument(request);
  }
  catch (err) {
    throw err;
  }
}

convert()
.then(() => {
  console.log("Successfully converted PDF to HTML file format.");
})
.catch((err) => {
  console.log("Error occurred while converting the PDF file:", err);
})

Бесплатный онлайн-конвертер PDF в HTML

Как изменить формат PDF на HTML онлайн бесплатно? Попробуйте следующий бесплатный онлайн-конвертер PDF в HTML. Этот онлайн-конвертер PDF в HTML5 разработан с использованием вышеуказанного API и может быстро конвертировать PDF в HTML-таблицу онлайн.

Заключение

Файлы PDF и HTML широко используются для хранения и передачи данных. Итак, в этой статье рассказывается, как преобразовать PDF в формат HTML в приложениях Node.js. Теперь ты знаешь:

  • как преобразовать PDF в формат HTML в Node.js с помощью REST API;
  • как преобразовать определенные страницы PDF в HTML в Node.js с помощью REST API
  • бесплатный онлайн-конвертер PDF в HTML;

Кроме того, вы можете узнать больше о GroupDocs.Conversion Cloud API, используя документацию или примеры, доступные на GitHub. Мы также предоставляем раздел Справочник по API, где вы можете взаимодействовать с API напрямую через веб-браузер. Вы можете ознакомиться с нашим Руководством по началу работы.

Кроме того, Groupdocs.cloud также постоянно обновляет новые темы. Так что будьте в курсе самой свежей информации.

Задайте вопрос

Вы можете задавать вопросы о конвертере PDF в HTML Node.js на нашем Бесплатном форуме поддержки.

Часто задаваемые вопросы

Как преобразовать PDF в HTML в Node.js?

Пожалуйста, перейдите по этой ссылке, чтобы узнать фрагмент кода о том, как быстро и удобно генерировать PDF из HTML с помощью javascript.

Как сгенерировать PDF из HTML Node.js с помощью REST API?

Создайте экземпляр ConvertApi,, установите значения параметров преобразования и вызовите метод convertDocument с ConvertDocumentRequest для создания PDF из HTML-файла.

Как конвертировать PDF в HTML онлайн бесплатно?

Бесплатный онлайн-конвертер PDF в HTML позволяет быстро и легко конвертировать файлы PDF в формат HTML. После завершения преобразования вы можете загрузить HTML-файл.

Как преобразовать PDF в HTML в автономном режиме?

Посетите эта ссылка, чтобы загрузить бесплатное программное обеспечение для конвертации PDF в HTML для Windows. Это бесплатно загружаемое онлайн-программное обеспечение для конвертации PDF в HTML можно использовать для быстрого преобразования PDF в HTML в Windows одним щелчком мыши.

Смотрите также

Мы рекомендуем вам прочитать следующие статьи, чтобы узнать больше: