Преобразование PDF в редактируемый документ Word с помощью Node.js

Вы можете легко программно преобразовать любой из ваших PDF-документов в редактируемые документы Word. Это преобразование позволит вам обновить содержимое ваших PDF-документов с помощью Microsoft Word. Как разработчик Node.js, вы можете программно преобразовывать PDF-файлы в документы Word (DOC или DOCX) в облаке. В этой статье вы узнаете, как преобразовать PDF в редактируемый документ Word с помощью REST API в Node.js.

В этой статье должны быть раскрыты следующие темы:

Преобразование PDF REST API и Node.js SDK

Для преобразования PDF в DOCX я буду использовать API Node.js SDK GroupDocs.Conversion Cloud. Это независимое от платформы решение для преобразования документов и изображений, не зависящее от какого-либо инструмента или программного обеспечения. Он позволяет быстро и надежно конвертировать изображения и документы любого supp в любой нужный вам формат. Вы можете легко конвертировать между более чем 50 типами документов и изображений, таких как Word, PowerPoint, Excel, PDF, HTML, CAD, растровые изображения и т. д. Он также предоставляет пакеты SDK для .NET, Java, PHP, Ruby, Android и Python. члены семьи преобразования документов для Cloud API.

Вы можете установить GroupDocs.Conversion Cloud в свой проект Node.js, используя следующую команду в консоли:

npm install groupdocs-conversion-cloud

Пожалуйста, получите свой идентификатор клиента и секретный код клиента на панели инструментов, прежде чем приступать к выполнению шагов и доступных примеров кода. Получив свой идентификатор и секрет, добавьте код, как показано ниже:

global.clientId = "112f0f38-9dae-42d5-b4fc-cc84ae644972";
global.clientSecret = "16ad3fe0bdc39c910f57d2fd48a5d618";
global.myStorage = "";

const config = new groupdocs_conversion_cloud.Configuration(clientId, clientSecret);
config.apiBaseUrl = "https://api.groupdocs.cloud";

Преобразование PDF в редактируемый документ Word с помощью REST API в Node.js

Вы можете программно преобразовать документ PDF в редактируемый документ Word в облаке, выполнив простые шаги, указанные ниже:

  1. Загрузить файл PDF в облако
  2. Конвертировать PDF в DOCX с помощью Node.js
  3. Скачать преобразованный файл DOCX

Загрузите PDF-файл

Во-первых, загрузите файл PDF в облако, используя следующий пример кода:

var resourcesFolder = 'C:\\Files\\sample.pdf';
fs.readFile(resourcesFolder, (err, fileStream) => {
  // построить FileApi
  var fileApi = groupdocs_conversion_cloud.FileApi.fromConfig(config);
  // создать запрос на загрузку файла
  var request = new groupdocs_conversion_cloud.UploadFileRequest("sample.pdf", fileStream, myStorage);
  // загрузить файл
  fileApi.uploadFile(request);
});

В результате загруженный PDF-файл будет доступен в разделе файлов вашей панели управления в облаке.

Преобразование PDF в DOCX с помощью Node.js

Вы можете легко преобразовать документ PDF в документ DOCX программно, выполнив шаги, указанные ниже:

  • Создайте экземпляр ConvertApi
  • Создайте экземпляр ConvertSettings
  • Установите путь к файлу PDF
  • Назначьте «docx» формату
  • Укажите путь к выходному файлу
  • Создайте ConvertDocumentRequest с ConvertSettings
  • Преобразуйте, вызвав метод convertDocument() с ConvertDocumentRequest.

В следующем примере кода показано, как преобразовать PDF в документ Word с помощью REST API в Node.js.

// инициализировать API
let convertApi = groupdocs_conversion_cloud.ConvertApi.fromKeys(clientId, clientSecret);

// определить настройки преобразования
let settings = new groupdocs_conversion_cloud.ConvertSettings();
settings.filePath = "sample.pdf"; // input file path on the cloud
settings.format = "docx";         // output format
settings.outputPath = "output";   // output file folder on the cloud

// создать запрос на преобразование документа
let request = new groupdocs_conversion_cloud.ConvertDocumentRequest(settings);

// конвертировать документ
let result = await convertApi.convertDocument(request);
console.log("Document converted successfully: " + result[0].url);
Преобразование PDF в редактируемый Word с помощью REST API в Node.js

Преобразование PDF в редактируемый Word с помощью REST API в Node.js

Загрузите преобразованный файл

Приведенный выше пример кода сохранит преобразованный файл DOCX в облаке. Вы можете загрузить его, используя следующий пример кода:

// построить FileApi
var fileApi = groupdocs_conversion_cloud.FileApi.fromConfig(config);

// создать запрос на скачивание файла
let request = new groupdocs_conversion_cloud.DownloadFileRequest("output/sample.docx", myStorage);

// Загрузка файла
let response = await fileApi.downloadFile(request);

// сохранить файл в вашем рабочем каталоге
fs.writeFile("C:\\Files\\sample.docx", response, "binary", function (err) { });
console.log(response);

Преобразование определенных страниц PDF в DOCX в Node.js

Вы можете легко преобразовать определенные страницы документа PDF в документ Word программным путем, выполнив шаги, указанные ниже:

  • Создайте экземпляр ConvertApi
  • Создайте экземпляр ConvertSettings
  • Установите путь к файлу PDF
  • Назначьте «docx» формату
  • Укажите путь к выходному файлу
  • Создайте экземпляр DocxConvertOptions
  • Укажите конкретные номера страниц для преобразования
  • Назначьте DocxConvertOptions для ConvertSettings
  • Создайте ConvertDocumentRequest с ConvertSettings
  • Преобразуйте, вызвав метод convertDocument() с ConvertDocumentRequest.

В следующем примере кода показано, как преобразовать определенные страницы документа PDF в документ Word с помощью REST API в Node.js. Пожалуйста, следуйте шагам, упомянутым ранее, чтобы загрузить и скачать файл.

// инициализировать API
let convertApi = groupdocs_conversion_cloud.ConvertApi.fromKeys(clientId, clientSecret);

// определить настройки преобразования
let settings = new groupdocs_conversion_cloud.ConvertSettings();
settings.filePath = "sample.pdf";
settings.format = "docx";

// определить параметры преобразования docx
let convertOptions = new groupdocs_conversion_cloud.DocxConvertOptions();
convertOptions.pages = [1,2]; // set page numbers to convert

settings.convertOptions = convertOptions
settings.outputPath = "specific_pages.docx";

// создать запрос на преобразование документа
let request = new groupdocs_conversion_cloud.ConvertDocumentRequest(settings);

// конвертировать документ
let result = await convertApi.convertDocument(request);
console.log("Document converted successfully: " + result[0].url);

В следующем примере кода показано, как преобразовать диапазон страниц из документа PDF в документ Word с помощью REST API в Node.js.

// инициализировать API
let convertApi = groupdocs_conversion_cloud.ConvertApi.fromKeys(clientId, clientSecret);

// определить настройки преобразования
let settings = new groupdocs_conversion_cloud.ConvertSettings();
settings.filePath = "sample.pdf";
settings.format = "docx";

// определить параметры преобразования docx
let convertOptions = new groupdocs_conversion_cloud.DocxConvertOptions();
convertOptions.fromPage = 1;    // set start page number
convertOptions.pagesCount = 2;  // total pages to convert

settings.convertOptions = convertOptions
settings.outputPath = "range_of_pages.docx";

// создать запрос на преобразование документа
let request = new groupdocs_conversion_cloud.ConvertDocumentRequest(settings);

// конвертировать документ
let result = await convertApi.convertDocument(request);
console.log("Document converted successfully: " + result[0].url);

Преобразование PDF в Word без использования облачного хранилища

Вы можете преобразовать PDF-документ без использования облачного хранилища, передав его в теле запроса и получив выходной файл в ответе API. Пожалуйста, следуйте инструкциям ниже, чтобы преобразовать PDF в DOCX без использования облачного хранилища.

  • Создайте экземпляр ConvertApi
  • Чтение входного PDF-файла с локального пути
  • Создать ConvertDocumentDirectRequest
  • Укажите целевой формат и путь к входному файлу в качестве входных параметров.
  • Получите результаты, вызвав метод convertDocumentDirect() с ConvertDocumentDirectRequest.
  • Сохраните выходной файл по локальному пути, используя метод FileStream.writeFile().

В следующем примере кода показано, как преобразовать PDF в документ Word без использования облачного хранилища.

// прочитать файл с локального диска
let file = fs.readFileSync('C:\\Files\\sample.pdf');

// создать прямой запрос конвертации документа
let request = new groupdocs_conversion_cloud.ConvertDocumentDirectRequest("docx", file);

// конвертировать документ напрямую
let result = await convertApi.convertDocumentDirect(request);

// сохранить файл в рабочей папке
fs.writeFile("C:\\Files\\Conversion\\sample_direct.docx", result, "binary", function (err) { });
console.log("Document converted: " + result.length);

Попробуйте онлайн

Пожалуйста, попробуйте следующий бесплатный онлайн-инструмент преобразования PDF в DOCX, который разработан с использованием вышеуказанного API. https://products.groupdocs.app/conversion/pdf-to-docx

Заключение

В этой статье вы узнали, как конвертировать PDF-файлы в документы Word в облаке. Вы также узнали, как преобразовать определенные страницы PDF в документ Word с помощью Node.js. Кроме того, вы узнали, как программно конвертировать ряд страниц из PDF в DOCX. В этой статье также объясняется, как программно загрузить файл PDF в облако, а затем загрузить преобразованный файл DOCX из облака. Вы можете узнать больше о GroupDocs.Conversion Cloud API, используя документацию. Мы также предоставляем раздел Справочник по API, который позволяет вам визуализировать наши API и взаимодействовать с ними непосредственно через браузер. В случае возникновения каких-либо неясностей, пожалуйста, свяжитесь с нами на форуме.

Смотрите также