Converter PDF em documento do Word editável usando Node.js

Você pode facilmente converter qualquer um dos seus documentos PDF em documentos editáveis do Word programaticamente. Esta conversão permitirá que você atualize o conteúdo de seus documentos PDF usando o Microsoft Word. Como desenvolvedor Node.js, você pode converter arquivos PDF em documentos do Word (DOC ou DOCX) programaticamente na nuvem. Neste artigo, você aprenderá como converter PDF em um documento editável do Word usando uma API REST no Node.js.

Os seguintes tópicos serão abordados neste artigo:

API REST de conversão de PDF e SDK Node.js

Para converter PDF em DOCX, usarei a API Node.js SDK of GroupDocs.Conversion Cloud. É uma solução de conversão de documentos e imagens independente de plataforma, sem depender de nenhuma ferramenta ou software. Ele permite que você converta de forma rápida e confiável imagens e documentos de qualquer supp para qualquer formato que você precisar. Você pode converter facilmente entre mais de 50 tipos de documentos e imagens, como Word, PowerPoint, Excel, PDF, HTML, CAD, imagens raster, etc. Ele também fornece SDKs .NET, Java, PHP, Ruby, Android e Python como seus membros da família de conversão de documentos para a Cloud API.

Você pode instalar o GroupDocs.Conversion Cloud em seu projeto Node.js usando o seguinte comando no console:

npm install groupdocs-conversion-cloud

Obtenha seu ID de cliente e Segredo do cliente no painel antes de começar a seguir as etapas e os exemplos de código disponíveis. Depois de ter seu ID e segredo, adicione o código conforme mostrado abaixo:

global.clientId = "112f0f38-9dae-42d5-b4fc-cc84ae644972";
global.clientSecret = "16ad3fe0bdc39c910f57d2fd48a5d618";
global.myStorage = "";

const config = new groupdocs_conversion_cloud.Configuration(clientId, clientSecret);
config.apiBaseUrl = "https://api.groupdocs.cloud";

Converter PDF em documento do Word editável usando uma API REST no Node.js

Você pode converter seu documento PDF em um documento editável do Word programaticamente na nuvem seguindo as etapas simples abaixo:

  1. Upload o arquivo PDF para a nuvem
  2. Converter PDF para DOCX usando Node.js
  3. Baixar o arquivo DOCX convertido

Carregar o arquivo PDF

Em primeiro lugar, carregue o arquivo PDF na nuvem usando o seguinte exemplo de código:

var resourcesFolder = 'C:\\Files\\sample.pdf';
fs.readFile(resourcesFolder, (err, fileStream) => {
  // construir FileApi
  var fileApi = groupdocs_conversion_cloud.FileApi.fromConfig(config);
  // criar solicitação de upload de arquivo
  var request = new groupdocs_conversion_cloud.UploadFileRequest("sample.pdf", fileStream, myStorage);
  // subir arquivo
  fileApi.uploadFile(request);
});

Como resultado, o arquivo PDF carregado estará disponível na seção de arquivos do seu painel na nuvem.

Converter PDF para DOCX usando Node.js

Você pode facilmente converter PDF para documento DOCX programaticamente seguindo as etapas mencionadas abaixo:

  • Crie uma instância do ConvertApi
  • Crie uma instância do ConvertSettings
  • Definir o caminho do arquivo PDF
  • Atribuir “docx” ao formato
  • Forneça o caminho do arquivo de saída
  • Criar ConvertDocumentRequest com ConvertSettings
  • Converter chamando o método convertDocument() com ConvertDocumentRequest

O exemplo de código a seguir mostra como converter PDF em documento do Word usando uma API REST em Node.js.

// inicializar API
let convertApi = groupdocs_conversion_cloud.ConvertApi.fromKeys(clientId, clientSecret);

// definir configurações de conversão
let settings = new groupdocs_conversion_cloud.ConvertSettings();
settings.filePath = "sample.pdf"; // input file path on the cloud
settings.format = "docx";         // output format
settings.outputPath = "output";   // output file folder on the cloud

// criar solicitação de conversão de documento
let request = new groupdocs_conversion_cloud.ConvertDocumentRequest(settings);

// converter documento
let result = await convertApi.convertDocument(request);
console.log("Document converted successfully: " + result[0].url);
Converter PDF em Word editável usando uma API REST em Node.js

Converter PDF em Word editável usando uma API REST em Node.js

Baixe o arquivo convertido

O exemplo de código acima salvará o arquivo DOCX convertido na nuvem. Você pode baixá-lo usando o seguinte exemplo de código:

// construir FileApi
var fileApi = groupdocs_conversion_cloud.FileApi.fromConfig(config);

// criar solicitação de download de arquivo
let request = new groupdocs_conversion_cloud.DownloadFileRequest("output/sample.docx", myStorage);

// ⇬ Fazer download do arquivo
let response = await fileApi.downloadFile(request);

// salve o arquivo em seu diretório de trabalho
fs.writeFile("C:\\Files\\sample.docx", response, "binary", function (err) { });
console.log(response);

Converter páginas específicas de PDF para DOCX em Node.js

Você pode facilmente converter páginas específicas de um documento PDF em um documento do Word programaticamente seguindo as etapas mencionadas abaixo:

  • Crie uma instância do ConvertApi
  • Crie uma instância do ConvertSettings
  • Definir o caminho do arquivo PDF
  • Atribuir “docx” ao formato
  • Forneça o caminho do arquivo de saída
  • Crie uma instância do DocxConvertOptions
  • Forneça números de página específicos para converter
  • Atribuir DocxConvertOptions para ConvertSettings
  • Criar ConvertDocumentRequest com ConvertSettings
  • Converter chamando o método convertDocument() com ConvertDocumentRequest

O exemplo de código a seguir mostra como converter páginas específicas de um documento PDF em Word usando uma API REST em Node.js. Siga as etapas mencionadas anteriormente para fazer upload e download de um arquivo.

// inicializar API
let convertApi = groupdocs_conversion_cloud.ConvertApi.fromKeys(clientId, clientSecret);

// definir configurações de conversão
let settings = new groupdocs_conversion_cloud.ConvertSettings();
settings.filePath = "sample.pdf";
settings.format = "docx";

// definir opções de conversão docx
let convertOptions = new groupdocs_conversion_cloud.DocxConvertOptions();
convertOptions.pages = [1,2]; // set page numbers to convert

settings.convertOptions = convertOptions
settings.outputPath = "specific_pages.docx";

// criar solicitação de conversão de documento
let request = new groupdocs_conversion_cloud.ConvertDocumentRequest(settings);

// converter documento
let result = await convertApi.convertDocument(request);
console.log("Document converted successfully: " + result[0].url);

O exemplo de código a seguir mostra como converter um intervalo de páginas de um documento PDF em um documento do Word usando uma API REST em Node.js.

// inicializar API
let convertApi = groupdocs_conversion_cloud.ConvertApi.fromKeys(clientId, clientSecret);

// definir configurações de conversão
let settings = new groupdocs_conversion_cloud.ConvertSettings();
settings.filePath = "sample.pdf";
settings.format = "docx";

// definir opções de conversão docx
let convertOptions = new groupdocs_conversion_cloud.DocxConvertOptions();
convertOptions.fromPage = 1;    // set start page number
convertOptions.pagesCount = 2;  // total pages to convert

settings.convertOptions = convertOptions
settings.outputPath = "range_of_pages.docx";

// criar solicitação de conversão de documento
let request = new groupdocs_conversion_cloud.ConvertDocumentRequest(settings);

// converter documento
let result = await convertApi.convertDocument(request);
console.log("Document converted successfully: " + result[0].url);

Conversão de PDF para Word sem usar armazenamento em nuvem

Você pode converter um documento PDF sem usar o armazenamento em nuvem passando-o no corpo da solicitação e recebendo o arquivo de saída na resposta da API. Siga as etapas mencionadas abaixo para converter um PDF em DOCX sem usar o armazenamento em nuvem.

  • Crie uma instância do ConvertApi
  • Leia o arquivo PDF de entrada do caminho local
  • Criar ConvertDocumentDirectRequest
  • Forneça o formato de destino e o caminho do arquivo de entrada como parâmetros de entrada
  • Obtenha resultados chamando o método convertDocumentDirect() com ConvertDocumentDirectRequest
  • Salve o arquivo de saída no caminho local usando o método FileStream.writeFile()

O exemplo de código a seguir mostra como converter um PDF em um documento do Word sem usar o armazenamento em nuvem.

// ler arquivo do disco local
let file = fs.readFileSync('C:\\Files\\sample.pdf');

// criar solicitação direta de documento de conversão
let request = new groupdocs_conversion_cloud.ConvertDocumentDirectRequest("docx", file);

// converter documento diretamente
let result = await convertApi.convertDocumentDirect(request);

// salvar arquivo no diretório de trabalho
fs.writeFile("C:\\Files\\Conversion\\sample_direct.docx", result, "binary", function (err) { });
console.log("Document converted: " + result.length);

Experimente on-line

Experimente a seguinte ferramenta de conversão online gratuita de PDF para DOCX, desenvolvida usando a API acima. https://products.groupdocs.app/conversion/pdf-to-docx

Conclusão

Neste artigo, você aprendeu como converter PDFs em documentos do Word na nuvem. Você também aprendeu como converter páginas específicas de um PDF em um documento do Word usando o Node.js. Além disso, você aprendeu como converter um intervalo de páginas de um PDF para DOCX programaticamente. Este artigo também explicou como carregar programaticamente o arquivo PDF na nuvem e, em seguida, baixar o arquivo DOCX convertido da nuvem. Você pode aprender mais sobre GroupDocs.Conversion Cloud API usando a documentação. Também fornecemos uma seção Referência de API que permite visualizar e interagir com nossas APIs diretamente pelo navegador. Em caso de ambiguidade, sinta-se à vontade para nos contatar no fórum.

Veja também