Come estrarre pagine da un documento word online utilizzando Node.js

Come estrarre pagine da Word DOC/DOCX online utilizzando Node.js

Potrebbe essere necessario estrarre le pagine del documento word in più documenti a livello di codice. Dividendo i documenti di Word, puoi facilmente estrarre la pagina dal documento di Word e condividere informazioni o dati specifici con le parti interessate. In qualità di sviluppatore Node.js, puoi estrarre un documento word in file separati online sul cloud. In questo articolo imparerai come estrarre pagine da word DOC/DOCX online usando Node.js.

In questo articolo saranno trattati i seguenti argomenti:

API REST online di Word Page Extractor e Node.js SDK

Per estrarre le pagine dal documento di Word, utilizzerò l’API Node.js SDK di GroupDocs.Merger Cloud. È una libreria di download gratuito per l’estrattore di pagine di Word online. Consente di dividere, unire, estrarre, rimuovere e riorganizzare una singola pagina o una raccolta di pagine da formati di documenti supportati di Word, Excel, PowerPoint, Disegni Visio, PDF e HTML.

Puoi installare GroupDocs.Merger cloud per estrarre le pagine di Word dall’applicazione Node.js utilizzando il seguente comando nella console:

npm install groupdocs-merger-cloud

Si prega di ottenere l’ID cliente e il segreto dalla dashboard prima di seguire i passaggi menzionati. Una volta che hai il tuo ID e segreto, aggiungi il codice come mostrato di seguito:

# Importa l'SDK Node.js nell'applicazione del nodo da http://api.groupdocs.cloud
global.groupdocs_merger_cloud = require("groupdocs-merger-cloud");
global.fs = require("fs");

// ottieni clientId e clientSecret da https://dashboard.groupdocs.cloud (è richiesta la registrazione gratuita).
global.clientId = "xxxxxxx-xxxx-xxxx-xxxx-xxxxxxxxxxxx";
global.clientSecret = "xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx";
global.myStorage = "test-internal-storage";
const config = new groupdocs_merger_cloud.Configuration(clientId, clientSecret);
config.apiBaseUrl = "https://api.groupdocs.cloud";

Estrai pagine da Word in un nuovo documento in base ai numeri di pagina esatti

Puoi esportare pagine specifiche da file Word in modo programmatico sul cloud seguendo i semplici passaggi indicati di seguito:

  • Carica il file Word nel Cloud
  • Estratto Pagine di Word che utilizzano l’API REST in Node.js
  • Scarica i file separati

Carica il file Word

Innanzitutto, carica il file Word nel cloud utilizzando l’esempio di codice fornito di seguito:

// apri il file in IOStream dall'unità di sistema.
var resourcesFolder = 'H:\\groupdocs-cloud-data\\input-sample-file.docx';
// leggi file
fs.readFile(resourcesFolder, (err, fileStream) => {
  // costruire FileApi
  var fileApi = groupdocs_merger_cloud.FileApi.fromConfig(config);
  // creare richiesta di file di caricamento
  var request = new groupdocs_merger_cloud.UploadFileRequest("input-sample-file.docx", fileStream, myStorage);
  // caricare un file
  fileApi.uploadFile(request)
    .then(function (response) {
      console.log("Expected response type is FilesUploadResult: " + response.uploaded.length);
    })
    .catch(function (error) {
      console.log("Error: " + error.message);
    });
});

Di conseguenza, il file Word caricato sarà disponibile nella sezione file della tua dashboard sul cloud.

Estrai le pagine di Word utilizzando l’API REST in Node.js

Puoi facilmente estrarre pagine di file Word a livello di codice seguendo i passaggi indicati di seguito:

  • Innanzitutto, crea un’istanza di PagesApi.
  • Crea un’istanza di ExtractOptions.
  • Crea un’istanza di FileInfo.
  • Quindi, imposta il percorso del file Word di input.
  • Successivamente, imposta il percorso del file Word estratto.
  • Imposta numeri di pagina specifici in un array separato da virgole per estrarre il file Word.
  • Crea ExtractRequest con ExtractOptions.
  • Infine, chiama il metodo pagesApi.extract() con ExtractRequest per ottenere i risultati.

Il seguente frammento di codice mostra come estrarre le pagine di Word in file separati utilizzando l’API REST in Node.js:

// Come estrarre pagine da Word in un nuovo documento in base ai numeri di pagina esatti
const extractwordpages = async () => {

  // inizializzazione dell'API
  global.pagesApi = groupdocs_merger_cloud.PagesApi.fromKeys(clientId, clientSecret);

  // definire le opzioni di estrazione
  let options = new groupdocs_merger_cloud.ExtractOptions();
  options.fileInfo = new groupdocs_merger_cloud.FileInfo();
  options.fileInfo.filePath = "nodejs-testing/input-sample-file.docx"; 
  options.outputPath = "nodejs-testing/output-sample-file.docx"; 
  options.pages = [2, 4, 7];
  
  try {
    // creare richiesta di estrazione
    let extractRequest = new groupdocs_merger_cloud.ExtractRequest(options);
    // estrarre le pagine dal file docx
    let result = await pagesApi.extract(extractRequest);
  }
  catch (err) {
    throw err;
  }
}

extractwordpages()
.then(() => {
  console.log("Successfully extract Word DOC pages: ");
})
.catch((err) => {
  console.log("Error occurred while extracting pages from Word file:", err);
})

Scarica i file estratti

L’esempio di codice precedente salverà i file separati nel cloud. Puoi scaricarli utilizzando il seguente esempio di codice:

// costruire FileApi per scaricare il file unito
var fileApi = groupdocs_merger_cloud.FileApi.fromConfig(config);
// creare una richiesta di file di download
let request = new groupdocs_merger_cloud.DownloadFileRequest("nodejs-testing/output-sample-file.docx", myStorage);
// scarica il file e il tipo di risposta Stream
fileApi.downloadFile(request)
    .then(function (response) {
        // salvare il file nella directory di sistema
        fs.writeFile("H:\\groupdocs-cloud-data\\output-sample-file.docx", response, "binary", function (err) { });
        console.log("Expected response type is Stream: " + response.length);
    })
    .catch(function (error) {
        console.log("Error: " + error.message);
    });

Estrai le pagine del documento Word per intervallo di pagine utilizzando l’API REST in Node.js

È possibile estrarre e salvare le pagine da una parola separatamente fornendo un intervallo di numeri di pagina a livello di codice seguendo i passaggi indicati di seguito:

  • Innanzitutto, crea un’istanza di PagesApi.
  • Crea un’istanza di ExtractOptions.
  • Crea un’istanza di FileInfo.
  • Quindi, imposta il percorso del file Word di input.
  • Successivamente, imposta il percorso del file Word estratto.
  • Impostare i valori startPageNumber e endPageNumber.
  • Quindi, imposta rangeMode come EvenPages o OddPages
  • Crea ExtractRequest con ExtractOptions.
  • Infine, chiama il metodo pagesApi.extract() con ExtractRequest per ottenere i risultati.

Il seguente frammento di codice mostra come estrarre pagine da Word online utilizzando l’intervallo di pagine e la modalità pagina in Node.js:

// Come estrarre pagine di documenti Word per intervallo di pagine utilizzando l'API REST in Node.js
const extractpages = async () => {

  // inizializzazione dell'API
  global.pagesApi = groupdocs_merger_cloud.PagesApi.fromKeys(clientId, clientSecret);

  // definire le opzioni di estrazione
  let options = new groupdocs_merger_cloud.ExtractOptions();
  options.fileInfo = new groupdocs_merger_cloud.FileInfo();
  options.fileInfo.filePath = "nodejs-testing/input-sample-file.docx"; 
  options.outputPath = "nodejs-testing/output-sample-file.docx"; 
  options.startPageNumber = 1;
  options.endPageNumber = 10;
  options.rangeMode = groupdocs_merger_cloud.ExtractOptions.RangeModeEnum.EvenPages;
  
  try {
    // creare richiesta di estrazione
    let extractRequest = new groupdocs_merger_cloud.ExtractRequest(options);
    // estrarre le pagine del file Word
    let result = await pagesApi.extract(extractRequest);
  } 
  catch (err) {
    throw err;
  }
}

extractpages()
.then(() => {
  console.log("Successfully extratcing pages of Word document.");
})
.catch((err) => {
  console.log("Error occurred while extracting pages from Word file.", err);
})

In modo simile, puoi estrarre le pagine dispari dai documenti di Word.

Prova in linea

Come estrarre le pagine dal documento di Word online? Prova il seguente strumento di estrazione di Word online gratuito per estrarre pagine da Word online gratuitamente. Questo strumento online gratuito per l’estrazione di pagine di Word è stato sviluppato utilizzando l’API di cui sopra.

Conclusione

In questo articolo hai imparato:

  • come estrarre determinate pagine dal documento Word online utilizzando l’API REST;
  • come estrarre le pagine dal documento di Word utilizzando l’intervallo di pagine e il filtro della modalità intervallo;
  • caricare il file Word nel cloud per esportare le pagine selezionate da Word online;
  • scaricare e salvare determinate pagine di Word dal cloud;
  • come estrarre pagine da Word gratis;

Ora sai come estrarre tutte le pagine dal documento di Word o come salvare determinate pagine di una parola. L’API consente inoltre di riordinare o sostituire le pagine del documento, modificare l’orientamento della pagina, gestire le password del documento ed eseguire facilmente altre manipolazioni per qualsiasi formato di file supportato. Inoltre, puoi saperne di più su GroupDocs.Merge Cloud API utilizzando la documentazione. Forniamo anche una sezione Riferimento API che ti consente di visualizzare e interagire con le nostre API direttamente attraverso il browser.

Fai una domanda

Puoi porre le tue domande sull’estrattore di pagine di Word per esportare pagine selezionate da Word, tramite il nostro Forum di supporto gratuito

Domande frequenti

Come estrarre più pagine da Word in un unico file?

Installa JS library per separare i file di Word in più pagine online in modo programmatico. Puoi visitare la documentazione per i dettagli completi dell’API.

Quanto tempo ci vuole per estrarre pagine specifiche da Word?

JavaScript HTML to Word library funziona molto velocemente e puoi estrarre pagine da Word protetto facilmente in pochi secondi.

Guarda anche