PPTX in Node.js

Estrai testo da PowerPoint PPT/PPTX in Node.js

In alcuni scenari, il testo formattato viene estratto dai documenti per un’ulteriore elaborazione come nell’analisi del testo, nella classificazione, ecc. Tra gli altri formati di file come PDF e Word, la presentazione PowerPoint viene utilizzata anche nell’estrazione del testo. Pertanto, questo articolo mostra come estrarre il testo da PowerPoint PPT/PPTX in Node.js. Puoi facilmente analizzare le tue presentazioni PowerPoint PPT/PPTX e il testo da una diapositiva specifica o estrarre tutto il testo a livello di codice sul cloud.

In questo articolo verranno trattati i seguenti argomenti:

Libreria Node.js per estrarre testo da PowerPoint PPT

Per l’analisi dei documenti PowerPoint, utilizzerò Node.js SDK dell’API GroupDocs.Parser Cloud. Ti consente di analizzare i dati da oltre 50 tipi di formati di documenti supportati. Supporta anche l’analisi di contenitori come archivi ZIP, file di dati di posta OST, e-book, markup, portfolio PowerPoint e PDF nelle tue applicazioni Node.js. Puoi estrarre testo, immagini e analizzare i dati da un modello utilizzando l’SDK. Fornisce inoltre SDK .NET, Java, PHP, Ruby e Python come membri della famiglia di analizzatori di documenti per l’API Cloud.

Puoi installare GroupDocs.Parser Cloud nella tua applicazione Node.js utilizzando il seguente comando nella console:

npm install groupdocs-parser-cloud

Si prega di ottenere l’ID cliente e il segreto dalla dashboard prima di seguire i passaggi menzionati. Una volta che hai il tuo ID e segreto, aggiungi il codice come mostrato di seguito:

# Importa l'SDK Node.js nell'applicazione del nodo da http://api.groupdocs.cloud
global.groupdocs_parser_cloud = require("groupdocs-parser-cloud");
global.fs = require("fs");

// ottieni clientId e clientSecret da https://dashboard.groupdocs.cloud (è richiesta la registrazione gratuita).
global.clientId = "xxxxxxx-xxxx-xxxx-xxxx-xxxxxxxxxxxx";
global.clientSecret = "xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx";
global.myStorage = "test-internal-storage";
const config = new groupdocs_parser_cloud.Configuration(clientId, clientSecret);
config.apiBaseUrl = "https://api.groupdocs.cloud";

Estrai tutto il testo da PowerPoint PPT/PPTX in Node.js utilizzando l’API REST

Puoi estrarre il testo dalle presentazioni di PowerPoint seguendo i semplici passaggi indicati di seguito:

Carica il file

Innanzitutto, carica il documento PowerPoint sul Cloud utilizzando l’esempio di codice riportato di seguito:

// apri il file in IOStream dall'unità di sistema.
var resourcesFolder = 'H:\\groupdocs-cloud-data\\sample-file.pptx';
// leggi file
fs.readFile(resourcesFolder, (err, fileStream) => {
  // costruire FileApi
  var fileApi = groupdocs_parser_cloud.FileApi.fromConfig(config);
  // creare richiesta di file di caricamento
  var request = new groupdocs_parser_cloud.UploadFileRequest("sample-file.pptx", fileStream, myStorage);
  // caricare un file
  fileApi.uploadFile(request)
    .then(function (response) {
      console.log("Expected response type is FilesUploadResult: " + response.uploaded.length);
    })
    .catch(function (error) {
      console.log("Error: " + error.message);
    });
});

Di conseguenza, il file PowerPoint caricato sarà disponibile nella sezione file della dashboard sul cloud.

Estrai il testo dalla presentazione di PowerPoint utilizzando Node.js

È possibile estrarre facilmente tutto il testo dai file PowerPoint a livello di codice seguendo i passaggi indicati di seguito:

  • Innanzitutto, crea un’istanza di ParseApi.
  • In secondo luogo, creare un’istanza di FileInfo.
  • Quindi, imposta il percorso del file PowerPoint.
  • Crea un’istanza di TextOptions.
  • Quindi, assegna FileInfo a TextOptions.
  • Creare un’istanza di FormattedTextOptions.
  • Imposta la modalità formattedTextOptions come PlainText
  • Successivamente, assegna il valore formattedTextOptions
  • Ora crea un’istanza di TextRequest con TextOptions.
  • Infine, ottieni risultati chiamando il metodo ParseApi.text() con TextRequest.

Il seguente esempio di codice mostra come estrarre tutto il testo dal file PowerPoint utilizzando un’API REST in Node.js:

// Come estrarre tutto il testo da PowerPoint PPT/PPTX in Node.js utilizzando l'API REST
const parse = async () => {
  global.parseApi = groupdocs_parser_cloud.ParseApi.fromKeys(clientId, clientSecret);

  let fileInfo = new groupdocs_parser_cloud.FileInfo();
  fileInfo.filePath = "nodejs-testing/sample-file.pptx";

  let options = new groupdocs_parser_cloud.TextOptions();
  options.fileInfo = fileInfo;

  let formattedTextOptions = new groupdocs_parser_cloud.FormattedTextOptions();
  formattedTextOptions.mode = "PlainText";
  options.formattedTextOptions = formattedTextOptions;

  try {
    // Crea richiesta di documento di analisi
    let request = new groupdocs_parser_cloud.TextRequest(options);
    let response = await parseApi.text(request);
    // Visualizza i risultati
    console.log(response.text);
  }
  catch (err) {
    throw err;
  }
}

parse()
.then(() => {
  console.log("Successfully extracted text from PowerPoint PPTX document.");
})
.catch((err) => {
  console.log("Error occurred while extracting text from PowerPoint PPTX file:", err);
})
Come estrarre il testo dalla presentazione di PowerPoint utilizzando Node.js

Estrai il testo dalla presentazione di PowerPoint utilizzando Node.js

Estrai testo da PowerPoint PPT per intervallo di numeri di pagina in Node.js

È possibile estrarre il testo da pagine specifiche di un file PDF in modo programmatico seguendo i passaggi indicati di seguito:

  • Innanzitutto, crea un’istanza di ParseApi.
  • Successivamente, crea un’istanza di FileInfo.
  • Quindi, imposta il percorso del file PowerPoint PPTX.
  • Crea un’istanza di TextOptions.
  • Quindi, assegna FileInfo a TextOptions.
  • Impostare i valori startPageNumber e countPagesToExtract
  • Creare un’istanza di FormattedTextOptions.
  • Imposta la modalità formattedTextOptions come PlainText
  • Successivamente, assegna il valore formattedTextOptions.
  • Imposta il numero della pagina iniziale e il numero totale di pagine da estrarre.
  • Ora crea un’istanza di TextRequest con TextOptions.
  • Infine, ottieni risultati chiamando il metodo ParseApi.text() con TextRequest.

Il seguente esempio di codice mostra come estrarre testo specifico dal file PPTX di PowerPoint in base ai numeri di pagina in Node.js utilizzando l’API REST:

// Come estrarre il testo da PowerPoint PPT per intervallo di numeri di pagina in Node.js
const parse = async () => {
  global.parseApi = groupdocs_parser_cloud.ParseApi.fromKeys(clientId, clientSecret);

  let fileInfo = new groupdocs_parser_cloud.FileInfo();
  fileInfo.filePath = "nodejs-testing/sample-file.pptx";

  let options = new groupdocs_parser_cloud.TextOptions();
  options.fileInfo = fileInfo;
  options.startPageNumber = 0;
  options.countPagesToExtract = 2;

  let formattedTextOptions = new groupdocs_parser_cloud.FormattedTextOptions();
  formattedTextOptions.mode = "PlainText";
  options.formattedTextOptions = formattedTextOptions;

  try {
    // Crea richiesta di documento di analisi
    let request = new groupdocs_parser_cloud.TextRequest(options);
    let response = await parseApi.text(request);
    // Visualizza i risultati
    let pages = response.pages;
    pages.forEach(page => console.log("Page No: " + page.pageIndex + " - " + page.text));
  }
  catch (err) {
    throw err;
  }
}

parse()
.then(() => {
  console.log("Successfully extracted text from PowerPoint Presentation.");
})
.catch((err) => {
  console.log("Error occurred while extracting text from PowerPoint file:", err);
})
Come estrarre il testo da PowerPoint PPT per intervallo di numeri di pagina in Node.js

Estrai testo da PowerPoint PPT per intervallo di numeri di pagina in Node.js

Prova in linea

Prova il seguente strumento di analisi di PowerPoint online gratuito, sviluppato utilizzando l’API di cui sopra.

Conclusione

In questo articolo, hai imparato come analizzare ed estrarre il testo da PowerPoint PPT in Nodejs. Hai visto:

  • come estrarre il testo da una diapositiva specifica in Node.js utilizzando l’API REST;
  • come estrarre il testo da tutte le diapositive di una presentazione PowerPoint in Node.js;
  • caricare in modo programmatico un file PowerPoint nel cloud;

Inoltre, puoi saperne di più su GroupDocs.Parser Cloud API utilizzando la documentazione. Forniamo anche una sezione Riferimento API che ti consente di visualizzare e interagire con le nostre API direttamente attraverso il browser. In caso di qualsiasi ambiguità, non esitate a contattarci sul forum.

Fai una domanda

In caso di domande o confusione su Online Text Extractor, informaci tramite il nostro forum.

Domande frequenti

Come estraggo il testo da PowerPoint in Node.js?

Segui [questo link](https://blog.groupdocs.cloud/it/parser/extract-text-from-powerpoint-pptpptx-in-node.js/#Extract-All-Text-from-PowerPoint-PPT-PPTX- in-Node.js-using-REST-API) per apprendere lo snippet di codice Node.js su come estrarre il testo dai file PPT in Node.js.

Come estrarre il testo dai documenti PPT online utilizzando l’API REST?

Innanzitutto, crea un’istanza di ParseApi, imposta i valori di TextOptions e ora chiama [ParseApi.text()](https:// apireference.groupdocs.cloud/parser/#/Parse/Text) con TextRequest per estrarre il testo selezionato dai file PPT online.

Come installare una libreria di download gratuito di estrattore di testo PPT?

Puoi installare l’estrattore di testo PPT libreria Node.js per estrarre il testo dai file PPT in modo programmatico.

Come estraggo il testo da PPT offline in Windows?

Visita questo collegamento per scaricare il software di estrazione del testo per Windows. Questo strumento di estrazione del testo estrarrà istantaneamente il testo in Windows, con un solo clic.

Guarda anche