PPTX dans Node.js

Extraire le texte de PowerPoint PPT/PPTX dans Node.js

Dans certains scénarios, le texte formaté est extrait des documents pour un traitement ultérieur tel que l’analyse de texte, la classification, etc. Parmi d’autres formats de fichiers tels que PDF et Word, la présentation PowerPoint est également utilisée dans l’extraction de texte. Par conséquent, cet article montre comment extraire du texte de PowerPoint PPT/PPTX dans Node.js. Vous pouvez facilement analyser vos présentations PowerPoint PPT/PPTX et le texte d’une diapositive spécifique ou extraire tout le texte par programmation sur le cloud.

Les sujets suivants seront abordés dans cet article :

Bibliothèque Node.js pour extraire du texte de PowerPoint PPT

Pour analyser les documents PowerPoint, j’utiliserai le Node.js SDK de GroupDocs.Parser Cloud API. Il vous permet d’analyser les données de plus de 50 types de [formats de document] pris en charge 4. Il prend également en charge l’analyse de conteneurs tels que les archives ZIP, les fichiers de données de messagerie OST, les e-books, les annotations, les portefeuilles PowerPoint et PDF dans vos applications Node.js. Vous pouvez extraire du texte, des images et analyser des données à l’aide d’un modèle à l’aide du SDK. Il fournit également des SDK .NET, Java, PHP, Ruby et Python en tant que membres de la famille d’analyseurs de documents pour l’API Cloud.

Vous pouvez installer GroupDocs.Parser Cloud sur votre application Node.js à l’aide de la commande suivante dans la console :

npm install groupdocs-parser-cloud

Veuillez obtenir votre ID client et votre secret à partir du tableau de bord avant de suivre les étapes mentionnées. Une fois que vous avez votre identifiant et votre secret, ajoutez le code comme indiqué ci-dessous :

# Importez le SDK Node.js dans votre application de nœud à partir de http://api.groupdocs.cloud
global.groupdocs_parser_cloud = require("groupdocs-parser-cloud");
global.fs = require("fs");

// obtenez clientId et clientSecret depuis https://dashboard.groupdocs.cloud (une inscription gratuite est requise).
global.clientId = "xxxxxxx-xxxx-xxxx-xxxx-xxxxxxxxxxxx";
global.clientSecret = "xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx";
global.myStorage = "test-internal-storage";
const config = new groupdocs_parser_cloud.Configuration(clientId, clientSecret);
config.apiBaseUrl = "https://api.groupdocs.cloud";

Extraire tout le texte de PowerPoint PPT/PPTX dans Node.js à l’aide de l’API REST

Vous pouvez extraire du texte de présentations PowerPoint en suivant les étapes simples mentionnées ci-dessous :

Télécharger le fichier

Tout d’abord, téléchargez le document PowerPoint sur le Cloud à l’aide de l’exemple de code ci-dessous :

// ouvrez le fichier dans IOStream à partir de votre lecteur système.
var resourcesFolder = 'H:\\groupdocs-cloud-data\\sample-file.pptx';
// lire le fichier
fs.readFile(resourcesFolder, (err, fileStream) => {
  // construire FileApi
  var fileApi = groupdocs_parser_cloud.FileApi.fromConfig(config);
  // créer une demande de téléchargement de fichier
  var request = new groupdocs_parser_cloud.UploadFileRequest("sample-file.pptx", fileStream, myStorage);
  // téléverser un fichier
  fileApi.uploadFile(request)
    .then(function (response) {
      console.log("Expected response type is FilesUploadResult: " + response.uploaded.length);
    })
    .catch(function (error) {
      console.log("Error: " + error.message);
    });
});

Par conséquent, le fichier PowerPoint téléchargé sera disponible dans la section des fichiers de votre tableau de bord sur le cloud.

Extraire le texte d’une présentation PowerPoint à l’aide de Node.js

Vous pouvez facilement extraire tout le texte des fichiers PowerPoint par programmation en suivant les étapes ci-dessous :

  • Tout d’abord, créez une instance de ParseApi.
  • Deuxièmement, créez une instance de FileInfo.
  • Ensuite, définissez le chemin d’accès au fichier PowerPoint.
  • Créez une instance de TextOptions.
  • Ensuite, affectez FileInfo à TextOptions.
  • Créez une instance de FormattedTextOptions.
  • Définir le mode formattedTextOptions sur PlainText
  • Ensuite, attribuez la valeur formattedTextOptions
  • Maintenant, créez une instance de TextRequest avec TextOptions.
  • Enfin, obtenez des résultats en appelant la méthode ParseApi.text() avec TextRequest.

L’exemple de code suivant montre comment extraire tout le texte d’un fichier PowerPoint à l’aide d’une API REST dans Node.js :

// Comment extraire tout le texte de PowerPoint PPT/PPTX dans Node.js à l'aide de l'API REST
const parse = async () => {
  global.parseApi = groupdocs_parser_cloud.ParseApi.fromKeys(clientId, clientSecret);

  let fileInfo = new groupdocs_parser_cloud.FileInfo();
  fileInfo.filePath = "nodejs-testing/sample-file.pptx";

  let options = new groupdocs_parser_cloud.TextOptions();
  options.fileInfo = fileInfo;

  let formattedTextOptions = new groupdocs_parser_cloud.FormattedTextOptions();
  formattedTextOptions.mode = "PlainText";
  options.formattedTextOptions = formattedTextOptions;

  try {
    // Créer une demande de document d'analyse
    let request = new groupdocs_parser_cloud.TextRequest(options);
    let response = await parseApi.text(request);
    // Afficher les résultats
    console.log(response.text);
  }
  catch (err) {
    throw err;
  }
}

parse()
.then(() => {
  console.log("Successfully extracted text from PowerPoint PPTX document.");
})
.catch((err) => {
  console.log("Error occurred while extracting text from PowerPoint PPTX file:", err);
})
Comment extraire du texte d'une présentation PowerPoint à l'aide de Node.js

Extraire le texte d’une présentation PowerPoint à l’aide de Node.js

Extraire le texte de PowerPoint PPT par plage de numéros de page dans Node.js

Vous pouvez extraire le texte de pages spécifiques d’un fichier PDF par programmation en suivant les étapes ci-dessous :

  • Tout d’abord, créez une instance de ParseApi.
  • Ensuite, créez une instance de FileInfo.
  • Ensuite, définissez le chemin d’accès au fichier PowerPoint PPTX.
  • Créez une instance de TextOptions.
  • Ensuite, affectez FileInfo à TextOptions.
  • Définir les valeurs startPageNumber et countPagesToExtract
  • Créez une instance de FormattedTextOptions.
  • Définir le mode formattedTextOptions sur PlainText
  • Ensuite, attribuez la valeur formattedTextOptions.
  • Définissez le numéro de la page de démarrage et le nombre total de pages à extraire.
  • Maintenant, créez une instance de TextRequest avec TextOptions.
  • Enfin, obtenez des résultats en appelant la méthode ParseApi.text() avec TextRequest.

L’exemple de code suivant montre comment extraire du texte spécifique d’un fichier PowerPoint PPTX par numéros de page dans Node.js à l’aide de l’API REST :

// Comment extraire du texte de PowerPoint PPT par plage de numéros de page dans Node.js
const parse = async () => {
  global.parseApi = groupdocs_parser_cloud.ParseApi.fromKeys(clientId, clientSecret);

  let fileInfo = new groupdocs_parser_cloud.FileInfo();
  fileInfo.filePath = "nodejs-testing/sample-file.pptx";

  let options = new groupdocs_parser_cloud.TextOptions();
  options.fileInfo = fileInfo;
  options.startPageNumber = 0;
  options.countPagesToExtract = 2;

  let formattedTextOptions = new groupdocs_parser_cloud.FormattedTextOptions();
  formattedTextOptions.mode = "PlainText";
  options.formattedTextOptions = formattedTextOptions;

  try {
    // Créer une demande de document d'analyse
    let request = new groupdocs_parser_cloud.TextRequest(options);
    let response = await parseApi.text(request);
    // Afficher les résultats
    let pages = response.pages;
    pages.forEach(page => console.log("Page No: " + page.pageIndex + " - " + page.text));
  }
  catch (err) {
    throw err;
  }
}

parse()
.then(() => {
  console.log("Successfully extracted text from PowerPoint Presentation.");
})
.catch((err) => {
  console.log("Error occurred while extracting text from PowerPoint file:", err);
})
Comment extraire du texte de PowerPoint PPT par plage de numéros de page dans Node.js

Extraire le texte de PowerPoint PPT par plage de numéros de page dans Node.js

Essayez en ligne

Veuillez essayer l’outil d’analyse PowerPoint en ligne gratuit suivant, qui est développé à l’aide de l’API ci-dessus.

Conclusion

Dans cet article, vous avez appris à analyser et extraire du texte de PowerPoint PPT dans Nodejs. Vous avez vu:

  • comment extraire du texte d’une diapositive spécifique dans Node.js à l’aide de l’API REST ;
  • comment extraire du texte de toutes les diapositives d’une présentation PowerPoint dans Node.js ;
  • télécharger par programmation un fichier PowerPoint dans le cloud ;

En outre, vous pouvez en savoir plus sur l’API GroupDocs.Parser Cloud à l’aide de la documentation. Nous fournissons également une section API Reference qui vous permet de visualiser et d’interagir avec nos API directement via le navigateur. En cas d’ambiguïté, n’hésitez pas à nous contacter sur le forum.

poser une question

En cas de questions ou de confusion concernant Online Text Extractor, informez-nous via notre forum.

FAQ

Comment extraire du texte de PowerPoint dans Node.js ?

Veuillez suivre [ce lien](https://blog.groupdocs.cloud/fr/parser/extract-text-from-powerpoint-pptpptx-in-node.js/#Extract-All-Text-from-PowerPoint-PPT-PPTX- in-Node.js-using-REST-API) pour apprendre l’extrait de code Node.js pour savoir comment extraire le texte des fichiers PPT dans Node.js.

Comment extraire du texte de documents PPT en ligne à l’aide de l’API REST ?

Tout d’abord, créez une instance de ParseApi, définissez les valeurs de TextOptions et appelez maintenant [ParseApi.text()](https:// apireference.groupdocs.cloud/parser/#/Parse/Text) avec TextRequest pour extraire le texte sélectionné des fichiers PPT en ligne.

Comment installer une bibliothèque de téléchargement gratuit d’extracteur de texte PPT ?

Vous pouvez installer l’extracteur de texte PPT bibliothèque Node.js pour extraire le texte des fichiers PPT par programmation.

Comment puis-je extraire du texte de PPT hors ligne dans Windows ?

Veuillez visiter ce lien pour télécharger le logiciel d’extraction de texte pour Windows. Cet outil d’extraction de texte extraira instantanément le texte dans Windows, en un seul clic.

Voir également