PPTX in Node.js

Extrahieren Sie Text aus PowerPoint PPT/PPTX in Node.js

In bestimmten Szenarien wird der formatierte Text aus den Dokumenten extrahiert, um ihn weiterzuverarbeiten, z. B. bei der Textanalyse, Klassifizierung usw. Neben anderen Dateiformaten wie PDF und Word wird auch PowerPoint Presentation bei der Textextraktion verwendet. Daher zeigt dieser Artikel, wie man Text aus PowerPoint PPT/PPTX in Node.js extrahiert. Sie können Ihre PowerPoint PPT/PPTX-Präsentationen und den Text einer bestimmten Folie ganz einfach analysieren oder den gesamten Text programmgesteuert in der Cloud extrahieren.

Folgende Themen werden in diesem Artikel behandelt:

Node.js-Bibliothek zum Extrahieren von Text aus PowerPoint PPT

Zum Parsen der PowerPoint Dokumente verwende ich das Node.js SDK der GroupDocs.Parser Cloud API. Es ermöglicht Ihnen, Daten aus über 50 Arten unterstützter Dokumentformate zu analysieren. Es unterstützt auch das Parsen von Containern wie ZIP-Archiven, OST-Mail-Datendateien, E-Books, Markups, PowerPoint und PDF-Portfolios in Ihren Node.js-Anwendungen. Mit dem SDK können Sie Text und Bilder extrahieren und Daten anhand einer Vorlage analysieren. Es stellt außerdem .NET-, Java-, PHP-, Ruby und Python-SDKs als Mitglieder der Dokumentparser-Familie für die Cloud-API bereit.

Sie können GroupDocs.Parser Cloud mit dem folgenden Befehl in der Konsole in Ihrer Node.js-Anwendung installieren:

npm install groupdocs-parser-cloud

Bitte holen Sie sich Ihre Kunden-ID und Ihr Geheimnis aus dem Dashboard, bevor Sie die genannten Schritte ausführen. Sobald Sie Ihre ID und Ihr Geheimnis haben, fügen Sie den Code wie unten gezeigt ein:

# Importieren Sie das Node.js SDK in Ihre Knotenanwendung von http://api.groupdocs.cloud
global.groupdocs_parser_cloud = require("groupdocs-parser-cloud");
global.fs = require("fs");

// Holen Sie sich clientId und clientSecret von https://dashboard.groupdocs.cloud (kostenlose Registrierung erforderlich).
global.clientId = "xxxxxxx-xxxx-xxxx-xxxx-xxxxxxxxxxxx";
global.clientSecret = "xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx";
global.myStorage = "test-internal-storage";
const config = new groupdocs_parser_cloud.Configuration(clientId, clientSecret);
config.apiBaseUrl = "https://api.groupdocs.cloud";

Extrahieren Sie den gesamten Text aus PowerPoint PPT/PPTX in Node.js mithilfe der REST-API

Sie können Text aus PowerPoint-Präsentationen extrahieren, indem Sie die folgenden einfachen Schritte ausführen:

Laden Sie die Datei hoch

Laden Sie zunächst das PowerPoint Dokument mithilfe des unten angegebenen Codebeispiels in die Cloud hoch:

// Öffnen Sie die Datei in IOStream von Ihrem Systemlaufwerk.
var resourcesFolder = 'H:\\groupdocs-cloud-data\\sample-file.pptx';
// Datei lesen
fs.readFile(resourcesFolder, (err, fileStream) => {
  // Konstruieren Sie FileApi
  var fileApi = groupdocs_parser_cloud.FileApi.fromConfig(config);
  // Anfrage zum Hochladen einer Datei erstellen
  var request = new groupdocs_parser_cloud.UploadFileRequest("sample-file.pptx", fileStream, myStorage);
  // Datei hochladen
  fileApi.uploadFile(request)
    .then(function (response) {
      console.log("Expected response type is FilesUploadResult: " + response.uploaded.length);
    })
    .catch(function (error) {
      console.log("Error: " + error.message);
    });
});

Dadurch ist die hochgeladene PowerPoint-Datei im Dateienbereich Ihres Dashboards in der Cloud verfügbar.

Extrahieren Sie Text aus einer PowerPoint-Präsentation mit Node.js

Sie können den gesamten Text ganz einfach programmgesteuert aus den PowerPoint Dateien extrahieren, indem Sie die folgenden Schritte ausführen:

  • Erstellen Sie zunächst eine Instanz von ParseApi.
  • Zweitens erstellen Sie eine Instanz der FileInfo.
  • Legen Sie dann den Pfad zur PowerPoint-Datei fest.
  • Erstellen Sie eine Instanz der TextOptions.
  • Weisen Sie dann FileInfo den TextOptions zu.
  • Erstellen Sie eine Instanz von FormattedTextOptions.
  • Legen Sie den formattedTextOptions-Modus als PlainText fest
  • Weisen Sie als Nächstes den Wert „formattedTextOptions“ zu
  • Erstellen Sie nun eine Instanz von TextRequest mit TextOptions.
  • Abschließend erhalten Sie Ergebnisse, indem Sie die Methode ParseApi.text() mit der TextRequest aufrufen.

Das folgende Codebeispiel zeigt, wie der gesamte Text mithilfe einer REST-API in Node.js aus einer PowerPoint-Datei extrahiert wird:

// So extrahieren Sie den gesamten Text aus PowerPoint PPT/PPTX in Node.js mithilfe der REST-API
const parse = async () => {
  global.parseApi = groupdocs_parser_cloud.ParseApi.fromKeys(clientId, clientSecret);

  let fileInfo = new groupdocs_parser_cloud.FileInfo();
  fileInfo.filePath = "nodejs-testing/sample-file.pptx";

  let options = new groupdocs_parser_cloud.TextOptions();
  options.fileInfo = fileInfo;

  let formattedTextOptions = new groupdocs_parser_cloud.FormattedTextOptions();
  formattedTextOptions.mode = "PlainText";
  options.formattedTextOptions = formattedTextOptions;

  try {
    // Analysedokumentanforderung erstellen
    let request = new groupdocs_parser_cloud.TextRequest(options);
    let response = await parseApi.text(request);
    // Ergebnisse anzeigen
    console.log(response.text);
  }
  catch (err) {
    throw err;
  }
}

parse()
.then(() => {
  console.log("Successfully extracted text from PowerPoint PPTX document.");
})
.catch((err) => {
  console.log("Error occurred while extracting text from PowerPoint PPTX file:", err);
})
So extrahieren Sie Text aus einer PowerPoint-Präsentation mit Node.js

Extrahieren Sie Text aus einer PowerPoint-Präsentation mit Node.js

Text aus PowerPoint PPT nach Seitenzahlbereich in Node.js extrahieren

Sie können den Text aus bestimmten Seiten einer PDF-Datei programmgesteuert extrahieren, indem Sie die folgenden Schritte ausführen:

  • Erstellen Sie zunächst eine Instanz von ParseApi.
  • Erstellen Sie als Nächstes eine Instanz von FileInfo.
  • Legen Sie dann den Pfad zur PowerPoint PPTX-Datei fest.
  • Erstellen Sie eine Instanz der TextOptions.
  • Weisen Sie dann FileInfo den TextOptions zu.
  • Legen Sie die Werte startPageNumber und countPagesToExtract fest
  • Erstellen Sie eine Instanz von FormattedTextOptions.
  • Legen Sie den formattedTextOptions-Modus als PlainText fest
  • Weisen Sie als Nächstes den Wert „formattedTextOptions“ zu.
  • Legen Sie die Nummer der Startseite und die Gesamtzahl der zu extrahierenden Seiten fest.
  • Erstellen Sie nun eine Instanz von TextRequest mit TextOptions.
  • Abschließend erhalten Sie Ergebnisse, indem Sie die Methode ParseApi.text() mit der TextRequest aufrufen.

Das folgende Codebeispiel zeigt, wie Sie mithilfe der REST-API bestimmten Text aus einer PowerPoint-PPTX-Datei nach Seitenzahlen in Node.js extrahieren:

// So extrahieren Sie Text aus PowerPoint PPT nach Seitenzahlbereich in Node.js
const parse = async () => {
  global.parseApi = groupdocs_parser_cloud.ParseApi.fromKeys(clientId, clientSecret);

  let fileInfo = new groupdocs_parser_cloud.FileInfo();
  fileInfo.filePath = "nodejs-testing/sample-file.pptx";

  let options = new groupdocs_parser_cloud.TextOptions();
  options.fileInfo = fileInfo;
  options.startPageNumber = 0;
  options.countPagesToExtract = 2;

  let formattedTextOptions = new groupdocs_parser_cloud.FormattedTextOptions();
  formattedTextOptions.mode = "PlainText";
  options.formattedTextOptions = formattedTextOptions;

  try {
    // Analysedokumentanforderung erstellen
    let request = new groupdocs_parser_cloud.TextRequest(options);
    let response = await parseApi.text(request);
    // Ergebnisse anzeigen
    let pages = response.pages;
    pages.forEach(page => console.log("Page No: " + page.pageIndex + " - " + page.text));
  }
  catch (err) {
    throw err;
  }
}

parse()
.then(() => {
  console.log("Successfully extracted text from PowerPoint Presentation.");
})
.catch((err) => {
  console.log("Error occurred while extracting text from PowerPoint file:", err);
})
So extrahieren Sie Text aus PowerPoint PPT nach Seitenzahlbereich in Node.js

Extrahieren Sie Text aus PowerPoint PPT nach Seitenzahlbereich in Node.js

Versuchen Sie es online

Bitte probieren Sie das folgende kostenlose Online-PowerPoint-Parsing-Tool aus, das mit der oben genannten API entwickelt wurde.

Abschluss

In diesem Artikel haben Sie erfahren, wie Sie Text aus PowerPoint PPT in Nodejs analysieren und extrahieren. Du hast gesehen:

  • wie man mithilfe der REST-API Text aus bestimmten Folien in Node.js extrahiert;
  • wie man Text aus allen Folien einer PowerPoint-Präsentation in Node.js extrahiert;
  • Laden Sie eine PowerPoint-Datei programmgesteuert in die Cloud hoch.

Außerdem können Sie mithilfe der Dokumentation mehr über die GroupDocs.Parser Cloud API erfahren. Wir bieten auch einen Abschnitt API-Referenz an, mit dem Sie unsere APIs direkt über den Browser visualisieren und mit ihnen interagieren können. Bei Unklarheiten können Sie uns gerne im Forum kontaktieren.

Stelle eine Frage

Falls Sie Fragen oder Unklarheiten zum Online Text Extractor haben, informieren Sie uns über unser Forum.

FAQs

Wie extrahiere ich Text aus PowerPoint in Node.js?

Bitte folgen Sie [diesem Link](https://blog.groupdocs.cloud/de/parser/extract-text-from-powerpoint-pptpptx-in-node.js/#Extract-All-Text-from-PowerPoint-PPT-PPTX- in-Node.js-using-REST-API), um das Node.js-Code-Snippet zum Extrahieren von Text aus PPT Dateien in Node.js zu lernen.

Wie extrahiere ich Text aus PPT Dokumenten online mithilfe der REST-API?

Erstellen Sie zunächst eine Instanz von ParseApi, legen Sie die Werte der TextOptions fest und rufen Sie nun die [ParseApi.text()](https:// apireference.groupdocs.cloud/parser/#/Parse/Text)-Methode mit TextRequest, um ausgewählten Text online aus PPT Dateien zu extrahieren.

Wie installiere ich eine kostenlose Download-Bibliothek für den PPT-Textextraktor?

Sie können den PPT-Textextraktor Node.js-Bibliothek installieren, um Text programmgesteuert aus PPT Dateien zu extrahieren.

Wie extrahiere ich Text offline aus PPT in Windows?

Bitte besuchen Sie diesen Link, um Textextraktionssoftware für Windows herunterzuladen. Dieses Textextraktionstool extrahiert Text in Windows sofort mit einem einzigen Klick.

Siehe auch