
Wenn Sie einfachen oder strukturierten Text aus Microsoft Word Dokumenten für Automatisierung, Indizierung oder Analyse extrahieren müssen, bietet GroupDocs.Parser Cloud SDK für Node.js eine zuverlässige RESTful-Lösung. Mit nur wenigen Codezeilen können Sie Inhalte aus .doc und .docx Dateien extrahieren, ohne Microsoft Word zu installieren oder serverseitige Tools zu verwenden.
- Word Dokument Text Extraktion API
- Wie man Text aus Word mit Node.js extrahiert
- Text aus Word mit cURL extrahieren
- Online Word Text Extractor
Word Dokument Text Extraktions-API
Das GroupDocs.Parser Cloud SDK für Node.js ist eine Wrapper für die REST-API, die das Extrahieren vereinfacht:
- Text (gesamtes Dokument oder selektive Seiten).
- Tabellen und strukturierte Daten.
- Metadaten und eingebettete Felder.
- Anhänge und Bilder.
Es unterstützt verschiedene Formate, einschließlich PDF, Word, Excel, PowerPoint, MSG, ZIP und mehr.
Voraussetzungen
- Erstellen Sie ein Konto im GroupDocs.Cloud Dashboard.
- Holen Sie sich Ihre Client-ID und Client-Secret.
- Installieren Sie das SDK:
npm install groupdocs-parser-cloud
Sie können in Betracht ziehen, den folgenden Artikel zu besuchen, um mehr darüber zu erfahren, wie Sie Ihre Client-ID und Ihr Client-Geheimnis zur Authentifizierung erhalten.
Word Dokument Text Extraktions-API
Bitte folgen Sie den untenstehenden Schritten für Informationen, wie Sie Text aus einem Word Dokument mit dem Node.js SDK extrahieren können.
Schritt 1: Konfiguration initialisieren:
const { ParserApi, Configuration, ImagesRequest, FileInfo, ImagesOptions } = require("groupdocs-parser-cloud");
const config = new Configuration("YOUR_CLIENT_ID", "YOUR_CLIENT_SECRET");
const parserApi = new ParserApi(config);
Schritt 2: Datei-Info und Textoptionen einrichten: Initialisieren Sie ein Objekt der TextRequest Klasse und übergeben Sie die Instanz der TextOptions Klasse.
const fileInfo = new FileInfo();
// path to your Word file
fileInfo.filePath = "sample.docx";
const options = new TextOptions();
options.fileInfo = fileInfo;
const request = new TextRequest(options);
Schritt 3: Text aus Word-Datei extrahieren: Rufen Sie die text Methode auf, und sie wird den reinen Textinhalt aus dem Word Dokument zurückgeben.
parserApi.text(request).then(response => {
console.log("Extracted text content:");
console.log(response.text);
}).catch(err => {
console.error("Error extracting text:", err);
});
// Für weitere Beispiele besuchen Sie bitte https://github.com/groupdocs-parser-cloud/groupdocs-parser-cloud-node
const { Configuration, ParserApi, TextOptions, TextRequest, FileInfo } = require("groupdocs-parser-cloud");
const config = new Configuration("YOUR_CLIENT_ID", "YOUR_CLIENT_SECRET");
const parserApi = new ParserApi(config);
const fileInfo = new FileInfo();
// path of word document
fileInfo.filePath = "sample.docx";
const options = new TextOptions();
options.fileInfo = fileInfo;
const request = new TextRequest(options);
parserApi.text(request).then(response => {
console.log("Extracted text content:");
console.log(response.text);
}).catch(err => {
console.error("Error extracting text:", err);
});
Sie können die Ausgabe des obigen Codesamples im Bild unten sehen:

Text aus Word über cURL extrahieren
Wenn Sie Befehlszeilenoperationen bevorzugen oder in ein Skript integrieren möchten? Sie können Text aus einem Word Dokument mit cURL und der GroupDocs.Parser REST API extrahieren.
Schritt 1 – Zugriffstoken generieren:
curl -X POST "https://api.groupdocs.cloud/connect/token" \
-d "grant_type=client_credentials&client_id=YOUR_CLIENT_ID&client_secret=YOUR_CLIENT_SECRET" \
-H "Content-Type: application/x-www-form-urlencoded"
Schritt 2 – Text über API-Aufruf extrahieren:
curl -v -X POST "https://api.groupdocs.cloud/v1.0/parser/text" \
-H "accept: application/json" \
-H "authorization: Bearer {ACCESS_TOKEN}" \
-H "Content-Type: application/json" \
-d
"{
\"FileInfo\":
{
\"FilePath\": \"sample.docx\",
\"StorageName\": \"internal\"
},
\"StartPageNumber\": 0,
\"CountPagesToExtract\": 1
}"
- Ersetzen Sie durch den von Ihnen generierten.
Vorteile der Verwendung von cURL mit der GroupDocs.Parser API
- ✅ Keine SDK-Installation.
- ✅ Plattformübergreifende Automatisierung.
- ✅ Ideal für Shell-Skripte & CI-Pipelines.
- ✅ Effizient und leicht.
Online Word Text Extractor
Verwenden Sie unseren Kostenlosen Online-Wort-Text-Extractor, betrieben von GroupDocs.Parser Cloud, wenn Sie eine No-Code-Option bevorzugen.

Schlussfolgerung
Mit dem GroupDocs.Parser Cloud SDK für Node.js können Sie ganz einfach Text aus Word Dokumenten (.docx oder .doc) für Automatisierung, Indizierung oder Datenextraktion extrahieren. Das SDK und die REST-API bieten flexible und skalierbare Optionen, egal ob Sie Node.js oder direkte cURL-Befehle bevorzugen.
📚 Zusätzliche Ressourcen
Häufig gestellte Fragen – FAQs
- Kann ich auch Text aus DOCX-Tabellen extrahieren?
- Ja. GroupDocs.Parser kann strukturierte Inhalte extrahieren, einschließlich Tabellenzellen und Layoutdaten.
- Is Microsoft Word erforderlich?
- Nein. Die API läuft in der Cloud und ist nicht von Microsoft Office abhängig.
- What is the pricing model?
- Wir bieten ein einfaches Pay-as-you-go-Preismodell an. Für weitere Informationen besuchen Sie bitte pricing guide.
- Kann ich eine kostenlose Testversion haben?
- Ja. Sobald Sie ein kostenloses Probeabonnement haben, können Sie 150 API-Aufrufe pro Monat kostenlos tätigen. Bitte besuchen Sie pricing guide für weitere Details.