Die Konvertierung von Word Dokumenten (DOC, DOCX) in das Textformat ist ein gängiges Anliegen bei der Datenextraktion, Indizierung oder in Automatisierungs-Workflows. Mit der Hilfe des .NET Cloud SDK können Sie ganz einfach Text aus Word Dokumenten für die Verarbeitung natürlicher Sprache, Inhaltsanalyse oder das Speichern großer Textdaten extrahieren, ohne von Microsoft Word abhängig zu sein.
Word to Text Conversion API
Das GroupDocs.Parser Cloud SDK für .NET bietet leistungsstarke Tools zum Parsen, Extrahieren und Konvertieren von Word Dokumenten in das Textformat. Es unterstützt DOC, DOCX und andere gängige Dokumentformate und bietet Entwicklern eine schnelle Möglichkeit, Dokument zu Text oder docx zu txt-Konverter in .NET-Anwendungen zu erstellen.
Voraussetzungen
- Melden Sie sich beim GroupDocs Cloud Dashboard an.
- Holen Sie sich Ihre Client-ID und Ihr Client-Geheimnis. Für weitere Informationen besuchen Sie bitte this article.
- Installieren Sie .NET 6.0 oder höher und Visual Studio.
- Installieren Sie das SDK aus NuGet-Paketen:
NuGet\Install-Package GroupDocs.Parser-Cloud -Version 25.7.0
DOCX in TXT umwandeln mit C#
Hier ist ein einfaches Beispiel, das zeigt, wie man DOCX in TXT umwandelt oder Text aus Word Dokumenten mit dem GroupDocs.Parser Cloud SDK für .NET extrahiert.
1.: API-Konfiguration initialisieren
var config = new Configuration
{
ClientId = "YOUR_CLIENT_ID",
ClientSecret = "YOUR_CLIENT_SECRET"
};
var parserApi = new ParserApi(config);
2.: Rufen Sie die Parse-Methode auf, um den Textinhalt des Dokuments zu extrahieren. Initialisieren Sie ein Objekt der ImagesRequest Klasse, wobei wir die Instanz der ImagesOptions Klasse als Argument übergeben.
var response = parserApi.Parse(new ParseRequest("sample.docx"));
3.: Speichern Sie den extrahierten Text lokal als .txt-Datei für die weitere Verarbeitung.
File.WriteAllText("output.txt", response.Text);
- 💡 Sie können auch Text aus bestimmten Seiten oder Absätzen extrahieren, indem Sie Filter im ParseOptions-Parameter festlegen.
// Für weitere Beispiele besuchen Sie bitte https://github.com/groupdocs-parser-cloud/groupdocs-parser-cloud-dotnet
var configuration = new Configuration("XXXXXXX-XXXXXXX-XXXXXX-55c38f4b7f22", "XXXXXXXXXXXX");
var parseApi = new ParseApi(configuration);
var fileApi = new FileApi(configuration);
// Load input Word document
using (var fileStream = OpenRead("input.docx"))
{
// upload the input Word document to cloud storage
var uploadRequest = new Requests.UploadFileRequest("sample.docx", fileStream);
fileApi.UploadFile(uploadRequest);
}
var options = new TextOptions
{
FileInfo = new FileInfo { FilePath = "sample.docx" }
};
var request = new TextRequest(options);
// extract text from input Word document
var response = parseApi.Text(request);
Console.WriteLine("Extracted Text:\n");
Console.WriteLine(response.Text);
Text aus Word über cURL extrahieren
Wenn Sie Befehlszeilenoperationen bevorzugen, können Sie die REST-API direkt über cURL verwenden, um DOC oder DOCX online in Text umzuwandeln.
Schritt 1: Zugriffs-Token erhalten:
curl -X POST "https://api.groupdocs.cloud/connect/token" \
-d "grant_type=client_credentials&client_id=YOUR_CLIENT_ID&client_secret=YOUR_CLIENT_SECRET" \
-H "Content-Type: application/x-www-form-urlencoded"
Schritt 2: DOCX in TXT umwandeln:
curl -X POST "https://api.groupdocs.cloud/v1.0/parser/{inputFile}/text" \
-H "accept: application/json" \
-H "authorization: Bearer {ACCESS_TOKEN}" \
-o "{outputFile}.txt"
Ersetzen Sie {inputFile} durch den Namen Ihrer Word-Datei und {outputFile} durch den gewünschten TXT-Dateinamen, um lokal zu speichern.
Free DOCX to TXT Converter Online
Wenn Sie schnell die Word to text conversion online ausprobieren möchten, schauen Sie sich den kostenlosen DOCX zu TXT-Konverter an. Er ermöglicht es Ihnen, jede Word-Datei hochzuladen und sofort in das Textformat direkt in Ihrem Browser zu konvertieren — keine Installation oder Codierung erforderlich.

Summary
Wir haben erkundet, dass unser .NET Cloud SDK eine zuverlässige, cloudbasierte Lösung für die Extraktion von Text aus Word Dokumenten und deren Umwandlung in das TXT-Format bietet. Es vereinfacht die Datenextraktion, Inhaltsanalyse und Integration mit Unternehmensdokumentenverarbeitungssysteme.
Warum GroupDocs.Parser Cloud verwenden?
- Unterstützt DOC und DOCX-Formate.
- Einfache Integration mit .NET-Anwendungen.
- 100% cloudbasiert — kein Microsoft Word erforderlich.
- Generiere sauberen TXT-Ausgang, der für die Datenverarbeitung oder -speicherung bereit ist.
Häufig gestellte Fragen (FAQs)
- Can I convert DOCX to TXT using C#?
- Ja. Das SDK ermöglicht es Ihnen, Text aus Word Dokumenten direkt im TXT-Format zu extrahieren und zu speichern.
- Unterstützt es sowohl DOC- als auch DOCX Dateien?
- Ja. Beide Dateiformate werden vollständig für die Konvertierung und Text extrahierung unterstützt.
- Is Microsoft Word required for this conversion?
- Nein. Die Konvertierung erfolgt vollständig auf der GroupDocs Cloud-Plattform.
- Kann ich bestimmte Abschnitte oder Seiten zur Extraktion auswählen?
- Ja. Sie können Seitenbereiche oder Regionen für die teilweise Textextraktion definieren.
