Manchmal enthalten die PowerPoint-Präsentationen (PPTX, PPT) wichtige Textinformationen wie Titel, Aufzählungspunkte und Beschreibungen, die Sie möglicherweise analysieren oder wiederverwenden müssen. Anstatt Text manuell zu kopieren, zeigt dieser Artikel, wie Sie Text programmgesteuert aus PowerPoint-Folien (PPT oder PPTX) mithilfe der .NET REST API extrahieren können.
- Warum Text aus PowerPoint extrahieren?
- PowerPoint Text Extraction API
- Extract Text from PPTX in C# .NET
- Extract PowerPoint Text using cURL
- Versuchen Sie den Online PowerPoint Text Extraktor
Warum Text aus PowerPoint extrahieren?
Das Extrahieren von Text aus PowerPoint-Folien ist nützlich, wenn Sie:
- Retrieve content or notes from presentation slides for documentation.
- Indexieren und Durchsuchen von Folieninhalten in Wissenssystemen.
- Perform content analysis or text mining.
- Automatisieren Sie die maschenhafte Textextraktion aus PowerPoint für Archivierungs oder Berichterstattungszwecke.
Durch die Verwendung von GroupDocs.Parser Cloud können Sie Textinhalte aus PowerPoint-Präsentationen sicher in der Cloud extrahieren, ohne dass PowerPoint auf ihren Systemen erforderlich ist.
PowerPoint Text Extraction API
GroupDocs.Parser Cloud SDK für .NET ist eine leistungsstarke REST-API, die entwickelt wurde, um Text, Metadaten und strukturierte Daten aus mehreren Dokumentformaten zu extrahieren, einschließlich PowerPoint, Word, Excel und PDF.
Voraussetzungen
Bevor Sie beginnen, stellen Sie sicher, dass Sie:
- Ein GroupDocs Cloud-Konto um Ihre Client-ID und Ihren Client-Secret zu erhalten.
- .NET 6.0 oder höher auf Ihrem System installiert.
- Visual Studio oder eine andere kompatible IDE.
Installiere das SDK
Installieren Sie das Paket über NuGet:
NuGet\Install-Package GroupDocs.Parser-Cloud -Version 25.7.0
Extract Text from PPTX in C# .NET
Befolge diese Schritte, um Text programmgesteuert aus einer PowerPoint-Präsentation zu extrahieren.
Schritt 1 – API initialisieren
var configuration = new Configuration("YOUR_CLIENT_ID", "YOUR_CLIENT_SECRET");
var parserApi = new ParserApi(configuration);
Schritt 2 – Dateiinformationen festlegen
var fileInfo = new FileInfo { FilePath = "presentation.pptx" };
var options = new ParseOptions { FileInfo = fileInfo };
var request = new ParseRequest(options);
Schritt 3 – Text aus Folien extrahieren
var response = parserApi.Parse(request);
Console.WriteLine("Extracted Text: ");
Console.WriteLine(response.Text);
/ For further examples, please visit https://github.com/groupdocs-parser-cloud/groupdocs-parser-cloud-dotnet
var configuration = new Configuration("XXXXXXX-XXXXXXX-XXXXXX-55c38f4b7f22", "XXXXXXXXXXXX");
var parseApi = new ParseApi(configuration);
var fileApi = new FileApi(configuration);
// Load input PowerPoint document
using (var fileStream = OpenRead("input.pptx"))
{
// upload the input PPT to cloud storage
var uploadRequest = new Requests.UploadFileRequest("input.pptx", fileStream);
fileApi.UploadFile(uploadRequest);
}
var options = new TextOptions
{
FileInfo = new FileInfo { FilePath = "input.pptx" }
};
var request = new TextRequest(options);
// extract text from PowerPoint presentation
var response = parseApi.Text(request);
Console.WriteLine("Extracted Text:\n");
Console.WriteLine(response.Text);
💡 Sie können die Anfrage ändern, um Text nur von ausgewählten Folien zu extrahieren, indem Sie die Foliennummern im Parameter
ParseOptionsdefinieren.
Extrahieren Sie PowerPoint-Text mit cURL
Wenn Sie es bevorzugen, mit direkten REST-API-Aufrufen zu arbeiten, verwenden Sie die folgenden cURL-Befehle, um Text aus PowerPoint Dateien zu extrahieren, ohne Code schreiben zu müssen.
Schritt 1 – Zugriffstoken erhalten
curl -X POST "https://api.groupdocs.cloud/connect/token" \
-d "grant_type=client_credentials&client_id=YOUR_CLIENT_ID&client_secret=YOUR_CLIENT_SECRET" \
-H "Content-Type: application/x-www-form-urlencoded"
Schritt 2 – Text aus PowerPoint extrahieren
curl -v -X POST "https://api.groupdocs.cloud/v1.0/parser/text" \
-H "accept: application/json" \
-H "authorization: Bearer {ACCESS_TOKEN}" \
-H "Content-Type: application/json" \
-d "{ \"FileInfo\": { \"FilePath\": \"slides.pptx\", \"StorageName\": \"internal\" } }"
Ersetzen Sie
{ACCESSTOKEN}mit dem oben erhaltenen Token, und geben Sie Ihren PowerPoint-Dateinamen unterFilePathan.
Versuchen Sie den Online PowerPoint-Text-Extractor.
Sie können auch unseren kostenlosen Online PowerPoint Text Extractor verwenden, um die API funktionalität ohne das Schreiben von Code zu testen. Laden Sie Ihre PowerPoint-Datei hoch und laden Sie den extrahierten Textinhalt sofort im Nur-Text-Format herunter.

Text aus PowerPoint online mit GroupDocs.Parser Cloud extrahieren.
Schlussfolgerung
In diesem Tutorial haben Sie gelernt, wie man Text aus PowerPoint-Präsentationen mit dem GroupDocs.Parser Cloud SDK für .NET extrahiert. Dieser Ansatz ermöglicht es Entwicklern, die Text extraktion aus PowerPoint zu automatisieren, was ihn ideal für den Aufbau von Inhaltsanalysen, Indizierungs oder Suchlösungen macht.
Wesentliche Vorteile:
- Text aus PPT und PPTX-Folien mühelos extrahieren.
- Keine PowerPoint-Installation erforderlich.
- Vollständig cloud-basiert mit REST-API-Integration.
- Exportieren Sie saubere, strukturierte Textdaten für die weitere Verarbeitung.
Häufig gestellte Fragen – FAQs
Kann ich Text aus PPT und PPTX Dateien extrahieren? Ja. Die API unterstützt sowohl das alte PPT- als auch das moderne PPTX-Format.
Muss ich Microsoft PowerPoint installiert haben? Nein. GroupDocs.Parser Cloud funktioniert unabhängig von Desktop-Software.
Kann ich Text nur von bestimmten Folien extrahieren? Ja. Sie können Foliennummern oder -bereiche in Ihren Anfrageoptionen definieren.
Was ist das Format des extrahierten Textes? Text wird als reiner Text (.txt) -Ausgabe zurückgegeben, die für die Analyse oder Indizierung geeignet ist.
Ist eine kostenlose Version zum Testen verfügbar? Ja. Sie können ein kostenloses Testkonto erstellen und bis zu 150 API-Aufrufe pro Monat tätigen.
