A volte, le presentazioni PowerPoint (PPTX, PPT) contengono informazioni testuali importanti come titoli, punti elenco e descrizioni che potresti dover analizzare o riutilizzare. Invece di copiare il testo manualmente, questo articolo dimostra come estrarre testo dalle diapositive di PowerPoint (PPT o PPTX) in modo programmatico utilizzando l’API REST .NET.

Perché estrarre testo da PowerPoint?

Estrai testo dalle diapositive di PowerPoint è utile quando vuoi:

  • Retrieve content or notes from presentation slides for documentation.
  • Indicizza e cerca attraverso il contenuto delle diapositive nei sistemi di conoscenza.
  • Perform content analysis or text mining.
  • Automatizzare l’estrazione di testo in blocco da PowerPoint per archiviazione o reportistica.

Utilizzando GroupDocs.Parser Cloud, puoi facilmente estrarre contenuti testuali da presentazioni PowerPoint in modo sicuro nel cloud, senza richiedere PowerPoint sui loro sistemi.

API di estrazione testo PowerPoint

GroupDocs.Parser Cloud SDK per .NET è una potente API REST progettata per estrarre testo, metadati e dati strutturati da più formati di documento tra cui PowerPoint, Word, Excel e PDF.

Prerequisites

Prima di iniziare, assicurati di avere:

  • Un GroupDocs Cloud account per ottenere il tuo Client ID e Client Secret.
  • .NET 6.0 o superiore installato sul tuo sistema.
  • Visual Studio o un altro IDE compatibile.

Installa il SDK

Installa il pacchetto tramite NuGet:

NuGet\Install-Package GroupDocs.Parser-Cloud -Version 25.7.0

Estrai testo da PPTX in C# .NET

Segui questi passaggi per estrarre testo da una presentazione PowerPoint in modo programmatico.

Passo 1 – Inizializzare l’API

var configuration = new Configuration("YOUR_CLIENT_ID", "YOUR_CLIENT_SECRET");
var parserApi = new ParserApi(configuration);

Passaggio 2 – Imposta le informazioni del file

var fileInfo = new FileInfo { FilePath = "presentation.pptx" };
var options = new ParseOptions { FileInfo = fileInfo };
var request = new ParseRequest(options);

Passaggio 3 - Estrai testo dalle diapo

var response = parserApi.Parse(request);
Console.WriteLine("Extracted Text: ");
Console.WriteLine(response.Text);
/ For further examples, please visit https://github.com/groupdocs-parser-cloud/groupdocs-parser-cloud-dotnet

var configuration = new Configuration("XXXXXXX-XXXXXXX-XXXXXX-55c38f4b7f22", "XXXXXXXXXXXX");
var parseApi = new ParseApi(configuration);
var fileApi = new FileApi(configuration);

// Load input PowerPoint document
using (var fileStream = OpenRead("input.pptx"))
{
    // upload the input PPT to cloud storage
    var uploadRequest = new Requests.UploadFileRequest("input.pptx", fileStream);
    fileApi.UploadFile(uploadRequest);
}

var options = new TextOptions
{
    FileInfo = new FileInfo { FilePath = "input.pptx" }
};

var request = new TextRequest(options);
// extract text from PowerPoint presentation
var response = parseApi.Text(request);

Console.WriteLine("Extracted Text:\n");
Console.WriteLine(response.Text);    

💡 Puoi modificare la richiesta per estrarre testo solo da slide selezionate definendo i numeri delle slide nel parametro ParseOptions.

Estrai testo da PowerPoint utilizzando cURL

Se preferisci lavorare con chiamate API REST dirette, utilizza i seguenti comandi cURL per estrarre testo dai file PowerPoint senza scrivere codice.

Passo 1 – Ottenere il Token di Accesso

curl -X POST "https://api.groupdocs.cloud/connect/token" \
-d "grant_type=client_credentials&client_id=YOUR_CLIENT_ID&client_secret=YOUR_CLIENT_SECRET" \
-H "Content-Type: application/x-www-form-urlencoded"

Passaggio 2 – Estrai testo da PowerPoint

curl -v -X POST "https://api.groupdocs.cloud/v1.0/parser/text" \
-H  "accept: application/json" \
-H  "authorization: Bearer {ACCESS_TOKEN}" \
-H  "Content-Type: application/json" \
-d "{ \"FileInfo\": { \"FilePath\": \"slides.pptx\", \"StorageName\": \"internal\" } }"

Sostituisci {ACCESSTOKEN} con il token ottenuto sopra, e specifica il nome del file PowerPoint sotto FilePath.

Prova l’estrattore di testo PowerPoint online

Puoi anche utilizzare il nostro Estrattore di Testo PowerPoint Online gratuito per testare la funzionalità dell’API senza scrivere codice. Carica il tuo file PowerPoint e scarica immediatamente il contenuto del testo estratto in formato di testo semplice.

extract text from powerpoint online

Estrai testo da PowerPoint online utilizzando GroupDocs.Parser Cloud.

Conclusione

In questo tutorial, hai imparato come estrarre testo da presentazioni PowerPoint utilizzando il GroupDocs.Parser Cloud SDK per .NET. Questo approccio consente agli sviluppatori di automatizzare l’estrazione di testo da PowerPoint, rendendolo ideale per costruire soluzioni di analisi dei contenuti, indicizzazione o ricerca.

Vantaggi chiave:

  • Estrai testo da slide PPT e PPTX senza sforzo.
  • Nessuna installazione di PowerPoint richiesta.
  • Completamente basato su cloud con integrazione REST API.
  • Esporta dati testuali puliti e strutturati per ulteriori elaborazioni.

Domande Frequenti – FAQ

  1. Posso estrarre testo da file PPT e PPTX? Sì. L’API supporta sia i formati PPT legacy che i moderni PPTX.

  2. Ho bisogno di Microsoft PowerPoint installato? No. GroupDocs.Parser Cloud funziona indipendentemente dal software desktop.

  3. Posso estrarre testo solo da diapositive specifiche? Sì. Puoi definire i numeri di diapositiva o gli intervalli nelle opzioni della tua richiesta.

  4. Qual è il formato del testo estratto? Text is returned as plain text (.txt) output, suitable for analysis or indexing.

  5. È disponibile una versione gratuita per il test? Sì. Puoi creare un account di prova gratuito e effettuare fino a 150 chiamate API al mese.

Articoli correlati