A veces, las presentaciones de PowerPoint (PPTX, PPT) contienen información de texto importante como títulos, viñetas y descripciones que puede que necesite analizar o reutilizar. En lugar de copiar el texto manualmente, este artículo demuestra cómo extraer texto de las diapositivas de PowerPoint (PPT o PPTX) de forma programática utilizando la API REST de .NET.
- ¿Por qué extraer texto de PowerPoint?
- API de extracción de texto de PowerPoint
- Extraer texto de PPTX en C# .NET
- Extraer texto de PowerPoint usando cURL
- Prueba el extractor de texto de PowerPoint en línea
¿Por qué Extraer Texto de PowerPoint?
Extraer texto de las diapositivas de PowerPoint es útil cuando deseas:
- Retrieve content or notes from presentation slides for documentation.
- Indexar y buscar a través del contenido de las diapositivas en sistemas de conocimiento.
- Realice un análisis de contenido o minería de texto.
- Automatizar la extracción de texto de PowerPoint en lote para archivado o informes.
Al utilizar GroupDocs.Parser Cloud, puede extraer fácilmente contenido textual de presentaciones de PowerPoint de forma segura en la nube, sin necesitar PowerPoint en sus sistemas.
API de extracción de texto de PowerPoint
GroupDocs.Parser Cloud SDK for .NET es una poderosa API REST diseñada para extraer texto, metadatos y datos estructurados de múltiples formatos de documento, incluyendo PowerPoint, Word, Excel y PDF.
Requisitos previos
Antes de comenzar, asegúrate de que tienes:
- Una GroupDocs Cloud account para obtener tu Client ID y Client Secret.
- .NET 6.0 o superior instalado en su sistema.
- Visual Studio o otro IDE compatible.
Instalar el SDK
Instala el paquete a través de NuGet:
NuGet\Install-Package GroupDocs.Parser-Cloud -Version 25.7.0
Extraer texto de PPTX en C# .NET
Sigue estos pasos para extraer texto de una presentación de PowerPoint programáticamente.
Paso 1 – Inicializar la API
var configuration = new Configuration("YOUR_CLIENT_ID", "YOUR_CLIENT_SECRET");
var parserApi = new ParserApi(configuration);
Paso 2 – Establecer información del archivo
var fileInfo = new FileInfo { FilePath = "presentation.pptx" };
var options = new ParseOptions { FileInfo = fileInfo };
var request = new ParseRequest(options);
Paso 3 – Extraer texto de las diapositivas
var response = parserApi.Parse(request);
Console.WriteLine("Extracted Text: ");
Console.WriteLine(response.Text);
/ For further examples, please visit https://github.com/groupdocs-parser-cloud/groupdocs-parser-cloud-dotnet
var configuration = new Configuration("XXXXXXX-XXXXXXX-XXXXXX-55c38f4b7f22", "XXXXXXXXXXXX");
var parseApi = new ParseApi(configuration);
var fileApi = new FileApi(configuration);
// Load input PowerPoint document
using (var fileStream = OpenRead("input.pptx"))
{
// upload the input PPT to cloud storage
var uploadRequest = new Requests.UploadFileRequest("input.pptx", fileStream);
fileApi.UploadFile(uploadRequest);
}
var options = new TextOptions
{
FileInfo = new FileInfo { FilePath = "input.pptx" }
};
var request = new TextRequest(options);
// extract text from PowerPoint presentation
var response = parseApi.Text(request);
Console.WriteLine("Extracted Text:\n");
Console.WriteLine(response.Text);
💡 Puedes modificar la solicitud para extraer texto solo de las diapositivas seleccionadas definiendo los números de diapositiva en el parámetro
ParseOptions.
Extraer texto de PowerPoint usando cURL
Si prefieres trabajar con llamadas directas a la API REST, utiliza los siguientes comandos cURL para extraer texto de archivos de PowerPoint sin escribir código.
Paso 1 – Obtener el Token de Acceso
curl -X POST "https://api.groupdocs.cloud/connect/token" \
-d "grant_type=client_credentials&client_id=YOUR_CLIENT_ID&client_secret=YOUR_CLIENT_SECRET" \
-H "Content-Type: application/x-www-form-urlencoded"
Paso 2 – Extraer texto de PowerPoint
curl -v -X POST "https://api.groupdocs.cloud/v1.0/parser/text" \
-H "accept: application/json" \
-H "authorization: Bearer {ACCESS_TOKEN}" \
-H "Content-Type: application/json" \
-d "{ \"FileInfo\": { \"FilePath\": \"slides.pptx\", \"StorageName\": \"internal\" } }"
Reemplace
{ACCESSTOKEN}con el token obtenido arriba, y especifique el nombre de su archivo de PowerPoint enFilePath.
Prueba el extractor de texto de PowerPoint en línea
También puedes usar nuestro Extractor de Texto de PowerPoint en Línea Gratuito para probar la funcionalidad de la API sin escribir código. Sube tu archivo de PowerPoint y descarga instantáneamente el contenido de texto extraído en formato de texto plano.

Extraer texto de PowerPoint en línea usando GroupDocs.Parser Cloud.
Conclusión
En este tutorial, aprendiste cómo extraer texto de presentaciones de PowerPoint utilizando el GroupDocs.Parser Cloud SDK para .NET. Este enfoque permite a los desarrolladores automatizar la extracción de texto de PowerPoint, lo que lo hace ideal para construir soluciones de análisis de contenido, indexación o búsqueda.
Ventajas clave:
- Extraiga texto de diapositivas de PPT y PPTX sin esfuerzo.
- No se requiere instalación de PowerPoint.
- Totalmente basado en la nube con integración de API REST.
- Exportar datos de texto limpios y estructurados para un procesamiento adicional.
Preguntas Frecuentes – PFs
¿Puedo extraer texto de archivos PPT y PPTX? Sí. La API admite tanto formatos PPT heredados como modernos PPTX.
¿Necesito tener Microsoft PowerPoint instalado? No. GroupDocs.Parser Cloud funciona independientemente del software de escritorio.
¿Puedo extraer texto solo de diapositivas específicas? Sí. Puede definir números de diapositivas o rangos en las opciones de su solicitud.
¿Cuál es el formato del texto extraído? El texto se devuelve como salida de texto plano (.txt), adecuado para análisis o indexación.
¿Hay una versión gratuita disponible para probar? Sí. Puedes crear una cuenta de prueba gratuita y realizar hasta 150 llamadas a la API por mes.
