Иногда презентации PowerPoint (PPTX, PPT) содержат важную текстовую информацию, такую как заголовки, пункты и описания, которые вам может понадобиться анализировать или повторно использовать. Вместо того чтобы вручную копировать текст, эта статья демонстрирует, как программно извлекать текст из слайдов PowerPoint (PPT или PPTX) с помощью .NET REST API.
- Почему извлекать текст из PowerPoint?
- API извлечения текста PowerPoint
- Извлечение текста из PPTX в C# .NET
- Извлечение текста из PowerPoint с использованием cURL
- Попробуйте Онлайн Экстрактор Текста из PowerPoint
Почему извлекать текст из PowerPoint?
Извлечение текста из слайдов PowerPoint полезно, когда вы хотите:
- Retrieve content or notes from presentation slides for documentation.
- Индексировать и искать по содержимому слайдов в системах знаний.
- Проведите анализ содержимого или текстовый анализ.
- Автоматизируйте массовый извлечение текста из PowerPoint для архивирования или отчетности.
Используя GroupDocs.Parser Cloud, вы можете легко извлекать текстовый контент из презентаций PowerPoint безопасно в облаке, не требуя PowerPoint на своих системах.
API для извлечения текста из PowerPoint
GroupDocs.Parser Cloud SDK for .NET — это мощный REST API, разработанный для извлечения текста, метаданных и структурированных данных из множества форматов документов, включая PowerPoint, Word, Excel и PDF.
Предварительные требования
Перед тем как начать, убедитесь, что у вас есть:
- A GroupDocs Cloud account чтобы получить ваш Client ID и Client Secret.
- Установлен .NET 6.0 или выше на вашу систему.
- Visual Studio или другая совместимая IDE.
Установите SDK
Установите пакет через NuGet:
NuGet\Install-Package GroupDocs.Parser-Cloud -Version 25.7.0
Извлечение текста из PPTX в C# .NET
Следуйте этим шагам, чтобы программно извлечь текст из презентации PowerPoint.
Шаг 1 – Инициализируйте API
var configuration = new Configuration("YOUR_CLIENT_ID", "YOUR_CLIENT_SECRET");
var parserApi = new ParserApi(configuration);
Шаг 2 – Установить информацию о файле
var fileInfo = new FileInfo { FilePath = "presentation.pptx" };
var options = new ParseOptions { FileInfo = fileInfo };
var request = new ParseRequest(options);
Шаг 3 – Извлечение текста из слайдов
var response = parserApi.Parse(request);
Console.WriteLine("Extracted Text: ");
Console.WriteLine(response.Text);
/ For further examples, please visit https://github.com/groupdocs-parser-cloud/groupdocs-parser-cloud-dotnet
var configuration = new Configuration("XXXXXXX-XXXXXXX-XXXXXX-55c38f4b7f22", "XXXXXXXXXXXX");
var parseApi = new ParseApi(configuration);
var fileApi = new FileApi(configuration);
// Load input PowerPoint document
using (var fileStream = OpenRead("input.pptx"))
{
// upload the input PPT to cloud storage
var uploadRequest = new Requests.UploadFileRequest("input.pptx", fileStream);
fileApi.UploadFile(uploadRequest);
}
var options = new TextOptions
{
FileInfo = new FileInfo { FilePath = "input.pptx" }
};
var request = new TextRequest(options);
// извлечь текст из презентации PowerPoint
var response = parseApi.Text(request);
Console.WriteLine("Extracted Text:\n");
Console.WriteLine(response.Text);
💡 Вы можете изменить запрос, чтобы извлечь текст только из выбранных слайдов, определив номера слайдов в параметре
ParseOptions.
Извлечение текста из PowerPoint с помощью cURL
Если вы предпочитаете работать с прямыми вызовами REST API, используйте следующие команды cURL для извлечения текста из файлов PowerPoint без написания кода.
Шаг 1 – Получить токен доступа
curl -X POST "https://api.groupdocs.cloud/connect/token" \
-d "grant_type=client_credentials&client_id=YOUR_CLIENT_ID&client_secret=YOUR_CLIENT_SECRET" \
-H "Content-Type: application/x-www-form-urlencoded"
Шаг 2 – Извлечение текста из PowerPoint
curl -v -X POST "https://api.groupdocs.cloud/v1.0/parser/text" \
-H "accept: application/json" \
-H "authorization: Bearer {ACCESS_TOKEN}" \
-H "Content-Type: application/json" \
-d "{ \"FileInfo\": { \"FilePath\": \"slides.pptx\", \"StorageName\": \"internal\" } }"
Замените
{ACCESSTOKEN}на токен, полученный выше, и укажите имя вашего файла PowerPoint подFilePath.
Попробуйте онлайн-экстрактор текста PowerPoint.
Вы также можете использовать наш бесплатный Online PowerPoint Text Extractor, чтобы протестировать функциональность API без написания кода. Загрузите свой файл PowerPoint и мгновенно скачайте извлечённое текстовое содержимое в формате обычного текста.

Извлечение текста из PowerPoint онлайн с помощью GroupDocs.Parser Cloud.
Заключение
В этом учебном пособии вы узнали, как извлекать текст из презентаций PowerPoint с помощью GroupDocs.Parser Cloud SDK для .NET. Этот подход позволяет разработчикам автоматизировать извлечение текста из PowerPoint, что идеально подходит для создания решений по анализу контента, индексации или поиска.
Ключевые преимущества:
- Извлекайте текст из слайдов PPT и PPTX без усилий.
- Не требуется установка PowerPoint.
- Полностью облачный с интеграцией REST API.
- Экспортируйте чистые, структурированные текстовые данные для дальнейшей обработки.
Часто задаваемые вопросы – FAQs
Могу ли я извлечь текст из файлов PPT и PPTX? Да. API поддерживает как устаревший формат PPT, так и современный формат PPTX.
Мне нужно установить Microsoft PowerPoint? Нет. GroupDocs.Parser Cloud работает независимо от настольного ПО.
Могу ли я извлечь текст только с определенных слайдов? Да. Вы можете определить номера или диапазоны слайдов в параметрах вашего запроса.
Каков формат извлеченного текста? Текст возвращается в виде обычного текста (.txt), подходящего для анализа или индексирования.
Есть ли доступная бесплатная версия для тестирования? Да. Вы можете создать бесплатную учетную запись и сделать до 150 вызовов API в месяц.
