Иногда презентации PowerPoint (PPTX, PPT) содержат важную текстовую информацию, такую как заголовки, пункты и описания, которые вам может понадобиться анализировать или повторно использовать. Вместо того чтобы вручную копировать текст, эта статья демонстрирует, как программно извлекать текст из слайдов PowerPoint (PPT или PPTX) с помощью .NET REST API.

Почему извлекать текст из PowerPoint?

Извлечение текста из слайдов PowerPoint полезно, когда вы хотите:

  • Retrieve content or notes from presentation slides for documentation.
  • Индексировать и искать по содержимому слайдов в системах знаний.
  • Проведите анализ содержимого или текстовый анализ.
  • Автоматизируйте массовый извлечение текста из PowerPoint для архивирования или отчетности.

Используя GroupDocs.Parser Cloud, вы можете легко извлекать текстовый контент из презентаций PowerPoint безопасно в облаке, не требуя PowerPoint на своих системах.

API для извлечения текста из PowerPoint

GroupDocs.Parser Cloud SDK for .NET — это мощный REST API, разработанный для извлечения текста, метаданных и структурированных данных из множества форматов документов, включая PowerPoint, Word, Excel и PDF.

Предварительные требования

Перед тем как начать, убедитесь, что у вас есть:

  • A GroupDocs Cloud account чтобы получить ваш Client ID и Client Secret.
  • Установлен .NET 6.0 или выше на вашу систему.
  • Visual Studio или другая совместимая IDE.

Установите SDK

Установите пакет через NuGet:

NuGet\Install-Package GroupDocs.Parser-Cloud -Version 25.7.0

Извлечение текста из PPTX в C# .NET

Следуйте этим шагам, чтобы программно извлечь текст из презентации PowerPoint.

Шаг 1 – Инициализируйте API

var configuration = new Configuration("YOUR_CLIENT_ID", "YOUR_CLIENT_SECRET");
var parserApi = new ParserApi(configuration);

Шаг 2 – Установить информацию о файле

var fileInfo = new FileInfo { FilePath = "presentation.pptx" };
var options = new ParseOptions { FileInfo = fileInfo };
var request = new ParseRequest(options);

Шаг 3 – Извлечение текста из слайдов

var response = parserApi.Parse(request);
Console.WriteLine("Extracted Text: ");
Console.WriteLine(response.Text);
/ For further examples, please visit https://github.com/groupdocs-parser-cloud/groupdocs-parser-cloud-dotnet

var configuration = new Configuration("XXXXXXX-XXXXXXX-XXXXXX-55c38f4b7f22", "XXXXXXXXXXXX");
var parseApi = new ParseApi(configuration);
var fileApi = new FileApi(configuration);

// Load input PowerPoint document
using (var fileStream = OpenRead("input.pptx"))
{
    // upload the input PPT to cloud storage
    var uploadRequest = new Requests.UploadFileRequest("input.pptx", fileStream);
    fileApi.UploadFile(uploadRequest);
}

var options = new TextOptions
{
    FileInfo = new FileInfo { FilePath = "input.pptx" }
};

var request = new TextRequest(options);
// извлечь текст из презентации PowerPoint
var response = parseApi.Text(request);

Console.WriteLine("Extracted Text:\n");
Console.WriteLine(response.Text);    

💡 Вы можете изменить запрос, чтобы извлечь текст только из выбранных слайдов, определив номера слайдов в параметре ParseOptions.

Извлечение текста из PowerPoint с помощью cURL

Если вы предпочитаете работать с прямыми вызовами REST API, используйте следующие команды cURL для извлечения текста из файлов PowerPoint без написания кода.

Шаг 1 – Получить токен доступа

curl -X POST "https://api.groupdocs.cloud/connect/token" \
-d "grant_type=client_credentials&client_id=YOUR_CLIENT_ID&client_secret=YOUR_CLIENT_SECRET" \
-H "Content-Type: application/x-www-form-urlencoded"

Шаг 2 – Извлечение текста из PowerPoint

curl -v -X POST "https://api.groupdocs.cloud/v1.0/parser/text" \
-H  "accept: application/json" \
-H  "authorization: Bearer {ACCESS_TOKEN}" \
-H  "Content-Type: application/json" \
-d "{ \"FileInfo\": { \"FilePath\": \"slides.pptx\", \"StorageName\": \"internal\" } }"

Замените {ACCESSTOKEN} на токен, полученный выше, и укажите имя вашего файла PowerPoint под FilePath.

Попробуйте онлайн-экстрактор текста PowerPoint.

Вы также можете использовать наш бесплатный Online PowerPoint Text Extractor, чтобы протестировать функциональность API без написания кода. Загрузите свой файл PowerPoint и мгновенно скачайте извлечённое текстовое содержимое в формате обычного текста.

извлечь текст из PowerPoint онлайн

Извлечение текста из PowerPoint онлайн с помощью GroupDocs.Parser Cloud.

Заключение

В этом учебном пособии вы узнали, как извлекать текст из презентаций PowerPoint с помощью GroupDocs.Parser Cloud SDK для .NET. Этот подход позволяет разработчикам автоматизировать извлечение текста из PowerPoint, что идеально подходит для создания решений по анализу контента, индексации или поиска.

Ключевые преимущества:

  • Извлекайте текст из слайдов PPT и PPTX без усилий.
  • Не требуется установка PowerPoint.
  • Полностью облачный с интеграцией REST API.
  • Экспортируйте чистые, структурированные текстовые данные для дальнейшей обработки.

Часто задаваемые вопросы – FAQs

  1. Могу ли я извлечь текст из файлов PPT и PPTX? Да. API поддерживает как устаревший формат PPT, так и современный формат PPTX.

  2. Мне нужно установить Microsoft PowerPoint? Нет. GroupDocs.Parser Cloud работает независимо от настольного ПО.

  3. Могу ли я извлечь текст только с определенных слайдов? Да. Вы можете определить номера или диапазоны слайдов в параметрах вашего запроса.

  4. Каков формат извлеченного текста? Текст возвращается в виде обычного текста (.txt), подходящего для анализа или индексирования.

  5. Есть ли доступная бесплатная версия для тестирования? Да. Вы можете создать бесплатную учетную запись и сделать до 150 вызовов API в месяц.

Полезные ссылки

Связанные статьи