Інколи презентації PowerPoint (PPTX, PPT) містять важливу текстову інформацію, таку як заголовки, марковані пункти та описи, які вам може знадобитися аналізувати або повторно використовувати. Замість того, щоб вручну копіювати текст, ця стаття демонструє, як витягти текст з слайдів PowerPoint (PPT або PPTX) програмно, використовуючи .NET REST API.

Чому витягувати текст з PowerPoint?

Витягування тексту з слайдів PowerPoint є корисним, коли ви хочете:

  • Retrieve content or notes from presentation slides for documentation.
  • Індексуйте та шукайте вміст слайдів у системах знань.
  • Виконайте аналіз вмісту або текстову видобуток.
  • Автоматизуйте масове вилучення тексту з PowerPoint для архівування або звітності.

Використовуючи GroupDocs.Parser Cloud, ви можете легко витягувати текстовий контент з презентацій PowerPoint безпечно в хмарі, не потребуючи PowerPoint на своїх системах.

API витягування тексту з PowerPoint

GroupDocs.Parser Cloud SDK for .NET є потужним REST API, призначеним для вилучення тексту, метаданих і структурованих даних з кількох форматів документів, включаючи PowerPoint, Word, Excel та PDF.

Передумови

Перед тим, як почати, переконайтеся, що у вас є:

  • A GroupDocs Cloud account щоб отримати ваш ідентифікатор клієнта та секрет клієнта.
  • .NET 6.0 або вища версія встановлені на вашій системі.
  • Visual Studio або інша сумісна IDE.

Встановіть SDK

Встановіть пакет через NuGet:

NuGet\Install-Package GroupDocs.Parser-Cloud -Version 25.7.0

Витягання тексту з PPTX у C# .NET

Слідуйте цим крокам, щоб програмно витягнути текст з презентації PowerPoint.

Крок 1 – Ініціалізуйте API

var configuration = new Configuration("YOUR_CLIENT_ID", "YOUR_CLIENT_SECRET");
var parserApi = new ParserApi(configuration);

Крок 2 – Встановіть інформацію про файл

var fileInfo = new FileInfo { FilePath = "presentation.pptx" };
var options = new ParseOptions { FileInfo = fileInfo };
var request = new ParseRequest(options);

Крок 3 – Витягти текст зі слайдів

var response = parserApi.Parse(request);
Console.WriteLine("Extracted Text: ");
Console.WriteLine(response.Text);
/ For further examples, please visit https://github.com/groupdocs-parser-cloud/groupdocs-parser-cloud-dotnet

var configuration = new Configuration("XXXXXXX-XXXXXXX-XXXXXX-55c38f4b7f22", "XXXXXXXXXXXX");
var parseApi = new ParseApi(configuration);
var fileApi = new FileApi(configuration);

// Load input PowerPoint document
using (var fileStream = OpenRead("input.pptx"))
{
    // upload the input PPT to cloud storage
    var uploadRequest = new Requests.UploadFileRequest("input.pptx", fileStream);
    fileApi.UploadFile(uploadRequest);
}

var options = new TextOptions
{
    FileInfo = new FileInfo { FilePath = "input.pptx" }
};

var request = new TextRequest(options);
// extract text from PowerPoint presentation
var response = parseApi.Text(request);

Console.WriteLine("Extracted Text:\n");
Console.WriteLine(response.Text);    

💡 Ви можете змінити запит, щоб витягти текст лише з вибраних слайдів, визначивши номери слайдів у параметрі ParseOptions.

Витягніть текст з PowerPoint за допомогою cURL

Якщо ви віддаєте перевагу працювати з прямими викликами REST API, використовуйте наступні команди cURL для витягування тексту з файлів PowerPoint без написання коду.

Крок 1 – Отримати токен доступу

curl -X POST "https://api.groupdocs.cloud/connect/token" \
-d "grant_type=client_credentials&client_id=YOUR_CLIENT_ID&client_secret=YOUR_CLIENT_SECRET" \
-H "Content-Type: application/x-www-form-urlencoded"

Крок 2 – Витягти текст з PowerPoint

curl -v -X POST "https://api.groupdocs.cloud/v1.0/parser/text" \
-H  "accept: application/json" \
-H  "authorization: Bearer {ACCESS_TOKEN}" \
-H  "Content-Type: application/json" \
-d "{ \"FileInfo\": { \"FilePath\": \"slides.pptx\", \"StorageName\": \"internal\" } }"

Замініть {ACCESSTOKEN} на отриманий вище токен, і вкажіть назву вашого файлу PowerPoint під FilePath.

Спробуйте онлайн інструмент для витягання тексту з PowerPoint.

Ви також можете використовувати наш безкоштовний Online PowerPoint Text Extractor, щоб протестувати функціональність API, не пишучи код. Завантажте свій файл PowerPoint і миттєво завантажте вилучений текстовий контент у форматі простого тексту.

extract text from powerpoint online

Витягніть текст з PowerPoint online, використовуючи GroupDocs.Parser Cloud.

Висновок

У цьому навчальному посібнику ви дізналися, як видобувати текст з презентацій PowerPoint, використовуючи GroupDocs.Parser Cloud SDK для .NET. Цей підхід дозволяє розробникам автоматизувати видобуток тексту з PowerPoint, що робить його ідеальним для створення рішень для аналізу вмісту, індексації або пошуку.

Ключові переваги:

  • Екстрагуйте текст з слайдів PPT та PPTX без зусиль.
  • Не потрібна установка PowerPoint.
  • Повністю хмарне рішення з інтеграцією REST API.
  • Експортуйте чисті, структуровані текстові дані для подальшої обробки.

Часто задавані питання – FAQs

  1. Чи можу я витягнути текст з файлів PPT та PPTX? Так. API підтримує як застарілі формати PPT, так і сучасні формати PPTX.

  2. Чи потрібно мені встановлювати Microsoft PowerPoint? Ні. GroupDocs.Parser Cloud працює незалежно від програмного забезпечення для настільних комп’ютерів.

  3. Чи можу я витягнути текст лише з конкретних слайдів? Так. Ви можете визначити номери слайдів або діапазони у параметрах вашого запиту.

  4. Який формат витягнутого тексту? Text is returned as plain text (.txt) output, suitable for analysis or indexing.

  5. Чи є безкоштовна версія для тестування? Так. Ви можете створити безкоштовний пробний акаунт і здійснити до 150 викликів API на місяць.

Корисні посилання

Схожі статті