Czasami prezentacje PowerPoint (PPTX, PPT) zawierają ważne informacje tekstowe, takie jak tytuły, punkty wypunktowane i opisy, które mogą być potrzebne do analizy lub ponownego wykorzystania. Zamiast ręcznie kopiować tekst, ten artykuł demonstruje, jak programowo wydobywać tekst z slajdów PowerPoint (PPT lub PPTX) za pomocą interfejsu API REST .NET.

Dlaczego wydobywać tekst z PowerPointa?

Ekstrakcja tekstu z slajdów PowerPointa jest przydatna, gdy chcesz:

  • Retrieve content or notes from presentation slides for documentation.
  • Indeksuj i przeszukuj zawartość slajdów w systemach wiedzy.
  • Przeprowadź analizę treści lub eksplorację tekstu.
  • Automatyzuj masowe wydobywanie tekstu z PowerPointa do archiwizacji lub raportowania.

Korzystając z GroupDocs.Parser Cloud, możesz łatwo wydobywać treść tekstową z prezentacji PowerPoint w bezpieczny sposób w chmurze, bez potrzeby posiadania PowerPointa na swoich systemach.

API do wyodrębniania tekstu z PowerPointa

GroupDocs.Parser Cloud SDK for .NET to potężne REST API zaprojektowane do ekstrakcji tekstu, metadanych i danych strukturalnych z wielu formatów dokumentów, w tym PowerPoint, Word, Excel i PDF.

Wymagania wstępne

Zanim zaczniesz, upewnij się, że masz:

  • Konto GroupDocs Cloud aby uzyskać swój identyfikator klienta i tajny klucz klienta.
  • .z 6.0 lub wyższa zainstalowana na twoim systemie.
  • Visual Studio lub inny kompatybilny IDE.

Zainstaluj SDK

Zainstaluj pakiet za pomocą NuGet:

NuGet\Install-Package GroupDocs.Parser-Cloud -Version 25.7.0

Extract Text from PPTX in C# .NET

Postępuj zgodnie z tymi krokami, aby programowo wyodrębnić tekst z prezentacji PowerPoint.

Krok 1 – Zainicjuj API

var configuration = new Configuration("YOUR_CLIENT_ID", "YOUR_CLIENT_SECRET");
var parserApi = new ParserApi(configuration);

Krok 2 – Ustaw informacje o pliku

var fileInfo = new FileInfo { FilePath = "presentation.pptx" };
var options = new ParseOptions { FileInfo = fileInfo };
var request = new ParseRequest(options);

Krok 3 – Wyodrębnij tekst z slajdów

var response = parserApi.Parse(request);
Console.WriteLine("Extracted Text: ");
Console.WriteLine(response.Text);
/ For further examples, please visit https://github.com/groupdocs-parser-cloud/groupdocs-parser-cloud-dotnet

var configuration = new Configuration("XXXXXXX-XXXXXXX-XXXXXX-55c38f4b7f22", "XXXXXXXXXXXX");
var parseApi = new ParseApi(configuration);
var fileApi = new FileApi(configuration);

// Load input PowerPoint document
using (var fileStream = OpenRead("input.pptx"))
{
    // upload the input PPT to cloud storage
    var uploadRequest = new Requests.UploadFileRequest("input.pptx", fileStream);
    fileApi.UploadFile(uploadRequest);
}

var options = new TextOptions
{
    FileInfo = new FileInfo { FilePath = "input.pptx" }
};

var request = new TextRequest(options);
// extract text from PowerPoint presentation
var response = parseApi.Text(request);

Console.WriteLine("Extracted Text:\n");
Console.WriteLine(response.Text);    

💡 Możesz zmodyfikować żądanie, aby wyodrębnić tekst tylko z wybranych slajdów, definiując numery slajdów w parametrze ParseOptions.

Wyodrębnij tekst PowerPoint za pomocą cURL

Jeśli wolisz pracować z bezpośrednimi wywołaniami REST API, użyj następujących poleceń cURL, aby wydobyć tekst z plików PowerPoint bez pisania kodu.

Krok 1 – Uzyskaj token dostępu

curl -X POST "https://api.groupdocs.cloud/connect/token" \
-d "grant_type=client_credentials&client_id=YOUR_CLIENT_ID&client_secret=YOUR_CLIENT_SECRET" \
-H "Content-Type: application/x-www-form-urlencoded"

Krok 2 – Wyodrębnij tekst z PowerPointa

curl -v -X POST "https://api.groupdocs.cloud/v1.0/parser/text" \
-H  "accept: application/json" \
-H  "authorization: Bearer {ACCESS_TOKEN}" \
-H  "Content-Type: application/json" \
-d "{ \"FileInfo\": { \"FilePath\": \"slides.pptx\", \"StorageName\": \"internal\" } }"

Zamień {ACCESSTOKEN} na token uzyskany powyżej, i określ nazwę pliku PowerPoint pod FilePath.

Spróbuj internetowego ekstraktora tekstu z PowerPointa.

Możesz także skorzystać z naszego darmowego Online PowerPoint Text Extractor, aby przetestować funkcjonalność API bez pisania kodu. Prześlij swój plik PowerPoint i natychmiast pobierz wydobyty tekst w formacie zwykłego tekstu.

extract text from powerpoint online

Wyodrębnij tekst z PowerPoint online za pomocą GroupDocs.Parser Cloud.

Wniosek

W tym poradniku nauczyłeś się, jak wydobywać tekst z prezentacji PowerPoint za pomocą GroupDocs.Parser Cloud SDK dla .NET. To podejście umożliwia programistom automatyzację wydobywania tekstu z PowerPoint, co czyni je idealnym do budowania rozwiązań do analizy treści, indeksowania lub wyszukiwania.

Kluczowe zalety:

  • Extract text from PPT and PPTX slides effortlessly.
  • Nie jest wymagana instalacja PowerPointa.
  • W pełni oparty na chmurze z integracją REST API.
  • Eksportuj czyste, uporządkowane dane tekstowe do dalszego przetwarzania.

Najczęściej Zadawane Pytania – FAQs

  1. Czy mogę wyodrębnić tekst z plików PPT i PPTX? Tak. API obsługuje zarówno starsze formaty PPT, jak i nowoczesne formaty PPTX.

  2. Czy muszę mieć zainstalowany Microsoft PowerPoint? Nie. GroupDocs.Parser Cloud działa niezależnie od oprogramowania na komputerze stacjonarnym.

  3. Czy mogę wyciągnąć tekst tylko z konkretnych slajdów? Tak. Możesz zdefiniować numery slajdów lub zakresy w opcjach swojego żądania.

  4. Jaki jest format wyodrębnionego tekstu? Tekst jest zwracany jako zwykły tekst (.txt), odpowiedni do analizy lub indeksowania.

  5. Czy dostępna jest darmowa wersja do testowania? Tak. Możesz założyć konto próbne i wykonać do 150 wywołań API miesięcznie.

Przydatne linki

Powiązane artykuły