Czasami prezentacje PowerPoint (PPTX, PPT) zawierają ważne informacje tekstowe, takie jak tytuły, punkty wypunktowane i opisy, które mogą być potrzebne do analizy lub ponownego wykorzystania. Zamiast ręcznie kopiować tekst, ten artykuł demonstruje, jak programowo wydobywać tekst z slajdów PowerPoint (PPT lub PPTX) za pomocą interfejsu API REST .NET.
- Dlaczego wyodrębniać tekst z PowerPointa?
- API do ekstrakcji tekstu z PowerPointa
- Extract Text from PPTX in C# .NET
- Wyodrębnij tekst PowerPointa za pomocą cURL
- Wypróbuj internetowy ekstraktor tekstu PowerPoint.
Dlaczego wydobywać tekst z PowerPointa?
Ekstrakcja tekstu z slajdów PowerPointa jest przydatna, gdy chcesz:
- Retrieve content or notes from presentation slides for documentation.
- Indeksuj i przeszukuj zawartość slajdów w systemach wiedzy.
- Przeprowadź analizę treści lub eksplorację tekstu.
- Automatyzuj masowe wydobywanie tekstu z PowerPointa do archiwizacji lub raportowania.
Korzystając z GroupDocs.Parser Cloud, możesz łatwo wydobywać treść tekstową z prezentacji PowerPoint w bezpieczny sposób w chmurze, bez potrzeby posiadania PowerPointa na swoich systemach.
API do wyodrębniania tekstu z PowerPointa
GroupDocs.Parser Cloud SDK for .NET to potężne REST API zaprojektowane do ekstrakcji tekstu, metadanych i danych strukturalnych z wielu formatów dokumentów, w tym PowerPoint, Word, Excel i PDF.
Wymagania wstępne
Zanim zaczniesz, upewnij się, że masz:
- Konto GroupDocs Cloud aby uzyskać swój identyfikator klienta i tajny klucz klienta.
- .z 6.0 lub wyższa zainstalowana na twoim systemie.
- Visual Studio lub inny kompatybilny IDE.
Zainstaluj SDK
Zainstaluj pakiet za pomocą NuGet:
NuGet\Install-Package GroupDocs.Parser-Cloud -Version 25.7.0
Extract Text from PPTX in C# .NET
Postępuj zgodnie z tymi krokami, aby programowo wyodrębnić tekst z prezentacji PowerPoint.
Krok 1 – Zainicjuj API
var configuration = new Configuration("YOUR_CLIENT_ID", "YOUR_CLIENT_SECRET");
var parserApi = new ParserApi(configuration);
Krok 2 – Ustaw informacje o pliku
var fileInfo = new FileInfo { FilePath = "presentation.pptx" };
var options = new ParseOptions { FileInfo = fileInfo };
var request = new ParseRequest(options);
Krok 3 – Wyodrębnij tekst z slajdów
var response = parserApi.Parse(request);
Console.WriteLine("Extracted Text: ");
Console.WriteLine(response.Text);
/ For further examples, please visit https://github.com/groupdocs-parser-cloud/groupdocs-parser-cloud-dotnet
var configuration = new Configuration("XXXXXXX-XXXXXXX-XXXXXX-55c38f4b7f22", "XXXXXXXXXXXX");
var parseApi = new ParseApi(configuration);
var fileApi = new FileApi(configuration);
// Load input PowerPoint document
using (var fileStream = OpenRead("input.pptx"))
{
// upload the input PPT to cloud storage
var uploadRequest = new Requests.UploadFileRequest("input.pptx", fileStream);
fileApi.UploadFile(uploadRequest);
}
var options = new TextOptions
{
FileInfo = new FileInfo { FilePath = "input.pptx" }
};
var request = new TextRequest(options);
// extract text from PowerPoint presentation
var response = parseApi.Text(request);
Console.WriteLine("Extracted Text:\n");
Console.WriteLine(response.Text);
💡 Możesz zmodyfikować żądanie, aby wyodrębnić tekst tylko z wybranych slajdów, definiując numery slajdów w parametrze
ParseOptions.
Wyodrębnij tekst PowerPoint za pomocą cURL
Jeśli wolisz pracować z bezpośrednimi wywołaniami REST API, użyj następujących poleceń cURL, aby wydobyć tekst z plików PowerPoint bez pisania kodu.
Krok 1 – Uzyskaj token dostępu
curl -X POST "https://api.groupdocs.cloud/connect/token" \
-d "grant_type=client_credentials&client_id=YOUR_CLIENT_ID&client_secret=YOUR_CLIENT_SECRET" \
-H "Content-Type: application/x-www-form-urlencoded"
Krok 2 – Wyodrębnij tekst z PowerPointa
curl -v -X POST "https://api.groupdocs.cloud/v1.0/parser/text" \
-H "accept: application/json" \
-H "authorization: Bearer {ACCESS_TOKEN}" \
-H "Content-Type: application/json" \
-d "{ \"FileInfo\": { \"FilePath\": \"slides.pptx\", \"StorageName\": \"internal\" } }"
Zamień
{ACCESSTOKEN}na token uzyskany powyżej, i określ nazwę pliku PowerPoint podFilePath.
Spróbuj internetowego ekstraktora tekstu z PowerPointa.
Możesz także skorzystać z naszego darmowego Online PowerPoint Text Extractor, aby przetestować funkcjonalność API bez pisania kodu. Prześlij swój plik PowerPoint i natychmiast pobierz wydobyty tekst w formacie zwykłego tekstu.

Wyodrębnij tekst z PowerPoint online za pomocą GroupDocs.Parser Cloud.
Wniosek
W tym poradniku nauczyłeś się, jak wydobywać tekst z prezentacji PowerPoint za pomocą GroupDocs.Parser Cloud SDK dla .NET. To podejście umożliwia programistom automatyzację wydobywania tekstu z PowerPoint, co czyni je idealnym do budowania rozwiązań do analizy treści, indeksowania lub wyszukiwania.
Kluczowe zalety:
- Extract text from PPT and PPTX slides effortlessly.
- Nie jest wymagana instalacja PowerPointa.
- W pełni oparty na chmurze z integracją REST API.
- Eksportuj czyste, uporządkowane dane tekstowe do dalszego przetwarzania.
Najczęściej Zadawane Pytania – FAQs
Czy mogę wyodrębnić tekst z plików PPT i PPTX? Tak. API obsługuje zarówno starsze formaty PPT, jak i nowoczesne formaty PPTX.
Czy muszę mieć zainstalowany Microsoft PowerPoint? Nie. GroupDocs.Parser Cloud działa niezależnie od oprogramowania na komputerze stacjonarnym.
Czy mogę wyciągnąć tekst tylko z konkretnych slajdów? Tak. Możesz zdefiniować numery slajdów lub zakresy w opcjach swojego żądania.
Jaki jest format wyodrębnionego tekstu? Tekst jest zwracany jako zwykły tekst (.txt), odpowiedni do analizy lub indeksowania.
Czy dostępna jest darmowa wersja do testowania? Tak. Możesz założyć konto próbne i wykonać do 150 wywołań API miesięcznie.
