Ekstrakcja obrazów z dokumentów Word przy użyciu C# .NET

Dokumenty Word często zawierają bogate elementy wizualne, takie jak logotypy, wykresy i obrazy produktów, które możesz potrzebować ponownie wykorzystać lub analizować oddzielnie. Ręczne zapisywanie każdego obrazu z pliku .doc lub .docx może być powolne i podatne na błędy — szczególnie podczas obsługi dokumentów hurtowych lub zautomatyzowanych przepływów pracy.

Dlatego w tym artykule dowiemy się szczegółów dotyczących tego, jak możemy programowo wydobywać obrazy z dokumentów Word za pomocą kilku prostych wywołań API. Nasze oparte na REST SDK działa całkowicie w chmurze — bez potrzeby posiadania Microsoft Word lub zewnętrznych bibliotek — co czyni je idealnym do automatyzacji, integracji i skalowalnych aplikacji.

Cechy wyróżniające ekstrakcji obrazów

Archiwizacja wizualizacji dokumentów do scentralizowanej biblioteki multimedialnej
Przetwarzanie grafiki osadzonej do nauki maszynowej lub przepływów pracy OCR
Ponowne wykorzystanie aktywów firmy z raportów i umów
Migracja danych wizualnych między systemami dokumentowymi

Zbadajmy następujące tematy bardziej szczegółowo:

API przetwarzania dokumentów Word
Jak wyodrębnić obrazy z Worda w C#
Pobierz obrazy dokumentów Word za pomocą cURL
Darmowy Extractor Obrazów z Dokumentów Word

API przetwarzania dokumentów Word

SDK GroupDocs.Parser Cloud dla .NET to nasze nagradzane API oparte na REST, które oferuje możliwości manipulacji dużą różnorodnością formatów plików, w tym dokumentami Word, PPTX, Excel, PDF, ZIP itd. Zgodnie z naszymi wymaganiami, API upraszcza te przypadki użycia, umożliwiając czytanie, wyciąganie i zapisywanie obrazów bezpośrednio z plików .doc i .docx w twoich aplikacjach C#.

Wymagania wstępne

Zarejestruj się na GroupDocs Cloud Dashboard.
Uzyskaj swój identyfikator klienta i tajny klucz klienta. Aby uzyskać więcej informacji, odwiedź ten artykuł.
Zainstaluj SDK oparte na REST:
Zainstaluj .NET 6.0 lub nowszy oraz Visual Studio.

Zainstaluj SDK z pakietów NuGet:

NuGet\Install-Package GroupDocs.Parser-Cloud -Version 25.7.0

Aby uzyskać więcej informacji na temat poświadczeń klienta,

Jak wyodrębnić obrazy z Worda w C#

Postępuj zgodnie z prostym, trzyetapowym procesem poniżej, aby wyodrębnić obrazy z dokumentu Word za pomocą C# i GroupDocs.Parser Cloud REST API.

Krok 1: Zainicjuj konfigurację API

var config = new Configuration
{
    ClientId = "YOUR_CLIENT_ID",
    ClientSecret = "YOUR_CLIENT_SECRET"
};
var parserApi = new ParserApi(config);

Krok 2: Ustaw ścieżkę pliku i opcje ekstrakcji Zainicializuj obiekt obiektu ImagesRequest, gdzie przekazujemy instancję klasy ImagesOptions jako argument.

var fileInfo = new FileInfo
{
    FilePath = "sample.docx"
};

var options = new ImagesOptions
{
    FileInfo = fileInfo
};

var request = new ImagesRequest(options);

Krok 3: Pobierz obrazy dokumentów. Wywołaj API images, aby wyodrębnić obrazy z dokumentu Word.

var response = parserApi.Images(request);

foreach (var image in response.Images)
{
    // write the name of image extracted from word document
    Console.WriteLine($"Image found at: {image.Path}");
}

// Aby uzyskać więcej informacji, odwiedź proszę https://github.com/groupdocs-parser-cloud/groupdocs-parser-cloud-dotnet

var config = new Configuration
{
    ClientId = "YOUR_CLIENT_ID",
    ClientSecret = "YOUR_CLIENT_SECRET"
};
var parserApi = new ParserApi(config);

// określ informacje o dokumencie Word
var fileInfo = new FileInfo
{
    FilePath = "sample.docx"
};

var options = new ImagesOptions
{
    FileInfo = fileInfo
};

// Utwórz obiekt ImagesRequest
var request = new ImagesRequest(options);

// Call the API to extract images from Word document
var response = parserApi.Images(request);

foreach (var image in response.Images)
{
    Console.WriteLine($"Image found at: {image.Path}");
}

Pobierz obrazy dokumentu Word za pomocą cURL

Jeśli preferujesz ekstrakcję obrazów bez fragmentu kodu, spróbuj wywołać GroupDocs.Parser Cloud za pomocą poleceń cURL z terminala wiersza poleceń lub plików wsadowych.

Krok 1 – Wygeneruj token JWTAccess:

curl -X POST "https://api.groupdocs.cloud/connect/token" \
-d "grant_type=client_credentials&client_id=YOUR_CLIENT_ID&client_secret=YOUR_CLIENT_SECRET" \
-H "Content-Type: application/x-www-form-urlencoded"

Krok 2 – Wyodrębnij obrazy:

curl -v -X POST "https://api.groupdocs.cloud/v1.0/parser/images" \
-H  "accept: application/json" \
-H  "authorization: Bearer {ACCESS_TOKEN}" \
-H  "Content-Type: application/json" \
-d "{  
        \"FileInfo\": {
            \"FilePath\": \"input.docx\",
            \"StorageName\": \"internal\"
            },
            \"OutputPath\": \"internal\",
            \"StartPageNumber\": 1,
            \"CountPagesToExtract\": 2
    }"

Zastąp tym, który wygenerowałeś.

Jeśli wolisz wyodrębnić obrazy ze wszystkich stron, pomiń parametry StartPageNumber i CountPagesToExtract.

Free Word Document Images Extractor

Jeśli nie masz skonfigurowanego środowiska i chcesz przetestować możliwości API GroupDocs.Parser Cloud, możesz rozważyć wypróbowanie naszej darmowej aplikacji online Word Image Extractor.

Podsumowanie

GroupDocs.Parser Cloud SDK dla .NET to niezawodne rozwiązanie do ekstrakcji treści, analizy dokumentów i automatyzacji przepływów pracy, które obejmują formaty Word, PDF, Excel i inne. Wypróbuj nasze API REST już dziś!

Dalsza lektura

Przewodnik dla programistów
API Reference
SDK Source Code
Darmowe Forum Wsparcia

Najczęściej Zadawane Pytania – FAQs

Czy mogę wyodrębnić obrazy z konkretnych stron w dokumencie Word?

Tak. Możesz zdefiniować parametry StartPageNumber i CountPagesToExtract.

Czy API zachowuje rozdzielczość obrazów?

Tak. API zwraca osadzone obrazy w podobnej jakości i rozdzielczości, jak były osadzone w dokumencie Word.

Czy Microsoft Word jest wymagany do wykonania tej operacji?

Nie. To jest rozwiązanie oparte na chmurze i działa niezależnie od MS Office.

Czy jest bezpłatny okres próbny?

Tak. Możesz uzyskać 150 darmowych wywołań API miesięcznie z kontem próbnym. Aby uzyskać więcej informacji, odwiedź proszę pricing guide.

Ekstrakcja obrazów z dokumentu Word w C# .NET | API do ekstrakcji obrazów z Worda

Cechy wyróżniające ekstrakcji obrazów

API przetwarzania dokumentów Word

Jak wyodrębnić obrazy z Worda w C#

Pobierz obrazy dokumentu Word za pomocą cURL

Free Word Document Images Extractor

Podsumowanie

Dalsza lektura

Najczęściej Zadawane Pytania – FAQs

Powiązane samouczki

Cechy wyróżniające ekstrakcji obrazów#

API przetwarzania dokumentów Word#

Jak wyodrębnić obrazy z Worda w C##

Pobierz obrazy dokumentu Word za pomocą cURL#

Free Word Document Images Extractor#

Podsumowanie#

Dalsza lektura#

Najczęściej Zadawane Pytania – FAQs#

Powiązane samouczki#

Cechy wyróżniające ekstrakcji obrazów

API przetwarzania dokumentów Word

Jak wyodrębnić obrazy z Worda w C#

Pobierz obrazy dokumentu Word za pomocą cURL

Free Word Document Images Extractor

Podsumowanie

Dalsza lektura

Najczęściej Zadawane Pytania – FAQs

Powiązane samouczki