Dokumenty Word często zawierają bogate elementy wizualne, takie jak logotypy, wykresy i obrazy produktów, które możesz potrzebować ponownie wykorzystać lub analizować oddzielnie. Ręczne zapisywanie każdego obrazu z pliku .doc lub .docx może być powolne i podatne na błędy — szczególnie podczas obsługi dokumentów hurtowych lub zautomatyzowanych przepływów pracy.

Dlatego w tym artykule dowiemy się szczegółów dotyczących tego, jak możemy programowo wydobywać obrazy z dokumentów Word za pomocą kilku prostych wywołań API. Nasze oparte na REST SDK działa całkowicie w chmurze — bez potrzeby posiadania Microsoft Word lub zewnętrznych bibliotek — co czyni je idealnym do automatyzacji, integracji i skalowalnych aplikacji.

Cechy wyróżniające ekstrakcji obrazów

  • Archiwizacja wizualizacji dokumentów do scentralizowanej biblioteki multimedialnej
  • Przetwarzanie grafiki osadzonej do nauki maszynowej lub przepływów pracy OCR
  • Ponowne wykorzystanie aktywów firmy z raportów i umów
  • Migracja danych wizualnych między systemami dokumentowymi

Zbadajmy następujące tematy bardziej szczegółowo:

API przetwarzania dokumentów Word

SDK GroupDocs.Parser Cloud dla .NET to nasze nagradzane API oparte na REST, które oferuje możliwości manipulacji dużą różnorodnością formatów plików, w tym dokumentami Word, PPTX, Excel, PDF, ZIP itd. Zgodnie z naszymi wymaganiami, API upraszcza te przypadki użycia, umożliwiając czytanie, wyciąganie i zapisywanie obrazów bezpośrednio z plików .doc i .docx w twoich aplikacjach C#.

Wymagania wstępne

  • Zarejestruj się na GroupDocs Cloud Dashboard.
  • Uzyskaj swój identyfikator klienta i tajny klucz klienta. Aby uzyskać więcej informacji, odwiedź ten artykuł.
  • Zainstaluj SDK oparte na REST:
  • Zainstaluj .NET 6.0 lub nowszy oraz Visual Studio.

Zainstaluj SDK z pakietów NuGet:

NuGet\Install-Package GroupDocs.Parser-Cloud -Version 25.7.0
  • Aby uzyskać więcej informacji na temat poświadczeń klienta,

Jak wyodrębnić obrazy z Worda w C#

Postępuj zgodnie z prostym, trzyetapowym procesem poniżej, aby wyodrębnić obrazy z dokumentu Word za pomocą C# i GroupDocs.Parser Cloud REST API.

Krok 1: Zainicjuj konfigurację API

var config = new Configuration
{
    ClientId = "YOUR_CLIENT_ID",
    ClientSecret = "YOUR_CLIENT_SECRET"
};
var parserApi = new ParserApi(config);

Krok 2: Ustaw ścieżkę pliku i opcje ekstrakcji Zainicializuj obiekt obiektu ImagesRequest, gdzie przekazujemy instancję klasy ImagesOptions jako argument.

var fileInfo = new FileInfo
{
    FilePath = "sample.docx"
};

var options = new ImagesOptions
{
    FileInfo = fileInfo
};

var request = new ImagesRequest(options);

Krok 3: Pobierz obrazy dokumentów. Wywołaj API images, aby wyodrębnić obrazy z dokumentu Word.

var response = parserApi.Images(request);

foreach (var image in response.Images)
{
    // write the name of image extracted from word document
    Console.WriteLine($"Image found at: {image.Path}");
}
// Aby uzyskać więcej informacji, odwiedź proszę https://github.com/groupdocs-parser-cloud/groupdocs-parser-cloud-dotnet

var config = new Configuration
{
    ClientId = "YOUR_CLIENT_ID",
    ClientSecret = "YOUR_CLIENT_SECRET"
};
var parserApi = new ParserApi(config);

// określ informacje o dokumencie Word
var fileInfo = new FileInfo
{
    FilePath = "sample.docx"
};

var options = new ImagesOptions
{
    FileInfo = fileInfo
};

// Utwórz obiekt ImagesRequest
var request = new ImagesRequest(options);

// Call the API to extract images from Word document
var response = parserApi.Images(request);

foreach (var image in response.Images)
{
    Console.WriteLine($"Image found at: {image.Path}");
}

Pobierz obrazy dokumentu Word za pomocą cURL

Jeśli preferujesz ekstrakcję obrazów bez fragmentu kodu, spróbuj wywołać GroupDocs.Parser Cloud za pomocą poleceń cURL z terminala wiersza poleceń lub plików wsadowych.

Krok 1 – Wygeneruj token JWTAccess:

curl -X POST "https://api.groupdocs.cloud/connect/token" \
-d "grant_type=client_credentials&client_id=YOUR_CLIENT_ID&client_secret=YOUR_CLIENT_SECRET" \
-H "Content-Type: application/x-www-form-urlencoded"

Krok 2 – Wyodrębnij obrazy:

curl -v -X POST "https://api.groupdocs.cloud/v1.0/parser/images" \
-H  "accept: application/json" \
-H  "authorization: Bearer {ACCESS_TOKEN}" \
-H  "Content-Type: application/json" \
-d "{  
        \"FileInfo\": {
            \"FilePath\": \"input.docx\",
            \"StorageName\": \"internal\"
            },
            \"OutputPath\": \"internal\",
            \"StartPageNumber\": 1,
            \"CountPagesToExtract\": 2
    }"
  • Zastąp tym, który wygenerowałeś.
  • Jeśli wolisz wyodrębnić obrazy ze wszystkich stron, pomiń parametry StartPageNumber i CountPagesToExtract.

Free Word Document Images Extractor

Jeśli nie masz skonfigurowanego środowiska i chcesz przetestować możliwości API GroupDocs.Parser Cloud, możesz rozważyć wypróbowanie naszej darmowej aplikacji online Word Image Extractor.

Free Images Extractor

Podsumowanie

GroupDocs.Parser Cloud SDK dla .NET to niezawodne rozwiązanie do ekstrakcji treści, analizy dokumentów i automatyzacji przepływów pracy, które obejmują formaty Word, PDF, Excel i inne. Wypróbuj nasze API REST już dziś!

Dalsza lektura

Najczęściej Zadawane Pytania – FAQs

Czy mogę wyodrębnić obrazy z konkretnych stron w dokumencie Word?

  • Tak. Możesz zdefiniować parametry StartPageNumber i CountPagesToExtract.

Czy API zachowuje rozdzielczość obrazów?

  • Tak. API zwraca osadzone obrazy w podobnej jakości i rozdzielczości, jak były osadzone w dokumencie Word.

Czy Microsoft Word jest wymagany do wykonania tej operacji?

  • Nie. To jest rozwiązanie oparte na chmurze i działa niezależnie od MS Office.

Czy jest bezpłatny okres próbny?

  • Tak. Możesz uzyskać 150 darmowych wywołań API miesięcznie z kontem próbnym. Aby uzyskać więcej informacji, odwiedź proszę pricing guide.

Powiązane samouczki