Ekstrakcja obrazów z dokumentu Word w Node.js

Wyodrębnij obrazy PowerPoint z dokumentu Word - Ekstractor obrazów

Jeśli masz wymaganie, aby wyodrębnić osadzone obrazy z dokumentów Word do archiwizacji, automatyzacji lub rozpoznawania obrazów? W takim razie nasza usługa REST API w Node.js oferuje solidne i oparte na chmurze rozwiązanie do wyodrębniania obrazów z .doc i .docx bez potrzeby instalacji Microsoft Word.

Może zaistnieć potrzeba wyodrębnienia obrazu, jeśli będziemy musieli:

Złap grafikę, wykresy i zdjęcia osadzone w raportach.
Zautomatyzuj ekstrakcję z zeskanowanych dokumentów lub szablonów.
Zbuduj zbiory obrazów z repozytoriów dokumentów.
Preprocess content for OCR or AI tasks.

Zbadajmy następujące tematy w większych detalach:

API Ekstrakcji Obrazów z Dokumentów Word
Jak wyodrębnić obrazy z Worda za pomocą Node.js
Extract Images from Word via cURL
Spróbuj darmowego narzędzia do wyodrębniania obrazów z dokumentów Word online

API do wyodrębniania obrazów z dokumentu Word

SDK GroupDocs.Parser Cloud dla Node.js to rozwiązanie oparte na REST, które oferuje możliwości analizowania dokumentów MS Word do manipulacji treścią. Nie tylko dokumenty Word, ale także oferuje wsparcie dla ekstrakcji treści z prawie wszystkich powszechnych formatów dokumentów biznesowych, w tym (PPTX, Excel, PDF, ZIP itp.).

Wymagania wstępne

Zarejestruj się na GroupDocs Cloud Dashboard.
Uzyskaj swój identyfikator klienta i sekret klienta.
Zainstaluj SDK oparte na REST:

npm install groupdocs-parser-cloud

Aby uzyskać więcej informacji na temat poświadczeń klienta, proszę odwiedzić ten artykuł.

Jak wyodrębnić obrazy z Worda za pomocą Node.js

Postępuj zgodnie z tymi krokami, aby opracować prostą i niezawodną aplikację do ekstrakcji obrazów z dokumentu MS Word przy użyciu interfejsu API Node.js:

Krok 1: Inicjalizuj Konfigurację.

const { ParserApi, Configuration, ImagesRequest, FileInfo, ImagesOptions } = require("groupdocs-parser-cloud");

const config = new Configuration("YOUR_CLIENT_ID", "YOUR_CLIENT_SECRET");
const parserApi = new ParserApi(config);

Krok 2: Ustawienia informacji o pliku i opcje obrazu. Zainicjalizuj obiekt klasy ImagesRequest i przekaż instancję klasy ImagesOptions.

const fileInfo = new FileInfo();
// path to your PowerPoint file
fileInfo.filePath = "input.docx";

const options = new ImagesOptions();
options.fileInfo = fileInfo;

const request = new ImagesRequest(options);

Krok 3: Wyciągnij obrazy z dokumentu Word. Wywołaj metodę images, aby wyodrębnić obrazy z dokumentu word w internecie.

parserApi.images(request).then((response) => {
    console.log("The Word document Images extracted successfully.");
    console.log(response.images);
}).catch((err) => {
    console.error("Failed to extract images:", err);
});

// For more examples, please visit https://github.com/groupdocs-parser-cloud/groupdocs-parser-cloud-node
const { Configuration, ParserApi, TextOptions, TextRequest, FileInfo } = require("groupdocs-parser-cloud");

const config = new Configuration("YOUR_CLIENT_ID", "YOUR_CLIENT_SECRET");
const parserApi = new ParserApi(config);

const fileInfo = new FileInfo();
// path of word document
fileInfo.filePath = "sample.docx";

const options = new TextOptions();
options.fileInfo = fileInfo;

const request = new TextRequest(options);

parserApi.images(request).then((response) => {
  console.log("The Word document Images extracted successfully.");
  console.log(response.images);
}).catch(err => {
    console.error("Failed to extract images:", err);
});

Możesz zobaczyć wynik powyższego przykładu kodu na obrazie poniżej:

Podgląd wydobywania obrazów z dokumentu Word za pomocą interfejsu API Node.js

Wyodrębnij obrazy z Worda za pomocą cURL

Jeśli preferujesz podejście wiersza poleceń do wyodrębniania obrazów z dokumentów Word za pomocą poleceń cURL, to GroupDocs.Parser Cloud obsługuje te możliwości. Przyjrzyjmy się bliżej tej funkcji, aby uprościć wymogi dotyczące uzyskiwania obrazów z dokumentu Word za pomocą poleceń cURL.

Krok 1 – Wygeneruj token dostępu:

curl -X POST "https://api.groupdocs.cloud/connect/token" \
-d "grant_type=client_credentials&client_id=YOUR_CLIENT_ID&client_secret=YOUR_CLIENT_SECRET" \
-H "Content-Type: application/x-www-form-urlencoded"

Krok 2 – Ekstrahuj obrazy z pliku Word:

curl -v -X POST "https://api.groupdocs.cloud/v1.0/parser/images" \
-H  "accept: application/json" \
-H  "authorization: Bearer {ACCESS_TOKEN}" \
-H  "Content-Type: application/json" \
-d "{  
        \"FileInfo\": {
            \"FilePath\": \"input.docx\",
            \"StorageName\": \"internal\"
            },
            \"OutputPath\": \"internal\",
            \"StartPageNumber\": 1,
            \"CountPagesToExtract\": 2
    }"

🔐 Zamień na ten, który wygenerowałeś.
W przypadku, gdy potrzebujesz wyodrębnić obrazy z całego dokumentu, po prostu zignoruj parametry StartPageNumber i CountPagesToExtract.

Spróbuj darmowego narzędzia do wyodrębniania obrazów z tekstu online

Jeśli wolisz podejście oparte na interfejsie użytkownika do wyodrębniania obrazów z dokumentu Word, możesz rozważyć skorzystanie z naszego darmowego narzędzia online Word Document Image Extractor zasilanego przez GroupDocs.Parser Cloud.

Wnioski

Za pomocą GroupDocs.Parser Cloud SDK dla Node.js, wyodrębnianie obrazów z plików Word staje się szybkie i skalowalne. Niezależnie od tego, czy musisz przetworzyć umowy, raporty czy zeskanowane formularze — to API daje ci pełną kontrolę nad wyodrębnianiem obrazów z dokumentów Word.

📚 Dodatkowe zasoby

Dokumentacja API parsera
API Reference
GitHub SDK (Node.js)
Forum wsparcia

Często Zadawane Pytania – FAQ

Can I extract images from specific pages in a Word document?

Tak. Możesz zdefiniować parametry StartPageNumber i CountPagesToExtract.

Czy obrazy są wyodrębnione w oryginalnym formacie i rozdzielczości?

Tak. API zwraca osadzone obrazy tak, jak są w dokumencie.

Czy muszę mieć zainstalowany Microsoft Word?

Nie. To jest rozwiązanie oparte na chmurze i działa niezależnie od MS Office.

Czy jest dostępny bezpłatny okres próbny?

Tak. Możesz uzyskać 150 darmowych wywołań API miesięcznie z kontem próbny. Aby uzyskać więcej informacji, odwiedź proszę pricing guide.

Wyodrębnij obrazy z Worda w Node.js | Ekstraktor obrazów dokumentów Word

API do wyodrębniania obrazów z dokumentu Word

Jak wyodrębnić obrazy z Worda za pomocą Node.js

Wyodrębnij obrazy z Worda za pomocą cURL

Spróbuj darmowego narzędzia do wyodrębniania obrazów z tekstu online

Wnioski

📚 Dodatkowe zasoby

Często Zadawane Pytania – FAQ

Artykuły powiązane

API do wyodrębniania obrazów z dokumentu Word#

Jak wyodrębnić obrazy z Worda za pomocą Node.js#

Wyodrębnij obrazy z Worda za pomocą cURL#

Spróbuj darmowego narzędzia do wyodrębniania obrazów z tekstu online#

Wnioski#

📚 Dodatkowe zasoby#

Często Zadawane Pytania – FAQ#

Artykuły powiązane#

API do wyodrębniania obrazów z dokumentu Word

Jak wyodrębnić obrazy z Worda za pomocą Node.js

Wyodrębnij obrazy z Worda za pomocą cURL

Spróbuj darmowego narzędzia do wyodrębniania obrazów z tekstu online

Wnioski

📚 Dodatkowe zasoby

Często Zadawane Pytania – FAQ

Artykuły powiązane