
Jeśli masz wymaganie, aby wyodrębnić osadzone obrazy z dokumentów Word do archiwizacji, automatyzacji lub rozpoznawania obrazów? W takim razie nasza usługa REST API w Node.js oferuje solidne i oparte na chmurze rozwiązanie do wyodrębniania obrazów z .doc i .docx bez potrzeby instalacji Microsoft Word.
Może zaistnieć potrzeba wyodrębnienia obrazu, jeśli będziemy musieli:
- Złap grafikę, wykresy i zdjęcia osadzone w raportach.
- Zautomatyzuj ekstrakcję z zeskanowanych dokumentów lub szablonów.
- Zbuduj zbiory obrazów z repozytoriów dokumentów.
- Preprocess content for OCR or AI tasks.
Zbadajmy następujące tematy w większych detalach:
- API Ekstrakcji Obrazów z Dokumentów Word
- Jak wyodrębnić obrazy z Worda za pomocą Node.js
- Extract Images from Word via cURL
- Spróbuj darmowego narzędzia do wyodrębniania obrazów z dokumentów Word online
API do wyodrębniania obrazów z dokumentu Word
SDK GroupDocs.Parser Cloud dla Node.js to rozwiązanie oparte na REST, które oferuje możliwości analizowania dokumentów MS Word do manipulacji treścią. Nie tylko dokumenty Word, ale także oferuje wsparcie dla ekstrakcji treści z prawie wszystkich powszechnych formatów dokumentów biznesowych, w tym (PPTX, Excel, PDF, ZIP itp.).
Wymagania wstępne
- Zarejestruj się na GroupDocs Cloud Dashboard.
- Uzyskaj swój identyfikator klienta i sekret klienta.
- Zainstaluj SDK oparte na REST:
npm install groupdocs-parser-cloud
- Aby uzyskać więcej informacji na temat poświadczeń klienta, proszę odwiedzić ten artykuł.
Jak wyodrębnić obrazy z Worda za pomocą Node.js
Postępuj zgodnie z tymi krokami, aby opracować prostą i niezawodną aplikację do ekstrakcji obrazów z dokumentu MS Word przy użyciu interfejsu API Node.js:
Krok 1: Inicjalizuj Konfigurację.
const { ParserApi, Configuration, ImagesRequest, FileInfo, ImagesOptions } = require("groupdocs-parser-cloud");
const config = new Configuration("YOUR_CLIENT_ID", "YOUR_CLIENT_SECRET");
const parserApi = new ParserApi(config);
Krok 2: Ustawienia informacji o pliku i opcje obrazu. Zainicjalizuj obiekt klasy ImagesRequest i przekaż instancję klasy ImagesOptions.
const fileInfo = new FileInfo();
// path to your PowerPoint file
fileInfo.filePath = "input.docx";
const options = new ImagesOptions();
options.fileInfo = fileInfo;
const request = new ImagesRequest(options);
Krok 3: Wyciągnij obrazy z dokumentu Word. Wywołaj metodę images, aby wyodrębnić obrazy z dokumentu word w internecie.
parserApi.images(request).then((response) => {
console.log("The Word document Images extracted successfully.");
console.log(response.images);
}).catch((err) => {
console.error("Failed to extract images:", err);
});
// For more examples, please visit https://github.com/groupdocs-parser-cloud/groupdocs-parser-cloud-node
const { Configuration, ParserApi, TextOptions, TextRequest, FileInfo } = require("groupdocs-parser-cloud");
const config = new Configuration("YOUR_CLIENT_ID", "YOUR_CLIENT_SECRET");
const parserApi = new ParserApi(config);
const fileInfo = new FileInfo();
// path of word document
fileInfo.filePath = "sample.docx";
const options = new TextOptions();
options.fileInfo = fileInfo;
const request = new TextRequest(options);
parserApi.images(request).then((response) => {
console.log("The Word document Images extracted successfully.");
console.log(response.images);
}).catch(err => {
console.error("Failed to extract images:", err);
});
Możesz zobaczyć wynik powyższego przykładu kodu na obrazie poniżej:

Wyodrębnij obrazy z Worda za pomocą cURL
Jeśli preferujesz podejście wiersza poleceń do wyodrębniania obrazów z dokumentów Word za pomocą poleceń cURL, to GroupDocs.Parser Cloud obsługuje te możliwości. Przyjrzyjmy się bliżej tej funkcji, aby uprościć wymogi dotyczące uzyskiwania obrazów z dokumentu Word za pomocą poleceń cURL.
Krok 1 – Wygeneruj token dostępu:
curl -X POST "https://api.groupdocs.cloud/connect/token" \
-d "grant_type=client_credentials&client_id=YOUR_CLIENT_ID&client_secret=YOUR_CLIENT_SECRET" \
-H "Content-Type: application/x-www-form-urlencoded"
Krok 2 – Ekstrahuj obrazy z pliku Word:
curl -v -X POST "https://api.groupdocs.cloud/v1.0/parser/images" \
-H "accept: application/json" \
-H "authorization: Bearer {ACCESS_TOKEN}" \
-H "Content-Type: application/json" \
-d "{
\"FileInfo\": {
\"FilePath\": \"input.docx\",
\"StorageName\": \"internal\"
},
\"OutputPath\": \"internal\",
\"StartPageNumber\": 1,
\"CountPagesToExtract\": 2
}"
- 🔐 Zamień na ten, który wygenerowałeś.
- W przypadku, gdy potrzebujesz wyodrębnić obrazy z całego dokumentu, po prostu zignoruj parametry
StartPageNumber
iCountPagesToExtract
.
Spróbuj darmowego narzędzia do wyodrębniania obrazów z tekstu online
Jeśli wolisz podejście oparte na interfejsie użytkownika do wyodrębniania obrazów z dokumentu Word, możesz rozważyć skorzystanie z naszego darmowego narzędzia online Word Document Image Extractor zasilanego przez GroupDocs.Parser Cloud.

Wnioski
Za pomocą GroupDocs.Parser Cloud SDK dla Node.js, wyodrębnianie obrazów z plików Word staje się szybkie i skalowalne. Niezależnie od tego, czy musisz przetworzyć umowy, raporty czy zeskanowane formularze — to API daje ci pełną kontrolę nad wyodrębnianiem obrazów z dokumentów Word.
📚 Dodatkowe zasoby
Często Zadawane Pytania – FAQ
Can I extract images from specific pages in a Word document?
- Tak. Możesz zdefiniować parametry
StartPageNumber
iCountPagesToExtract
.
Czy obrazy są wyodrębnione w oryginalnym formacie i rozdzielczości?
- Tak. API zwraca osadzone obrazy tak, jak są w dokumencie.
Czy muszę mieć zainstalowany Microsoft Word?
- Nie. To jest rozwiązanie oparte na chmurze i działa niezależnie od MS Office.
Czy jest dostępny bezpłatny okres próbny?
- Tak. Możesz uzyskać 150 darmowych wywołań API miesięcznie z kontem próbny. Aby uzyskać więcej informacji, odwiedź proszę pricing guide.