
Jeśli potrzebujesz wyodrębnić zwykły lub strukturalny tekst z dokumentów Microsoft Word do automatyzacji, indeksowania lub analizy, GroupDocs.Parser Cloud SDK dla Node.js oferuje niezawodne rozwiązanie RESTful. Wystarczy zaledwie kilka linijek kodu, aby wyodrębnić zawartość z .doc i .docx plików bez instalowania Microsoft Word lub używania jakichkolwiek narzędzi po stronie serwera.
- API do ekstrakcji tekstu z dokumentów Word
- Jak wydobyć tekst z Worda za pomocą Node.js
- Extract Text from Word via cURL
- Online Word Text Extractor
API do ekstrakcji tekstu z dokumentów Word
SDK GroupDocs.Parser Cloud for Node.js jest opakowaniem dla REST API, które upraszcza ekstrakcję:
- Text (full document or selective pages).
- Tabele i dane strukturalne.
- Metadane i pola osadzone.
- Załączniki i obrazy.
Obsługuje różne formaty, w tym PDF, Word, Excel, PowerPoint, MSG, ZIP, i inne.
Wymagania wstępne
- Utwórz konto na GroupDocs.Cloud Dashboard.
- Uzyskaj swój identyfikator klienta i tajny klucz klienta.
- Zainstaluj SDK:
npm install groupdocs-parser-cloud
Możesz rozważyć odwiedzenie następującego artykułu, aby dowiedzieć się więcej o tym, jak uzyskać swój Client ID i Client Secret do autoryzacji.
API do ekstrakcji tekstu z dokumentów Word
Proszę postępować zgodnie z poniższymi krokami, aby uzyskać informacje na temat tego, jak wyodrębnić tekst z dokumentu Word za pomocą SDK Node.js.
Krok 1: Zainicjalizuj konfigurację:
const { ParserApi, Configuration, ImagesRequest, FileInfo, ImagesOptions } = require("groupdocs-parser-cloud");
const config = new Configuration("YOUR_CLIENT_ID", "YOUR_CLIENT_SECRET");
const parserApi = new ParserApi(config);
Krok 2: Ustawienia informacji o pliku i opcje tekstowe: Zainicjuj obiekt klasy TextRequest i przekaż instancję klasy TextOptions.
const fileInfo = new FileInfo();
// path to your Word file
fileInfo.filePath = "sample.docx";
const options = new TextOptions();
options.fileInfo = fileInfo;
const request = new TextRequest(options);
Krok 3: Wyodrębnij tekst z pliku Word: Invoke the text method, and it will return the plain text content from Word document.
parserApi.text(request).then(response => {
console.log("Extracted text content:");
console.log(response.text);
}).catch(err => {
console.error("Error extracting text:", err);
});
// Dla większej liczby przykładów, proszę odwiedzić https://github.com/groupdocs-parser-cloud/groupdocs-parser-cloud-node
const { Configuration, ParserApi, TextOptions, TextRequest, FileInfo } = require("groupdocs-parser-cloud");
const config = new Configuration("YOUR_CLIENT_ID", "YOUR_CLIENT_SECRET");
const parserApi = new ParserApi(config);
const fileInfo = new FileInfo();
// path of word document
fileInfo.filePath = "sample.docx";
const options = new TextOptions();
options.fileInfo = fileInfo;
const request = new TextRequest(options);
parserApi.text(request).then(response => {
console.log("Extracted text content:");
console.log(response.text);
}).catch(err => {
console.error("Error extracting text:", err);
});
Możesz zobaczyć wynik powyższego przykładu kodu na poniższym obrazku:

Extract Text from Word via cURL
Jeśli preferujesz operacje z linii poleceń lub chcesz zintegrować z skryptem? Możesz wyodrębnić tekst z dokumentu Word, używając cURL oraz GroupDocs.Parser REST API.
Krok 1 – Wygeneruj token dostępu:
curl -X POST "https://api.groupdocs.cloud/connect/token" \
-d "grant_type=client_credentials&client_id=YOUR_CLIENT_ID&client_secret=YOUR_CLIENT_SECRET" \
-H "Content-Type: application/x-www-form-urlencoded"
Krok 2 – Ekstrakcja tekstu za pomocą wywołania API:
curl -v -X POST "https://api.groupdocs.cloud/v1.0/parser/text" \
-H "accept: application/json" \
-H "authorization: Bearer {ACCESS_TOKEN}" \
-H "Content-Type: application/json" \
-d
"{
\"FileInfo\":
{
\"FilePath\": \"sample.docx\",
\"StorageName\": \"internal\"
},
\"StartPageNumber\": 0,
\"CountPagesToExtract\": 1
}"
- Zamień na ten, który wygenerowałeś.
Korzyści z używania cURL z API GroupDocs.Parser
- ✅ Brak instalacji SDK.
- ✅ Automatyzacja międzyplatformowa.
- ✅ Idealne do skryptów powłoki i potoków CI.
- ✅ Efektywny i lekki.
Online Word Text Extractor
Użyj naszego Free Online Word Text Extractor zasilanego przez GroupDocs.Parser Cloud, jeśli wolisz opcję bez kodu.

Wnioski
Za pomocą GroupDocs.Parser Cloud SDK dla Node.js możesz łatwo wyodrębnić tekst z dokumentów Word (.docx lub .doc) do automatyzacji, indeksowania lub wydobywania danych. SDK i interfejs API REST oferują elastyczne i skalowalne opcje, niezależnie od tego, czy wolisz Node.js, czy bezpośrednie polecenia cURL.
📚 Dodatkowe zasoby
Najczęściej zadawane pytania – FAQ
- Czy mogę również wyodrębnić tekst z tabel DOCX?
- Tak. GroupDocs.Parser może wydobywać ustrukturyzowane treści, w tym komórki tabeli i dane dotyczące układu.
- Czy Microsoft Word jest wymagany?
- Nie. API działa w chmurze i nie zależy od Microsoft Office.
- Jaki jest model cenowy?
- Oferujemy model płatności “pay as you go” w jednolitej formie. Aby uzyskać więcej informacji, odwiedź pricing guide.
- Can I have free trial?
- Tak. Gdy subskrybujesz konto próbne, możesz wykonywać 150 wywołań API miesięcznie za darmo. Proszę odwiedzić pricing guide po więcej szczegółów.