
Se hai bisogno di estrarre testo semplice o strutturato da documenti Microsoft Word per automazione, indicizzazione o analisi, GroupDocs.Parser Cloud SDK per Node.js offre una soluzione RESTful affidabile. Con solo poche righe di codice, puoi estrarre contenuto da .doc e .docx file senza installare Microsoft Word o utilizzare strumenti lato server.
- API di Estrazione del Testo da Documenti Word
- Come estrarre testo da Word utilizzando Node.js
- Estrai testo da Word tramite cURL
- Estrai Testo da Documenti Word Online
API di estrazione del testo da documenti Word
Il GroupDocs.Parser Cloud SDK per Node.js è un wrapper per l’API REST che semplifica l’estrazione:
- Text (full document or selective pages).
- Tabelle e dati strutturati.
- Metadata e campi incorporati.
- Allegati e immagini.
Supporta vari formati, tra cui PDF, Word, Excel, PowerPoint, MSG, ZIP, e altro ancora.
Prerequisites
- Crea un account su GroupDocs.Cloud Dashboard.
- Ottieni il tuo Client ID e Client Secret.
- Installa SDK:
npm install groupdocs-parser-cloud
Potresti prendere in considerazione di visitare il seguente articolo per saperne di più su, come ottenere il tuo Client ID e Client Secret per l’autenticazione.
API di Estrazione Testo da Documenti Word
Si prega di seguire i passaggi indicati di seguito per informazioni su come estrarre testo da un documento Word utilizzando il SDK Node.js.
Step 1: Inizializza Configurazione:
const { ParserApi, Configuration, ImagesRequest, FileInfo, ImagesOptions } = require("groupdocs-parser-cloud");
const config = new Configuration("YOUR_CLIENT_ID", "YOUR_CLIENT_SECRET");
const parserApi = new ParserApi(config);
Step 2: Configura le informazioni sul file e le opzioni di testo: Inizializza un oggetto della classe TextRequest e passa l’istanza della classe TextOptions.
const fileInfo = new FileInfo();
// path to your Word file
fileInfo.filePath = "sample.docx";
const options = new TextOptions();
options.fileInfo = fileInfo;
const request = new TextRequest(options);
Passo 3: Estrai testo dal file Word: Invoca il text metodo, e restituirà il contenuto di testo normale dal documento Word.
parserApi.text(request).then(response => {
console.log("Extracted text content:");
console.log(response.text);
}).catch(err => {
console.error("Error extracting text:", err);
});
// Per ulteriori esempi, visitare https://github.com/groupdocs-parser-cloud/groupdocs-parser-cloud-node
const { Configuration, ParserApi, TextOptions, TextRequest, FileInfo } = require("groupdocs-parser-cloud");
const config = new Configuration("YOUR_CLIENT_ID", "YOUR_CLIENT_SECRET");
const parserApi = new ParserApi(config);
const fileInfo = new FileInfo();
// path of word document
fileInfo.filePath = "sample.docx";
const options = new TextOptions();
options.fileInfo = fileInfo;
const request = new TextRequest(options);
parserApi.text(request).then(response => {
console.log("Extracted text content:");
console.log(response.text);
}).catch(err => {
console.error("Error extracting text:", err);
});
Puoi vedere l’output del campione di codice sopra nell’immagine qui sotto:

Estrai testo da Word tramite cURL
Se preferisci operazioni da riga di comando o vuoi integrare in uno script? Puoi estrarre testo da un documento Word utilizzando cURL e l’API REST di GroupDocs.Parser.
Passaggio 1 – Genera Token di Accesso:
curl -X POST "https://api.groupdocs.cloud/connect/token" \
-d "grant_type=client_credentials&client_id=YOUR_CLIENT_ID&client_secret=YOUR_CLIENT_SECRET" \
-H "Content-Type: application/x-www-form-urlencoded"
Passo 2 – Estrai Testo tramite Chiamata API:
curl -v -X POST "https://api.groupdocs.cloud/v1.0/parser/text" \
-H "accept: application/json" \
-H "authorization: Bearer {ACCESS_TOKEN}" \
-H "Content-Type: application/json" \
-d
"{
\"FileInfo\":
{
\"FilePath\": \"sample.docx\",
\"StorageName\": \"internal\"
},
\"StartPageNumber\": 0,
\"CountPagesToExtract\": 1
}"
- Sostituisci con quello che hai generato.
Benefici dell’utilizzo di cURL con l’API GroupDocs.Parser
- ✅ Nessuna installazione SDK.
- ✅ Automazione multipiattaforma.
- ✅ Ideale per script shell e pipeline CI.
- ✅ Efficiente e leggero.
Online Word Text Extractor
Usa il nostro Free Online Word Text Extractor alimentato da GroupDocs.Parser Cloud se preferisci un’opzione senza codice.

Conclusione
Con il GroupDocs.Parser Cloud SDK per Node.js, puoi facilmente estrarre testo da documenti Word (.docx o .doc) per automazione, indicizzazione o data mining. L’SDK e l’API REST offrono opzioni flessibili e scalabili, sia che tu preferisca Node.js o comandi cURL diretti.
📚 Risorse Aggiuntive
Domande Frequenti – FAQs
- Puoi estrarre testo anche dalle tabelle DOCX?
- Sì. GroupDocs.Parser può estrarre contenuti strutturati, inclusi le celle delle tabelle e i dati di layout.
- Is Microsoft Word required?
- No. L’API funziona nel cloud e non dipende da Microsoft Office.
- Qual è il modello di pricing?
- Offriamo un modello di prezzo pay as you go. Per ulteriori informazioni, si prega di visitare pricing guide.
- Posso avere una prova gratuita?
- Sì. Una volta che ti sei iscritto a un account di prova gratuito, puoi effettuare 150 chiamate API al mese gratuitamente. Si prega di visitare pricing guide per ulteriori dettagli.