
Si vous avez besoin d’extraire du texte brut ou structuré à partir de documents Microsoft Word pour l’automatisation, l’indexation ou l’analyse, GroupDocs.Parser Cloud SDK pour Node.js offre une solution RESTful fiable. Avec seulement quelques lignes de code, vous pouvez extraire du contenu à partir de .doc et .docx fichiers sans installer Microsoft Word ni utiliser d’outils côté serveur.
- API d’extraction de texte de document Word
- Comment extraire du texte de Word en utilisant Node.js
- Extraire du texte de Word via cURL
- Extracteur de texte en ligne
API d’extraction de texte de document Word
Le GroupDocs.Parser Cloud SDK for Node.js est un wrapper pour l’API REST qui simplifie l’extraction :
- Text (full document or selective pages).
- Tables et données structurées.
- Métadonnées et champs intégrés.
- Pièces jointes et images.
Il prend en charge divers formats, y compris PDF, Word, Excel, PowerPoint, MSG, ZIP, et plus encore.
Conditions préalables
- Créez un compte sur GroupDocs.Cloud Dashboard.
- Obtenez votre identifiant client et votre secret client.
- Installer SDK :
npm install groupdocs-parser-cloud
Vous pouvez envisager de consulter l’article suivant pour en savoir plus sur, comment obtenir votre ID Client et votre Secret Client pour l’authentification.
API d’extraction de texte de document Word
Veuillez suivre les étapes ci-dessous pour obtenir des informations sur la façon d’extraire du texte d’un document Word en utilisant le SDK Node.js.
Étape 1 : Initialiser la configuration :
const { ParserApi, Configuration, ImagesRequest, FileInfo, ImagesOptions } = require("groupdocs-parser-cloud");
const config = new Configuration("YOUR_CLIENT_ID", "YOUR_CLIENT_SECRET");
const parserApi = new ParserApi(config);
Étape 2 : Configurer les options d’information sur le fichier et de texte : Initialisez un objet de la classe TextRequest et passez l’instance de la classe TextOptions.
const fileInfo = new FileInfo();
// path to your Word file
fileInfo.filePath = "sample.docx";
const options = new TextOptions();
options.fileInfo = fileInfo;
const request = new TextRequest(options);
Étape 3 : Extraire le texte du fichier Word : Invoke the text méthode, et elle renverra le contenu texte brut du document Word.
parserApi.text(request).then(response => {
console.log("Extracted text content:");
console.log(response.text);
}).catch(err => {
console.error("Error extracting text:", err);
});
// Pour plus d'exemples, veuillez visiter https://github.com/groupdocs-parser-cloud/groupdocs-parser-cloud-node
const { Configuration, ParserApi, TextOptions, TextRequest, FileInfo } = require("groupdocs-parser-cloud");
const config = new Configuration("YOUR_CLIENT_ID", "YOUR_CLIENT_SECRET");
const parserApi = new ParserApi(config);
const fileInfo = new FileInfo();
// path of word document
fileInfo.filePath = "sample.docx";
const options = new TextOptions();
options.fileInfo = fileInfo;
const request = new TextRequest(options);
parserApi.text(request).then(response => {
console.log("Extracted text content:");
console.log(response.text);
}).catch(err => {
console.error("Error extracting text:", err);
});
Vous pouvez voir la sortie de l’exemple de code ci-dessus dans l’image ci-dessous :

Extract Text from Word via cURL
Si vous préférez les opérations en ligne de commande ou souhaitez intégrer cela dans un script ? Vous pouvez extraire du texte d’un document Word en utilisant cURL et l’API REST GroupDocs.Parser.
Étape 1 – Générer le jeton d’accès :
curl -X POST "https://api.groupdocs.cloud/connect/token" \
-d "grant_type=client_credentials&client_id=YOUR_CLIENT_ID&client_secret=YOUR_CLIENT_SECRET" \
-H "Content-Type: application/x-www-form-urlencoded"
Étape 2 – Extraire le texte via l’appel API :
curl -v -X POST "https://api.groupdocs.cloud/v1.0/parser/text" \
-H "accept: application/json" \
-H "authorization: Bearer {ACCESS_TOKEN}" \
-H "Content-Type: application/json" \
-d
"{
\"FileInfo\":
{
\"FilePath\": \"sample.docx\",
\"StorageName\": \"internal\"
},
\"StartPageNumber\": 0,
\"CountPagesToExtract\": 1
}"
- Remplacez par celui que vous avez généré.
Avantages d’utiliser cURL avec l’API GroupDocs.Parser
- ✅ Pas d’installation de SDK.
- ✅ Automatisation multi-plateforme.
- ✅ Idéal pour les scripts shell et les pipelines CI.
- ✅ Efficace et léger.
Extracteur de texte en ligne
Utilisez notre Free Online Word Text Extractor alimenté par GroupDocs.Parser Cloud si vous préférez une option sans code.

Conclusion
Avec le SDK GroupDocs.Parser Cloud pour Node.js, vous pouvez facilement extraire du texte à partir de documents Word (.docx ou .doc) pour l’automatisation, l’indexation ou l’exploration de données. Le SDK et l’API REST offrent des options flexibles et évolutives, que vous préfériez Node.js ou des commandes cURL directes.
📚 Ressources supplémentaires
Questions Fréquemment Posées – FAQ
- Puis-je extraire du texte des tableaux DOCX également ?
- Oui. GroupDocs.Parser peut extraire du contenu structuré, y compris des cellules de tableau et des données de mise en page.
- Is Microsoft Word requis ?
- Non. L’API fonctionne dans le cloud et ne dépend pas de Microsoft Office.
- Quel est le modèle de tarification ?
- Nous proposons un modèle de tarification unique à l’usage. Pour plus d’informations, veuillez visiter pricing guide.
- Puis-je avoir un essai gratuit ?
- Oui. Une fois que vous êtes abonné à un compte d’essai gratuit, vous pouvez effectuer 150 appels d’API par mois gratuitement. Veuillez visiter pricing guide pour plus de détails.