
Si necesitas extraer texto plano o estructurado de documentos de Microsoft Word para automatización, indexación o análisis, GroupDocs.Parser Cloud SDK para Node.js ofrece una solución RESTful confiable. Con solo unas pocas líneas de código, puedes extraer contenido de .doc y .docx archivos sin instalar Microsoft Word ni utilizar herramientas del lado del servidor.
- API de Extracción de Texto de Documentos Word
- Cómo extraer texto de Word usando Node.js
- Extraer texto de Word a través de cURL
- Extractor de Texto de Word en Línea
API de extracción de texto de documentos de Word
El GroupDocs.Parser Cloud SDK for Node.js es un envoltorio para la API REST que simplifica la extracción:
- Texto (documento completo o páginas selectivas).
- Tablas y datos estructurados.
- Metadatos y campos incrustados.
- Adjuntos e imágenes.
Soporta varios formatos, incluyendo PDF, Word, Excel, PowerPoint, MSG, ZIP, y más.
Requisitos previos
- Crea una cuenta en GroupDocs.Cloud Dashboard.
- Obtén tu Client ID y Client Secret.
- Instalar SDK:
npm install groupdocs-parser-cloud
Puede considerar visitar el siguiente artículo para aprender más sobre, cómo obtener su Client ID y Client Secret para autenticación.
API de extracción de texto de documentos de Word
Por favor, sigue los pasos indicados a continuación para obtener información sobre cómo extraer texto de un documento de Word utilizando el SDK de Node.js.
Paso 1: Inicializar Configuración:
const { ParserApi, Configuration, ImagesRequest, FileInfo, ImagesOptions } = require("groupdocs-parser-cloud");
const config = new Configuration("YOUR_CLIENT_ID", "YOUR_CLIENT_SECRET");
const parserApi = new ParserApi(config);
Paso 2: Configurar la Información del Archivo y las Opciones de Texto: Inicializa un objeto de la clase TextRequest y pasa la instancia de la clase TextOptions.
const fileInfo = new FileInfo();
// path to your Word file
fileInfo.filePath = "sample.docx";
const options = new TextOptions();
options.fileInfo = fileInfo;
const request = new TextRequest(options);
Paso 3: Extraer texto del archivo de Word: Invoca el text método, y devolverá el contenido de texto plano del documento de Word.
parserApi.text(request).then(response => {
console.log("Extracted text content:");
console.log(response.text);
}).catch(err => {
console.error("Error extracting text:", err);
});
// Para más ejemplos, por favor visita https://github.com/groupdocs-parser-cloud/groupdocs-parser-cloud-node
const { Configuration, ParserApi, TextOptions, TextRequest, FileInfo } = require("groupdocs-parser-cloud");
const config = new Configuration("YOUR_CLIENT_ID", "YOUR_CLIENT_SECRET");
const parserApi = new ParserApi(config);
const fileInfo = new FileInfo();
// path of word document
fileInfo.filePath = "sample.docx";
const options = new TextOptions();
options.fileInfo = fileInfo;
const request = new TextRequest(options);
parserApi.text(request).then(response => {
console.log("Extracted text content:");
console.log(response.text);
}).catch(err => {
console.error("Error extracting text:", err);
});
Puedes ver la salida del código de muestra anterior en la imagen a continuación:

Extraer texto de Word a través de cURL
¿Prefieres operaciones en la línea de comandos o quieres integrarte en un script? Puedes extraer texto de un documento de Word utilizando cURL y la API REST de GroupDocs.Parser.
Paso 1 – Generar token de acceso:
curl -X POST "https://api.groupdocs.cloud/connect/token" \
-d "grant_type=client_credentials&client_id=YOUR_CLIENT_ID&client_secret=YOUR_CLIENT_SECRET" \
-H "Content-Type: application/x-www-form-urlencoded"
Paso 2 – Extraer texto a través de la llamada a la API:
curl -v -X POST "https://api.groupdocs.cloud/v1.0/parser/text" \
-H "accept: application/json" \
-H "authorization: Bearer {ACCESS_TOKEN}" \
-H "Content-Type: application/json" \
-d
"{
\"FileInfo\":
{
\"FilePath\": \"sample.docx\",
\"StorageName\": \"internal\"
},
\"StartPageNumber\": 0,
\"CountPagesToExtract\": 1
}"
- Reemplace con el que generó.
Beneficios de usar cURL con la API de GroupDocs.Parser
- ✅ No se requiere instalación del SDK.
- ✅ Automatización multiplataforma.
- ✅ Ideal para scripts de shell y pipelines de CI.
- ✅ Eficiente y ligero.
Extractor de Texto en Línea
Utilice nuestro Extractor de Texto de Palabras en Línea Gratis impulsado por GroupDocs.Parser Cloud si prefiere una opción sin código.

Conclusión
Con GroupDocs.Parser Cloud SDK para Node.js, puedes extraer fácilmente texto de documentos de Word (.docx o .doc) para automatización, indexación o minería de datos. El SDK y la API REST ofrecen opciones flexibles y escalables, ya sea que prefieras Node.js o comandos cURL directos.
📚 Recursos Adicionales
Preguntas Frecuentes – FAQs
- ¿Puedo extraer texto de tablas DOCX también?
- Sí. GroupDocs.Parser puede extraer contenido estructurado, incluyendo celdas de tabla y datos de diseño.
- ¿Se requiere Microsoft Word?
- No. La API se ejecuta en la nube y no depende de Microsoft Office.
- ¿Qué es el modelo de precios?
- Ofrecemos un modelo de precios de pago por uso. Para más información, por favor visita pricing guide.
- ¿Puedo tener una prueba gratuita?
- Sí. Una vez que te suscribas a la cuenta de prueba gratuita, puedes hacer 150 llamadas a la API por mes de forma gratuita. Por favor visita pricing guide para más detalles.