
Se você precisar extrair texto simples ou estruturado de documentos do Microsoft Word para automação, indexação ou análise, o GroupDocs.Parser Cloud SDK para Node.js oferece uma solução RESTful confiável. Com apenas algumas linhas de código, você pode extrair conteúdo de .doc e .docx arquivos sem instalar o Microsoft Word ou usar quaisquer ferramentas do lado do servidor.
- API de Extração de Texto de Documento Word
- Como extrair texto do Word usando Node.js
- Extrair texto de Word via cURL
- Extrator de Texto de Word Online
API de Extração de Texto de Documentos do Word
O GroupDocs.Parser Cloud SDK for Node.js é um wrapper para a API REST que simplifica a extração:
- Texto (documento completo ou páginas seletivas).
- Tabelas e dados estruturados.
- Metadados e campos incorporados.
- Anexos e imagens.
Ele suporta vários formatos, incluindo PDF, Word, Excel, PowerPoint, MSG, ZIP e mais.
Pré-requisitos
- Crie uma conta no GroupDocs.Cloud Dashboard.
- Obtenha seu Client ID e Client Secret.
- Instalar SDK:
npm install groupdocs-parser-cloud
Você pode considerar visitar o seguinte artigo para aprender mais sobre, como obter seu Client ID e Client Secret para autenticação.
API de Extração de Texto de Documento Word
Por favor, siga os passos fornecidos abaixo para informações sobre como extrair texto de um documento do Word usando o SDK do Node.js.
Etapa 1: Inicializar Configuração:
const { ParserApi, Configuration, ImagesRequest, FileInfo, ImagesOptions } = require("groupdocs-parser-cloud");
const config = new Configuration("YOUR_CLIENT_ID", "YOUR_CLIENT_SECRET");
const parserApi = new ParserApi(config);
Passo 2: Configurar Informações do Arquivo e Opções de Texto: Inicialize um objeto da classe TextRequest e passe a instância da classe TextOptions.
const fileInfo = new FileInfo();
// path to your Word file
fileInfo.filePath = "sample.docx";
const options = new TextOptions();
options.fileInfo = fileInfo;
const request = new TextRequest(options);
Passo 3: Extrair Texto do Arquivo Word: Invoke o text método, e ele retornará o conteúdo de texto simples do documento do Word.
parserApi.text(request).then(response => {
console.log("Extracted text content:");
console.log(response.text);
}).catch(err => {
console.error("Error extracting text:", err);
});
// Para mais exemplos, por favor visite https://github.com/groupdocs-parser-cloud/groupdocs-parser-cloud-node
const { Configuration, ParserApi, TextOptions, TextRequest, FileInfo } = require("groupdocs-parser-cloud");
const config = new Configuration("YOUR_CLIENT_ID", "YOUR_CLIENT_SECRET");
const parserApi = new ParserApi(config);
const fileInfo = new FileInfo();
// path of word document
fileInfo.filePath = "sample.docx";
const options = new TextOptions();
options.fileInfo = fileInfo;
const request = new TextRequest(options);
parserApi.text(request).then(response => {
console.log("Extracted text content:");
console.log(response.text);
}).catch(err => {
console.error("Error extracting text:", err);
});
Você pode ver a saída do exemplo de código acima na imagem abaixo:

Extrair Texto do Word via cURL
Se você prefere operações de linha de comando ou deseja integrar em um script? Você pode extrair texto do documento Word usando cURL e GroupDocs.Parser REST API.
Passo 1 – Gerar Token de Acesso:
curl -X POST "https://api.groupdocs.cloud/connect/token" \
-d "grant_type=client_credentials&client_id=YOUR_CLIENT_ID&client_secret=YOUR_CLIENT_SECRET" \
-H "Content-Type: application/x-www-form-urlencoded"
Passo 2 – Extrair Texto via Chamada de API:
curl -v -X POST "https://api.groupdocs.cloud/v1.0/parser/text" \
-H "accept: application/json" \
-H "authorization: Bearer {ACCESS_TOKEN}" \
-H "Content-Type: application/json" \
-d
"{
\"FileInfo\":
{
\"FilePath\": \"sample.docx\",
\"StorageName\": \"internal\"
},
\"StartPageNumber\": 0,
\"CountPagesToExtract\": 1
}"
- Substitua pelo que você gerou.
Benefícios de usar cURL com a API GroupDocs.Parser
- ✅ Sem instalação do SDK.
- ✅ Automação multiplataforma.
- ✅ Ideal para scripts de shell e pipelines de CI.
- ✅ Eficiente e leve.
Extrator de Texto Online
Use nosso Free Online Word Text Extractor alimentado por GroupDocs.Parser Cloud se você preferir uma opção sem código.

Conclusão
Com o GroupDocs.Parser Cloud SDK para Node.js, você pode facilmente extrair texto de documentos do Word (.docx ou .doc) para automação, indexação ou mineração de dados. O SDK e a API REST oferecem opções flexíveis e escaláveis, quer você prefira Node.js ou comandos cURL diretos.
📚 Recursos Adicionais
Perguntas Frequentes – FAQs
- Posso extrair texto de tabelas DOCX também?
- Sim. O GroupDocs.Parser pode extrair conteúdo estruturado, incluindo células de tabela e dados de layout.
- Is Microsoft Word necessário?
- Não. A API roda na nuvem e não depende do Microsoft Office.
- Qual é o modelo de preços?
- Oferecemos um único modelo de preços pay as you go. Para mais informações, por favor visite pricing guide.
- Posso ter um teste gratuito?
- Sim. Uma vez que você esteja inscrito em uma conta de avaliação gratuita, você pode fazer 150 chamadas de API por mês gratuitamente. Por favor, visite pricing guide para mais detalhes.