La conversione di documenti Word (DOC, DOCX) in formato testo è una necessità comune nell’estrazione dei dati, indicizzazione o flussi di lavoro di automazione. Con l’aiuto del .NET Cloud SDK, puoi facilmente estrarre testo da documenti Word per il processamento del linguaggio naturale, analisi dei contenuti o archiviazione di grandi dati testuali senza dipendere da Microsoft Word.

API di Conversione da Testo a Parola

Il GroupDocs.Parser Cloud SDK for .NET offre potenti strumenti per analizzare, estrarre e convertire documenti Word in formato testo. Supporta i formati DOC, DOCX e altri formati di documento popolari, offrendo agli sviluppatori un modo rapido per costruire convertitori da documento a testo o da docx a txt nelle applicazioni .NET.

Prerequisites

  • Iscriviti su GroupDocs Cloud Dashboard.
  • Ottieni il tuo Client ID e Client Secret. Per ulteriori informazioni, visita questo articolo.
  • Installa .NET 6.0 o versioni successive e Visual Studio.
  • Installa il SDK da NuGet Packages:
NuGet\Install-Package GroupDocs.Parser-Cloud -Version 25.7.0

Convertire DOCX in TXT usando C#

Ecco un semplice esempio che dimostra come convertire DOCX in TXT o estrarre testo dai documenti Word utilizzando il GroupDocs.Parser Cloud SDK per .NET.

1.: Inizializza la configurazione dell’API

var config = new Configuration
{
    ClientId = "YOUR_CLIENT_ID",
    ClientSecret = "YOUR_CLIENT_SECRET"
};
var parserApi = new ParserApi(config);

2.: Chiama il metodo Parse per estrarre il contenuto testuale del documento. Inizializza un oggetto dell’oggetto ImagesRequest dove passiamo l’istanza della classe ImagesOptions come argomento.

var response = parserApi.Parse(new ParseRequest("sample.docx"));

3.: Salva il testo estratto come file .txt localmente per ulteriori elaborazioni.

File.WriteAllText("output.txt", response.Text);
  • 💡 Puoi anche estrarre testo da pagine o paragrafi specifici impostando filtri nel parametro ParseOptions.
// Per ulteriori esempi, si prega di visitare https://github.com/groupdocs-parser-cloud/groupdocs-parser-cloud-dotnet

var configuration = new Configuration("XXXXXXX-XXXXXXX-XXXXXX-55c38f4b7f22", "XXXXXXXXXXXX");
var parseApi = new ParseApi(configuration);
var fileApi = new FileApi(configuration);

// Load input Word document
using (var fileStream = OpenRead("input.docx"))
{
    // upload the input Word document to cloud storage
    var uploadRequest = new Requests.UploadFileRequest("sample.docx", fileStream);
    fileApi.UploadFile(uploadRequest);
}

var options = new TextOptions
{
    FileInfo = new FileInfo { FilePath = "sample.docx" }
};

var request = new TextRequest(options);
// extract text from input Word document
var response = parseApi.Text(request);

Console.WriteLine("Extracted Text:\n");
Console.WriteLine(response.Text);    

Estrai testo da Word tramite cURL

Se preferisci le operazioni da linea di comando, puoi utilizzare direttamente l’API REST tramite cURL per convertire DOC o DOCX in testo online.

Step 1: Ottenere il Token di Accesso:

curl -X POST "https://api.groupdocs.cloud/connect/token" \
-d "grant_type=client_credentials&client_id=YOUR_CLIENT_ID&client_secret=YOUR_CLIENT_SECRET" \
-H "Content-Type: application/x-www-form-urlencoded"

Passaggio 2: Convertire DOCX in TXT:

curl -X POST "https://api.groupdocs.cloud/v1.0/parser/{inputFile}/text" \
  -H "accept: application/json" \
  -H "authorization: Bearer {ACCESS_TOKEN}" \
  -o "{outputFile}.txt"

Sostituisci {inputFile} con il nome del tuo file Word e {outputFile} con il nome desiderato del file TXT da salvare localmente.

Free DOCX to TXT Converter Online

Se vuoi provare rapidamente la conversione da Word a testo online, dai un’occhiata al Free DOCX to TXT Converter. Ti consente di caricare e convertire istantaneamente qualsiasi file Word in formato testo direttamente nel tuo browser — nessuna installazione o programmazione richiesta.

Estrazione di Immagini Gratuite

Sommario

Abbiamo esplorato che il nostro .NET Cloud SDK fornisce una soluzione affidabile basata su cloud per estrarre testo da documenti Word e convertirli in formato TXT. Semplifica l’estrazione dei dati, l’analisi dei contenuti e l’integrazione con sistemi di elaborazione documentale aziendale.

Perché usare GroupDocs.Parser Cloud?

  • Supporta i formati DOC e DOCX.
  • Integrazione facile con applicazioni .NET.
  • 100% basato su cloud — nessun Microsoft Word necessario.
  • Generate clean TXT output ready for data processing or storage.

Domande Frequenti (FAQs)

  1. Can I convert DOCX to TXT using C#?
  • Sì. L’SDK ti consente di estrarre e salvare il testo dai documenti Word direttamente in formato TXT.
  1. Supporta sia i file DOC che i file DOCX?
  • Sì. Entrambi i formati di file sono completamente supportati per la conversione e l’estrazione di testo.
  1. Is Microsoft Word required for this conversion?
  • No. La conversione viene eseguita interamente sulla piattaforma GroupDocs Cloud.
  1. Posso selezionare sezioni o pagine specifiche per l’estrazione?
  • Sì. Puoi definire intervalli di pagina o regioni per l’ estrazione parziale del testo.

Articoli Correlati