Mengonversi dokumen Word (DOC, DOCX) ke format teks adalah kebutuhan umum dalam ekstraksi data, pengindeksan, atau alur kerja otomatisasi. Dengan bantuan .NET Cloud SDK, Anda dapat dengan mudah mengekstrak teks dari dokumen Word untuk pemrosesan bahasa alami, analisis konten, atau menyimpan data teks besar tanpa bergantung pada Microsoft Word.
API Konversi Kata ke Teks
SDK GroupDocs.Parser Cloud untuk .NET menawarkan alat yang kuat untuk mem-parsing, mengekstrak, dan mengonversi dokumen Word ke format teks. Ini mendukung format dokumen populer seperti DOC, DOCX, dan lainnya, memberikan pengembang cara cepat untuk membuat konverter dokumen-ke-teks atau docx-ke-txt dalam aplikasi .NET.
Prasyarat
- Daftar di GroupDocs Cloud Dashboard.
- Dapatkan ID Klien dan Rahasia Klien Anda. Untuk informasi lebih lanjut, silakan kunjungi artikel ini.
- Install .NET 6.0 atau yang lebih baru dan Visual Studio.
- Instal SDK dari Paket NuGet:
NuGet\Install-Package GroupDocs.Parser-Cloud -Version 25.7.0
Convert DOCX to TXT Menggunakan C#
Berikut adalah contoh sederhana yang menunjukkan cara mengonversi DOCX menjadi TXT atau mengekstrak teks dari dokumen Word menggunakan GroupDocs.Parser Cloud SDK untuk .NET.
1.: Inisialisasi Konfigurasi API
var config = new Configuration
{
ClientId = "YOUR_CLIENT_ID",
ClientSecret = "YOUR_CLIENT_SECRET"
};
var parserApi = new ParserApi(config);
2.: Panggil metode Parse untuk mengekstrak konten tekstual dokumen. Inisialisasi objek dari objek ImagesRequest di mana kita mengirimkan instance dari kelas ImagesOptions sebagai argumen.
var response = parserApi.Parse(new ParseRequest("sample.docx"));
3.: Simpan teks yang diekstrak sebagai file .txt secara lokal untuk pemrosesan lebih lanjut.
File.WriteAllText("output.txt", response.Text);
- 💡 Anda juga dapat mengekstrak teks dari halaman atau paragraf tertentu dengan mengatur filter di parameter ParseOptions.
// Untuk contoh lebih lanjut, silakan kunjungi https://github.com/groupdocs-parser-cloud/groupdocs-parser-cloud-dotnet
var configuration = new Configuration("XXXXXXX-XXXXXXX-XXXXXX-55c38f4b7f22", "XXXXXXXXXXXX");
var parseApi = new ParseApi(configuration);
var fileApi = new FileApi(configuration);
// Load input Word document
using (var fileStream = OpenRead("input.docx"))
{
// upload the input Word document to cloud storage
var uploadRequest = new Requests.UploadFileRequest("sample.docx", fileStream);
fileApi.UploadFile(uploadRequest);
}
var options = new TextOptions
{
FileInfo = new FileInfo { FilePath = "sample.docx" }
};
var request = new TextRequest(options);
// extract text from input Word document
var response = parseApi.Text(request);
Console.WriteLine("Extracted Text:\n");
Console.WriteLine(response.Text);
Extract Text from Word via cURL
Jika Anda lebih suka operasi melalui baris perintah, Anda dapat menggunakan REST API secara langsung melalui cURL untuk mengonversi DOC atau DOCX menjadi teks secara online.
Langkah 1: Dapatkan Token Akses:
curl -X POST "https://api.groupdocs.cloud/connect/token" \
-d "grant_type=client_credentials&client_id=YOUR_CLIENT_ID&client_secret=YOUR_CLIENT_SECRET" \
-H "Content-Type: application/x-www-form-urlencoded"
Langkah 2: Konversi DOCX ke TXT:
curl -X POST "https://api.groupdocs.cloud/v1.0/parser/{inputFile}/text" \
-H "accept: application/json" \
-H "authorization: Bearer {ACCESS_TOKEN}" \
-o "{outputFile}.txt"
Ganti {inputFile} dengan nama file Word Anda dan {outputFile} dengan nama file TXT yang diinginkan untuk disimpan secara lokal.
Free DOCX to TXT Converter Online
Jika Anda ingin mencoba dengan cepat konversi Word ke teks secara online, cek Konverter DOCX ke TXT Gratis. Ini memungkinkan Anda untuk mengunggah dan langsung mengonversi file Word apa pun ke format teks langsung di browser Anda — tanpa perlu pemasangan atau penulisan kode.

Ringkasan
Kami telah mengeksplorasi bahwa .NET Cloud SDK kami menyediakan solusi berbasis cloud yang andal untuk mengekstrak teks dari dokumen Word dan mengubahnya menjadi format TXT. Ini menyederhanakan ekstraksi data, analisis konten, dan integrasi dengan sistem pemrosesan dokumen perusahaan.
Mengapa Menggunakan GroupDocs.Parser Cloud?
- Mendukung format DOC dan DOCX.
- Integrasi yang mudah dengan aplikasi .NET.
- 100% Berbasis Cloud — tidak perlu Microsoft Word.
- Hasilkan output TXT yang bersih siap untuk pengolahan data atau penyimpanan.
Pertanyaan yang Sering Diajukan (FAQ)
- Can I convert DOCX to TXT using C#?
- Ya. SDK memungkinkan Anda untuk mengekstrak dan menyimpan teks dari dokumen Word langsung dalam format TXT.
- Apakah itu mendukung file DOC serta DOCX?
- Ya. Kedua format file sepenuhnya didukung untuk konversi dan ekstraksi teks.
- Is Microsoft Word required for this conversion?
- Tidak. Konversi dilakukan sepenuhnya di platform GroupDocs Cloud.
- Can I select specific sections or pages for extraction?
- Ya. Anda dapat menentukan rentang halaman atau wilayah untuk ekstraksi teks sebagian.
