Word belgelerini (DOC, DOCX) metin formatına dönüştürmek, veri çıkarımı, dizinleme veya otomasyon iş akışlarında yaygın bir gereksinimdir. .NET Cloud SDK’nın yardımıyla, Microsoft Word’e bağlı kalmadan doğal dil işleme, içerik analizi veya büyük metin verilerini depolamak için Word belgelerinden kolayca metin çıkarabilirsiniz.
- Word to Text Conversion API
- DOCX’i C# ile TXT’ye Dönüştürmek
- Word’den cURL aracılığıyla Metin Çıkartma
Word to Text Conversion API
GroupDocs.Parser Cloud SDK for .NET, Word belgelerini metin formatına ayıklamak, çıkartmak ve dönüştürmek için güçlü araçlar sunar. DOC, DOCX ve diğer popüler belge formatlarını destekler, geliştiricilere .NET uygulamalarında belgeyi metne veya docx’ten txt’ye dönüştürücüler oluşturmak için hızlı bir yol sağlar.
Ön koşullar
- GroupDocs Cloud Dashboard adresine kaydolun.
- Müşteri Kimliğinizi ve Müşteri Sırrınızı alın. Daha fazla bilgi için lütfen bu makaleye gidin.
- .NET 6.0 veya daha yenisini ve Visual Studio’yu kurun.
- SDK’yı NuGet Paketleri’nden yükleyin:
NuGet\Install-Package GroupDocs.Parser-Cloud -Version 25.7.0
DOCX’yi TXT’ye Dönüştürmek İçin C#
İşte DOCX’i TXT’ye dönüştürmeyi veya Word belgelerinden metin çıkarmayı gösteren basit bir örnek; GroupDocs.Parser Cloud SDK for .NET kullanarak.
1.: API Konfigürasyonunu Başlat
var config = new Configuration
{
ClientId = "YOUR_CLIENT_ID",
ClientSecret = "YOUR_CLIENT_SECRET"
};
var parserApi = new ParserApi(config);
2.: Belgeye ait metin içeriğini çıkarmak için Parse metodunu çağırın. ImagesOptions sınıfının örneğini bir argüman olarak geçerek ImagesRequest nesnesinin bir nesnesini başlatın.
var response = parserApi.Parse(new ParseRequest("sample.docx"));
3.: Çıkarılan metni yerel olarak daha fazla işlem için .txt dosyası olarak kaydedin.
File.WriteAllText("output.txt", response.Text);
- 💡 Belirli sayfalardan veya paragraflardan metin çıkarmak için ParseOptions parametresinde filtreler ayarlayarak da yapabilirsiniz.
// Daha fazla örnek için lütfen https://github.com/groupdocs-parser-cloud/groupdocs-parser-cloud-dotnet adresini ziyaret edin.
var configuration = new Configuration("XXXXXXX-XXXXXXX-XXXXXX-55c38f4b7f22", "XXXXXXXXXXXX");
var parseApi = new ParseApi(configuration);
var fileApi = new FileApi(configuration);
// Load input Word document
using (var fileStream = OpenRead("input.docx"))
{
// upload the input Word document to cloud storage
var uploadRequest = new Requests.UploadFileRequest("sample.docx", fileStream);
fileApi.UploadFile(uploadRequest);
}
var options = new TextOptions
{
FileInfo = new FileInfo { FilePath = "sample.docx" }
};
var request = new TextRequest(options);
// extract text from input Word document
var response = parseApi.Text(request);
Console.WriteLine("Extracted Text:\n");
Console.WriteLine(response.Text);
Word’dan Metin Çıkarmak için cURL
Eğer komut satırı işlemlerini tercih ediyorsanız, DOC veya DOCX’i çevrimiçi metne dönüştürmek için cURL aracılığıyla doğrudan REST API’sini kullanabilirsiniz.
Adım 1: Erişim Jetonu Alın:
curl -X POST "https://api.groupdocs.cloud/connect/token" \
-d "grant_type=client_credentials&client_id=YOUR_CLIENT_ID&client_secret=YOUR_CLIENT_SECRET" \
-H "Content-Type: application/x-www-form-urlencoded"
Adım 2: DOCX’i TXT’ye dönüştür:
curl -X POST "https://api.groupdocs.cloud/v1.0/parser/{inputFile}/text" \
-H "accept: application/json" \
-H "authorization: Bearer {ACCESS_TOKEN}" \
-o "{outputFile}.txt"
{inputFile} ile Word dosya adınızı ve {outputFile} ile yerel olarak kaydetmek istediğiniz TXT dosya adını değiştirin.
Ücretsiz DOCX’den TXT’ye Dönüştürücü Çevrimiçi
Eğer Word to text conversion online‘ı hızlıca denemek isterseniz, Ücretsiz DOCX to TXT Dönüştürücüsüne göz atabilirsiniz. Bu, herhangi bir Word dosyasını tarayıcınızda doğrudan metin formatına yüklemenize ve anında dönüştürmenize olanak tanır — herhangi bir kurulum veya kodlama gerektirmez.

Özet
Bizim .NET Cloud SDK’sının, Word belgelerinden metin çıkarmak ve bunları TXT formatına dönüştürmek için güvenilir, bulut tabanlı bir çözüm sunduğunu keşfettik. Veri çıkarımını, içerik analizini ve entegrasyonu basit hale getirir. kurumsal belge işleme sistemleri.
Neden GroupDocs.Parser Cloud Kullanmalıyız?
- DOC ve DOCX formatlarını destekler.
- .NET uygulamalarıyla kolay entegrasyon.
- %100 Cloud Tabanlı — Microsoft Word gerekir.
- Veri işleme veya depolama için hazır temiz TXT çıktısı oluşturun.
Sıkça Sorulan Sorular (SSS)
- Can I convert DOCX to TXT using C#?
- Evet. SDK, Word belgelerinden metin çıkarmanıza ve doğrudan TXT formatında kaydetmenize olanak tanır.
- DOC ve DOCX dosyalarını destekliyor mu?
- Evet. Her iki dosya formatı da dönüştürme ve metin çıkarımı için tam olarak desteklenmektedir.
- Microsoft Word bu dönüşüm için gereklimidir?
- Hayır. Dönüştürme tamamen GroupDocs Cloud platformunda gerçekleştirilir.
- Belirli bölümleri veya sayfaları çıkarmak için seçebilir miyim?
- Evet. Kısmi metin çıkarımı için sayfa aralıkları veya bölgeleri tanımlayabilirsiniz.
