تبدیل اسناد ورد (DOC، DOCX) به فرمت متنی یک نیاز رایج در استخراج داده، نمایهسازی یا جریانهای کاری اتوماسیون است. با کمک SDK ابری .NET، شما میتوانید به راحتی متن را از اسناد ورد استخراج کنید برای پردازش زبان طبیعی، تحلیل محتوا، یا ذخیرهسازی دادههای متنی بزرگ بدون وابستگی به مایکروسافت ورد.
API تبدیل کلمه به متن
SDK ابری GroupDocs.Parser Cloud برای .NET ابزارهای قدرتمندی برای تجزیه، استخراج و تبدیل اسناد ورد به فرمت متنی ارائه میدهد. این SDK از فرمتهای DOC، DOCX و دیگر فرمتهای محبوب اسناد پشتیبانی میکند و راهی سریع برای توسعهدهندگان برای ساخت تبدیلکنندههای سند به متن یا DOCX به TXT در برنامههای .NET فراهم میآورد.
پیشنیازها
- در GroupDocs Cloud Dashboard ثبت نام کنید.
- کد مشتری و رمز مشتری خود را دریافت کنید. برای اطلاعات بیشتر، لطفاً به این مقاله مراجعه کنید.
- .NET 6.0 یا بعد از آن و ویژوال استودیو را نصب کنید.
- SDK را از بستههای NuGet نصب کنید:
NuGet\Install-Package GroupDocs.Parser-Cloud -Version 25.7.0
مبدل DOCX به TXT با استفاده از C#
در اینجا یک مثال ساده وجود دارد که نحوه تبدیل DOCX به TXT یا استخراج متن از اسناد Word را با استفاده از GroupDocs.Parser Cloud SDK برای .NET نشان میدهد.
1.: پیکربندی API را راهاندازی کنید
var config = new Configuration
{
ClientId = "YOUR_CLIENT_ID",
ClientSecret = "YOUR_CLIENT_SECRET"
};
var parserApi = new ParserApi(config);
2.: متد Parse را فراخوانی کنید تا محتوای متنی سند را استخراج کند. یک شیء از شیء ImagesRequest را ایجاد کنید که در آن نمونهای از کلاس ImagesOptions را به عنوان آرگومان منتقل میکنیم.
var response = parserApi.Parse(new ParseRequest("sample.docx"));
3.: متن استخراج شده را به صورت یک فایل .txt به صورت محلی برای پردازشهای بیشتر ذخیره کنید.
File.WriteAllText("output.txt", response.Text);
- 💡 شما همچنین میتوانید متن را از صفحات یا پاراگرافهای خاص با تنظیم فیلترها در پارامتر ParseOptions استخراج کنید.
// برای مثالهای بیشتر، لطفاً به https://github.com/groupdocs-parser-cloud/groupdocs-parser-cloud-dotnet مراجعه کنید
var configuration = new Configuration("XXXXXXX-XXXXXXX-XXXXXX-55c38f4b7f22", "XXXXXXXXXXXX");
var parseApi = new ParseApi(configuration);
var fileApi = new FileApi(configuration);
// بارگذاری سند Word ورودی
using (var fileStream = OpenRead("input.docx"))
{
// upload the input Word document to cloud storage
var uploadRequest = new Requests.UploadFileRequest("sample.docx", fileStream);
fileApi.UploadFile(uploadRequest);
}
var options = new TextOptions
{
FileInfo = new FileInfo { FilePath = "sample.docx" }
};
var request = new TextRequest(options);
// extract text from input Word document
var response = parseApi.Text(request);
Console.WriteLine("Extracted Text:\n");
Console.WriteLine(response.Text);
از cURL برای استخراج متن از Word استفاده کنید
اگر شما عملیات خط فرمان را ترجیح میدهید، میتوانید از API REST بهطور مستقیم از طریق cURL برای تبدیل DOC یا DOCX به متن بهصورت آنلاین استفاده کنید.
مرحله 1: دسترسی به توکن را به دست آورید:
curl -X POST "https://api.groupdocs.cloud/connect/token" \
-d "grant_type=client_credentials&client_id=YOUR_CLIENT_ID&client_secret=YOUR_CLIENT_SECRET" \
-H "Content-Type: application/x-www-form-urlencoded"
مرحله ۲: تبدیل DOCX به TXT:
curl -X POST "https://api.groupdocs.cloud/v1.0/parser/{inputFile}/text" \
-H "accept: application/json" \
-H "authorization: Bearer {ACCESS_TOKEN}" \
-o "{outputFile}.txt"
نام فایل Word خود را با {inputFile} جایگزین کنید و نام فایل TXT مورد نظر برای ذخیره محلی را با {outputFile} جایگزین کنید.
مبدل آنلاین DOCX به TXT رایگان
اگر میخواهید به سرعت تبدیل کلمه به متن آنلاین را امتحان کنید، نگاهی به مبدل رایگان DOCX به TXT بیندازید. این مبدل به شما این امکان را میدهد که هر فایل وردی را بارگذاری کرده و به صورت آنی به فرمت متن تبدیل کنید — بدون نیاز به نصب یا کدنویسی.

خلاصه
ما بررسی کردهایم که .NET Cloud SDK ما یک راهحل قابلاعتماد و مبتنی بر Cloud برای استخراج متن از اسناد Word و تبدیل آنها به فرمت TXT ارائه میدهد. این کار استخراج داده، تحلیل محتوا و یکپارچهسازی را ساده میکند و با سیستمهای پردازش اسناد سازمانی.
چرا از GroupDocs.Parser Cloud استفاده کنیم؟
- از فرمتهای DOC و DOCX پشتیبانی میکند.
- یکپارچهسازی آسان با برنامههای .NET.
- 100% مبتنی بر Cloud — نیازی به Microsoft Word نیست.
- خروجی TXT تمیز ایجاد کنید که برای پردازش یا ذخیره دادهها آماده باشد.
سوالات متداول (FAQs)
- آیا میتوانم با استفاده از C# فایلهای DOCX را به TXT تبدیل کنم؟
- بله. SDK به شما این امکان را میدهد که متن را از اسناد Word به طور مستقیم در فرمت TXT استخراج و ذخیره کنید.
- آیا از فایلهای DOC و همچنین DOCX پشتیبانی میکند؟
- بله. هر دو فرمت فایل به طور کامل برای تبدیل و استخراج متن پشتیبانی میشوند.
- آیا برای این تبدیل به مایکروسافت ورد نیاز است؟
- نه. تبدیل به طور کامل بر روی پلتفرم Cloud GroupDocs انجام میشود.
- آیا میتوانم بخشها یا صفحات خاصی را برای استخراج انتخاب کنم؟
- بله. شما میتوانید بازههای صفحه یا نواحی را برای استخراج متن جزئی تعریف کنید.
