تبدیل اسناد ورد (DOC، DOCX) به فرمت متنی یک نیاز رایج در استخراج داده، نمایه‌سازی یا جریان‌های کاری اتوماسیون است. با کمک SDK ابری .NET، شما می‌توانید به راحتی متن را از اسناد ورد استخراج کنید برای پردازش زبان طبیعی، تحلیل محتوا، یا ذخیره‌سازی داده‌های متنی بزرگ بدون وابستگی به مایکروسافت ورد.

API تبدیل کلمه به متن

SDK ابری GroupDocs.Parser Cloud برای .NET ابزارهای قدرتمندی برای تجزیه، استخراج و تبدیل اسناد ورد به فرمت متنی ارائه می‌دهد. این SDK از فرمت‌های DOC، DOCX و دیگر فرمت‌های محبوب اسناد پشتیبانی می‌کند و راهی سریع برای توسعه‌دهندگان برای ساخت تبدیل‌کننده‌های سند به متن یا DOCX به TXT در برنامه‌های .NET فراهم می‌آورد.

پیش‌نیازها

  • در GroupDocs Cloud Dashboard ثبت نام کنید.
  • کد مشتری و رمز مشتری خود را دریافت کنید. برای اطلاعات بیشتر، لطفاً به این مقاله مراجعه کنید.
  • .NET 6.0 یا بعد از آن و ویژوال استودیو را نصب کنید.
  • SDK را از بسته‌های NuGet نصب کنید:
NuGet\Install-Package GroupDocs.Parser-Cloud -Version 25.7.0

مبدل DOCX به TXT با استفاده از C#

در اینجا یک مثال ساده وجود دارد که نحوه تبدیل DOCX به TXT یا استخراج متن از اسناد Word را با استفاده از GroupDocs.Parser Cloud SDK برای .NET نشان می‌دهد.

1.: پیکربندی API را راه‌اندازی کنید

var config = new Configuration
{
    ClientId = "YOUR_CLIENT_ID",
    ClientSecret = "YOUR_CLIENT_SECRET"
};
var parserApi = new ParserApi(config);

2.: متد Parse را فراخوانی کنید تا محتوای متنی سند را استخراج کند. یک شیء از شیء ImagesRequest را ایجاد کنید که در آن نمونه‌ای از کلاس ImagesOptions را به عنوان آرگومان منتقل می‌کنیم.

var response = parserApi.Parse(new ParseRequest("sample.docx"));

3.: متن استخراج شده را به صورت یک فایل .txt به صورت محلی برای پردازش‌های بیشتر ذخیره کنید.

File.WriteAllText("output.txt", response.Text);
  • 💡 شما همچنین می‌توانید متن را از صفحات یا پاراگراف‌های خاص با تنظیم فیلترها در پارامتر ParseOptions استخراج کنید.
// برای مثال‌های بیشتر، لطفاً به https://github.com/groupdocs-parser-cloud/groupdocs-parser-cloud-dotnet مراجعه کنید

var configuration = new Configuration("XXXXXXX-XXXXXXX-XXXXXX-55c38f4b7f22", "XXXXXXXXXXXX");
var parseApi = new ParseApi(configuration);
var fileApi = new FileApi(configuration);

// بارگذاری سند Word ورودی
using (var fileStream = OpenRead("input.docx"))
{
    // upload the input Word document to cloud storage
    var uploadRequest = new Requests.UploadFileRequest("sample.docx", fileStream);
    fileApi.UploadFile(uploadRequest);
}

var options = new TextOptions
{
    FileInfo = new FileInfo { FilePath = "sample.docx" }
};

var request = new TextRequest(options);
// extract text from input Word document
var response = parseApi.Text(request);

Console.WriteLine("Extracted Text:\n");
Console.WriteLine(response.Text);    

از cURL برای استخراج متن از Word استفاده کنید

اگر شما عملیات خط فرمان را ترجیح می‌دهید، می‌توانید از API REST به‌طور مستقیم از طریق cURL برای تبدیل DOC یا DOCX به متن به‌صورت آنلاین استفاده کنید.

مرحله 1: دسترسی به توکن را به دست آورید:

curl -X POST "https://api.groupdocs.cloud/connect/token" \
-d "grant_type=client_credentials&client_id=YOUR_CLIENT_ID&client_secret=YOUR_CLIENT_SECRET" \
-H "Content-Type: application/x-www-form-urlencoded"

مرحله ۲: تبدیل DOCX به TXT:

curl -X POST "https://api.groupdocs.cloud/v1.0/parser/{inputFile}/text" \
  -H "accept: application/json" \
  -H "authorization: Bearer {ACCESS_TOKEN}" \
  -o "{outputFile}.txt"

نام فایل Word خود را با {inputFile} جایگزین کنید و نام فایل TXT مورد نظر برای ذخیره محلی را با {outputFile} جایگزین کنید.

مبدل آنلاین DOCX به TXT رایگان

اگر می‌خواهید به سرعت تبدیل کلمه به متن آنلاین را امتحان کنید، نگاهی به مبدل رایگان DOCX به TXT بیندازید. این مبدل به شما این امکان را می‌دهد که هر فایل وردی را بارگذاری کرده و به صورت آنی به فرمت متن تبدیل کنید — بدون نیاز به نصب یا کدنویسی.

استخراج کننده تصاویر رایگان

خلاصه

ما بررسی کرده‌ایم که .NET Cloud SDK ما یک راه‌حل قابل‌اعتماد و مبتنی بر Cloud برای استخراج متن از اسناد Word و تبدیل آن‌ها به فرمت TXT ارائه می‌دهد. این کار استخراج داده، تحلیل محتوا و یکپارچه‌سازی را ساده می‌کند و با سیستم‌های پردازش اسناد سازمانی.

چرا از GroupDocs.Parser Cloud استفاده کنیم؟

  • از فرمت‌های DOC و DOCX پشتیبانی می‌کند.
  • یکپارچه‌سازی آسان با برنامه‌های .NET.
  • 100% مبتنی بر Cloud — نیازی به Microsoft Word نیست.
  • خروجی TXT تمیز ایجاد کنید که برای پردازش یا ذخیره داده‌ها آماده باشد.

سوالات متداول (FAQs)

  1. آیا می‌توانم با استفاده از C# فایل‌های DOCX را به TXT تبدیل کنم؟
  • بله. SDK به شما این امکان را می‌دهد که متن را از اسناد Word به طور مستقیم در فرمت TXT استخراج و ذخیره کنید.
  1. آیا از فایل‌های DOC و همچنین DOCX پشتیبانی می‌کند؟
  • بله. هر دو فرمت فایل به طور کامل برای تبدیل و استخراج متن پشتیبانی می‌شوند.
  1. آیا برای این تبدیل به مایکروسافت ورد نیاز است؟
  • نه. تبدیل به طور کامل بر روی پلتفرم Cloud GroupDocs انجام می‌شود.
  1. آیا می‌توانم بخش‌ها یا صفحات خاصی را برای استخراج انتخاب کنم؟
  • بله. شما می‌توانید بازه‌های صفحه یا نواحی را برای استخراج متن جزئی تعریف کنید.

لینک‌های مفید

مقالات مرتبط