گاه‌هایی، ارائه‌های پاورپوینت (PPTX, PPT) حاوی اطلاعات مهم متنی مانند عنوان‌ها، نکات گلوله‌ای و توضیحات هستند که ممکن است شما نیاز به تحلیل یا استفاده مجدد از آن‌ها داشته باشید. به جای کپی کردن متن به صورت دستی، این مقاله نشان می‌دهد که چگونه می‌توان به صورت برنامه‌نویسی از اسلایدهای پاورپوینت (PPT یا PPTX) متن استخراج کرد با استفاده از API REST .NET.

چرا متن را از پاورپوینت استخراج کنیم؟

استخراج متن از اسلایدهای پاورپوینت زمانی مفید است که شما بخواهید:

  • محتوا یا یادداشت‌ها را از اسلایدهای ارائه برای مستندسازی بازیابی کنید.
  • محتوای اسلایدها را در سیستم‌های دانش فهرست‌برداری و جستجو کنید.
  • تحلیل محتوا یا داده‌کاوی را انجام دهید.
  • استخراج خودکار متن پاورپوینت به صورت انبوه برای بایگانی یا گزارش‌گیری.

با استفاده از GroupDocs.Parser Cloud، شما می‌توانید به راحتی محتوای متنی را از ارائه‌های پاورپوینت به‌صورت ایمن در Cloud استخراج کنید، بدون اینکه به پاورپوینت در سیستم‌های خود نیاز داشته باشید.

API استخراج متن پاورپوینت

GroupDocs.Parser Cloud SDK for .NET یک API REST قدرتمند است که برای استخراج متن، متادیتا و داده‌های ساختاری از فرمت‌های مختلف اسناد از جمله پاورپوینت، ورد، اکسل و پی‌دی‌اف طراحی شده است.

پیش نیازها

قبل از شروع، اطمینان حاصل کنید که دارید:

  • یک GroupDocs Cloud account برای به دست آوردن شناسه مشتری و کلید محرمانه مشتری خود.
  • نسخه .NET 6.0 یا بالاتر بر روی سیستم شما نصب شده باشد.
  • Visual Studio یا یک IDE سازگار دیگر.

SDK را نصب کنید

پکیج را از طریق NuGet نصب کنید:

NuGet\Install-Package GroupDocs.Parser-Cloud -Version 25.7.0

متن را از PPTX در C# .NET استخراج کنید

این مراحل را برای استخراج متن از یک ارائه پاورپوینت به صورت برنامه‌نویسی دنبال کنید.

مرحله ۱ – راه‌اندازی API

var configuration = new Configuration("YOUR_CLIENT_ID", "YOUR_CLIENT_SECRET");
var parserApi = new ParserApi(configuration);

مرحله 2 – تنظیم اطلاعات فایل

var fileInfo = new FileInfo { FilePath = "presentation.pptx" };
var options = new ParseOptions { FileInfo = fileInfo };
var request = new ParseRequest(options);

گام ۳ – استخراج متن از اسلایدها

var response = parserApi.Parse(request);
Console.WriteLine("Extracted Text: ");
Console.WriteLine(response.Text);
/ For further examples, please visit https://github.com/groupdocs-parser-cloud/groupdocs-parser-cloud-dotnet

var configuration = new Configuration("XXXXXXX-XXXXXXX-XXXXXX-55c38f4b7f22", "XXXXXXXXXXXX");
var parseApi = new ParseApi(configuration);
var fileApi = new FileApi(configuration);

// بارگذاری سند پاورپوینت ورودی
using (var fileStream = OpenRead("input.pptx"))
{
    // فایل PPT ورودی را به فضای ابری بارگذاری کنید.
    var uploadRequest = new Requests.UploadFileRequest("input.pptx", fileStream);
    fileApi.UploadFile(uploadRequest);
}

var options = new TextOptions
{
    FileInfo = new FileInfo { FilePath = "input.pptx" }
};

var request = new TextRequest(options);
// متن را از ارائه پاورپوینت استخراج کنید
var response = parseApi.Text(request);

Console.WriteLine("Extracted Text:\n");
Console.WriteLine(response.Text);    

💡 شما می‌توانید درخواست را به‌گونه‌ای تغییر دهید که فقط متن را از اسلایدهای انتخاب شده با تعریف شماره‌های اسلاید در پارامتر ParseOptions استخراج کنید.

متن پاورپوینت را با استفاده از cURL استخراج کنید

اگر شما ترجیح می‌دهید با تماس‌های مستقیم API REST کار کنید، از دستورات cURL زیر برای استخراج متن از فایل‌های PowerPoint بدون نوشتن کد استفاده کنید.

مرحله ۱ – دسترسی به توکن را بدست آورید

curl -X POST "https://api.groupdocs.cloud/connect/token" \
-d "grant_type=client_credentials&client_id=YOUR_CLIENT_ID&client_secret=YOUR_CLIENT_SECRET" \
-H "Content-Type: application/x-www-form-urlencoded"

مرحله ۲ – استخراج متن از پاورپوینت

curl -v -X POST "https://api.groupdocs.cloud/v1.0/parser/text" \
-H  "accept: application/json" \
-H  "authorization: Bearer {ACCESS_TOKEN}" \
-H  "Content-Type: application/json" \
-d "{ \"FileInfo\": { \"FilePath\": \"slides.pptx\", \"StorageName\": \"internal\" } }"

{ACCESSTOKEN} را با توکن به دست آمده در بالا جایگزین کنید، و نام فایل PowerPoint خود را در زیر FilePath مشخص کنید.

تست کنید آنلاین استخراج کننده متن پاورپوینت

شما همچنین می‌توانید از ابزار آنلاین استخراج متن پاورپوینت رایگان ما استفاده کنید تا کارکرد API را بدون نوشتن کد آزمایش کنید. فایل پاورپوینت خود را بارگذاری کنید و به‌طور آنی محتوای متن استخراج‌شده را در فرمت متن ساده دانلود کنید.

متن را از پاورپوینت آنلاین استخراج کنید

از GroupDocs.Parser Cloud برای استخراج متن از PowerPoint آنلاین استفاده کنید.

نتیجه گیری

در این آموزش، شما یاد گرفتید که چگونه متن را از ارائه‌های پاورپوینت با استفاده از GroupDocs.Parser Cloud SDK برای .NET استخراج کنید. این رویکرد به توسعه‌دهندگان اجازه می‌دهد تا استخراج متن پاورپوینت را خودکار کنند و آن را برای ساخت تحلیل محتوا، ایندکس‌گذاری یا راه‌حل‌های جستجو ایده‌آل می‌سازد.

فواید کلیدی:

  • متن را به سادگی از اسلایدهای PPT و PPTX استخراج کنید.
  • نصب پاورپوینت لازم نیست.
  • کاملاً مبتنی بر Cloud با یکپارچگی REST API.
  • داده‌های متنی تمیز و ساختاریافته را برای پردازش‌های بیشتر صادر کنید.

سوالات متداول – FAQs

  1. آیا می‌توانم متن را از فایل‌های PPT و PPTX استخراج کنم؟ بله. این API از هر دو فرمت قدیمی PPT و فرمت مدرن PPTX پشتیبانی می‌کند.

  2. آیا به نصب نرم‌افزار مایکروسافت پاورپوینت نیاز دارم؟ نه. GroupDocs.Parser Cloud به طور مستقل از نرم‌افزارهای دسکتاپ کار می‌کند.

  3. آیا می‌توانم متن را تنها از اسلایدهای خاص استخراج کنم؟ بله. شما می‌توانید شماره‌های اسلاید یا دامنه‌ها را در گزینه‌های درخواست خود تعریف کنید.

  4. فرمت متن استخراج شده چیست؟ متن به عنوان خروجی متن ساده (.txt) بازگشت داده می‌شود، مناسب برای تحلیل یا نمایه‌سازی.

  5. آیا نسخه رایگانی برای تست در دسترس است؟ بله. شما می‌توانید یک حساب آزمایشی رایگان ایجاد کنید و تا 150 تماس API در هر ماه انجام دهید.

لینک‌های مفید

مقالات مرتبط