تصنيف المستندات والنص الخام باستخدام C#

تصنيف النص أو تصنيف النص هو عملية تعيين العلامات أو تصنيف النص في مجموعات منظمة. بصفتك مطور C# ، يمكنك بسهولة تصنيف النص الخام أو المستندات برمجيًا على السحابة. في هذه المقالة ، ستتعلم كيفية تصنيف المستندات والنص الخام باستخدام واجهة برمجة تطبيقات REST في C#.

المواضيع التالية تمت مناقشتها / تناولها في هذه المقالة:

تصنيف المستندات REST API و .NET SDK

لتصنيف النص أو المستندات ، سأستخدم .NET SDK of GroupDocs.Classification Cloud API. يمكّنك من تصنيف النص الخام وكذلك المستندات إلى فئات محددة مسبقًا. تدعم SDK أنواع تصنيف متعددة ، مثل IAB-2 وتصنيف المستندات والمشاعر. توضح معلومات التصنيف أفضل فئة بدرجة احتمالية.

يمكنك تثبيت GroupDocs.Classification في مشروع Visual Studio الخاص بك من مدير الحزم NuGet أو باستخدام الأمر التالي في وحدة تحكم مدير الحزم:

Install-Package GroupDocs.Classification-Cloud

يرجى الحصول على معرّف العميل وسر العميل من لوحة القيادة قبل البدء في اتباع الخطوات وأمثلة الكود المتاحة. بمجرد حصولك على معرّف العميل والسرية ، أضف الرمز كما هو موضح أدناه:

var configuration = new Configuration();
configuration.ClientId = "659fe7da-715b-4744-a0f7-cf469a392b73";
configuration.ClientSecret = "b377c36cfa28fa69960ebac6b6e36421";

تصنيف مستندات Word باستخدام واجهة برمجة تطبيقات REST في C#

يمكنك تصنيف مستندات Word الخاصة بك باتباع الخطوات البسيطة الواردة أدناه:

قم بتحميل المستند

أولاً ، قم بتحميل ملف DOCX على السحابة باستخدام نموذج الرمز الوارد أدناه:

// تهيئة API
var apiInstance = new FileApi(configuration);

// افتح الملف في IOStream من القرص المحلي / القرص.
var fileStream = File.Open("C:\\Files\\sample.docx", FileMode.Open);

// إنشاء طلب تحميل ملف
var request = new UploadFileRequest("sample.docx", fileStream, "");

var response = apiInstance.UploadFile(request);

نتيجة لذلك ، سيكون ملف DOCX الذي تم تحميله متاحًا في قسم الملفات من لوحة المعلومات الخاصة بك على السحابة.

تصنيف مستندات Word باستخدام C#

يمكنك تصنيف مستندات Word برمجيًا باتباع الخطوات الواردة أدناه.

  • قم بإنشاء مثيل ClassificationApi
  • قم بإنشاء مثيل BaseRequest
  • قم بتعيين مسار ملف DOCX وقم بتعيينه إلى مستند BaseRequest
  • قم بإنشاء ClassifyRequest باستخدام BaseRequest
  • تعيين BaseClassesCount
  • احصل على ClassificationResponse عن طريق استدعاء الأسلوب ClassificationApi.Classify()

يوضح نموذج التعليمات البرمجية التالي كيفية تصنيف مستند Word باستخدام REST API.

// تهيئة API
var apiInstance = new ClassificationApi(configuration);

// إنشاء طلب أساسي
BaseRequest baseRequest = new BaseRequest();
baseRequest.Document = new GroupDocs.Classification.Cloud.Sdk.Model.FileInfo()
{
    Name = "sample.docx",
    Folder = ""
};

// إنشاء طلب التصنيف
var request = new ClassifyRequest(baseRequest);
request.BestClassesCount = "3";

// احصل على نتائج التصنيف
ClassificationResponse response = apiInstance.Classify(request);
foreach(var r in response.BestResults)
{
    Console.WriteLine("ClassName: " + r.ClassName);
    Console.WriteLine("ClassProbability: " + r.ClassProbability);
    Console.WriteLine("--------------------------------");
}
تصنيف مستندات Word باستخدام واجهة برمجة تطبيقات REST في C#

تصنيف مستندات Word باستخدام واجهة برمجة تطبيقات REST في C#

تصنيف مستندات Word للتصنيف باستخدام C#

يمكنك تصنيف مستندات Word لتصنيف برمجيًا باتباع الخطوات الواردة أدناه.

  • قم بإنشاء مثيل ClassificationApi
  • قم بإنشاء مثيل BaseRequest
  • قم بتعيين مسار ملف DOCX وقم بتعيينه إلى مستند BaseRequest
  • قم بإنشاء ClassifyRequest باستخدام BaseRequest
  • تعيين BaseClassesCount
  • اضبط التصنيف
  • احصل على ClassificationResponse عن طريق استدعاء الأسلوب ClassificationApi.Classify()

يوضح نموذج التعليمات البرمجية التالي كيفية تصنيف مستند Word لتصنيف “المستندات” باستخدام واجهة برمجة تطبيقات REST. يرجى اتباع الخطوات المذكورة سابقاً لتحميل الملف.

// تهيئة API
var apiInstance = new ClassificationApi(configuration);

// إنشاء طلب أساسي
BaseRequest baseRequest = new BaseRequest();
baseRequest.Document = new GroupDocs.Classification.Cloud.Sdk.Model.FileInfo()
{
    Name = "sample.docx",
    Folder = ""
};

// إنشاء طلب التصنيف
var request = new ClassifyRequest(baseRequest);
request.BestClassesCount = "3";
request.Taxonomy = "documents";

// احصل على نتائج التصنيف
ClassificationResponse response = apiInstance.Classify(request);
foreach(var r in response.BestResults)
{
    Console.WriteLine("ClassName: " + r.ClassName);
    Console.WriteLine("ClassProbability: " + r.ClassProbability);
    Console.WriteLine("--------------------------------");
}
ClassName: ADVE
ClassProbability: 77.17
--------------------------------
ClassName: Resume
ClassProbability: 22.83
--------------------------------
ClassName: Scientific
ClassProbability: 0.01
--------------------------------

يمكنك استخدام ما يلي كتصنيف لتصنيف المستندات:

  • تقصير
  • iab2
  • وثائق
  • المشاعر
  • المشاعر3

يمكنك قراءة المزيد حول تصنيف معلمات الطلب في قسم “تصنيف معاملات الطلب”.

تصنيف النص الخام باستخدام REST API في C#

يمكنك تصنيف أي نص خام برمجيًا باتباع الخطوات الواردة أدناه.

  • قم بإنشاء مثيل ClassificationApi
  • إنشاء مثيل BaseRequest
  • قم بتوفير نص خام لوصف BaseRequest
  • قم بإنشاء ClassifyRequest باستخدام BaseRequest
  • تعيين BaseClassesCount
  • احصل على ClassificationResponse عن طريق استدعاء الأسلوب ClassificationApi.Classify()

يوضح نموذج التعليمات البرمجية التالي كيفية تصنيف النص الخام باستخدام واجهة برمجة تطبيقات REST.

// تهيئة API
var apiInstance = new ClassificationApi(configuration);

// إنشاء طلب أساسي
BaseRequest baseRequest = new BaseRequest();
baseRequest.Description = "We support some of the most popular file formats in business, "
    + "including Microsoft Word documents, Excel spreadsheets, PowerPoint presentations, "
    + "Outlook emails and archives, Visio diagrams, Project files, and Adobe Acrobat PDF documents..";

// إنشاء طلب التصنيف
var request = new ClassifyRequest(baseRequest);
request.BestClassesCount = "3";

// احصل على نتائج التصنيف
var response = apiInstance.Classify(request);
foreach (var r in response.BestResults)
{
    Console.WriteLine("ClassName: " + r.ClassName);
    Console.WriteLine("ClassProbability: " + r.ClassProbability);
    Console.WriteLine("--------------------------------");
}
ClassName: Hobbies_&_Interests
ClassProbability: 43.02
--------------------------------
ClassName: Business_and_Finance
ClassProbability: 26.64
--------------------------------
ClassName: Technology_&_Computing
ClassProbability: 18.25
--------------------------------

جرب عبر الإنترنت

يرجى تجربة أداة التصنيف المجانية التالية عبر الإنترنت ، والتي تم تطويرها باستخدام واجهة برمجة التطبيقات المذكورة أعلاه. [https://products.groupdocs.app/] [http://products.groupdocs.app/splitter/pdf) التصنيف[/](https:/ /products.groupdocs.app/splitter/pdf)

خاتمة

في هذه المقالة ، تعلمت كيفية تصنيف مستندات Word والنص الخام على السحابة باستخدام C#. لقد تعلمت أيضًا كيفية تحميل ملف DOCX برمجيًا على السحابة. يمكنك معرفة المزيد حول GroupDocs.Classification Cloud API باستخدام التوثيق. نوفر أيضًا قسم مرجع واجهة برمجة التطبيقات الذي يتيح لك تصور واجهات برمجة التطبيقات الخاصة بنا والتفاعل معها مباشرةً من خلال المتصفح. في حالة وجود أي غموض ، فلا تتردد في الاتصال بنا على المنتدى.

أنظر أيضا