طبقه بندی متن چیست؟
طبقهبندی متن، فرآیند اختصاص برچسبها یا دستهها به متن با توجه به محتوای آن با کاربردهای گستردهای مانند تجزیه و تحلیل احساسات، برچسبگذاری موضوع، تشخیص هرزنامه و تشخیص هدف است.
داده های بدون ساختار به شکل متن خام در همه جا وجود دارد: ایمیل ها، چت ها، صفحات وب، رسانه های اجتماعی، بلیط های پشتیبانی، پاسخ های نظرسنجی و موارد دیگر. متن می تواند منبع اطلاعاتی بسیار غنی باشد، اما استخراج بینش از آن به دلیل ماهیت بدون ساختار آن می تواند سخت و زمان بر باشد. کسبوکارها به طبقهبندی متن روی میآورند تا متن را به روشی سریع و مقرون به صرفه بسازند تا تصمیمگیری و فرآیندها را خودکار کنند.
تاکسونومی چیست؟
تاکسونومی عمل و علم طبقه بندی است. این کلمه همچنین به عنوان یک طرح طبقه بندی استفاده می شود. طبقه بندی یک طبقه بندی خاص است. در معنای گسترده تر و کلی تر، ممکن است به طبقه بندی اشیا یا مفاهیم و همچنین به اصول زیربنای چنین طبقه بندی اشاره کند.
GroupDocs.Classification Cloud API
GroupDocs.Classification Cloud API خروجی طبقهبندی متن خام را برای ردهبندی IAB-2 یا ردهبندی اسناد بازیابی میکند. یک شی را برمی گرداند که حاوی اطلاعاتی در مورد بهترین کلاس و احتمال آن و احتمالات سایر کلاس ها است.
مثال تاکسونومی IAB-2
GroupDocs.Classification Cloud API از طرح طبقه بندی IAB-2 پشتیبانی می کند، برخی از نمونه های طبقه بندی در زیر فهرست شده اند:
- “خودرو”،
- “کتاب\و\ادبیات”،
- “کسب و کار\و\مالی”،
- " شغل “،
- ‘تحصیلات’،
- “رویدادها\و\جاذبه ها”،
- “خانواده\و\روابط”،
- “هنر زیبا”،
- ‘غذا نوشیدنی’،
- ‘زندگی سالم’،
- “سرگرمی ها&\علائق”،
- ‘خانه و باغ’،
- “پزشکی/سلامت”،
- ‘فیلم ها’،
- “موسیقی\و\صوتی”،
- “اخبار\و\سیاست”،
- ‘امور مالی شخصی’
- و غیره.
درخواست cURL
### Upload document to default storage
curl -X POST "https://api.groupdocs.cloud/v2.0/viewer/storage/file/viewerdocs%2Fthree-layouts.dwf?storageName=MyStorage"
-H "accept: application/json"
-H "authorization: Bearer [Access_Token]"
-H "Content-Type: multipart/form-data"
-T C:/Temp/three-layouts.dwf
واکنش
{
"bestClassName": "Healthy_Living",
"bestClassProbability": 53.77,
"bestResults": [
{
"className": "Healthy_Living",
"classProbability": 53.77
},
{
"className": "Medical_Health",
"classProbability": 38.27
},
{
"className": "Pets",
"classProbability": 1.98
}
],
"code": 200,
"status": "OK"
}
مثال دات نت
//TODO: AppSID و AppKey خود را در https://dashboard.groupdocs.cloud دریافت کنید (ثبت نام رایگان لازم است).
using System;
using System.Diagnostics;
using GroupDocs.Classification.Cloud.Sdk.Api;
using GroupDocs.Classification.Cloud.Sdk.Model;
using GroupDocs.Classification.Cloud.Sdk.Model.Requests;
namespace GroupDocs.Classification.Cloud.Sdk.Examples
{
class Classification_CSharp_Classify_Document_from_Storage
{
public static void Run()
{
//TODO: AppSID و AppKey خود را در https://dashboard.groupdocs.cloud/ دریافت کنید (ثبت نام رایگان لازم است).
var configuration = new Configuration
{
AppSid = "XXX-XXXXXXX-XXXX",
AppKey = "XXXXXXXXXXXXX"
};
var apiInstance = new ClassificationApi(configuration);
try
{
var request = new ClassifyRequest(new BaseRequest()
{
Document = new FileInfo()
{
Name = "one-page.docx",
Folder = ""
},
},
bestClassesCount: "3");
// نتایج طبقه بندی را دریافت کنید
ClassificationResponse response = apiInstance.Classify(request);
Console.WriteLine(response.ToString());
}
catch (Exception e)
{
Console.WriteLine("Exception when calling ClassificationApi.Classify: " + e.Message);
}
}
}
}
نمونه تاکسونومی اسناد
طبقهبندی اسناد شامل فهرست زیر در GroupDocs.Classification Cloud API است:
- ADVE - تبلیغات، بروشورها.
- پست الکترونیک
- فرم
- حرف
- یادداشت - یادداشت ها.
- اخبار - مقالات، از جمله مقالات خبری.
- صورتحساب
- گزارش
- از سرگیری
- مقالات علمی - علمی.
- سایر - دسته های دیگر اسناد یا مواردی که طبقه بندی کننده مطمئن نیست.
درخواست cURL
curl -v "http://api.groupdocs.com/v/v1/classification/classify?bestClassesCount=3&taxonomy=documents"
-H "content-type: application/json"
-X POST -d '{ "Document": {"Folder": "words/docx","Name": "four-pages.docx" } }'
واکنش
{
"bestClassName": "Other",
"bestClassProbability": 36.8,
"bestResults": [
{
"className": "Other",
"classProbability": 36.8
},
{
"className": "ADVE",
"classProbability": 14.72
},
{
"className": "News",
"classProbability": 12.77
}
],
"code": 200,
"status": "OK"
}
مثال دات نت
//TODO: AppSID و AppKey خود را در https://dashboard.groupdocs.cloud دریافت کنید (ثبت نام رایگان لازم است).
using System;
using System.Diagnostics;
using GroupDocs.Classification.Cloud.Sdk.Api;
using GroupDocs.Classification.Cloud.Sdk.Model;
using GroupDocs.Classification.Cloud.Sdk.Model.Requests;
namespace GroupDocs.Classification.Cloud.Sdk.Examples
{
class Classification_CSharp_Classify_Raw_Text
{
public static void Run()
{
//TODO: AppSID و AppKey خود را در https://dashboard.groupdocs.cloud/ دریافت کنید (ثبت نام رایگان لازم است).
var configuration = new Configuration
{
AppSid = "XXX-XXXXXXX-XXXX",
AppKey = "XXXXXXXXXXXXX"
};
var apiInstance = new ClassificationApi(configuration);
try
{
var request = new ClassifyRequest(new BaseRequest() { Description = "Try Text classification using GroupDocs.Classification Cloud API" }, "3");
// نتایج طبقه بندی را دریافت کنید
var response = apiInstance.Classify(request);
Console.WriteLine(response.ToString());
}
catch (Exception e)
{
Console.WriteLine("Exception when calling ClassificationApi.Classify: " + e.Message);
}
}
}
}
امروز یک آزمایش رایگان را شروع کنید
همین امروز یک دوره آزمایشی رایگان را شروع کنید – تنها چیزی که نیاز دارید این است که با سرویس GroupDocs Cloud ثبت نام کنید. پس از ثبت نام، آماده هستید تا ویژگی های پردازش فایل قدرتمند ارائه شده توسط GroupDocs Cloud را امتحان کنید.