Co to jest klasyfikacja tekstu?
Klasyfikacja tekstu to proces przypisywania tagów lub kategorii do tekstu zgodnie z jego treścią, z szerokim zastosowaniem, takim jak analiza tonacji, etykietowanie tematów, wykrywanie spamu i wykrywanie intencji.
Nieustrukturyzowane dane w postaci nieprzetworzonego tekstu są wszędzie: e-maile, czaty, strony internetowe, media społecznościowe, zgłoszenia do pomocy technicznej, odpowiedzi na ankiety i nie tylko. Tekst może być niezwykle bogatym źródłem informacji, ale wydobywanie z niego wniosków może być trudne i czasochłonne ze względu na jego nieustrukturyzowany charakter. Firmy zwracają się do klasyfikacji tekstu w celu szybkiego i ekonomicznego uporządkowania tekstu w celu usprawnienia podejmowania decyzji i automatyzacji procesów.
Co to jest taksonomia?
Taksonomia to praktyka i nauka klasyfikacji. Słowo to jest również używane jako schemat taksonomiczny. Taksonomia to szczególna klasyfikacja. W szerszym, bardziej ogólnym sensie może odnosić się do klasyfikacji rzeczy lub pojęć, a także do zasad leżących u podstaw takiej klasyfikacji.
GroupDocs.Classification Cloud API
GroupDocs.Classification Cloud API pobiera nieprzetworzony tekst klasyfikacji dla taksonomii IAB-2 lub taksonomii dokumentów. Zwraca obiekt, który zawiera informacje o najlepszej klasie i jej prawdopodobieństwie oraz o prawdopodobieństwach pozostałych klas.
Przykład taksonomii IAB-2
GroupDocs.Classification Cloud API obsługuje schemat taksonomii IAB-2. Poniżej wymieniono niektóre przykłady taksonomii:
- ‘Automobilowy’,
- ‘Książki\i\Literatura’,
- ‘Biznes\i\Finanse’,
- „Kariera”,
- ‘Edukacja’,
- ‘Wydarzenia\i\Atrakcje’,
- „Rodzina\i\Związki”,
- ‘Sztuki piękne’,
- ‘Jedzenie picie’,
- ‘Zdrowe życie’,
- ‘Zainteresowania’,
- ‘Dom i ogród’,
- ‘Zdrowie medyczne’,
- ‘Kino’,
- ‘Muzyka\i\Audio’,
- ‘Aktualności\i\Polityka’,
- ‘Finanse osobiste’
- itp.
Żądanie cURL
### Upload document to default storage
curl -X POST "https://api.groupdocs.cloud/v2.0/viewer/storage/file/viewerdocs%2Fthree-layouts.dwf?storageName=MyStorage"
-H "accept: application/json"
-H "authorization: Bearer [Access_Token]"
-H "Content-Type: multipart/form-data"
-T C:/Temp/three-layouts.dwf
Odpowiedź
{
"bestClassName": "Healthy_Living",
"bestClassProbability": 53.77,
"bestResults": [
{
"className": "Healthy_Living",
"classProbability": 53.77
},
{
"className": "Medical_Health",
"classProbability": 38.27
},
{
"className": "Pets",
"classProbability": 1.98
}
],
"code": 200,
"status": "OK"
}
Przykład .NET
//DO ZROBIENIA: Uzyskaj swój AppSID i AppKey na stronie https://dashboard.groupdocs.cloud (wymagana jest bezpłatna rejestracja).
using System;
using System.Diagnostics;
using GroupDocs.Classification.Cloud.Sdk.Api;
using GroupDocs.Classification.Cloud.Sdk.Model;
using GroupDocs.Classification.Cloud.Sdk.Model.Requests;
namespace GroupDocs.Classification.Cloud.Sdk.Examples
{
class Classification_CSharp_Classify_Document_from_Storage
{
public static void Run()
{
//DO ZROBIENIA: Uzyskaj swój AppSID i AppKey na stronie https://dashboard.groupdocs.cloud/ (wymagana jest bezpłatna rejestracja).
var configuration = new Configuration
{
AppSid = "XXX-XXXXXXX-XXXX",
AppKey = "XXXXXXXXXXXXX"
};
var apiInstance = new ClassificationApi(configuration);
try
{
var request = new ClassifyRequest(new BaseRequest()
{
Document = new FileInfo()
{
Name = "one-page.docx",
Folder = ""
},
},
bestClassesCount: "3");
// Uzyskaj wyniki klasyfikacji
ClassificationResponse response = apiInstance.Classify(request);
Console.WriteLine(response.ToString());
}
catch (Exception e)
{
Console.WriteLine("Exception when calling ClassificationApi.Classify: " + e.Message);
}
}
}
}
Przykład taksonomii dokumentów
Taksonomia dokumentów obejmuje następującą listę w GroupDocs.Classification Cloud API:
- ADVE - reklamy, broszury.
- Formularz
- List
- Notatka — memorandum.
- Aktualności - artykuły, w tym artykuły z aktualnościami.
- Faktura
- Raport
- Wznawiać
- Artykuły naukowe - naukowe.
- Inne - inne klasy dokumentów lub spraw, co do których klasyfikator nie jest pewien.
Żądanie cURL
curl -v "http://api.groupdocs.com/v/v1/classification/classify?bestClassesCount=3&taxonomy=documents"
-H "content-type: application/json"
-X POST -d '{ "Document": {"Folder": "words/docx","Name": "four-pages.docx" } }'
Odpowiedź
{
"bestClassName": "Other",
"bestClassProbability": 36.8,
"bestResults": [
{
"className": "Other",
"classProbability": 36.8
},
{
"className": "ADVE",
"classProbability": 14.72
},
{
"className": "News",
"classProbability": 12.77
}
],
"code": 200,
"status": "OK"
}
Przykład .NET
//DO ZROBIENIA: Uzyskaj swój AppSID i AppKey na stronie https://dashboard.groupdocs.cloud (wymagana jest bezpłatna rejestracja).
using System;
using System.Diagnostics;
using GroupDocs.Classification.Cloud.Sdk.Api;
using GroupDocs.Classification.Cloud.Sdk.Model;
using GroupDocs.Classification.Cloud.Sdk.Model.Requests;
namespace GroupDocs.Classification.Cloud.Sdk.Examples
{
class Classification_CSharp_Classify_Raw_Text
{
public static void Run()
{
//DO ZROBIENIA: Uzyskaj swój AppSID i AppKey na stronie https://dashboard.groupdocs.cloud/ (wymagana jest bezpłatna rejestracja).
var configuration = new Configuration
{
AppSid = "XXX-XXXXXXX-XXXX",
AppKey = "XXXXXXXXXXXXX"
};
var apiInstance = new ClassificationApi(configuration);
try
{
var request = new ClassifyRequest(new BaseRequest() { Description = "Try Text classification using GroupDocs.Classification Cloud API" }, "3");
// Uzyskaj wyniki klasyfikacji
var response = apiInstance.Classify(request);
Console.WriteLine(response.ToString());
}
catch (Exception e)
{
Console.WriteLine("Exception when calling ClassificationApi.Classify: " + e.Message);
}
}
}
}
Rozpocznij bezpłatny okres próbny już dziś
Rozpocznij bezpłatny okres próbny już dziś – wystarczy zarejestrować się w usłudze GroupDocs Cloud. Po zarejestrowaniu się możesz wypróbować zaawansowane funkcje przetwarzania plików oferowane przez GroupDocs Cloud.