Co je klasifikace textu?
Klasifikace textu je proces přiřazování značek nebo kategorií k textu podle jeho obsahu s širokými aplikacemi, jako je analýza sentimentu, označování témat, detekce spamu a detekce záměrů.
Nestrukturovaná data ve formě nezpracovaného textu jsou všude: e-maily, chaty, webové stránky, sociální média, lístky na podporu, odpovědi na průzkumy a další. Text může být extrémně bohatým zdrojem informací, ale získávání poznatků z něj může být obtížné a časově náročné kvůli jeho nestrukturované povaze. Firmy se obracejí na klasifikaci textu, aby strukturovaly text rychlým a nákladově efektivním způsobem, aby zlepšily rozhodování a automatizovaly procesy.
Co je taxonomie?
Taxonomie je praxe a věda o klasifikaci. Slovo se také používá jako taxonomické schéma. Taxonomie je zvláštní klasifikace. V širším, obecnějším smyslu může odkazovat na klasifikaci věcí nebo pojmů, jakož i na principy, na nichž je taková klasifikace založena.
GroupDocs.Classification Cloud API
GroupDocs.Classification Cloud API načítá nezpracovaný výstup klasifikace textu pro taxonomii IAB-2 nebo taxonomii dokumentů. Vrací objekt, který obsahuje informace o nejlepší třídě a její pravděpodobnosti ao pravděpodobností ostatních tříd.
Příklad taxonomie IAB-2
GroupDocs.Classification Cloud API podporuje schéma taxonomie IAB-2. Některé příklady taxonomie jsou uvedeny níže:
- ‘Automobilový’,
- ‘Knihy\and\Literatura’,
- ‘Obchod\and\Finance’,
- ‘Kariéra’,
- ‘Vzdělání’,
- ‘Události\and\Atrakce’,
- ‘Rodina\and\vztahy’,
- ‘Výtvarné umění’,
- ‘Jídlo pití’,
- ‘Zdravý život’,
- ‘Koníčky zájmy’,
- ‘Dům a zahrada’,
- ‘Lékařství\Zdraví’,
- ‘Filmy’,
- ‘Music\and\Audio’,
- ‘Zprávy\and\Politika’,
- ‘Osobní\Finance’
- atd.
cURL požadavek
### Upload document to default storage
curl -X POST "https://api.groupdocs.cloud/v2.0/viewer/storage/file/viewerdocs%2Fthree-layouts.dwf?storageName=MyStorage"
-H "accept: application/json"
-H "authorization: Bearer [Access_Token]"
-H "Content-Type: multipart/form-data"
-T C:/Temp/three-layouts.dwf
Odezva
{
"bestClassName": "Healthy_Living",
"bestClassProbability": 53.77,
"bestResults": [
{
"className": "Healthy_Living",
"classProbability": 53.77
},
{
"className": "Medical_Health",
"classProbability": 38.27
},
{
"className": "Pets",
"classProbability": 1.98
}
],
"code": 200,
"status": "OK"
}
Příklad .NET
//TODO: Získejte své AppSID a AppKey na https://dashboard.groupdocs.cloud (je nutná bezplatná registrace).
using System;
using System.Diagnostics;
using GroupDocs.Classification.Cloud.Sdk.Api;
using GroupDocs.Classification.Cloud.Sdk.Model;
using GroupDocs.Classification.Cloud.Sdk.Model.Requests;
namespace GroupDocs.Classification.Cloud.Sdk.Examples
{
class Classification_CSharp_Classify_Document_from_Storage
{
public static void Run()
{
//TODO: Získejte své AppSID a AppKey na https://dashboard.groupdocs.cloud/ (je nutná bezplatná registrace).
var configuration = new Configuration
{
AppSid = "XXX-XXXXXXX-XXXX",
AppKey = "XXXXXXXXXXXXX"
};
var apiInstance = new ClassificationApi(configuration);
try
{
var request = new ClassifyRequest(new BaseRequest()
{
Document = new FileInfo()
{
Name = "one-page.docx",
Folder = ""
},
},
bestClassesCount: "3");
// Získejte výsledky klasifikace
ClassificationResponse response = apiInstance.Classify(request);
Console.WriteLine(response.ToString());
}
catch (Exception e)
{
Console.WriteLine("Exception when calling ClassificationApi.Classify: " + e.Message);
}
}
}
}
Příklad taxonomie dokumentů
Taxonomie dokumentů zahrnuje následující seznam v GroupDocs.Classification Cloud API:
- ADVE - inzeráty, brožury.
- E-mailem
- Formulář
- Dopis
- Memo - memorandum.
- Novinky - články, včetně novinových článků.
- Faktura
- Zpráva
- Životopis
- Vědecko - vědecké práce.
- Jiné – ostatní třídy dokumentů nebo případy, kdy si klasifikátor není jistý.
cURL požadavek
curl -v "http://api.groupdocs.com/v/v1/classification/classify?bestClassesCount=3&taxonomy=documents"
-H "content-type: application/json"
-X POST -d '{ "Document": {"Folder": "words/docx","Name": "four-pages.docx" } }'
Odezva
{
"bestClassName": "Other",
"bestClassProbability": 36.8,
"bestResults": [
{
"className": "Other",
"classProbability": 36.8
},
{
"className": "ADVE",
"classProbability": 14.72
},
{
"className": "News",
"classProbability": 12.77
}
],
"code": 200,
"status": "OK"
}
Příklad .NET
//TODO: Získejte své AppSID a AppKey na https://dashboard.groupdocs.cloud (je nutná bezplatná registrace).
using System;
using System.Diagnostics;
using GroupDocs.Classification.Cloud.Sdk.Api;
using GroupDocs.Classification.Cloud.Sdk.Model;
using GroupDocs.Classification.Cloud.Sdk.Model.Requests;
namespace GroupDocs.Classification.Cloud.Sdk.Examples
{
class Classification_CSharp_Classify_Raw_Text
{
public static void Run()
{
//TODO: Získejte své AppSID a AppKey na https://dashboard.groupdocs.cloud/ (je nutná bezplatná registrace).
var configuration = new Configuration
{
AppSid = "XXX-XXXXXXX-XXXX",
AppKey = "XXXXXXXXXXXXX"
};
var apiInstance = new ClassificationApi(configuration);
try
{
var request = new ClassifyRequest(new BaseRequest() { Description = "Try Text classification using GroupDocs.Classification Cloud API" }, "3");
// Získejte výsledky klasifikace
var response = apiInstance.Classify(request);
Console.WriteLine(response.ToString());
}
catch (Exception e)
{
Console.WriteLine("Exception when calling ClassificationApi.Classify: " + e.Message);
}
}
}
}
Začněte bezplatnou zkušební verzi ještě dnes
Začněte bezplatnou zkušební verzi ještě dnes – vše, co potřebujete, je zaregistrovat se do cloudové služby GroupDocs. Jakmile se zaregistrujete, jste připraveni vyzkoušet výkonné funkce zpracování souborů, které nabízí GroupDocs Cloud.