Was ist Textklassifizierung?
Bei der Textklassifizierung handelt es sich um den Prozess der Zuweisung von Tags oder Kategorien zu Text entsprechend seines Inhalts mit weitreichenden Anwendungen wie Stimmungsanalyse, Themenkennzeichnung, Spam-Erkennung und Absichtserkennung.
Unstrukturierte Daten in Form von Rohtext sind überall: E-Mails, Chats, Webseiten, soziale Medien, Support-Tickets, Umfrageantworten und mehr. Text kann eine äußerst reichhaltige Informationsquelle sein, aber aufgrund seiner unstrukturierten Natur kann es schwierig und zeitaufwändig sein, daraus Erkenntnisse zu gewinnen. Unternehmen nutzen die Textklassifizierung, um Texte schnell und kosteneffizient zu strukturieren, die Entscheidungsfindung zu verbessern und Prozesse zu automatisieren.
Was ist Taxonomie?
Taxonomie ist die Praxis und Wissenschaft der Klassifizierung. Das Wort wird auch als taxonomisches Schema verwendet. Die Taxonomie ist eine besondere Klassifizierung. Im weiteren, allgemeineren Sinne kann es sich auf eine Klassifizierung von Dingen oder Konzepten sowie auf die einer solchen Klassifizierung zugrunde liegenden Prinzipien beziehen.
GroupDocs.Classification Cloud-API
Die GroupDocs.Classification Cloud-API ruft die Ausgabe der Rohtextklassifizierung für IAB-2-Taxonomie oder Dokumenttaxonomie ab. Es gibt ein Objekt zurück, das Informationen über die beste Klasse und ihre Wahrscheinlichkeit sowie über Wahrscheinlichkeiten der anderen Klassen enthält.
Beispiel für eine IAB-2-Taxonomie
Die GroupDocs.Classification Cloud API unterstützt das Taxonomieschema IAB-2. Einige der Taxonomiebeispiele sind unten aufgeführt:
- „Automobil“,
- ‘Bücher\und\Literatur’,
- ‘Geschäft und Finanzen’,
- ‘Karriere’,
- ‘Ausbildung’,
- ‘Veranstaltungen\und\Attraktionen’,
- ‘Familie\und\Beziehungen’,
- ‘Kunst’,
- „Essen&\Trinken“,
- ‘Gesund leben’,
- ‘Hobbys Interessen’,
- ‘Haus & Garten’,
- ‘Medizinische Gesundheit’,
- ‘Filme’,
- „Musik\und\Audio“,
- ‘Nachrichten\und\Politik’,
- ‘Persönliche Finanzen’
- usw.
cURL-Anfrage
### Upload document to default storage
curl -X POST "https://api.groupdocs.cloud/v2.0/viewer/storage/file/viewerdocs%2Fthree-layouts.dwf?storageName=MyStorage"
-H "accept: application/json"
-H "authorization: Bearer [Access_Token]"
-H "Content-Type: multipart/form-data"
-T C:/Temp/three-layouts.dwf
Antwort
{
"bestClassName": "Healthy_Living",
"bestClassProbability": 53.77,
"bestResults": [
{
"className": "Healthy_Living",
"classProbability": 53.77
},
{
"className": "Medical_Health",
"classProbability": 38.27
},
{
"className": "Pets",
"classProbability": 1.98
}
],
"code": 200,
"status": "OK"
}
.NET-Beispiel
//TODO: Holen Sie sich Ihre AppSID und Ihren AppKey unter https://dashboard.groupdocs.cloud (kostenlose Registrierung erforderlich).
using System;
using System.Diagnostics;
using GroupDocs.Classification.Cloud.Sdk.Api;
using GroupDocs.Classification.Cloud.Sdk.Model;
using GroupDocs.Classification.Cloud.Sdk.Model.Requests;
namespace GroupDocs.Classification.Cloud.Sdk.Examples
{
class Classification_CSharp_Classify_Document_from_Storage
{
public static void Run()
{
//TODO: Holen Sie sich Ihre AppSID und Ihren AppKey unter https://dashboard.groupdocs.cloud/ (kostenlose Registrierung erforderlich).
var configuration = new Configuration
{
AppSid = "XXX-XXXXXXX-XXXX",
AppKey = "XXXXXXXXXXXXX"
};
var apiInstance = new ClassificationApi(configuration);
try
{
var request = new ClassifyRequest(new BaseRequest()
{
Document = new FileInfo()
{
Name = "one-page.docx",
Folder = ""
},
},
bestClassesCount: "3");
// Erhalten Sie Klassifizierungsergebnisse
ClassificationResponse response = apiInstance.Classify(request);
Console.WriteLine(response.ToString());
}
catch (Exception e)
{
Console.WriteLine("Exception when calling ClassificationApi.Classify: " + e.Message);
}
}
}
}
Beispiel für eine Dokumententaxonomie
Die Dokumententaxonomie umfasst die folgende Liste in der GroupDocs.Classification Cloud API:
- ADVE – Anzeigen, Broschüren.
- Form
- Brief
- Memo - Memoranden.
- Nachrichten – Artikel, einschließlich Nachrichtenartikel.
- Rechnung
- Bericht
- Fortsetzen
- Wissenschaftlich – wissenschaftliche Arbeiten.
- Andere – die anderen Klassen von Dokumenten oder Fällen, bei denen der Klassifikator nicht sicher ist.
cURL-Anfrage
curl -v "http://api.groupdocs.com/v/v1/classification/classify?bestClassesCount=3&taxonomy=documents"
-H "content-type: application/json"
-X POST -d '{ "Document": {"Folder": "words/docx","Name": "four-pages.docx" } }'
Antwort
{
"bestClassName": "Other",
"bestClassProbability": 36.8,
"bestResults": [
{
"className": "Other",
"classProbability": 36.8
},
{
"className": "ADVE",
"classProbability": 14.72
},
{
"className": "News",
"classProbability": 12.77
}
],
"code": 200,
"status": "OK"
}
.NET-Beispiel
//TODO: Holen Sie sich Ihre AppSID und Ihren AppKey unter https://dashboard.groupdocs.cloud (kostenlose Registrierung erforderlich).
using System;
using System.Diagnostics;
using GroupDocs.Classification.Cloud.Sdk.Api;
using GroupDocs.Classification.Cloud.Sdk.Model;
using GroupDocs.Classification.Cloud.Sdk.Model.Requests;
namespace GroupDocs.Classification.Cloud.Sdk.Examples
{
class Classification_CSharp_Classify_Raw_Text
{
public static void Run()
{
//TODO: Holen Sie sich Ihre AppSID und Ihren AppKey unter https://dashboard.groupdocs.cloud/ (kostenlose Registrierung erforderlich).
var configuration = new Configuration
{
AppSid = "XXX-XXXXXXX-XXXX",
AppKey = "XXXXXXXXXXXXX"
};
var apiInstance = new ClassificationApi(configuration);
try
{
var request = new ClassifyRequest(new BaseRequest() { Description = "Try Text classification using GroupDocs.Classification Cloud API" }, "3");
// Erhalten Sie Klassifizierungsergebnisse
var response = apiInstance.Classify(request);
Console.WriteLine(response.ToString());
}
catch (Exception e)
{
Console.WriteLine("Exception when calling ClassificationApi.Classify: " + e.Message);
}
}
}
}
Starten Sie noch heute eine kostenlose Testversion
Starten Sie noch heute eine kostenlose Testversion – Sie müssen sich lediglich beim GroupDocs Cloud-Dienst anmelden. Sobald Sie sich angemeldet haben, können Sie die leistungsstarken Dateiverarbeitungsfunktionen von GroupDocs Cloud ausprobieren.