Dokumente und Rohtext mit C# klassifizieren

Unter Textklassifizierung oder Textkategorisierung versteht man den Prozess der Zuweisung von Tags oder der Kategorisierung von Text in organisierte Gruppen. Als C#-Entwickler können Sie Rohtexte oder Dokumente problemlos programmgesteuert in der Cloud klassifizieren. In diesem Artikel erfahren Sie, wie Sie Dokumente und Rohtext mithilfe einer REST-API in C# klassifizieren.

Die folgenden Themen werden in diesem Artikel besprochen/behandelt:

Dokumentklassifizierung REST API und .NET SDK

Zum Klassifizieren von Texten oder Dokumenten verwende ich die API .NET SDK von GroupDocs.Classification Cloud. Es ermöglicht Ihnen, Ihren Rohtext sowie Dokumente in vordefinierte Kategorien zu klassifizieren. Das SDK unterstützt mehrere Taxonomietypen, wie z. B. IAB-2, Documents & Sentiment-Taxonomie. Die Klassifizierungsinformationen zeigen die beste Klasse mit ihrem Wahrscheinlichkeitswert.

Sie können GroupDocs.Classification über den Paket-Manager NuGet oder mit dem folgenden Befehl in der Paket-Manager-Konsole in Ihrem Visual Studio-Projekt installieren:

Install-Package GroupDocs.Classification-Cloud

Bitte rufen Sie Ihre Client-ID und Ihr Client-Geheimnis vom Dashboard ab, bevor Sie mit dem Befolgen der Schritte und verfügbaren Codebeispiele beginnen. Sobald Sie Ihre Kunden-ID und Ihr Geheimnis haben, fügen Sie den Code wie unten gezeigt ein:

var configuration = new Configuration();
configuration.ClientId = "659fe7da-715b-4744-a0f7-cf469a392b73";
configuration.ClientSecret = "b377c36cfa28fa69960ebac6b6e36421";

Klassifizieren Sie Word Dokumente mithilfe einer REST-API in C#

Sie können Ihre Word Dokumente klassifizieren, indem Sie die folgenden einfachen Schritte ausführen:

Laden Sie das Dokument hoch

Laden Sie zunächst die DOCX-Datei mit dem unten angegebenen Codebeispiel in die Cloud hoch:

// API-Initialisierung
var apiInstance = new FileApi(configuration);

// Öffnen Sie die Datei in IOStream von lokal/disc.
var fileStream = File.Open("C:\\Files\\sample.docx", FileMode.Open);

// Datei-Upload-Anfrage erstellen
var request = new UploadFileRequest("sample.docx", fileStream, "");

var response = apiInstance.UploadFile(request);

Dadurch ist die hochgeladene DOCX-Datei im Dateienbereich Ihres Dashboards in der Cloud verfügbar.

Word Dokumente mit C# klassifizieren

Sie können Word Dokumente programmgesteuert klassifizieren, indem Sie die folgenden Schritte ausführen.

  • Erstellen Sie eine Instanz von ClassificationApi
  • Erstellen Sie eine Instanz von BaseRequest
  • Legen Sie den DOCX-Dateipfad fest und weisen Sie ihn dem BaseRequest Dokument zu
  • Erstellen Sie ClassifyRequest mit BaseRequest
  • Legen Sie BaseClassesCount fest
  • Rufen Sie ClassificationResponse ab, indem Sie die Methode ClassificationApi.Classify() aufrufen

Das folgende Codebeispiel zeigt, wie Sie ein Word Dokument mithilfe einer REST-API klassifizieren.

// API-Initialisierung
var apiInstance = new ClassificationApi(configuration);

// Basisanfrage erstellen
BaseRequest baseRequest = new BaseRequest();
baseRequest.Document = new GroupDocs.Classification.Cloud.Sdk.Model.FileInfo()
{
    Name = "sample.docx",
    Folder = ""
};

// Klassifizierungsanfrage erstellen
var request = new ClassifyRequest(baseRequest);
request.BestClassesCount = "3";

// Erhalten Sie Klassifizierungsergebnisse
ClassificationResponse response = apiInstance.Classify(request);
foreach(var r in response.BestResults)
{
    Console.WriteLine("ClassName: " + r.ClassName);
    Console.WriteLine("ClassProbability: " + r.ClassProbability);
    Console.WriteLine("--------------------------------");
}
Klassifizieren Sie Word Dokumente mithilfe einer REST-API in C#

Klassifizieren Sie Word Dokumente mithilfe einer REST-API in C#

Klassifizieren Sie Word Dokumente für die Taxonomie mit C#

Sie können Word Dokumente programmgesteuert für eine Taxonomie klassifizieren, indem Sie die folgenden Schritte ausführen.

  • Erstellen Sie eine Instanz von ClassificationApi
  • Erstellen Sie eine Instanz von BaseRequest
  • Legen Sie den DOCX-Dateipfad fest und weisen Sie ihn dem BaseRequest Dokument zu
  • Erstellen Sie ClassifyRequest mit BaseRequest
  • Legen Sie BaseClassesCount fest
  • Taxonomie festlegen
  • Rufen Sie ClassificationResponse ab, indem Sie die Methode ClassificationApi.Classify() aufrufen

Das folgende Codebeispiel zeigt, wie ein Word Dokument mithilfe einer REST-API für die Taxonomie „Dokumente“ klassifiziert wird. Bitte befolgen Sie die zuvor genannten Schritte, um die Datei hochzuladen.

// API-Initialisierung
var apiInstance = new ClassificationApi(configuration);

// Basisanfrage erstellen
BaseRequest baseRequest = new BaseRequest();
baseRequest.Document = new GroupDocs.Classification.Cloud.Sdk.Model.FileInfo()
{
    Name = "sample.docx",
    Folder = ""
};

// Klassifizierungsanfrage erstellen
var request = new ClassifyRequest(baseRequest);
request.BestClassesCount = "3";
request.Taxonomy = "documents";

// Erhalten Sie Klassifizierungsergebnisse
ClassificationResponse response = apiInstance.Classify(request);
foreach(var r in response.BestResults)
{
    Console.WriteLine("ClassName: " + r.ClassName);
    Console.WriteLine("ClassProbability: " + r.ClassProbability);
    Console.WriteLine("--------------------------------");
}
ClassName: ADVE
ClassProbability: 77.17
--------------------------------
ClassName: Resume
ClassProbability: 22.83
--------------------------------
ClassName: Scientific
ClassProbability: 0.01
--------------------------------

Als Taxonomie zur Klassifizierung der Dokumente können Sie Folgendes verwenden:

  • Standard
  • iab2
  • Unterlagen
  • Gefühl
  • Gefühl3

Weitere Informationen zum Klassifizieren von Anforderungsparametern finden Sie im Abschnitt „Anforderungsparameter klassifizieren“.

Rohtext mithilfe einer REST-API in C# klassifizieren

Sie können jeden Rohtext programmgesteuert klassifizieren, indem Sie die folgenden Schritte ausführen.

  • Erstellen Sie eine Instanz von ClassificationApi
  • Erstellen Sie eine BaseRequest-Instanz
  • Geben Sie Rohtext für die BaseRequest-Beschreibung an
  • Erstellen Sie ClassifyRequest mit BaseRequest
  • Legen Sie BaseClassesCount fest
  • Rufen Sie ClassificationResponse ab, indem Sie die Methode ClassificationApi.Classify() aufrufen

Das folgende Codebeispiel zeigt, wie Rohtext mithilfe einer REST-API klassifiziert wird.

// API-Initialisierung
var apiInstance = new ClassificationApi(configuration);

// Basisanfrage erstellen
BaseRequest baseRequest = new BaseRequest();
baseRequest.Description = "We support some of the most popular file formats in business, "
    + "including Microsoft Word documents, Excel spreadsheets, PowerPoint presentations, "
    + "Outlook emails and archives, Visio diagrams, Project files, and Adobe Acrobat PDF documents..";

// Klassifizierungsanfrage erstellen
var request = new ClassifyRequest(baseRequest);
request.BestClassesCount = "3";

// Erhalten Sie Klassifizierungsergebnisse
var response = apiInstance.Classify(request);
foreach (var r in response.BestResults)
{
    Console.WriteLine("ClassName: " + r.ClassName);
    Console.WriteLine("ClassProbability: " + r.ClassProbability);
    Console.WriteLine("--------------------------------");
}
ClassName: Hobbies_&_Interests
ClassProbability: 43.02
--------------------------------
ClassName: Business_and_Finance
ClassProbability: 26.64
--------------------------------
ClassName: Technology_&_Computing
ClassProbability: 18.25
--------------------------------

Versuchen Sie es online

Bitte probieren Sie das folgende kostenlose Online-Klassifizierungstool aus, das mit der oben genannten API entwickelt wurde. https://products.groupdocs.app/classification[/](https:/ /products.groupdocs.app/splitter/pdf)

Abschluss

In diesem Artikel haben Sie erfahren, wie Sie Word Dokumente und Rohtext in der Cloud mit C# klassifizieren. Sie haben auch gelernt, wie Sie die DOCX-Datei programmgesteuert in die Cloud hochladen. Weitere Informationen zur GroupDocs.Classification Cloud API finden Sie in der Dokumentation. Wir bieten auch einen Abschnitt API-Referenz an, mit dem Sie unsere APIs direkt über den Browser visualisieren und mit ihnen interagieren können. Bei Unklarheiten können Sie uns gerne im Forum kontaktieren.

Siehe auch