Klasyfikuj dokumenty i nieprzetworzony tekst za pomocą C#

Klasyfikacja tekstu lub kategoryzacja tekstu to proces przypisywania znaczników lub kategoryzacji tekstu w zorganizowane grupy. Jako programista języka C# możesz łatwo i programowo klasyfikować nieprzetworzony tekst lub dokumenty w chmurze. W tym artykule dowiesz się, jak klasyfikować dokumenty i nieprzetworzony tekst przy użyciu interfejsu API REST w języku C#.

W tym artykule omówiono/omówiono następujące tematy:

Klasyfikacja dokumentów REST API i .NET SDK

Do klasyfikowania tekstu lub dokumentów będę używał .NET SDK of GroupDocs.Classification Cloud API. Umożliwia klasyfikowanie surowego tekstu oraz dokumentów na predefiniowane kategorie. SDK obsługuje wiele typów taksonomii, takich jak taksonomia IAB-2, Documents & Sentiment. Informacje o klasyfikacji pokazują najlepszą klasę wraz z wynikiem prawdopodobieństwa.

Możesz zainstalować GroupDocs.Classification w swoim projekcie Visual Studio z Menedżera pakietów NuGet lub za pomocą następującego polecenia w konsoli Menedżera pakietów:

Install-Package GroupDocs.Classification-Cloud

Zanim zaczniesz postępować zgodnie z instrukcjami i dostępnymi przykładami kodu, uzyskaj swój identyfikator klienta i klucz tajny klienta z panelu nawigacyjnego. Po uzyskaniu identyfikatora klienta i klucza tajnego dodaj kod, jak pokazano poniżej:

var configuration = new Configuration();
configuration.ClientId = "659fe7da-715b-4744-a0f7-cf469a392b73";
configuration.ClientSecret = "b377c36cfa28fa69960ebac6b6e36421";

Klasyfikuj dokumenty programu Word za pomocą interfejsu API REST w języku C#

Możesz sklasyfikować dokumenty programu Word, wykonując proste czynności podane poniżej:

Prześlij dokument

Najpierw prześlij plik DOCX do chmury, korzystając z przykładowego kodu podanego poniżej:

// Inicjalizacja interfejsu API
var apiInstance = new FileApi(configuration);

// Otwórz plik w IOStream z pliku local/disc.
var fileStream = File.Open("C:\\Files\\sample.docx", FileMode.Open);

// Utwórz żądanie przesłania pliku
var request = new UploadFileRequest("sample.docx", fileStream, "");

var response = apiInstance.UploadFile(request);

W rezultacie przesłany plik DOCX będzie dostępny w sekcji plików Twojego pulpitu nawigacyjnego w chmurze.

Klasyfikuj dokumenty Word za pomocą C#

Możesz programowo klasyfikować dokumenty programu Word, wykonując czynności podane poniżej.

  • Utwórz instancję ClassificationApi
  • Utwórz instancję BaseRequest
  • Ustaw ścieżkę pliku DOCX i przypisz ją do dokumentu BaseRequest
  • Utwórz ClassifyRequest za pomocą BaseRequest
  • Ustaw liczbę klas podstawowych
  • Uzyskaj ClassificationResponse, wywołując metodę ClassificationApi.Classify().

Poniższy przykładowy kod pokazuje, jak sklasyfikować dokument programu Word przy użyciu interfejsu API REST.

// Inicjalizacja interfejsu API
var apiInstance = new ClassificationApi(configuration);

// Utwórz żądanie podstawowe
BaseRequest baseRequest = new BaseRequest();
baseRequest.Document = new GroupDocs.Classification.Cloud.Sdk.Model.FileInfo()
{
    Name = "sample.docx",
    Folder = ""
};

// Utwórz żądanie klasyfikacji
var request = new ClassifyRequest(baseRequest);
request.BestClassesCount = "3";

// Uzyskaj wyniki klasyfikacji
ClassificationResponse response = apiInstance.Classify(request);
foreach(var r in response.BestResults)
{
    Console.WriteLine("ClassName: " + r.ClassName);
    Console.WriteLine("ClassProbability: " + r.ClassProbability);
    Console.WriteLine("--------------------------------");
}
Klasyfikuj dokumenty programu Word za pomocą interfejsu API REST w języku C#

Klasyfikuj dokumenty programu Word za pomocą interfejsu API REST w języku C#

Klasyfikuj dokumenty programu Word pod kątem taksonomii za pomocą języka C#

Możesz programowo klasyfikować dokumenty programu Word pod kątem taksonomii, wykonując czynności podane poniżej.

  • Utwórz instancję ClassificationApi
  • Utwórz instancję BaseRequest
  • Ustaw ścieżkę pliku DOCX i przypisz ją do dokumentu BaseRequest
  • Utwórz ClassifyRequest za pomocą BaseRequest
  • Ustaw liczbę klas podstawowych
  • Ustaw taksonomię
  • Uzyskaj ClassificationResponse, wywołując metodę ClassificationApi.Classify().

Poniższy przykładowy kod pokazuje, jak sklasyfikować dokument programu Word na potrzeby taksonomii „dokumentów” przy użyciu interfejsu API REST. Wykonaj czynności wymienione wcześniej, aby przesłać plik.

// Inicjalizacja API
var apiInstance = new ClassificationApi(configuration);

// Utwórz żądanie podstawowe
BaseRequest baseRequest = new BaseRequest();
baseRequest.Document = new GroupDocs.Classification.Cloud.Sdk.Model.FileInfo()
{
    Name = "sample.docx",
    Folder = ""
};

// Utwórz żądanie klasyfikacji
var request = new ClassifyRequest(baseRequest);
request.BestClassesCount = "3";
request.Taxonomy = "documents";

// Uzyskaj wyniki klasyfikacji
ClassificationResponse response = apiInstance.Classify(request);
foreach(var r in response.BestResults)
{
    Console.WriteLine("ClassName: " + r.ClassName);
    Console.WriteLine("ClassProbability: " + r.ClassProbability);
    Console.WriteLine("--------------------------------");
}
ClassName: ADVE
ClassProbability: 77.17
--------------------------------
ClassName: Resume
ClassProbability: 22.83
--------------------------------
ClassName: Scientific
ClassProbability: 0.01
--------------------------------

Możesz użyć następującej taksonomii do klasyfikowania dokumentów:

  • domyślny
  • iab2
  • dokumenty
  • sentyment
  • sentyment3

Więcej informacji na temat klasyfikowania parametrów żądania można znaleźć w sekcji „Klasyfikacja parametrów żądania”.

Klasyfikuj surowy tekst przy użyciu interfejsu API REST w języku C#

Możesz programowo sklasyfikować dowolny nieprzetworzony tekst, wykonując czynności podane poniżej.

  • Utwórz instancję ClassificationApi
  • Utwórz instancję BaseRequest
  • Podaj nieprzetworzony tekst do opisu BaseRequest
  • Utwórz ClassifyRequest za pomocą BaseRequest
  • Ustaw liczbę klas podstawowych
  • Uzyskaj ClassificationResponse, wywołując metodę ClassificationApi.Classify().

Poniższy przykładowy kod pokazuje, jak klasyfikować nieprzetworzony tekst przy użyciu interfejsu API REST.

// Inicjalizacja interfejsu API
var apiInstance = new ClassificationApi(configuration);

// Utwórz żądanie podstawowe
BaseRequest baseRequest = new BaseRequest();
baseRequest.Description = "We support some of the most popular file formats in business, "
    + "including Microsoft Word documents, Excel spreadsheets, PowerPoint presentations, "
    + "Outlook emails and archives, Visio diagrams, Project files, and Adobe Acrobat PDF documents..";

// Utwórz żądanie klasyfikacji
var request = new ClassifyRequest(baseRequest);
request.BestClassesCount = "3";

// Uzyskaj wyniki klasyfikacji
var response = apiInstance.Classify(request);
foreach (var r in response.BestResults)
{
    Console.WriteLine("ClassName: " + r.ClassName);
    Console.WriteLine("ClassProbability: " + r.ClassProbability);
    Console.WriteLine("--------------------------------");
}
ClassName: Hobbies_&_Interests
ClassProbability: 43.02
--------------------------------
ClassName: Business_and_Finance
ClassProbability: 26.64
--------------------------------
ClassName: Technology_&_Computing
ClassProbability: 18.25
--------------------------------

Wypróbuj online

Wypróbuj następujące bezpłatne narzędzie do klasyfikacji online, które zostało opracowane przy użyciu powyższego interfejsu API. https://products.groupdocs.app/klasyfikacja[/](https:/ /products.groupdocs.app/splitter/pdf)

Wniosek

W tym artykule nauczyłeś się, jak klasyfikować dokumenty programu Word i nieprzetworzony tekst w chmurze przy użyciu języka C#. Nauczyłeś się również, jak programowo przesyłać plik DOCX do chmury. Możesz dowiedzieć się więcej o GroupDocs.Classification Cloud API korzystając z dokumentacji. Udostępniamy również sekcję Informacje o interfejsach API, która umożliwia wizualizację i interakcję z naszymi interfejsami API bezpośrednio w przeglądarce. W przypadku jakichkolwiek niejasności prosimy o kontakt na forum.

Zobacz też