Classifica documenti e testo non elaborato utilizzando C#

La classificazione del testo o la categorizzazione del testo è il processo di assegnazione di tag o categorizzazione del testo in gruppi organizzati. In qualità di sviluppatore C#, puoi facilmente classificare testo o documenti non elaborati in modo programmatico nel cloud. In questo articolo imparerai come classificare documenti e testo non elaborato utilizzando un’API REST in C#.

I seguenti argomenti sono discussi/trattati in questo articolo:

API REST di classificazione dei documenti e .NET SDK

Per classificare testo o documenti, utilizzerò l’API .NET SDK of GroupDocs.Classification Cloud. Ti consente di classificare il tuo testo non elaborato e i documenti in categorie predefinite. L’SDK supporta più tipi di tassonomia, come la tassonomia IAB-2, Documents & Sentiment. Le informazioni sulla classificazione mostrano la classe migliore con il relativo punteggio di probabilità.

È possibile installare GroupDocs.Classification nel progetto di Visual Studio da NuGet Package Manager o utilizzando il comando seguente nella console di Package Manager:

Install-Package GroupDocs.Classification-Cloud

Ottieni il tuo ID cliente e il tuo segreto cliente dalla dashboard prima di iniziare a seguire i passaggi e gli esempi di codice disponibili. Una volta che hai il tuo ID cliente e segreto, aggiungi il codice come mostrato di seguito:

var configuration = new Configuration();
configuration.ClientId = "659fe7da-715b-4744-a0f7-cf469a392b73";
configuration.ClientSecret = "b377c36cfa28fa69960ebac6b6e36421";

Classifica i documenti di Word utilizzando un’API REST in C#

Puoi classificare i tuoi documenti Word seguendo i semplici passaggi indicati di seguito:

Carica il documento

Innanzitutto, carica il file DOCX sul Cloud utilizzando il codice di esempio riportato di seguito:

// Inizializzazione dell'API
var apiInstance = new FileApi(configuration);

// Apri il file in IOStream da locale/disco.
var fileStream = File.Open("C:\\Files\\sample.docx", FileMode.Open);

// Crea richiesta di caricamento file
var request = new UploadFileRequest("sample.docx", fileStream, "");

var response = apiInstance.UploadFile(request);

Di conseguenza, il file DOCX caricato sarà disponibile nella sezione file della dashboard sul cloud.

Classifica i documenti di Word usando C#

È possibile classificare i documenti di Word a livello di programmazione seguendo i passaggi indicati di seguito.

  • Crea un’istanza di ClassificationApi
  • Crea un’istanza di BaseRequest
  • Impostare il percorso del file DOCX e assegnarlo al documento BaseRequest
  • Crea ClassifyRequest con BaseRequest
  • Imposta BaseClassesCount
  • Ottieni ClassificationResponse chiamando il metodo ClassificationApi.Classify().

L’esempio di codice seguente mostra come classificare un documento di Word usando un’API REST.

// Inizializzazione dell'API
var apiInstance = new ClassificationApi(configuration);

// Crea richiesta di base
BaseRequest baseRequest = new BaseRequest();
baseRequest.Document = new GroupDocs.Classification.Cloud.Sdk.Model.FileInfo()
{
    Name = "sample.docx",
    Folder = ""
};

// Crea richiesta di classificazione
var request = new ClassifyRequest(baseRequest);
request.BestClassesCount = "3";

// Ottieni risultati di classificazione
ClassificationResponse response = apiInstance.Classify(request);
foreach(var r in response.BestResults)
{
    Console.WriteLine("ClassName: " + r.ClassName);
    Console.WriteLine("ClassProbability: " + r.ClassProbability);
    Console.WriteLine("--------------------------------");
}
Classifica i documenti di Word utilizzando un'API REST in C#

Classifica i documenti di Word utilizzando un’API REST in C#

Classifica i documenti di Word per la tassonomia usando C#

È possibile classificare i documenti di Word per una tassonomia a livello di programmazione seguendo i passaggi indicati di seguito.

  • Crea un’istanza di ClassificationApi
  • Crea un’istanza di BaseRequest
  • Impostare il percorso del file DOCX e assegnarlo al documento BaseRequest
  • Crea ClassifyRequest con BaseRequest
  • Imposta BaseClassesCount
  • Imposta tassonomia
  • Ottieni ClassificationResponse chiamando il metodo ClassificationApi.Classify().

L’esempio di codice seguente mostra come classificare un documento di Word per la tassonomia dei “documenti” usando un’API REST. Si prega di seguire i passaggi menzionati in precedenza per caricare il file.

// Inizializzazione dell'API
var apiInstance = new ClassificationApi(configuration);

// Crea richiesta di base
BaseRequest baseRequest = new BaseRequest();
baseRequest.Document = new GroupDocs.Classification.Cloud.Sdk.Model.FileInfo()
{
    Name = "sample.docx",
    Folder = ""
};

// Crea richiesta di classificazione
var request = new ClassifyRequest(baseRequest);
request.BestClassesCount = "3";
request.Taxonomy = "documents";

// Ottieni risultati di classificazione
ClassificationResponse response = apiInstance.Classify(request);
foreach(var r in response.BestResults)
{
    Console.WriteLine("ClassName: " + r.ClassName);
    Console.WriteLine("ClassProbability: " + r.ClassProbability);
    Console.WriteLine("--------------------------------");
}
ClassName: ADVE
ClassProbability: 77.17
--------------------------------
ClassName: Resume
ClassProbability: 22.83
--------------------------------
ClassName: Scientific
ClassProbability: 0.01
--------------------------------

È possibile utilizzare quanto segue come tassonomia per classificare i documenti:

  • predefinito
  • iab2
  • documenti
  • sentimento
  • sentimento3

Puoi leggere ulteriori informazioni sulla classificazione dei parametri della richiesta nella sezione “Classificare i parametri della richiesta”.

Classifica il testo non elaborato utilizzando un’API REST in C#

È possibile classificare qualsiasi testo non elaborato a livello di codice seguendo i passaggi indicati di seguito.

  • Crea un’istanza di ClassificationApi
  • Crea un’istanza BaseRequest
  • Fornisci testo non elaborato alla descrizione BaseRequest
  • Crea ClassifyRequest con BaseRequest
  • Imposta BaseClassesCount
  • Ottieni ClassificationResponse chiamando il metodo ClassificationApi.Classify().

L’esempio di codice seguente mostra come classificare il testo non elaborato usando un’API REST.

// Inizializzazione dell'API
var apiInstance = new ClassificationApi(configuration);

// Crea richiesta di base
BaseRequest baseRequest = new BaseRequest();
baseRequest.Description = "We support some of the most popular file formats in business, "
    + "including Microsoft Word documents, Excel spreadsheets, PowerPoint presentations, "
    + "Outlook emails and archives, Visio diagrams, Project files, and Adobe Acrobat PDF documents..";

// Crea richiesta di classificazione
var request = new ClassifyRequest(baseRequest);
request.BestClassesCount = "3";

// Ottieni risultati di classificazione
var response = apiInstance.Classify(request);
foreach (var r in response.BestResults)
{
    Console.WriteLine("ClassName: " + r.ClassName);
    Console.WriteLine("ClassProbability: " + r.ClassProbability);
    Console.WriteLine("--------------------------------");
}
ClassName: Hobbies_&_Interests
ClassProbability: 43.02
--------------------------------
ClassName: Business_and_Finance
ClassProbability: 26.64
--------------------------------
ClassName: Technology_&_Computing
ClassProbability: 18.25
--------------------------------

Prova in linea

Prova il seguente strumento di classificazione online gratuito, sviluppato utilizzando l’API di cui sopra. https://products.groupdocs.app/classificazione[/](https:/ /products.groupdocs.app/splitter/pdf)

Conclusione

In questo articolo, hai imparato a classificare i documenti di Word e il testo non elaborato nel cloud utilizzando C#. Hai anche imparato come caricare in modo programmatico il file DOCX sul cloud. Puoi saperne di più su GroupDocs.Classification Cloud API utilizzando la documentazione. Forniamo anche una sezione API Reference che consente di visualizzare e interagire con le nostre API direttamente tramite il browser. In caso di ambiguità, non esitate a contattarci sul forum.

Guarda anche