Classer les documents et le texte brut à l'aide de C#

La classification de texte ou la catégorisation de texte est le processus d’attribution de balises ou de catégorisation de texte en groupes organisés. En tant que développeur C#, vous pouvez facilement classer du texte brut ou des documents par programmation sur le cloud. Dans cet article, vous apprendrez à classer des documents et du texte brut à l’aide d’une API REST en C#.

Les sujets suivants sont abordés/couverts dans cet article :

API REST de classification de documents et SDK .NET

Pour classer du texte ou des documents, j’utiliserai l’API .NET SDK of GroupDocs.Classification Cloud. Il vous permet de classer votre texte brut ainsi que des documents dans des catégories prédéfinies. Le SDK prend en charge plusieurs types de taxonomie, tels que la taxonomie IAB-2, Documents & Sentiment. Les informations de classification indiquent la meilleure classe avec son score de probabilité.

Vous pouvez installer GroupDocs.Classification dans votre projet Visual Studio à partir du gestionnaire de packages NuGet ou à l’aide de la commande suivante dans la console du gestionnaire de packages :

Install-Package GroupDocs.Classification-Cloud

Veuillez obtenir votre ID client et votre secret client à partir du tableau de bord avant de commencer à suivre les étapes et les exemples de code disponibles. Une fois que vous avez votre ID client et votre secret, ajoutez le code comme indiqué ci-dessous :

var configuration = new Configuration();
configuration.ClientId = "659fe7da-715b-4744-a0f7-cf469a392b73";
configuration.ClientSecret = "b377c36cfa28fa69960ebac6b6e36421";

Classifier des documents Word à l’aide d’une API REST en C#

Vous pouvez classer vos documents Word en suivant les étapes simples ci-dessous :

Télécharger le document

Tout d’abord, téléchargez le fichier DOCX sur le Cloud à l’aide de l’exemple de code ci-dessous :

// Initialisation de l'API
var apiInstance = new FileApi(configuration);

// Ouvrez le fichier dans IOStream à partir de local/disque.
var fileStream = File.Open("C:\\Files\\sample.docx", FileMode.Open);

// Créer une demande de téléchargement de fichier
var request = new UploadFileRequest("sample.docx", fileStream, "");

var response = apiInstance.UploadFile(request);

Par conséquent, le fichier DOCX téléchargé sera disponible dans la section fichiers de votre tableau de bord sur le cloud.

Classer des documents Word à l’aide de C#

Vous pouvez classer les documents Word par programmation en suivant les étapes ci-dessous.

  • Créer une instance de ClassificationApi
  • Créer une instance de BaseRequest
  • Définissez le chemin du fichier DOCX et attribuez-le au document BaseRequest
  • Créer ClassifyRequest avec BaseRequest
  • Définir le nombre de classes de base
  • Obtenez ClassificationResponse en appelant la méthode ClassificationApi.Classify()

L’exemple de code suivant montre comment classer un document Word à l’aide d’une API REST.

// Initialisation de l'API
var apiInstance = new ClassificationApi(configuration);

// Créer une requête de base
BaseRequest baseRequest = new BaseRequest();
baseRequest.Document = new GroupDocs.Classification.Cloud.Sdk.Model.FileInfo()
{
    Name = "sample.docx",
    Folder = ""
};

// Créer une demande de classement
var request = new ClassifyRequest(baseRequest);
request.BestClassesCount = "3";

// Obtenir les résultats de la classification
ClassificationResponse response = apiInstance.Classify(request);
foreach(var r in response.BestResults)
{
    Console.WriteLine("ClassName: " + r.ClassName);
    Console.WriteLine("ClassProbability: " + r.ClassProbability);
    Console.WriteLine("--------------------------------");
}
Classifier des documents Word à l'aide d'une API REST en C#

Classifier des documents Word à l’aide d’une API REST en C#

Classer les documents Word pour la taxonomie à l’aide de C#

Vous pouvez classer des documents Word pour une taxonomie par programmation en suivant les étapes ci-dessous.

  • Créer une instance de ClassificationApi
  • Créer une instance de BaseRequest
  • Définissez le chemin du fichier DOCX et attribuez-le au document BaseRequest
  • Créer ClassifyRequest avec BaseRequest
  • Définir le nombre de classes de base
  • Définir la taxonomie
  • Obtenez ClassificationResponse en appelant la méthode ClassificationApi.Classify()

L’exemple de code suivant montre comment classer un document Word pour la taxonomie “documents” à l’aide d’une API REST. Veuillez suivre les étapes mentionnées précédemment pour télécharger le fichier.

// Initialisation de l'API
var apiInstance = new ClassificationApi(configuration);

// Créer une requête de base
BaseRequest baseRequest = new BaseRequest();
baseRequest.Document = new GroupDocs.Classification.Cloud.Sdk.Model.FileInfo()
{
    Name = "sample.docx",
    Folder = ""
};

// Créer une demande de classement
var request = new ClassifyRequest(baseRequest);
request.BestClassesCount = "3";
request.Taxonomy = "documents";

// Obtenir les résultats de la classification
ClassificationResponse response = apiInstance.Classify(request);
foreach(var r in response.BestResults)
{
    Console.WriteLine("ClassName: " + r.ClassName);
    Console.WriteLine("ClassProbability: " + r.ClassProbability);
    Console.WriteLine("--------------------------------");
}
ClassName: ADVE
ClassProbability: 77.17
--------------------------------
ClassName: Resume
ClassProbability: 22.83
--------------------------------
ClassName: Scientific
ClassProbability: 0.01
--------------------------------

Vous pouvez utiliser les éléments suivants comme taxonomie pour classer les documents :

  • défaut
  • iab2
  • documents
  • sentiment
  • sentiment3

Vous pouvez en savoir plus sur la classification des paramètres de requête dans la section “Classifier les paramètres de requête”.

Classer le texte brut à l’aide d’une API REST en C#

Vous pouvez classer n’importe quel texte brut par programmation en suivant les étapes ci-dessous.

  • Créer une instance de ClassificationApi
  • Créer une instance BaseRequest
  • Fournir du texte brut à la description de BaseRequest
  • Créer ClassifyRequest avec BaseRequest
  • Définir le nombre de classes de base
  • Obtenez ClassificationResponse en appelant la méthode ClassificationApi.Classify()

L’exemple de code suivant montre comment classer du texte brut à l’aide d’une API REST.

// Initialisation de l'API
var apiInstance = new ClassificationApi(configuration);

// Créer une requête de base
BaseRequest baseRequest = new BaseRequest();
baseRequest.Description = "We support some of the most popular file formats in business, "
    + "including Microsoft Word documents, Excel spreadsheets, PowerPoint presentations, "
    + "Outlook emails and archives, Visio diagrams, Project files, and Adobe Acrobat PDF documents..";

// Créer une demande de classement
var request = new ClassifyRequest(baseRequest);
request.BestClassesCount = "3";

// Obtenir les résultats de la classification
var response = apiInstance.Classify(request);
foreach (var r in response.BestResults)
{
    Console.WriteLine("ClassName: " + r.ClassName);
    Console.WriteLine("ClassProbability: " + r.ClassProbability);
    Console.WriteLine("--------------------------------");
}
ClassName: Hobbies_&_Interests
ClassProbability: 43.02
--------------------------------
ClassName: Business_and_Finance
ClassProbability: 26.64
--------------------------------
ClassName: Technology_&_Computing
ClassProbability: 18.25
--------------------------------

Essayez en ligne

Veuillez essayer l’outil de classification en ligne gratuit suivant, qui est développé à l’aide de l’API ci-dessus. https://products.groupdocs.app/classification[/](https:/ /products.groupdocs.app/splitter/pdf)

Conclusion

Dans cet article, vous avez appris à classer des documents Word et du texte brut sur le cloud à l’aide de C#. Vous avez également appris à télécharger par programmation le fichier DOCX sur le cloud. Vous pouvez en savoir plus sur l’API GroupDocs.Classification Cloud à l’aide de la documentation. Nous fournissons également une section API Reference qui vous permet de visualiser et d’interagir avec nos API directement via le navigateur. En cas d’ambiguïté, n’hésitez pas à nous contacter sur le forum.

Voir également