Che cos’è la classificazione del testo?
La classificazione del testo è il processo di assegnazione di tag o categorie al testo in base al suo contenuto con ampie applicazioni come l’analisi del sentiment, l’etichettatura degli argomenti, il rilevamento dello spam e il rilevamento degli intenti.
I dati non strutturati sotto forma di testo non elaborato sono ovunque: e-mail, chat, pagine Web, social media, ticket di supporto, risposte ai sondaggi e altro ancora. Il testo può essere una fonte di informazioni estremamente ricca, ma estrarne informazioni può essere difficile e richiedere molto tempo a causa della sua natura non strutturata. Le aziende si rivolgono alla classificazione del testo per strutturare il testo in modo rapido ed economico per migliorare il processo decisionale e automatizzare i processi.
Cos’è la tassonomia?
La tassonomia è la pratica e la scienza della classificazione. La parola è anche usata come schema tassonomico. La tassonomia è una classificazione particolare. In un senso più ampio e generale, può riferirsi a una classificazione di cose o concetti, nonché ai principi che stanno alla base di tale classificazione.
API GroupDocs.Classification Cloud
L’API GroupDocs.Classification Cloud recupera l’output della classificazione del testo non elaborato per la tassonomia IAB-2 o la tassonomia dei documenti. Restituisce un oggetto che contiene informazioni sulla classe migliore e la sua probabilità e sulle probabilità delle altre classi.
Esempio di tassonomia IAB-2
GroupDocs.Classification Cloud API supporta lo schema di tassonomia IAB-2. Di seguito sono elencati alcuni esempi di tassonomia:
- ‘Settore automobilistico’,
- ‘Libri\e\Letteratura’,
- ‘Affari\e\Finanza’,
- ‘Carriere’,
- ‘Formazione scolastica’,
- ‘Eventi\e\Attrazioni’,
- ‘Famiglia\e\Relazioni’,
- ‘Belle Arti’,
- ‘Cibo bevanda’,
- ‘Vita sana’,
- ‘Hobbies’,
- ‘Casa & Giardino’,
- ‘Medico\Salute’,
- ‘Film’,
- ‘Musica\e\Audio’,
- ‘Notizie\e\Politica’,
- ‘Finanza personale’
- eccetera.
Richiesta arricciatura
### Upload document to default storage
curl -X POST "https://api.groupdocs.cloud/v2.0/viewer/storage/file/viewerdocs%2Fthree-layouts.dwf?storageName=MyStorage"
-H "accept: application/json"
-H "authorization: Bearer [Access_Token]"
-H "Content-Type: multipart/form-data"
-T C:/Temp/three-layouts.dwf
Risposta
{
"bestClassName": "Healthy_Living",
"bestClassProbability": 53.77,
"bestResults": [
{
"className": "Healthy_Living",
"classProbability": 53.77
},
{
"className": "Medical_Health",
"classProbability": 38.27
},
{
"className": "Pets",
"classProbability": 1.98
}
],
"code": 200,
"status": "OK"
}
Esempio .NET
//TODO: Ottieni il tuo AppSID e AppKey su https://dashboard.groupdocs.cloud (è richiesta la registrazione gratuita).
using System;
using System.Diagnostics;
using GroupDocs.Classification.Cloud.Sdk.Api;
using GroupDocs.Classification.Cloud.Sdk.Model;
using GroupDocs.Classification.Cloud.Sdk.Model.Requests;
namespace GroupDocs.Classification.Cloud.Sdk.Examples
{
class Classification_CSharp_Classify_Document_from_Storage
{
public static void Run()
{
//TODO: Ottieni il tuo AppSID e AppKey su https://dashboard.groupdocs.cloud/ (è richiesta la registrazione gratuita).
var configuration = new Configuration
{
AppSid = "XXX-XXXXXXX-XXXX",
AppKey = "XXXXXXXXXXXXX"
};
var apiInstance = new ClassificationApi(configuration);
try
{
var request = new ClassifyRequest(new BaseRequest()
{
Document = new FileInfo()
{
Name = "one-page.docx",
Folder = ""
},
},
bestClassesCount: "3");
// Ottieni risultati di classificazione
ClassificationResponse response = apiInstance.Classify(request);
Console.WriteLine(response.ToString());
}
catch (Exception e)
{
Console.WriteLine("Exception when calling ClassificationApi.Classify: " + e.Message);
}
}
}
}
Esempio di tassonomia dei documenti
La tassonomia dei documenti include il seguente elenco in GroupDocs.Classification Cloud API:
- ADVE - pubblicità, opuscoli.
- Modulo
- Lettera
- Promemoria - promemoria.
- Notizie - articoli, inclusi articoli di notizie.
- Fattura
- Rapporto
- Riprendere
- Scientifico - articoli scientifici.
- Altro - le altre classi di documenti o casi in cui il classificatore non è sicuro.
Richiesta arricciatura
curl -v "http://api.groupdocs.com/v/v1/classification/classify?bestClassesCount=3&taxonomy=documents"
-H "content-type: application/json"
-X POST -d '{ "Document": {"Folder": "words/docx","Name": "four-pages.docx" } }'
Risposta
{
"bestClassName": "Other",
"bestClassProbability": 36.8,
"bestResults": [
{
"className": "Other",
"classProbability": 36.8
},
{
"className": "ADVE",
"classProbability": 14.72
},
{
"className": "News",
"classProbability": 12.77
}
],
"code": 200,
"status": "OK"
}
Esempio .NET
//TODO: Ottieni il tuo AppSID e AppKey su https://dashboard.groupdocs.cloud (è richiesta la registrazione gratuita).
using System;
using System.Diagnostics;
using GroupDocs.Classification.Cloud.Sdk.Api;
using GroupDocs.Classification.Cloud.Sdk.Model;
using GroupDocs.Classification.Cloud.Sdk.Model.Requests;
namespace GroupDocs.Classification.Cloud.Sdk.Examples
{
class Classification_CSharp_Classify_Raw_Text
{
public static void Run()
{
//TODO: Ottieni il tuo AppSID e AppKey su https://dashboard.groupdocs.cloud/ (è richiesta la registrazione gratuita).
var configuration = new Configuration
{
AppSid = "XXX-XXXXXXX-XXXX",
AppKey = "XXXXXXXXXXXXX"
};
var apiInstance = new ClassificationApi(configuration);
try
{
var request = new ClassifyRequest(new BaseRequest() { Description = "Try Text classification using GroupDocs.Classification Cloud API" }, "3");
// Ottieni risultati di classificazione
var response = apiInstance.Classify(request);
Console.WriteLine(response.ToString());
}
catch (Exception e)
{
Console.WriteLine("Exception when calling ClassificationApi.Classify: " + e.Message);
}
}
}
}
Inizia una prova gratuita oggi
Inizia una prova gratuita oggi: tutto ciò di cui hai bisogno è iscriverti al servizio GroupDocs Cloud. Dopo esserti registrato, sei pronto per provare le potenti funzionalità di elaborazione dei file offerte da GroupDocs Cloud.