¿Qué es la clasificación de texto?
La clasificación de texto es el proceso de asignación de etiquetas o categorías al texto de acuerdo con su contenido con amplias aplicaciones como el análisis de opiniones, el etiquetado de temas, la detección de spam y la detección de intenciones.
Los datos no estructurados en forma de texto sin procesar están en todas partes: correos electrónicos, chats, páginas web, redes sociales, tickets de soporte, respuestas a encuestas y más. El texto puede ser una fuente de información extremadamente rica, pero extraer información de él puede ser difícil y llevar mucho tiempo debido a su naturaleza no estructurada. Las empresas están recurriendo a la clasificación de texto para estructurar el texto de una manera rápida y rentable para mejorar la toma de decisiones y automatizar los procesos.
¿Qué es la taxonomía?
Taxonomia es la practica y ciencia de clasificacion. La palabra también se utiliza como un esquema taxonómico. La taxonomía es una clasificación particular. En un sentido más amplio y general, puede referirse a una clasificación de cosas o conceptos, así como a los principios que subyacen a dicha clasificación.
GroupDocs.Classification Cloud API
GroupDocs.Classification Cloud API recupera la salida de clasificación de texto sin formato para taxonomía IAB-2 o taxonomía de documentos. Devuelve un objeto que contiene información sobre la mejor clase y su probabilidad y sobre las probabilidades de las otras clases.
Ejemplo de taxonomía IAB-2
GroupDocs.Classification Cloud API es compatible con el esquema de taxonomía IAB-2. Algunos de los ejemplos de taxonomía se enumeran a continuación:
- ‘Automotor’,
- ‘Libros\y\Literatura’,
- ‘Negocios y Finanzas’,
- ‘Carreras’,
- ‘Educación’,
- ‘Eventos\y\Atracciones’,
- ‘Familia\y\Relaciones’,
- ‘Arte fino’,
- ‘Comida&\Bebida’,
- ‘Vida saludable’,
- ‘Pasatiempos&\Intereses’,
- ‘Hogar & Jardín’,
- ‘Salud médica’,
- ‘Películas’,
- ‘Música\y\Audio’,
- ‘Noticias\y\Política’,
- ‘Finanzas personales’
- etc.
Solicitud cURL
### Upload document to default storage
curl -X POST "https://api.groupdocs.cloud/v2.0/viewer/storage/file/viewerdocs%2Fthree-layouts.dwf?storageName=MyStorage"
-H "accept: application/json"
-H "authorization: Bearer [Access_Token]"
-H "Content-Type: multipart/form-data"
-T C:/Temp/three-layouts.dwf
Respuesta
{
"bestClassName": "Healthy_Living",
"bestClassProbability": 53.77,
"bestResults": [
{
"className": "Healthy_Living",
"classProbability": 53.77
},
{
"className": "Medical_Health",
"classProbability": 38.27
},
{
"className": "Pets",
"classProbability": 1.98
}
],
"code": 200,
"status": "OK"
}
Ejemplo .NET
//TODO: obtenga su AppSID y AppKey en https://dashboard.groupdocs.cloud (se requiere registro gratuito).
using System;
using System.Diagnostics;
using GroupDocs.Classification.Cloud.Sdk.Api;
using GroupDocs.Classification.Cloud.Sdk.Model;
using GroupDocs.Classification.Cloud.Sdk.Model.Requests;
namespace GroupDocs.Classification.Cloud.Sdk.Examples
{
class Classification_CSharp_Classify_Document_from_Storage
{
public static void Run()
{
//TODO: obtenga su AppSID y AppKey en https://dashboard.groupdocs.cloud/ (se requiere registro gratuito).
var configuration = new Configuration
{
AppSid = "XXX-XXXXXXX-XXXX",
AppKey = "XXXXXXXXXXXXX"
};
var apiInstance = new ClassificationApi(configuration);
try
{
var request = new ClassifyRequest(new BaseRequest()
{
Document = new FileInfo()
{
Name = "one-page.docx",
Folder = ""
},
},
bestClassesCount: "3");
// Obtener resultados de clasificación
ClassificationResponse response = apiInstance.Classify(request);
Console.WriteLine(response.ToString());
}
catch (Exception e)
{
Console.WriteLine("Exception when calling ClassificationApi.Classify: " + e.Message);
}
}
}
}
Ejemplo de taxonomía de documentos
La taxonomía de documentos incluye la siguiente lista en GroupDocs.Classification Cloud API:
- ADVE - anuncios, folletos.
- Correo electrónico
- Forma
- Carta
- Memo - memorandos.
- Noticias: artículos, incluidos los artículos de noticias.
- Factura
- Informe
- Reanudar
- Científico - artículos científicos.
- Otro: las otras clases de documentos o casos en los que el clasificador no está seguro.
Solicitud cURL
curl -v "http://api.groupdocs.com/v/v1/classification/classify?bestClassesCount=3&taxonomy=documents"
-H "content-type: application/json"
-X POST -d '{ "Document": {"Folder": "words/docx","Name": "four-pages.docx" } }'
Respuesta
{
"bestClassName": "Other",
"bestClassProbability": 36.8,
"bestResults": [
{
"className": "Other",
"classProbability": 36.8
},
{
"className": "ADVE",
"classProbability": 14.72
},
{
"className": "News",
"classProbability": 12.77
}
],
"code": 200,
"status": "OK"
}
Ejemplo .NET
//TODO: obtenga su AppSID y AppKey en https://dashboard.groupdocs.cloud (se requiere registro gratuito).
using System;
using System.Diagnostics;
using GroupDocs.Classification.Cloud.Sdk.Api;
using GroupDocs.Classification.Cloud.Sdk.Model;
using GroupDocs.Classification.Cloud.Sdk.Model.Requests;
namespace GroupDocs.Classification.Cloud.Sdk.Examples
{
class Classification_CSharp_Classify_Raw_Text
{
public static void Run()
{
//TODO: obtenga su AppSID y AppKey en https://dashboard.groupdocs.cloud/ (se requiere registro gratuito).
var configuration = new Configuration
{
AppSid = "XXX-XXXXXXX-XXXX",
AppKey = "XXXXXXXXXXXXX"
};
var apiInstance = new ClassificationApi(configuration);
try
{
var request = new ClassifyRequest(new BaseRequest() { Description = "Try Text classification using GroupDocs.Classification Cloud API" }, "3");
// Obtener resultados de clasificación
var response = apiInstance.Classify(request);
Console.WriteLine(response.ToString());
}
catch (Exception e)
{
Console.WriteLine("Exception when calling ClassificationApi.Classify: " + e.Message);
}
}
}
}
Comience una prueba gratuita hoy
Comience una prueba gratuita hoy; todo lo que necesita es registrarse en el servicio en la nube de GroupDocs. Una vez que se haya registrado, estará listo para probar las potentes funciones de procesamiento de archivos que ofrece GroupDocs Cloud.