O que é Classificação de Texto?
A classificação de texto é o processo de atribuir tags ou categorias ao texto de acordo com seu conteúdo com aplicações amplas, como análise de sentimento, rotulagem de tópicos, detecção de spam e detecção de intenção.
Dados não estruturados na forma de texto bruto estão em todos os lugares: e-mails, bate-papos, páginas da web, mídia social, tíquetes de suporte, respostas a pesquisas e muito mais. O texto pode ser uma fonte extremamente rica de informações, mas extrair insights dele pode ser difícil e demorado devido à sua natureza não estruturada. As empresas estão recorrendo à classificação de texto para estruturar o texto de maneira rápida e econômica para aprimorar a tomada de decisões e automatizar processos.
O que é Taxonomia?
A taxonomia é a prática e a ciência da classificação. A palavra também é usada como um esquema taxonômico. Taxonomia é uma classificação particular. Num sentido mais amplo, mais geral, pode referir-se a uma classificação de coisas ou conceitos, bem como aos princípios subjacentes a tal classificação.
GroupDocs.Classification Cloud API
GroupDocs.Classification Cloud API recupera saída de classificação de texto bruto para taxonomia IAB-2 ou taxonomia de documentos. Ele retorna um objeto que contém informações sobre a melhor classe e sua probabilidade e sobre as probabilidades das outras classes.
Exemplo de Taxonomia IAB-2
GroupDocs.Classification Cloud API oferece suporte ao esquema de taxonomia IAB-2. Alguns dos exemplos de taxonomia estão listados abaixo:
- ‘Automotivo’,
- ‘Livros\e\Literatura’,
- ‘Negócios\e\Finanças’,
- ‘Carreiras’,
- ‘Educação’,
- ‘Eventos\e\Atrações’,
- ‘Família\e\Relacionamentos’,
- ‘Belo\Arte’,
- ‘Comida&\Bebida’,
- ‘Saudável\Vida’,
- ‘Hobbies&\Interesses’,
- ‘Casa&\Jardim’,
- ‘Saúde médica’,
- ‘Filmes’,
- ‘Música\e\Áudio’,
- ‘Notícias\e\Política’,
- ‘Finanças pessoais’
- etc.
Solicitação cURL
### Upload document to default storage
curl -X POST "https://api.groupdocs.cloud/v2.0/viewer/storage/file/viewerdocs%2Fthree-layouts.dwf?storageName=MyStorage"
-H "accept: application/json"
-H "authorization: Bearer [Access_Token]"
-H "Content-Type: multipart/form-data"
-T C:/Temp/three-layouts.dwf
Resposta
{
"bestClassName": "Healthy_Living",
"bestClassProbability": 53.77,
"bestResults": [
{
"className": "Healthy_Living",
"classProbability": 53.77
},
{
"className": "Medical_Health",
"classProbability": 38.27
},
{
"className": "Pets",
"classProbability": 1.98
}
],
"code": 200,
"status": "OK"
}
Exemplo de .NET
//TODO: Obtenha seu AppSID e AppKey em https://dashboard.groupdocs.cloud (registro gratuito é necessário).
using System;
using System.Diagnostics;
using GroupDocs.Classification.Cloud.Sdk.Api;
using GroupDocs.Classification.Cloud.Sdk.Model;
using GroupDocs.Classification.Cloud.Sdk.Model.Requests;
namespace GroupDocs.Classification.Cloud.Sdk.Examples
{
class Classification_CSharp_Classify_Document_from_Storage
{
public static void Run()
{
//TODO: Obtenha seu AppSID e AppKey em https://dashboard.groupdocs.cloud/ (registro gratuito é necessário).
var configuration = new Configuration
{
AppSid = "XXX-XXXXXXX-XXXX",
AppKey = "XXXXXXXXXXXXX"
};
var apiInstance = new ClassificationApi(configuration);
try
{
var request = new ClassifyRequest(new BaseRequest()
{
Document = new FileInfo()
{
Name = "one-page.docx",
Folder = ""
},
},
bestClassesCount: "3");
// Obter resultados de classificação
ClassificationResponse response = apiInstance.Classify(request);
Console.WriteLine(response.ToString());
}
catch (Exception e)
{
Console.WriteLine("Exception when calling ClassificationApi.Classify: " + e.Message);
}
}
}
}
Exemplo de Taxonomia de Documentos
A taxonomia de documentos inclui a seguinte lista em GroupDocs.Classification Cloud API:
- ADVE - anúncios, brochuras.
- Forma
- Carta
- Memorando - memorandos.
- Notícias - artigos, incluindo artigos de notícias.
- Fatura
- Relatório
- Retomar
- Científico - artigos científicos.
- Outros - as outras classes de documentos ou casos em que o classificador não tem certeza.
Solicitação cURL
curl -v "http://api.groupdocs.com/v/v1/classification/classify?bestClassesCount=3&taxonomy=documents"
-H "content-type: application/json"
-X POST -d '{ "Document": {"Folder": "words/docx","Name": "four-pages.docx" } }'
Resposta
{
"bestClassName": "Other",
"bestClassProbability": 36.8,
"bestResults": [
{
"className": "Other",
"classProbability": 36.8
},
{
"className": "ADVE",
"classProbability": 14.72
},
{
"className": "News",
"classProbability": 12.77
}
],
"code": 200,
"status": "OK"
}
Exemplo de .NET
//TODO: Obtenha seu AppSID e AppKey em https://dashboard.groupdocs.cloud (registro gratuito é necessário).
using System;
using System.Diagnostics;
using GroupDocs.Classification.Cloud.Sdk.Api;
using GroupDocs.Classification.Cloud.Sdk.Model;
using GroupDocs.Classification.Cloud.Sdk.Model.Requests;
namespace GroupDocs.Classification.Cloud.Sdk.Examples
{
class Classification_CSharp_Classify_Raw_Text
{
public static void Run()
{
//TODO: Obtenha seu AppSID e AppKey em https://dashboard.groupdocs.cloud/ (registro gratuito é necessário).
var configuration = new Configuration
{
AppSid = "XXX-XXXXXXX-XXXX",
AppKey = "XXXXXXXXXXXXX"
};
var apiInstance = new ClassificationApi(configuration);
try
{
var request = new ClassifyRequest(new BaseRequest() { Description = "Try Text classification using GroupDocs.Classification Cloud API" }, "3");
// Obter resultados de classificação
var response = apiInstance.Classify(request);
Console.WriteLine(response.ToString());
}
catch (Exception e)
{
Console.WriteLine("Exception when calling ClassificationApi.Classify: " + e.Message);
}
}
}
}
Comece uma avaliação gratuita hoje
Comece uma avaliação gratuita hoje – tudo que você precisa é inscrever-se com o serviço GroupDocs Cloud. Depois de se inscrever, você está pronto para experimentar os poderosos recursos de processamento de arquivos oferecidos pelo GroupDocs Cloud.