Классификация текста также известна как категоризация текста. Классификаторы текста можно использовать для установления, структурирования и категоризации почти всего в тексте. Например, новые статьи могут быть предварительно организованы по темам, запросы в службу поддержки могут быть организованы по срочности, обсуждения могут быть организованы по языку, а упоминания брендов могут быть организованы по эмоциям и т. д. API-интерфейс GroupDocs.Classification Cloud позволяет вам классифицировать ваши необработанный текст, а также документы в предопределенные категории. Облако классификаций поддерживает несколько типов таксономии, например таксономию IAB-2 ‎ и таксономию Document. Информация о классификации может быть просмотрена в отношении классов, а также их соответствующих вероятностей.

Заметные особенности

  • Выполните классификацию необработанного текста в соответствии с таксономией IAB-2.
  • Классифицировать документы на основе таксономии документов
  • Просмотр классов с соответствующими вероятностями в качестве информации о классификации
  • Простая интеграция с REST API
  • Безопасные API, требующие аутентификации

Поддерживаемые форматыGroupDocs.Classification Cloud REST API поддерживает классификацию:

  • Необработанный текст
  • Документы
    • Формат переносимого документа: PDF
    • Microsoft Word: DOC, DOCX, DOCM, DOT, DOTX, DOTM
    • Форматы OpenDocument: ODT, OTT
    • Расширенный текстовый формат: RTF
    • Простой текстовый файл: TXT

Классификация необработанного текста

Этот API извлекает результат классификации необработанного текста для таксономии IAB-2 или таксономии Documents. Он возвращает объект, содержащий информацию о лучшем классе и его вероятности, а также о вероятностях других классов.

Запрос

 curl -v "http://api.groupdocs.com/v1/classification/classify&bestClassesCount=3" 
-H "content-type: application/json"
-X POST -d '{ "Description" : "Medicine is an important part of our life" }'

Ответ

 {
  "bestClassName": "Healthy_Living",
  "bestClassProbability": 53.77,
  "bestResults": [
    {
      "className": "Healthy_Living",
      "classProbability": 53.77
    },
    {
      "className": "Medical_Health",
      "classProbability": 38.27
    },
    {
      "className": "Pets",
      "classProbability": 1.98
    }
  ],
  "code": 200,
  "status": "OK"
} 

Классификация документов

API GroupDocs.Classification извлекает результат классификации документов для таксономии IAB-2 или таксономии Documents. Он возвращает объект, содержащий информацию о лучшем классе и его вероятности, а также о вероятности других классов. Нажмите здесь для получения дополнительной информации о поддерживаемых форматах документов в GroupDocs.Classification Cloud.

Запрос

 curl -v "http://api.groupdocs.com/v1/classification/classify"
-H "content-type: application/json"
-X POST -d '{ "Document": {"Folder": "words/docx","Name": "four-pages.docx" } }'

Ответ

 {
  "bestClassName": "Books_and_Literature",
  "bestClassProbability": 48.92,
  "bestResults": [],
  "code": 200,
  "status": "OK"
}