文本分类也称为文本分类。文本分类器可用于对文本中的几乎所有内容进行建立、结构化和分类。例如,新文章可以按主题预先安排,支持票可以按紧急程度组织,讨论可以按语言组织,品牌提及可以按情感组织等。 GroupDocs.Classification Cloud API 使您能够对您的内容进行分类原始文本以及文档进入预定义的类别。分类云支持多种分类法类型,例如 IAB-2 分类法和 文档 分类法。可以查看有关类别及其各自概率的分类信息。

显着特点

  • 根据 IAB-2 分类法执行原始文本分类
  • 根据文档分类法对文档进行分类
  • 查看类别及其各自的概率作为分类信息
  • 与 REST API 轻松集成
  • 需要身份验证的安全 API

支持的格式GroupDocs.Classification Cloud REST API 支持以下分类:

  • 原始文本
  • 文件
    • 便携式文档格式:PDF
    • Microsoft Word:DOC、DOCX、DOCM、DOT、DOTX、DOTM
    • 开放文档格式:ODT、OTT
    • 富文本格式:RTF
    • 纯文本文件:TXT

原始文本分类

此 API 检索 IAB-2 分类法或 文档 分类法的原始文本分类结果。它返回一个对象,其中包含有关最佳类别及其概率以及其他类别的概率的信息。

要求

 curl -v "http://api.groupdocs.com/v1/classification/classify&bestClassesCount=3" 
-H "content-type: application/json"
-X POST -d '{ "Description" : "Medicine is an important part of our life" }'

回复

 {
  "bestClassName": "Healthy_Living",
  "bestClassProbability": 53.77,
  "bestResults": [
    {
      "className": "Healthy_Living",
      "classProbability": 53.77
    },
    {
      "className": "Medical_Health",
      "classProbability": 38.27
    },
    {
      "className": "Pets",
      "classProbability": 1.98
    }
  ],
  "code": 200,
  "status": "OK"
} 

文件分类

GroupDocs.Classification API 检索 IAB-2 分类法或 文档 分类法的文档分类结果。它返回一个对象,其中包含有关最佳类别及其概率以及其他类别概率的信息。请单击此处,了解有关 GroupDocs.Classification Cloud 中支持的文档格式的更多详细信息。

要求

 curl -v "http://api.groupdocs.com/v1/classification/classify"
-H "content-type: application/json"
-X POST -d '{ "Document": {"Folder": "words/docx","Name": "four-pages.docx" } }'

回复

 {
  "bestClassName": "Books_and_Literature",
  "bestClassProbability": 48.92,
  "bestResults": [],
  "code": 200,
  "status": "OK"
}