什么是文本分类?

文本分类是根据文本内容为其分配标签或类别的过程,具有广泛的应用,例如情感分析、主题标记、垃圾邮件检测和意图检测。

GroupDocs.分类云API

GroupDocs.分类云

原始文本形式的非结构化数据无处不在:电子邮件、聊天、网页、社交媒体、支持票、调查回复等等。文本可以是极其丰富的信息源,但由于其非结构化性质,从中提取见解可能非常困难且耗时。企业正在转向文本分类,以快速且经济高效的方式构建文本,以增强决策和自动化流程。

什么是分类法?

分类学是分类的实践和科学。该词也用作分类方案。分类法是一种特殊的分类。从更广泛、更一般的意义上来说,它可以指事物或概念的分类,以及这种分类背后的原则。

GroupDocs.分类云API

GroupDocs.Classification Cloud API 检索 IAB-2 分类法文档分类法 的原始文本分类输出。它返回一个对象,其中包含有关最佳类别及其概率以及其他类别的概率的信息。

IAB-2 分类示例

GroupDocs.Classification Cloud API 支持 IAB-2 分类方案,下面列出了一些分类示例:

  • “汽车”,
  • ‘书籍\和\文学’,
  • “商业\和\金融”,
  • “职业生涯”,
  • ‘教育’,
  • ‘活动\和\景点’,
  • ‘家庭\和\关系’,
  • ‘美术\艺术’,
  • ‘食物和饮料’,
  • ‘健康生活’,
  • ‘兴趣爱好’,
  • ‘家&\花园’,
  • ‘医疗\健康’,
  • ‘电影’,
  • ‘音乐\和\音频’,
  • ‘新闻\和\政治’,
  • ‘个人财务’
  • ETC。

卷曲请求

### Upload document to default storage
curl -X POST "https://api.groupdocs.cloud/v2.0/viewer/storage/file/viewerdocs%2Fthree-layouts.dwf?storageName=MyStorage" 
-H "accept: application/json" 
-H "authorization: Bearer [Access_Token]" 
-H "Content-Type: multipart/form-data" 
-T C:/Temp/three-layouts.dwf

回复

{
  "bestClassName": "Healthy_Living",
  "bestClassProbability": 53.77,
  "bestResults": [
    {
      "className": "Healthy_Living",
      "classProbability": 53.77
    },
    {
      "className": "Medical_Health",
      "classProbability": 38.27
    },
    {
      "className": "Pets",
      "classProbability": 1.98
    }
  ],
  "code": 200,
  "status": "OK"
}

.NET 示例

//TODO:在 https://dashboard.groupdocs.cloud 获取您的 AppSID 和 AppKey(需要免费注册)。

using System;
using System.Diagnostics;
using GroupDocs.Classification.Cloud.Sdk.Api;
using GroupDocs.Classification.Cloud.Sdk.Model;
using GroupDocs.Classification.Cloud.Sdk.Model.Requests;

namespace GroupDocs.Classification.Cloud.Sdk.Examples
{
    class Classification_CSharp_Classify_Document_from_Storage
    {
        public static void Run()
        {
            //TODO:在 https://dashboard.groupdocs.cloud/ 获取您的 AppSID 和 AppKey(需要免费注册)。
            var configuration = new Configuration
            {
                AppSid = "XXX-XXXXXXX-XXXX",
                AppKey = "XXXXXXXXXXXXX"
            };

            var apiInstance = new ClassificationApi(configuration);

            try
            {
                var request = new ClassifyRequest(new BaseRequest()
                {
                    Document = new FileInfo()
                    {
                        Name = "one-page.docx",
                        Folder = ""
                    },
                },
                bestClassesCount: "3");

                // 获取分类结果
                ClassificationResponse response = apiInstance.Classify(request);
                Console.WriteLine(response.ToString());
            }
            catch (Exception e)
            {
                Console.WriteLine("Exception when calling ClassificationApi.Classify: " + e.Message);
            }
        }
    }
}

文档分类示例

文档分类包括 GroupDocs.Classification Cloud API 中的以下列表:

  • ADVE - 广告、小册子。
  • 电子邮件
  • 形式
  • 备忘录——备忘录。
  • 新闻 - 文章,包括新闻文章。
  • 发票
  • 报告
  • 恢复
  • 科学——科学论文。
  • 其他 - 分类器不确定的其他类别的文档或案例。

卷曲请求

curl -v "http://api.groupdocs.com/v/v1/classification/classify?bestClassesCount=3&taxonomy=documents"
-H "content-type: application/json"
-X POST -d '{ "Document": {"Folder": "words/docx","Name": "four-pages.docx" } }'

回复

{
  "bestClassName": "Other",
  "bestClassProbability": 36.8,
  "bestResults": [
    {
      "className": "Other",
      "classProbability": 36.8
    },
    {
      "className": "ADVE",
      "classProbability": 14.72
    },
    {
      "className": "News",
      "classProbability": 12.77
    }
  ],
  "code": 200,
  "status": "OK"
}

.NET 示例

//TODO:在 https://dashboard.groupdocs.cloud 获取您的 AppSID 和 AppKey(需要免费注册)。

using System;
using System.Diagnostics;
using GroupDocs.Classification.Cloud.Sdk.Api;
using GroupDocs.Classification.Cloud.Sdk.Model;
using GroupDocs.Classification.Cloud.Sdk.Model.Requests;

namespace GroupDocs.Classification.Cloud.Sdk.Examples
{
    class Classification_CSharp_Classify_Raw_Text
    {
        public static void Run()
        {
            //TODO:在 https://dashboard.groupdocs.cloud/ 获取您的 AppSID 和 AppKey(需要免费注册)。
            var configuration = new Configuration
            {
                AppSid = "XXX-XXXXXXX-XXXX",
                AppKey = "XXXXXXXXXXXXX"
            };

            var apiInstance = new ClassificationApi(configuration);

            try
            {
                var request = new ClassifyRequest(new BaseRequest() { Description = "Try Text classification using GroupDocs.Classification Cloud API" }, "3");

                // 获取分类结果
                var response = apiInstance.Classify(request);
                Console.WriteLine(response.ToString());
            }
            catch (Exception e)
            {
                Console.WriteLine("Exception when calling ClassificationApi.Classify: " + e.Message);
            }
        }
    }
}

立即开始免费试用

立即开始免费试用 – 您只需注册 GroupDocs 云服务。注册后,您就可以尝试 GroupDocs Cloud 提供的强大文件处理功能。