什么是文本分类?
文本分类是根据文本内容为其分配标签或类别的过程,具有广泛的应用,例如情感分析、主题标记、垃圾邮件检测和意图检测。

GroupDocs.分类云
原始文本形式的非结构化数据无处不在:电子邮件、聊天、网页、社交媒体、支持票、调查回复等等。文本可以是极其丰富的信息源,但由于其非结构化性质,从中提取见解可能非常困难且耗时。企业正在转向文本分类,以快速且经济高效的方式构建文本,以增强决策和自动化流程。
什么是分类法?
分类学是分类的实践和科学。该词也用作分类方案。分类法是一种特殊的分类。从更广泛、更一般的意义上来说,它可以指事物或概念的分类,以及这种分类背后的原则。
GroupDocs.分类云API
GroupDocs.Classification Cloud API 检索 IAB-2 分类法 或 文档分类法 的原始文本分类输出。它返回一个对象,其中包含有关最佳类别及其概率以及其他类别的概率的信息。
IAB-2 分类示例
GroupDocs.Classification Cloud API 支持 IAB-2 分类方案,下面列出了一些分类示例:
- “汽车”,
- ‘书籍\和\文学’,
- “商业\和\金融”,
- “职业生涯”,
- ‘教育’,
- ‘活动\和\景点’,
- ‘家庭\和\关系’,
- ‘美术\艺术’,
- ‘食物和饮料’,
- ‘健康生活’,
- ‘兴趣爱好’,
- ‘家&\花园’,
- ‘医疗\健康’,
- ‘电影’,
- ‘音乐\和\音频’,
- ‘新闻\和\政治’,
- ‘个人财务’
- ETC。
卷曲请求
### Upload document to default storage
curl -X POST "https://api.groupdocs.cloud/v2.0/viewer/storage/file/viewerdocs%2Fthree-layouts.dwf?storageName=MyStorage"
-H "accept: application/json"
-H "authorization: Bearer [Access_Token]"
-H "Content-Type: multipart/form-data"
-T C:/Temp/three-layouts.dwf
回复
{
"bestClassName": "Healthy_Living",
"bestClassProbability": 53.77,
"bestResults": [
{
"className": "Healthy_Living",
"classProbability": 53.77
},
{
"className": "Medical_Health",
"classProbability": 38.27
},
{
"className": "Pets",
"classProbability": 1.98
}
],
"code": 200,
"status": "OK"
}
.NET 示例
//TODO:在 https://dashboard.groupdocs.cloud 获取您的 AppSID 和 AppKey(需要免费注册)。
using System;
using System.Diagnostics;
using GroupDocs.Classification.Cloud.Sdk.Api;
using GroupDocs.Classification.Cloud.Sdk.Model;
using GroupDocs.Classification.Cloud.Sdk.Model.Requests;
namespace GroupDocs.Classification.Cloud.Sdk.Examples
{
class Classification_CSharp_Classify_Document_from_Storage
{
public static void Run()
{
//TODO:在 https://dashboard.groupdocs.cloud/ 获取您的 AppSID 和 AppKey(需要免费注册)。
var configuration = new Configuration
{
AppSid = "XXX-XXXXXXX-XXXX",
AppKey = "XXXXXXXXXXXXX"
};
var apiInstance = new ClassificationApi(configuration);
try
{
var request = new ClassifyRequest(new BaseRequest()
{
Document = new FileInfo()
{
Name = "one-page.docx",
Folder = ""
},
},
bestClassesCount: "3");
// 获取分类结果
ClassificationResponse response = apiInstance.Classify(request);
Console.WriteLine(response.ToString());
}
catch (Exception e)
{
Console.WriteLine("Exception when calling ClassificationApi.Classify: " + e.Message);
}
}
}
}
文档分类示例
文档分类包括 GroupDocs.Classification Cloud API 中的以下列表:
- ADVE - 广告、小册子。
- 电子邮件
- 形式
- 信
- 备忘录——备忘录。
- 新闻 - 文章,包括新闻文章。
- 发票
- 报告
- 恢复
- 科学——科学论文。
- 其他 - 分类器不确定的其他类别的文档或案例。
卷曲请求
curl -v "http://api.groupdocs.com/v/v1/classification/classify?bestClassesCount=3&taxonomy=documents"
-H "content-type: application/json"
-X POST -d '{ "Document": {"Folder": "words/docx","Name": "four-pages.docx" } }'
回复
{
"bestClassName": "Other",
"bestClassProbability": 36.8,
"bestResults": [
{
"className": "Other",
"classProbability": 36.8
},
{
"className": "ADVE",
"classProbability": 14.72
},
{
"className": "News",
"classProbability": 12.77
}
],
"code": 200,
"status": "OK"
}
.NET 示例
//TODO:在 https://dashboard.groupdocs.cloud 获取您的 AppSID 和 AppKey(需要免费注册)。
using System;
using System.Diagnostics;
using GroupDocs.Classification.Cloud.Sdk.Api;
using GroupDocs.Classification.Cloud.Sdk.Model;
using GroupDocs.Classification.Cloud.Sdk.Model.Requests;
namespace GroupDocs.Classification.Cloud.Sdk.Examples
{
class Classification_CSharp_Classify_Raw_Text
{
public static void Run()
{
//TODO:在 https://dashboard.groupdocs.cloud/ 获取您的 AppSID 和 AppKey(需要免费注册)。
var configuration = new Configuration
{
AppSid = "XXX-XXXXXXX-XXXX",
AppKey = "XXXXXXXXXXXXX"
};
var apiInstance = new ClassificationApi(configuration);
try
{
var request = new ClassifyRequest(new BaseRequest() { Description = "Try Text classification using GroupDocs.Classification Cloud API" }, "3");
// 获取分类结果
var response = apiInstance.Classify(request);
Console.WriteLine(response.ToString());
}
catch (Exception e)
{
Console.WriteLine("Exception when calling ClassificationApi.Classify: " + e.Message);
}
}
}
}
立即开始免费试用
立即开始免费试用 – 您只需注册 GroupDocs 云服务。注册后,您就可以尝试 GroupDocs Cloud 提供的强大文件处理功能。