什麼是文本分類?
文本分類是根據文本內容為其分配標籤或類別的過程,具有廣泛的應用,例如情感分析、主題標記、垃圾郵件檢測和意圖檢測。
原始文本形式的非結構化數據無處不在:電子郵件、聊天、網頁、社交媒體、支持票、調查回復等等。文本可以是極其豐富的信息源,但由於其非結構化性質,從中提取見解可能非常困難且耗時。企業正在轉向文本分類,以快速且經濟高效的方式構建文本,以增強決策和自動化流程。
什麼是分類法?
分類學是分類的實踐和科學。該詞也用作分類方案。分類法是一種特殊的分類。從更廣泛、更一般的意義上來說,它可以指事物或概念的分類,以及這種分類背後的原則。
GroupDocs.分類雲API
GroupDocs.Classification Cloud API 檢索 IAB-2 分類法 或 文檔分類法 的原始文本分類輸出。它返回一個對象,其中包含有關最佳類別及其概率以及其他類別的概率的信息。
IAB-2 分類示例
GroupDocs.Classification Cloud API 支持 IAB-2 分類方案,下面列出了一些分類示例:
- “汽車”,
- ‘書籍\和\文學’,
- “商業\和\金融”,
- “職業生涯”,
- ‘教育’,
- ‘活動\和\景點’,
- ‘家庭\和\關係’,
- ‘美術\藝術’,
- ‘食物和飲料’,
- ‘健康生活’,
- ‘興趣愛好’,
- ‘家&\花園’,
- ‘醫療\健康’,
- ‘電影’,
- ‘音樂\和\音頻’,
- ‘新聞\和\政治’,
- ‘個人財務’
- ETC。
捲曲請求
### Upload document to default storage
curl -X POST "https://api.groupdocs.cloud/v2.0/viewer/storage/file/viewerdocs%2Fthree-layouts.dwf?storageName=MyStorage"
-H "accept: application/json"
-H "authorization: Bearer [Access_Token]"
-H "Content-Type: multipart/form-data"
-T C:/Temp/three-layouts.dwf
回复
{
"bestClassName": "Healthy_Living",
"bestClassProbability": 53.77,
"bestResults": [
{
"className": "Healthy_Living",
"classProbability": 53.77
},
{
"className": "Medical_Health",
"classProbability": 38.27
},
{
"className": "Pets",
"classProbability": 1.98
}
],
"code": 200,
"status": "OK"
}
.NET 示例
//TODO:在 https://dashboard.groupdocs.cloud 獲取您的 AppSID 和 AppKey(需要免費註冊)。
using System;
using System.Diagnostics;
using GroupDocs.Classification.Cloud.Sdk.Api;
using GroupDocs.Classification.Cloud.Sdk.Model;
using GroupDocs.Classification.Cloud.Sdk.Model.Requests;
namespace GroupDocs.Classification.Cloud.Sdk.Examples
{
class Classification_CSharp_Classify_Document_from_Storage
{
public static void Run()
{
//TODO:在 https://dashboard.groupdocs.cloud/ 獲取您的 AppSID 和 AppKey(需要免費註冊)。
var configuration = new Configuration
{
AppSid = "XXX-XXXXXXX-XXXX",
AppKey = "XXXXXXXXXXXXX"
};
var apiInstance = new ClassificationApi(configuration);
try
{
var request = new ClassifyRequest(new BaseRequest()
{
Document = new FileInfo()
{
Name = "one-page.docx",
Folder = ""
},
},
bestClassesCount: "3");
// 獲取分類結果
ClassificationResponse response = apiInstance.Classify(request);
Console.WriteLine(response.ToString());
}
catch (Exception e)
{
Console.WriteLine("Exception when calling ClassificationApi.Classify: " + e.Message);
}
}
}
}
文檔分類示例
文檔分類包括 GroupDocs.Classification Cloud API 中的以下列表:
- ADVE - 廣告、小冊子。
- 電子郵件
- 形式
- 信
- 備忘錄——備忘錄。
- 新聞 - 文章,包括新聞文章。
- 發票
- 報告
- 恢復
- 科學——科學論文。
- 其他 - 分類器不確定的其他類別的文檔或案例。
捲曲請求
curl -v "http://api.groupdocs.com/v/v1/classification/classify?bestClassesCount=3&taxonomy=documents"
-H "content-type: application/json"
-X POST -d '{ "Document": {"Folder": "words/docx","Name": "four-pages.docx" } }'
回复
{
"bestClassName": "Other",
"bestClassProbability": 36.8,
"bestResults": [
{
"className": "Other",
"classProbability": 36.8
},
{
"className": "ADVE",
"classProbability": 14.72
},
{
"className": "News",
"classProbability": 12.77
}
],
"code": 200,
"status": "OK"
}
.NET 示例
//TODO:在 https://dashboard.groupdocs.cloud 獲取您的 AppSID 和 AppKey(需要免費註冊)。
using System;
using System.Diagnostics;
using GroupDocs.Classification.Cloud.Sdk.Api;
using GroupDocs.Classification.Cloud.Sdk.Model;
using GroupDocs.Classification.Cloud.Sdk.Model.Requests;
namespace GroupDocs.Classification.Cloud.Sdk.Examples
{
class Classification_CSharp_Classify_Raw_Text
{
public static void Run()
{
//TODO:在 https://dashboard.groupdocs.cloud/ 獲取您的 AppSID 和 AppKey(需要免費註冊)。
var configuration = new Configuration
{
AppSid = "XXX-XXXXXXX-XXXX",
AppKey = "XXXXXXXXXXXXX"
};
var apiInstance = new ClassificationApi(configuration);
try
{
var request = new ClassifyRequest(new BaseRequest() { Description = "Try Text classification using GroupDocs.Classification Cloud API" }, "3");
// 獲取分類結果
var response = apiInstance.Classify(request);
Console.WriteLine(response.ToString());
}
catch (Exception e)
{
Console.WriteLine("Exception when calling ClassificationApi.Classify: " + e.Message);
}
}
}
}
立即開始免費試用
立即開始免費試用 – 您只需註冊 GroupDocs 雲服務。註冊後,您就可以嘗試 GroupDocs Cloud 提供的強大文件處理功能。