什麼是文本分類?

文本分類是根據文本內容為其分配標籤或類別的過程,具有廣泛的應用,例如情感分析、主題標記、垃圾郵件檢測和意圖檢測。

GroupDocs.分類雲API

GroupDocs.分類雲

原始文本形式的非結構化數據無處不在:電子郵件、聊天、網頁、社交媒體、支持票、調查回復等等。文本可以是極其豐富的信息源,但由於其非結構化性質,從中提取見解可能非常困難且耗時。企業正在轉向文本分類,以快速且經濟高效的方式構建文本,以增強決策和自動化流程。

什麼是分類法?

分類學是分類的實踐和科學。該詞也用作分類方案。分類法是一種特殊的分類。從更廣泛、更一般的意義上來說,它可以指事物或概念的分類,以及這種分類背後的原則。

GroupDocs.分類雲API

GroupDocs.Classification Cloud API 檢索 IAB-2 分類法文檔分類法 的原始文本分類輸出。它返回一個對象,其中包含有關最佳類別及其概率以及其他類別的概率的信息。

IAB-2 分類示例

GroupDocs.Classification Cloud API 支持 IAB-2 分類方案,下面列出了一些分類示例:

  • “汽車”,
  • ‘書籍\和\文學’,
  • “商業\和\金融”,
  • “職業生涯”,
  • ‘教育’,
  • ‘活動\和\景點’,
  • ‘家庭\和\關係’,
  • ‘美術\藝術’,
  • ‘食物和飲料’,
  • ‘健康生活’,
  • ‘興趣愛好’,
  • ‘家&\花園’,
  • ‘醫療\健康’,
  • ‘電影’,
  • ‘音樂\和\音頻’,
  • ‘新聞\和\政治’,
  • ‘個人財務’
  • ETC。

捲曲請求

### Upload document to default storage
curl -X POST "https://api.groupdocs.cloud/v2.0/viewer/storage/file/viewerdocs%2Fthree-layouts.dwf?storageName=MyStorage" 
-H "accept: application/json" 
-H "authorization: Bearer [Access_Token]" 
-H "Content-Type: multipart/form-data" 
-T C:/Temp/three-layouts.dwf

回复

{
  "bestClassName": "Healthy_Living",
  "bestClassProbability": 53.77,
  "bestResults": [
    {
      "className": "Healthy_Living",
      "classProbability": 53.77
    },
    {
      "className": "Medical_Health",
      "classProbability": 38.27
    },
    {
      "className": "Pets",
      "classProbability": 1.98
    }
  ],
  "code": 200,
  "status": "OK"
}

.NET 示例

//TODO:在 https://dashboard.groupdocs.cloud 獲取您的 AppSID 和 AppKey(需要免費註冊)。

using System;
using System.Diagnostics;
using GroupDocs.Classification.Cloud.Sdk.Api;
using GroupDocs.Classification.Cloud.Sdk.Model;
using GroupDocs.Classification.Cloud.Sdk.Model.Requests;

namespace GroupDocs.Classification.Cloud.Sdk.Examples
{
    class Classification_CSharp_Classify_Document_from_Storage
    {
        public static void Run()
        {
            //TODO:在 https://dashboard.groupdocs.cloud/ 獲取您的 AppSID 和 AppKey(需要免費註冊)。
            var configuration = new Configuration
            {
                AppSid = "XXX-XXXXXXX-XXXX",
                AppKey = "XXXXXXXXXXXXX"
            };

            var apiInstance = new ClassificationApi(configuration);

            try
            {
                var request = new ClassifyRequest(new BaseRequest()
                {
                    Document = new FileInfo()
                    {
                        Name = "one-page.docx",
                        Folder = ""
                    },
                },
                bestClassesCount: "3");

                // 獲取分類結果
                ClassificationResponse response = apiInstance.Classify(request);
                Console.WriteLine(response.ToString());
            }
            catch (Exception e)
            {
                Console.WriteLine("Exception when calling ClassificationApi.Classify: " + e.Message);
            }
        }
    }
}

文檔分類示例

文檔分類包括 GroupDocs.Classification Cloud API 中的以下列表:

  • ADVE - 廣告、小冊子。
  • 電子郵件
  • 形式
  • 備忘錄——備忘錄。
  • 新聞 - 文章,包括新聞文章。
  • 發票
  • 報告
  • 恢復
  • 科學——科學論文。
  • 其他 - 分類器不確定的其他類別的文檔或案例。

捲曲請求

curl -v "http://api.groupdocs.com/v/v1/classification/classify?bestClassesCount=3&taxonomy=documents"
-H "content-type: application/json"
-X POST -d '{ "Document": {"Folder": "words/docx","Name": "four-pages.docx" } }'

回复

{
  "bestClassName": "Other",
  "bestClassProbability": 36.8,
  "bestResults": [
    {
      "className": "Other",
      "classProbability": 36.8
    },
    {
      "className": "ADVE",
      "classProbability": 14.72
    },
    {
      "className": "News",
      "classProbability": 12.77
    }
  ],
  "code": 200,
  "status": "OK"
}

.NET 示例

//TODO:在 https://dashboard.groupdocs.cloud 獲取您的 AppSID 和 AppKey(需要免費註冊)。

using System;
using System.Diagnostics;
using GroupDocs.Classification.Cloud.Sdk.Api;
using GroupDocs.Classification.Cloud.Sdk.Model;
using GroupDocs.Classification.Cloud.Sdk.Model.Requests;

namespace GroupDocs.Classification.Cloud.Sdk.Examples
{
    class Classification_CSharp_Classify_Raw_Text
    {
        public static void Run()
        {
            //TODO:在 https://dashboard.groupdocs.cloud/ 獲取您的 AppSID 和 AppKey(需要免費註冊)。
            var configuration = new Configuration
            {
                AppSid = "XXX-XXXXXXX-XXXX",
                AppKey = "XXXXXXXXXXXXX"
            };

            var apiInstance = new ClassificationApi(configuration);

            try
            {
                var request = new ClassifyRequest(new BaseRequest() { Description = "Try Text classification using GroupDocs.Classification Cloud API" }, "3");

                // 獲取分類結果
                var response = apiInstance.Classify(request);
                Console.WriteLine(response.ToString());
            }
            catch (Exception e)
            {
                Console.WriteLine("Exception when calling ClassificationApi.Classify: " + e.Message);
            }
        }
    }
}

立即開始免費試用

立即開始免費試用 – 您只需註冊 GroupDocs 雲服務。註冊後,您就可以嘗試 GroupDocs Cloud 提供的強大文件處理功能。