使用 C# 對文檔和原始文本進行分類

文本分類或文本分類是分配標籤或將文本分類為有組織的組的過程。作為 C# 開發人員,您可以輕鬆地以編程方式在雲端對原始文本或文檔進行分類。在本文中,您將學習如何在 C# 中使用 REST API 對文檔和原始文本進行分類。

本文討論/涵蓋以下主題:

文檔分類 REST API 和 .NET SDK

為了對文本或文檔進行分類,我將使用 GroupDocs.Classification Cloud 的 .NET SDK API。它使您能夠將原始文本和文檔分類到預定義的類別中。 SDK 支持多種分類法類型,例如 IAB-2、Documents & Sentiment 分類法。分類信息顯示最佳類別及其概率得分。

您可以從 NuGet 包管理器或在包管理器控制台中使用以下命令將 GroupDocs.Classification 安裝到您的 Visual Studio 項目中:

Install-Package GroupDocs.Classification-Cloud

在開始執行步驟和可用代碼示例之前,請從 儀表板 獲取您的客戶端 ID 和客戶端密碼。獲得客戶端 ID 和密碼後,添加如下所示的代碼:

var configuration = new Configuration();
configuration.ClientId = "659fe7da-715b-4744-a0f7-cf469a392b73";
configuration.ClientSecret = "b377c36cfa28fa69960ebac6b6e36421";

在 C# 中使用 REST API 對 Word 文檔進行分類

您可以按照下面給出的簡單步驟對您的 Word 文檔進行分類:

上傳文件

首先,使用下面給出的代碼示例將 DOCX 文件上傳到雲端:

// API初始化
var apiInstance = new FileApi(configuration);

// 從本地/光盤打開 IOStream 中的文件。
var fileStream = File.Open("C:\\Files\\sample.docx", FileMode.Open);

// 創建文件上傳請求
var request = new UploadFileRequest("sample.docx", fileStream, "");

var response = apiInstance.UploadFile(request);

因此,上傳的 DOCX 文件將在雲端儀表板的 文件部分 中可用。

使用 C# 對 Word 文檔進行分類

您可以按照下面給出的步驟以編程方式對 Word 文檔進行分類。

  • 創建 ClassificationApi 實例
  • 創建 BaseRequest 的實例
  • 設置DOCX文件路徑,賦值給BaseRequest文檔
  • 使用 BaseRequest 創建 ClassifyRequest
  • 設置 BaseClassesCount
  • 通過調用 ClassificationApi.Classify() 方法獲取 ClassificationResponse

以下代碼示例展示瞭如何使用 REST API 對 Word 文檔進行分類。

// API初始化
var apiInstance = new ClassificationApi(configuration);

// 創建基礎請求
BaseRequest baseRequest = new BaseRequest();
baseRequest.Document = new GroupDocs.Classification.Cloud.Sdk.Model.FileInfo()
{
    Name = "sample.docx",
    Folder = ""
};

// 創建分類請求
var request = new ClassifyRequest(baseRequest);
request.BestClassesCount = "3";

// 獲取分類結果
ClassificationResponse response = apiInstance.Classify(request);
foreach(var r in response.BestResults)
{
    Console.WriteLine("ClassName: " + r.ClassName);
    Console.WriteLine("ClassProbability: " + r.ClassProbability);
    Console.WriteLine("--------------------------------");
}
在 C# 中使用 REST API 對 Word 文檔進行分類

在 C# 中使用 REST API 對 Word 文檔進行分類

使用 C# 對分類法的 Word 文檔進行分類

您可以按照下面給出的步驟以編程方式對 Word 文檔進行分類。

  • 創建 ClassificationApi 實例
  • 創建 BaseRequest 的實例
  • 設置DOCX文件路徑,賦值給BaseRequest文檔
  • 使用 BaseRequest 創建 ClassifyRequest
  • 設置 BaseClassesCount
  • 設置分類
  • 通過調用 ClassificationApi.Classify() 方法獲取 ClassificationResponse

以下代碼示例顯示如何使用 REST API 對 Word 文檔進行“文檔”分類。請按照前面提到的步驟上傳文件。

// API初始化
var apiInstance = new ClassificationApi(configuration);

// 創建基礎請求
BaseRequest baseRequest = new BaseRequest();
baseRequest.Document = new GroupDocs.Classification.Cloud.Sdk.Model.FileInfo()
{
    Name = "sample.docx",
    Folder = ""
};

// 創建分類請求
var request = new ClassifyRequest(baseRequest);
request.BestClassesCount = "3";
request.Taxonomy = "documents";

// 獲取分類結果
ClassificationResponse response = apiInstance.Classify(request);
foreach(var r in response.BestResults)
{
    Console.WriteLine("ClassName: " + r.ClassName);
    Console.WriteLine("ClassProbability: " + r.ClassProbability);
    Console.WriteLine("--------------------------------");
}
ClassName: ADVE
ClassProbability: 77.17
--------------------------------
ClassName: Resume
ClassProbability: 22.83
--------------------------------
ClassName: Scientific
ClassProbability: 0.01
--------------------------------

您可以使用以下內容作為分類法來對文檔進行分類:

  • 默認
  • iab2
  • 文件
  • 情緒
  • 情緒3

您可以在“分類請求參數”部分閱讀更多關於分類請求參數的信息。

在 C# 中使用 REST API 對原始文本進行分類

您可以按照下面給出的步驟以編程方式對任何原始文本進行分類。

  • 創建 ClassificationApi 實例
  • 創建 BaseRequest 實例
  • 向 BaseRequest 描述提供原始文本
  • 使用 BaseRequest 創建 ClassifyRequest
  • 設置 BaseClassesCount
  • 通過調用 ClassificationApi.Classify() 方法獲取 ClassificationResponse

以下代碼示例展示瞭如何使用 REST API 對原始文本進行分類。

// API初始化
var apiInstance = new ClassificationApi(configuration);

// 創建基礎請求
BaseRequest baseRequest = new BaseRequest();
baseRequest.Description = "We support some of the most popular file formats in business, "
    + "including Microsoft Word documents, Excel spreadsheets, PowerPoint presentations, "
    + "Outlook emails and archives, Visio diagrams, Project files, and Adobe Acrobat PDF documents..";

// 創建分類請求
var request = new ClassifyRequest(baseRequest);
request.BestClassesCount = "3";

// 獲取分類結果
var response = apiInstance.Classify(request);
foreach (var r in response.BestResults)
{
    Console.WriteLine("ClassName: " + r.ClassName);
    Console.WriteLine("ClassProbability: " + r.ClassProbability);
    Console.WriteLine("--------------------------------");
}
ClassName: Hobbies_&_Interests
ClassProbability: 43.02
--------------------------------
ClassName: Business_and_Finance
ClassProbability: 26.64
--------------------------------
ClassName: Technology_&_Computing
ClassProbability: 18.25
--------------------------------

在線試用

請試用以下免費在線分類工具,該工具是使用上述API開發的。 https://products.groupdocs.app/分類[/](https:/ /products.groupdocs.app/splitter/pdf)

結論

在本文中,您學習瞭如何使用 C# 對雲端的 Word 文檔和原始文本進行分類。您還學習瞭如何以編程方式將 DOCX 文件上傳到雲端。您可以使用 文檔 了解有關 GroupDocs.Classification Cloud API 的更多信息。我們還提供了一個 API 參考 部分,讓您可以直接通過瀏覽器可視化我們的 API 並與之交互。如有任何歧義,請隨時在論壇上與我們聯繫。

也可以看看