C#을 사용하여 문서 및 원시 텍스트 분류

텍스트 분류 또는 텍스트 분류는 태그를 할당하거나 텍스트를 조직화된 그룹으로 분류하는 프로세스입니다. C# 개발자는 클라우드에서 프로그래밍 방식으로 원시 텍스트 또는 문서를 쉽게 분류할 수 있습니다. 이 기사에서는 C#에서 REST API를 사용하여 문서 및 원시 텍스트를 분류하는 방법을 배웁니다.

이 문서에서는 다음 항목에 대해 설명/다룹니다.

문서 분류 REST API 및 .NET SDK

텍스트나 문서를 분류하기 위해 GroupDocs.Classification Cloud의 .NET SDK API를 사용합니다. 이를 통해 원시 텍스트와 문서를 미리 정의된 범주로 분류할 수 있습니다. SDK는 IAB-2, 문서 및 감정 분류와 같은 여러 분류 유형을 지원합니다. 분류 정보는 확률 점수와 함께 최상의 클래스를 보여줍니다.

NuGet 패키지 관리자에서 또는 패키지 관리자 콘솔에서 다음 명령을 사용하여 GroupDocs.Classification을 Visual Studio 프로젝트에 설치할 수 있습니다.

Install-Package GroupDocs.Classification-Cloud

단계와 사용 가능한 코드 예제를 시작하기 전에 대시보드에서 클라이언트 ID와 클라이언트 암호를 얻으십시오. 클라이언트 ID와 시크릿이 있으면 아래와 같이 코드를 추가합니다.

var configuration = new Configuration();
configuration.ClientId = "659fe7da-715b-4744-a0f7-cf469a392b73";
configuration.ClientSecret = "b377c36cfa28fa69960ebac6b6e36421";

C#에서 REST API를 사용하여 Word 문서 분류

아래 제공된 간단한 단계에 따라 Word 문서를 분류할 수 있습니다.

문서 업로드

먼저 아래 제공된 코드 샘플을 사용하여 DOCX 파일을 클라우드에 업로드합니다.

// API 초기화
var apiInstance = new FileApi(configuration);

// 로컬/디스크에서 IOStream의 파일을 엽니다.
var fileStream = File.Open("C:\\Files\\sample.docx", FileMode.Open);

// 파일 업로드 요청 생성
var request = new UploadFileRequest("sample.docx", fileStream, "");

var response = apiInstance.UploadFile(request);

결과적으로 업로드된 DOCX 파일은 클라우드 대시보드의 파일 섹션에서 사용할 수 있습니다.

C#을 사용하여 Word 문서 분류

아래 제공된 단계에 따라 프로그래밍 방식으로 Word 문서를 분류할 수 있습니다.

  • ClassificationApi 인스턴스 생성
  • BaseRequest의 인스턴스 생성
  • DOCX 파일 경로를 설정하고 BaseRequest 문서에 할당
  • BaseRequest로 ClassifyRequest 생성
  • BaseClassesCount 설정
  • ClassificationApi.Classify() 메서드를 호출하여 ClassificationResponse 가져오기

다음 코드 샘플은 REST API를 사용하여 Word 문서를 분류하는 방법을 보여줍니다.

// API 초기화
var apiInstance = new ClassificationApi(configuration);

// 기본 요청 만들기
BaseRequest baseRequest = new BaseRequest();
baseRequest.Document = new GroupDocs.Classification.Cloud.Sdk.Model.FileInfo()
{
    Name = "sample.docx",
    Folder = ""
};

// 분류 요청 생성
var request = new ClassifyRequest(baseRequest);
request.BestClassesCount = "3";

// 분류 결과 얻기
ClassificationResponse response = apiInstance.Classify(request);
foreach(var r in response.BestResults)
{
    Console.WriteLine("ClassName: " + r.ClassName);
    Console.WriteLine("ClassProbability: " + r.ClassProbability);
    Console.WriteLine("--------------------------------");
}
C#에서 REST API를 사용하여 Word 문서 분류

C#에서 REST API를 사용하여 Word 문서 분류

C#을 사용하여 분류법을 위한 Word 문서 분류

아래 제공된 단계에 따라 프로그래밍 방식으로 분류법에 대한 Word 문서를 분류할 수 있습니다.

  • ClassificationApi 인스턴스 생성
  • BaseRequest의 인스턴스 생성
  • DOCX 파일 경로를 설정하고 BaseRequest 문서에 할당
  • BaseRequest로 ClassifyRequest 생성
  • BaseClassesCount 설정
  • 분류 설정
  • ClassificationApi.Classify() 메서드를 호출하여 ClassificationResponse 가져오기

다음 코드 샘플은 REST API를 사용하여 “문서” 분류에 대한 Word 문서를 분류하는 방법을 보여줍니다. 앞에서 언급한 단계에 따라 파일을 업로드하십시오.

// API 초기화
var apiInstance = new ClassificationApi(configuration);

// 기본 요청 만들기
BaseRequest baseRequest = new BaseRequest();
baseRequest.Document = new GroupDocs.Classification.Cloud.Sdk.Model.FileInfo()
{
    Name = "sample.docx",
    Folder = ""
};

// 분류 요청 생성
var request = new ClassifyRequest(baseRequest);
request.BestClassesCount = "3";
request.Taxonomy = "documents";

// 분류 결과 얻기
ClassificationResponse response = apiInstance.Classify(request);
foreach(var r in response.BestResults)
{
    Console.WriteLine("ClassName: " + r.ClassName);
    Console.WriteLine("ClassProbability: " + r.ClassProbability);
    Console.WriteLine("--------------------------------");
}
ClassName: ADVE
ClassProbability: 77.17
--------------------------------
ClassName: Resume
ClassProbability: 22.83
--------------------------------
ClassName: Scientific
ClassProbability: 0.01
--------------------------------

다음을 분류법으로 사용하여 문서를 분류할 수 있습니다.

  • 기본
  • iab2
  • 서류
  • 감정
  • 감정3

요청 매개변수 분류” 섹션에서 요청 매개변수 분류에 대해 자세히 알아볼 수 있습니다.

C#에서 REST API를 사용하여 원시 텍스트 분류

아래 제공된 단계에 따라 프로그래밍 방식으로 원시 텍스트를 분류할 수 있습니다.

  • ClassificationApi 인스턴스 생성
  • BaseRequest 인스턴스 생성
  • BaseRequest 설명에 원시 텍스트 제공
  • BaseRequest로 ClassifyRequest 생성
  • BaseClassesCount 설정
  • ClassificationApi.Classify() 메서드를 호출하여 ClassificationResponse 가져오기

다음 코드 샘플은 REST API를 사용하여 원시 텍스트를 분류하는 방법을 보여줍니다.

// API 초기화
var apiInstance = new ClassificationApi(configuration);

// 기본 요청 만들기
BaseRequest baseRequest = new BaseRequest();
baseRequest.Description = "We support some of the most popular file formats in business, "
    + "including Microsoft Word documents, Excel spreadsheets, PowerPoint presentations, "
    + "Outlook emails and archives, Visio diagrams, Project files, and Adobe Acrobat PDF documents..";

// 분류 요청 생성
var request = new ClassifyRequest(baseRequest);
request.BestClassesCount = "3";

// 분류 결과 얻기
var response = apiInstance.Classify(request);
foreach (var r in response.BestResults)
{
    Console.WriteLine("ClassName: " + r.ClassName);
    Console.WriteLine("ClassProbability: " + r.ClassProbability);
    Console.WriteLine("--------------------------------");
}
ClassName: Hobbies_&_Interests
ClassProbability: 43.02
--------------------------------
ClassName: Business_and_Finance
ClassProbability: 26.64
--------------------------------
ClassName: Technology_&_Computing
ClassProbability: 18.25
--------------------------------

온라인 시도

위의 API를 사용하여 개발된 다음 무료 온라인 분류 도구를 사용해 보십시오. https://products.groupdocs.app/분류[/](https:/ /products.groupdocs.app/splitter/pdf)

결론

이 기사에서는 C#을 사용하여 클라우드에서 Word 문서와 원시 텍스트를 분류하는 방법을 배웠습니다. 프로그래밍 방식으로 DOCX 파일을 클라우드에 업로드하는 방법도 배웠습니다. 문서를 사용하여 GroupDocs.Classification Cloud API에 대해 자세히 알아볼 수 있습니다. 또한 브라우저를 통해 직접 API를 시각화하고 상호 작용할 수 있는 API 참조 섹션을 제공합니다. 모호한 점이 있는 경우 포럼에서 언제든지 문의해 주십시오.

또한보십시오