텍스트 분류 또는 텍스트 분류는 태그를 할당하거나 텍스트를 조직화된 그룹으로 분류하는 프로세스입니다. C# 개발자는 클라우드에서 프로그래밍 방식으로 원시 텍스트 또는 문서를 쉽게 분류할 수 있습니다. 이 기사에서는 C#에서 REST API를 사용하여 문서 및 원시 텍스트를 분류하는 방법을 배웁니다.
이 문서에서는 다음 항목에 대해 설명/다룹니다.
문서 분류 REST API 및 .NET SDK
텍스트나 문서를 분류하기 위해 GroupDocs.Classification Cloud의 .NET SDK API를 사용합니다. 이를 통해 원시 텍스트와 문서를 미리 정의된 범주로 분류할 수 있습니다. SDK는 IAB-2, 문서 및 감정 분류와 같은 여러 분류 유형을 지원합니다. 분류 정보는 확률 점수와 함께 최상의 클래스를 보여줍니다.
NuGet 패키지 관리자에서 또는 패키지 관리자 콘솔에서 다음 명령을 사용하여 GroupDocs.Classification을 Visual Studio 프로젝트에 설치할 수 있습니다.
Install-Package GroupDocs.Classification-Cloud
단계와 사용 가능한 코드 예제를 시작하기 전에 대시보드에서 클라이언트 ID와 클라이언트 암호를 얻으십시오. 클라이언트 ID와 시크릿이 있으면 아래와 같이 코드를 추가합니다.
var configuration = new Configuration();
configuration.ClientId = "659fe7da-715b-4744-a0f7-cf469a392b73";
configuration.ClientSecret = "b377c36cfa28fa69960ebac6b6e36421";
C#에서 REST API를 사용하여 Word 문서 분류
아래 제공된 간단한 단계에 따라 Word 문서를 분류할 수 있습니다.
- 업로드 클라우드에 DOCX 파일 업로드
- C#을 사용하여 Word 문서 분류
- C#을 사용하여 분류법을 위한 Word 문서 분류
문서 업로드
먼저 아래 제공된 코드 샘플을 사용하여 DOCX 파일을 클라우드에 업로드합니다.
// API 초기화
var apiInstance = new FileApi(configuration);
// 로컬/디스크에서 IOStream의 파일을 엽니다.
var fileStream = File.Open("C:\\Files\\sample.docx", FileMode.Open);
// 파일 업로드 요청 생성
var request = new UploadFileRequest("sample.docx", fileStream, "");
var response = apiInstance.UploadFile(request);
결과적으로 업로드된 DOCX 파일은 클라우드 대시보드의 파일 섹션에서 사용할 수 있습니다.
C#을 사용하여 Word 문서 분류
아래 제공된 단계에 따라 프로그래밍 방식으로 Word 문서를 분류할 수 있습니다.
- ClassificationApi 인스턴스 생성
- BaseRequest의 인스턴스 생성
- DOCX 파일 경로를 설정하고 BaseRequest 문서에 할당
- BaseRequest로 ClassifyRequest 생성
- BaseClassesCount 설정
- ClassificationApi.Classify() 메서드를 호출하여 ClassificationResponse 가져오기
다음 코드 샘플은 REST API를 사용하여 Word 문서를 분류하는 방법을 보여줍니다.
// API 초기화
var apiInstance = new ClassificationApi(configuration);
// 기본 요청 만들기
BaseRequest baseRequest = new BaseRequest();
baseRequest.Document = new GroupDocs.Classification.Cloud.Sdk.Model.FileInfo()
{
Name = "sample.docx",
Folder = ""
};
// 분류 요청 생성
var request = new ClassifyRequest(baseRequest);
request.BestClassesCount = "3";
// 분류 결과 얻기
ClassificationResponse response = apiInstance.Classify(request);
foreach(var r in response.BestResults)
{
Console.WriteLine("ClassName: " + r.ClassName);
Console.WriteLine("ClassProbability: " + r.ClassProbability);
Console.WriteLine("--------------------------------");
}
C#을 사용하여 분류법을 위한 Word 문서 분류
아래 제공된 단계에 따라 프로그래밍 방식으로 분류법에 대한 Word 문서를 분류할 수 있습니다.
- ClassificationApi 인스턴스 생성
- BaseRequest의 인스턴스 생성
- DOCX 파일 경로를 설정하고 BaseRequest 문서에 할당
- BaseRequest로 ClassifyRequest 생성
- BaseClassesCount 설정
- 분류 설정
- ClassificationApi.Classify() 메서드를 호출하여 ClassificationResponse 가져오기
다음 코드 샘플은 REST API를 사용하여 “문서” 분류에 대한 Word 문서를 분류하는 방법을 보여줍니다. 앞에서 언급한 단계에 따라 파일을 업로드하십시오.
// API 초기화
var apiInstance = new ClassificationApi(configuration);
// 기본 요청 만들기
BaseRequest baseRequest = new BaseRequest();
baseRequest.Document = new GroupDocs.Classification.Cloud.Sdk.Model.FileInfo()
{
Name = "sample.docx",
Folder = ""
};
// 분류 요청 생성
var request = new ClassifyRequest(baseRequest);
request.BestClassesCount = "3";
request.Taxonomy = "documents";
// 분류 결과 얻기
ClassificationResponse response = apiInstance.Classify(request);
foreach(var r in response.BestResults)
{
Console.WriteLine("ClassName: " + r.ClassName);
Console.WriteLine("ClassProbability: " + r.ClassProbability);
Console.WriteLine("--------------------------------");
}
ClassName: ADVE
ClassProbability: 77.17
--------------------------------
ClassName: Resume
ClassProbability: 22.83
--------------------------------
ClassName: Scientific
ClassProbability: 0.01
--------------------------------
다음을 분류법으로 사용하여 문서를 분류할 수 있습니다.
- 기본
- iab2
- 서류
- 감정
- 감정3
“요청 매개변수 분류” 섹션에서 요청 매개변수 분류에 대해 자세히 알아볼 수 있습니다.
C#에서 REST API를 사용하여 원시 텍스트 분류
아래 제공된 단계에 따라 프로그래밍 방식으로 원시 텍스트를 분류할 수 있습니다.
- ClassificationApi 인스턴스 생성
- BaseRequest 인스턴스 생성
- BaseRequest 설명에 원시 텍스트 제공
- BaseRequest로 ClassifyRequest 생성
- BaseClassesCount 설정
- ClassificationApi.Classify() 메서드를 호출하여 ClassificationResponse 가져오기
다음 코드 샘플은 REST API를 사용하여 원시 텍스트를 분류하는 방법을 보여줍니다.
// API 초기화
var apiInstance = new ClassificationApi(configuration);
// 기본 요청 만들기
BaseRequest baseRequest = new BaseRequest();
baseRequest.Description = "We support some of the most popular file formats in business, "
+ "including Microsoft Word documents, Excel spreadsheets, PowerPoint presentations, "
+ "Outlook emails and archives, Visio diagrams, Project files, and Adobe Acrobat PDF documents..";
// 분류 요청 생성
var request = new ClassifyRequest(baseRequest);
request.BestClassesCount = "3";
// 분류 결과 얻기
var response = apiInstance.Classify(request);
foreach (var r in response.BestResults)
{
Console.WriteLine("ClassName: " + r.ClassName);
Console.WriteLine("ClassProbability: " + r.ClassProbability);
Console.WriteLine("--------------------------------");
}
ClassName: Hobbies_&_Interests
ClassProbability: 43.02
--------------------------------
ClassName: Business_and_Finance
ClassProbability: 26.64
--------------------------------
ClassName: Technology_&_Computing
ClassProbability: 18.25
--------------------------------
온라인 시도
위의 API를 사용하여 개발된 다음 무료 온라인 분류 도구를 사용해 보십시오. https://products.groupdocs.app/분류[/](https:/ /products.groupdocs.app/splitter/pdf)
결론
이 기사에서는 C#을 사용하여 클라우드에서 Word 문서와 원시 텍스트를 분류하는 방법을 배웠습니다. 프로그래밍 방식으로 DOCX 파일을 클라우드에 업로드하는 방법도 배웠습니다. 문서를 사용하여 GroupDocs.Classification Cloud API에 대해 자세히 알아볼 수 있습니다. 또한 브라우저를 통해 직접 API를 시각화하고 상호 작용할 수 있는 API 참조 섹션을 제공합니다. 모호한 점이 있는 경우 포럼에서 언제든지 문의해 주십시오.