Klasifikasi Dokumen dan Teks Mentah menggunakan C#

Klasifikasi teks atau kategorisasi teks adalah proses menetapkan tag atau mengkategorikan teks ke dalam kelompok yang terorganisir. Sebagai pengembang C#, Anda dapat dengan mudah mengklasifikasikan teks atau dokumen mentah secara terprogram di cloud. Pada artikel ini, Anda akan mempelajari cara mengklasifikasikan dokumen dan teks mentah menggunakan REST API di C#.

Topik-topik berikut dibahas/dibahas dalam artikel ini:

Klasifikasi Dokumen REST API dan .NET SDK

Untuk mengklasifikasikan teks atau dokumen, saya akan menggunakan .NET SDK of GroupDocs.Classification Cloud API. Ini memungkinkan Anda untuk mengklasifikasikan teks mentah serta dokumen ke dalam kategori yang telah ditentukan. SDK mendukung beberapa jenis taksonomi, seperti taksonomi IAB-2, Dokumen & Sentimen. Informasi klasifikasi menunjukkan kelas terbaik dengan skor probabilitasnya.

Anda dapat menginstal GroupDocs.Classification ke dalam proyek Visual Studio Anda dari Package Manager NuGet atau menggunakan perintah berikut di konsol Package Manager:

Install-Package GroupDocs.Classification-Cloud

Dapatkan ID Klien dan Rahasia Klien Anda dari dashboard sebelum Anda mulai mengikuti langkah-langkah dan contoh kode yang tersedia. Setelah Anda memiliki ID klien dan Rahasia, tambahkan kode seperti yang ditunjukkan di bawah ini:

var configuration = new Configuration();
configuration.ClientId = "659fe7da-715b-4744-a0f7-cf469a392b73";
configuration.ClientSecret = "b377c36cfa28fa69960ebac6b6e36421";

Klasifikasi Dokumen Word menggunakan REST API di C#

Anda dapat mengklasifikasikan dokumen Word Anda dengan mengikuti langkah-langkah sederhana yang diberikan di bawah ini:

Unggah Dokumen

Pertama, unggah file DOCX di Cloud menggunakan contoh kode yang diberikan di bawah ini:

// inisialisasi API
var apiInstance = new FileApi(configuration);

// Buka file di IOStream dari local/disc.
var fileStream = File.Open("C:\\Files\\sample.docx", FileMode.Open);

// Buat permintaan unggah file
var request = new UploadFileRequest("sample.docx", fileStream, "");

var response = apiInstance.UploadFile(request);

Akibatnya, file DOCX yang diunggah akan tersedia di bagian file dasbor Anda di cloud.

Klasifikasi Dokumen Word menggunakan C#

Anda dapat mengklasifikasikan dokumen Word secara terprogram dengan mengikuti langkah-langkah yang diberikan di bawah ini.

  • Buat instance dari ClassificationApi
  • Buat instance BaseRequest
  • Setel jalur file DOCX dan tetapkan ke dokumen BaseRequest
  • Buat ClassifyRequest dengan BaseRequest
  • Tetapkan Hitungan Kelas Dasar
  • Dapatkan ClassificationResponse dengan memanggil metode ClassificationApi.Classify().

Contoh kode berikut menunjukkan cara mengklasifikasikan dokumen Word menggunakan REST API.

// inisialisasi API
var apiInstance = new ClassificationApi(configuration);

// Buat permintaan dasar
BaseRequest baseRequest = new BaseRequest();
baseRequest.Document = new GroupDocs.Classification.Cloud.Sdk.Model.FileInfo()
{
    Name = "sample.docx",
    Folder = ""
};

// Buat permintaan klasifikasi
var request = new ClassifyRequest(baseRequest);
request.BestClassesCount = "3";

// Dapatkan hasil klasifikasi
ClassificationResponse response = apiInstance.Classify(request);
foreach(var r in response.BestResults)
{
    Console.WriteLine("ClassName: " + r.ClassName);
    Console.WriteLine("ClassProbability: " + r.ClassProbability);
    Console.WriteLine("--------------------------------");
}
Klasifikasi Dokumen Word menggunakan REST API di C#

Klasifikasi Dokumen Word menggunakan REST API di C#

Klasifikasi Dokumen Word untuk Taksonomi menggunakan C#

Anda dapat mengklasifikasikan dokumen Word untuk taksonomi secara terprogram dengan mengikuti langkah-langkah di bawah ini.

  • Buat instance dari ClassificationApi
  • Buat instance BaseRequest
  • Setel jalur file DOCX dan tetapkan ke dokumen BaseRequest
  • Buat ClassifyRequest dengan BaseRequest
  • Tetapkan Hitungan Kelas Dasar
  • Tetapkan Taksonomi
  • Dapatkan ClassificationResponse dengan memanggil metode ClassificationApi.Classify().

Contoh kode berikut menunjukkan cara mengklasifikasikan dokumen Word untuk taksonomi “dokumen” menggunakan REST API. Silakan ikuti langkah-langkah yang disebutkan sebelumnya untuk mengunggah file.

// inisialisasi API
var apiInstance = new ClassificationApi(configuration);

// Buat permintaan dasar
BaseRequest baseRequest = new BaseRequest();
baseRequest.Document = new GroupDocs.Classification.Cloud.Sdk.Model.FileInfo()
{
    Name = "sample.docx",
    Folder = ""
};

// Buat permintaan klasifikasi
var request = new ClassifyRequest(baseRequest);
request.BestClassesCount = "3";
request.Taxonomy = "documents";

// Dapatkan hasil klasifikasi
ClassificationResponse response = apiInstance.Classify(request);
foreach(var r in response.BestResults)
{
    Console.WriteLine("ClassName: " + r.ClassName);
    Console.WriteLine("ClassProbability: " + r.ClassProbability);
    Console.WriteLine("--------------------------------");
}
ClassName: ADVE
ClassProbability: 77.17
--------------------------------
ClassName: Resume
ClassProbability: 22.83
--------------------------------
ClassName: Scientific
ClassProbability: 0.01
--------------------------------

Anda dapat menggunakan yang berikut ini sebagai taksonomi untuk mengklasifikasikan dokumen:

  • bawaan
  • iab2
  • dokumen
  • sentimen
  • sentimen3

Anda dapat membaca selengkapnya tentang mengklasifikasikan parameter permintaan di bagian “Mengklasifikasikan Parameter Permintaan”.

Klasifikasikan Teks Mentah menggunakan REST API di C#

Anda dapat mengklasifikasikan teks mentah apa pun secara terprogram dengan mengikuti langkah-langkah yang diberikan di bawah ini.

  • Buat instance dari ClassificationApi
  • Buat instance BaseRequest
  • Berikan teks mentah ke deskripsi BaseRequest
  • Buat ClassifyRequest dengan BaseRequest
  • Tetapkan Hitungan Kelas Dasar
  • Dapatkan ClassificationResponse dengan memanggil metode ClassificationApi.Classify().

Contoh kode berikut menunjukkan cara mengklasifikasikan teks mentah menggunakan REST API.

// inisialisasi API
var apiInstance = new ClassificationApi(configuration);

// Buat permintaan dasar
BaseRequest baseRequest = new BaseRequest();
baseRequest.Description = "We support some of the most popular file formats in business, "
    + "including Microsoft Word documents, Excel spreadsheets, PowerPoint presentations, "
    + "Outlook emails and archives, Visio diagrams, Project files, and Adobe Acrobat PDF documents..";

// Buat permintaan klasifikasi
var request = new ClassifyRequest(baseRequest);
request.BestClassesCount = "3";

// Dapatkan hasil klasifikasi
var response = apiInstance.Classify(request);
foreach (var r in response.BestResults)
{
    Console.WriteLine("ClassName: " + r.ClassName);
    Console.WriteLine("ClassProbability: " + r.ClassProbability);
    Console.WriteLine("--------------------------------");
}
ClassName: Hobbies_&_Interests
ClassProbability: 43.02
--------------------------------
ClassName: Business_and_Finance
ClassProbability: 26.64
--------------------------------
ClassName: Technology_&_Computing
ClassProbability: 18.25
--------------------------------

Coba Daring

Silakan coba alat klasifikasi online gratis berikut, yang dikembangkan menggunakan API di atas. https://products.groupdocs.app/klasifikasi[/](https:/ /products.groupdocs.app/splitter/pdf)

Kesimpulan

Pada artikel ini, Anda telah mempelajari cara mengklasifikasikan dokumen Word dan teks mentah di cloud menggunakan C#. Anda juga mempelajari cara mengunggah file DOCX secara terprogram di cloud. Anda dapat mempelajari lebih lanjut tentang GroupDocs.Classification Cloud API menggunakan dokumentasi. Kami juga menyediakan bagian Referensi API yang memungkinkan Anda memvisualisasikan dan berinteraksi dengan API kami secara langsung melalui browser. Jika ada ambiguitas, jangan ragu untuk menghubungi kami di forum.

Lihat juga