จัดประเภทเอกสารและข้อความดิบโดยใช้ C#

การจัดหมวดหมู่ข้อความหรือการจัดหมวดหมู่ข้อความเป็นกระบวนการกำหนดแท็กหรือจัดหมวดหมู่ข้อความเป็นกลุ่มที่จัดไว้ ในฐานะนักพัฒนา C# คุณสามารถจัดประเภทข้อความดิบหรือเอกสารทางโปรแกรมบนคลาวด์ได้อย่างง่ายดาย ในบทความนี้ คุณจะได้เรียนรู้วิธีจัดประเภทเอกสารและข้อความดิบโดยใช้ REST API ใน C#

หัวข้อต่อไปนี้จะกล่าวถึง/ครอบคลุมในบทความนี้:

การจำแนกประเภทเอกสาร REST API และ .NET SDK

สำหรับการจำแนกข้อความหรือเอกสาร ฉันจะใช้ API ของ .NET SDK of GroupDocs.Classification Cloud ช่วยให้คุณสามารถจัดประเภทข้อความดิบและเอกสารของคุณเป็นหมวดหมู่ที่กำหนดไว้ล่วงหน้า SDK รองรับอนุกรมวิธานหลายประเภท เช่น IAB-2, Documents & Sentiment taxonomy ข้อมูลการจัดประเภทจะแสดงชั้นเรียนที่ดีที่สุดพร้อมคะแนนความน่าจะเป็น

คุณสามารถติดตั้ง GroupDocs.Classification ในโครงการ Visual Studio ของคุณได้จาก NuGet Package Manager หรือใช้คำสั่งต่อไปนี้ในคอนโซล Package Manager:

Install-Package GroupDocs.Classification-Cloud

โปรดรับรหัสไคลเอ็นต์และรหัสลับไคลเอ็นต์ของคุณจาก แดชบอร์ด ก่อนที่คุณจะเริ่มทำตามขั้นตอนและตัวอย่างโค้ดที่มีอยู่ เมื่อคุณมีรหัสไคลเอ็นต์และรหัสลับแล้ว ให้เพิ่มรหัสตามที่แสดงด้านล่าง:

var configuration = new Configuration();
configuration.ClientId = "659fe7da-715b-4744-a0f7-cf469a392b73";
configuration.ClientSecret = "b377c36cfa28fa69960ebac6b6e36421";

จัดประเภทเอกสาร Word โดยใช้ REST API ใน C#

คุณสามารถจัดประเภทเอกสาร Word ของคุณโดยทำตามขั้นตอนง่าย ๆ ด้านล่าง:

อัปโหลดเอกสาร

ขั้นแรก อัปโหลดไฟล์ DOCX บนคลาวด์โดยใช้ตัวอย่างโค้ดที่ระบุด้านล่าง:

// การเริ่มต้น API
var apiInstance = new FileApi(configuration);

// เปิดไฟล์ใน IOStream จากในเครื่อง/ดิสก์
var fileStream = File.Open("C:\\Files\\sample.docx", FileMode.Open);

// สร้างคำขออัปโหลดไฟล์
var request = new UploadFileRequest("sample.docx", fileStream, "");

var response = apiInstance.UploadFile(request);

ด้วยเหตุนี้ ไฟล์ DOCX ที่อัปโหลดจะอยู่ใน ส่วนไฟล์ ของแดชบอร์ดของคุณบนระบบคลาวด์

จัดประเภทเอกสาร Word โดยใช้ C#

คุณสามารถจัดประเภทเอกสาร Word โดยทางโปรแกรมโดยทำตามขั้นตอนด้านล่าง

  • สร้างอินสแตนซ์ของ ClassificationApi
  • สร้างตัวอย่างของ BaseRequest
  • กำหนดเส้นทางไฟล์ DOCX และกำหนดให้กับเอกสาร BaseRequest
  • สร้าง ClassifyRequest ด้วย BaseRequest
  • ตั้งค่า BaseClassesCount
  • รับ ClassificationResponse โดยเรียกเมธอด ClassificationApi.Classify()

ตัวอย่างโค้ดต่อไปนี้แสดงวิธีจัดประเภทเอกสาร Word โดยใช้ REST API

// การเริ่มต้น API
var apiInstance = new ClassificationApi(configuration);

// สร้างคำขอพื้นฐาน
BaseRequest baseRequest = new BaseRequest();
baseRequest.Document = new GroupDocs.Classification.Cloud.Sdk.Model.FileInfo()
{
    Name = "sample.docx",
    Folder = ""
};

// สร้างคำขอจัดประเภท
var request = new ClassifyRequest(baseRequest);
request.BestClassesCount = "3";

// รับผลการจำแนกประเภท
ClassificationResponse response = apiInstance.Classify(request);
foreach(var r in response.BestResults)
{
    Console.WriteLine("ClassName: " + r.ClassName);
    Console.WriteLine("ClassProbability: " + r.ClassProbability);
    Console.WriteLine("--------------------------------");
}
จัดประเภทเอกสาร Word โดยใช้ REST API ใน C#

จัดประเภทเอกสาร Word โดยใช้ REST API ใน C#

จัดประเภทเอกสาร Word สำหรับ Taxonomy โดยใช้ C#

คุณสามารถจัดประเภทเอกสาร Word สำหรับอนุกรมวิธานโดยทางโปรแกรมโดยทำตามขั้นตอนด้านล่าง

  • สร้างอินสแตนซ์ของ ClassificationApi
  • สร้างตัวอย่างของ BaseRequest
  • กำหนดเส้นทางไฟล์ DOCX และกำหนดให้กับเอกสาร BaseRequest
  • สร้าง ClassifyRequest ด้วย BaseRequest
  • ตั้งค่า BaseClassesCount
  • ตั้งอนุกรมวิธาน
  • รับ ClassificationResponse โดยเรียกเมธอด ClassificationApi.Classify()

ตัวอย่างโค้ดต่อไปนี้แสดงวิธีจัดประเภทเอกสาร Word สำหรับอนุกรมวิธาน “เอกสาร” โดยใช้ REST API โปรดทำตามขั้นตอนที่กล่าวถึงก่อนหน้านี้เพื่ออัปโหลดไฟล์

// การเริ่มต้น API
var apiInstance = new ClassificationApi(configuration);

// สร้างคำขอพื้นฐาน
BaseRequest baseRequest = new BaseRequest();
baseRequest.Document = new GroupDocs.Classification.Cloud.Sdk.Model.FileInfo()
{
    Name = "sample.docx",
    Folder = ""
};

// สร้างคำขอจัดประเภท
var request = new ClassifyRequest(baseRequest);
request.BestClassesCount = "3";
request.Taxonomy = "documents";

// รับผลการจำแนกประเภท
ClassificationResponse response = apiInstance.Classify(request);
foreach(var r in response.BestResults)
{
    Console.WriteLine("ClassName: " + r.ClassName);
    Console.WriteLine("ClassProbability: " + r.ClassProbability);
    Console.WriteLine("--------------------------------");
}
ClassName: ADVE
ClassProbability: 77.17
--------------------------------
ClassName: Resume
ClassProbability: 22.83
--------------------------------
ClassName: Scientific
ClassProbability: 0.01
--------------------------------

คุณสามารถใช้สิ่งต่อไปนี้เป็นอนุกรมวิธานเพื่อจัดประเภทเอกสาร:

  • ค่าเริ่มต้น
  • iab2
  • เอกสาร
  • ความรู้สึก
  • ความรู้สึก3

คุณสามารถอ่านเพิ่มเติมเกี่ยวกับการจำแนกพารามิเตอร์คำขอได้ในส่วน “จัดประเภทพารามิเตอร์คำขอ

จัดประเภทข้อความดิบโดยใช้ REST API ใน C#

คุณสามารถจัดประเภทข้อความดิบโดยทางโปรแกรมโดยทำตามขั้นตอนด้านล่าง

  • สร้างอินสแตนซ์ของ ClassificationApi
  • สร้างตัวอย่าง BaseRequest
  • ระบุข้อความดิบในคำอธิบาย BaseRequest
  • สร้าง ClassifyRequest ด้วย BaseRequest
  • ตั้งค่า BaseClassesCount
  • รับ ClassificationResponse โดยเรียกเมธอด ClassificationApi.Classify()

ตัวอย่างโค้ดต่อไปนี้แสดงวิธีจำแนกข้อความดิบโดยใช้ REST API

// การเริ่มต้น API
var apiInstance = new ClassificationApi(configuration);

// สร้างคำขอพื้นฐาน
BaseRequest baseRequest = new BaseRequest();
baseRequest.Description = "We support some of the most popular file formats in business, "
    + "including Microsoft Word documents, Excel spreadsheets, PowerPoint presentations, "
    + "Outlook emails and archives, Visio diagrams, Project files, and Adobe Acrobat PDF documents..";

// สร้างคำขอจัดประเภท
var request = new ClassifyRequest(baseRequest);
request.BestClassesCount = "3";

// รับผลการจำแนกประเภท
var response = apiInstance.Classify(request);
foreach (var r in response.BestResults)
{
    Console.WriteLine("ClassName: " + r.ClassName);
    Console.WriteLine("ClassProbability: " + r.ClassProbability);
    Console.WriteLine("--------------------------------");
}
ClassName: Hobbies_&_Interests
ClassProbability: 43.02
--------------------------------
ClassName: Business_and_Finance
ClassProbability: 26.64
--------------------------------
ClassName: Technology_&_Computing
ClassProbability: 18.25
--------------------------------

ลองออนไลน์

โปรดลองใช้เครื่องมือจัดหมวดหมู่ออนไลน์ฟรีต่อไปนี้ ซึ่งพัฒนาโดยใช้ API ข้างต้น https://products.groupdocs.app/การจัดหมวดหมู่[/](https:/ /products.groupdocs.app/splitter/pdf)

บทสรุป

ในบทความนี้ คุณได้เรียนรู้วิธีจัดประเภทเอกสาร Word และข้อความดิบบนคลาวด์โดยใช้ C# คุณยังได้เรียนรู้วิธีอัปโหลดไฟล์ DOCX บนคลาวด์โดยทางโปรแกรม คุณสามารถเรียนรู้เพิ่มเติมเกี่ยวกับ GroupDocs.Classification Cloud API โดยใช้ เอกสารประกอบ เรายังมีส่วน API Reference ที่ช่วยให้คุณแสดงภาพและโต้ตอบกับ API ของเราได้โดยตรงผ่านเบราว์เซอร์ ในกรณีที่มีความคลุมเครือ โปรดติดต่อเราได้ที่ ฟอรัม

ดูสิ่งนี้ด้วย