Doanh nghiệp xử lý khối lượng lớn văn bản không có cấu trúc — PDF, báo cáo, tài liệu Word, và HTML files. Việc trích xuất các điểm chính một cách thủ công mất nhiều thời gian và kém hiệu quả. AI dựa trên REST của chúng tôi cung cấp khả năng tóm tắt và giúp làm ngắn nội dung dài thành các tóm tắt ngắn gọn và có ý nghĩa.

Hướng dẫn này giải thích cách tích hợp API vào các ứng dụng .NET của bạn và tóm tắt các tài liệu.


Tại sao Tóm tắt Tài liệu?

Tóm tắt giúp bạn nhanh chóng hiểu thông tin quan trọng mà không cần đọc toàn bộ tài liệu.

Bạn có thể sử dụng nó cho:

  • Quyết định
  • Trích xuất tri thức
  • Email và tóm tắt báo cáo
  • Các đường ống huấn luyện AI
  • Quy trình quản lý tài liệu

Document Summarization API

GroupDocs.Rewriter Cloud SDK cho phép tóm tắt tài liệu đơn giản và quy mô với phương pháp dựa trên REST.

Các tính năng chính

  • Summarize full documents
  • Trích xuất những thông tin cơ bản
  • Chọn mức độ chi tiết tóm tắt
  • Hỗ trợ nhiều ngôn ngữ
  • Dễ dàng tích hợp với các ứng dụng .NET

Với sự trợ giúp của .NET Cloud SDK của chúng tôi, bạn có thể tự động tóm tắt các định dạng tệp phổ biến bao gồm PDF, DOC / DOCX, HTML, Markdown, TXTRTF files.


Cài đặt qua NuGet

dotnet add package GroupDocs.Rewriter-Cloud --version 25.7.0

Tóm tắt văn bản bằng C#

Dưới đây là ví dụ trình bày cách tóm tắt một tài liệu Word thông qua GroupDocs.Rewriter Cloud API.

Bước 1 — Khởi tạo API

var config = new Configuration("YOUR_CLIENT_ID", "YOUR_CLIENT_SECRET");
var rewriterApi = new TextApi(config);
var fileApi = new FileApi(config);

Bước 2 — Tải Tài Liệu Lên

var uploadRequest = new UploadFileRequest("input/document.docx", File.OpenRead("document.docx"));
fileApi.UploadFile(uploadRequest);

Bước 3 — Tóm tắt nội dung

var fileInfo = new FileInfo { FilePath = "input/document.docx" };

var request = new SummarizeRequest(
    new SummarizeOptions
    {
        FileInfo = fileInfo,
        SummaryType = "Short",
        Language = "en"
    }
);

var response = rewriterApi.Summarize(request);
Console.WriteLine(response.SummaryText);

Bước 4 — Lưu đầu ra tóm tắt

File.WriteAllText("summary-output.txt", response.SummaryText);

// Để xem thêm ví dụ, vui lòng truy cập https://github.com/groupdocs-rewriter-cloud/groupdocs-rewriter-cloud-dotnet/tree/main/GroupDocs.Rewriter.Cloud.SDK.Net.Demo

Configuration conf = new Configuration();
conf.ClientId = "XXXXXX-XXXXXX";
conf.ClientSecret = "XXXXXXXXXX";
            
// request parameters for rewriting
string name = "test.docx";
string folder = "";
string language = "en";
string format = "docx";
string storage = ""; //add storage name of your app

// các đường dẫn cục bộ để tải lên và tải xuống tệp
string uploadPath = name;
string downloadPath = saveFile;

RewriterApi api = new RewriterApi(conf);
FileApi fileApi = new FileApi(conf);

Stream stream = File.Open(uploadPath, FileMode.Open);

UploadFileRequest uploadRequest = new UploadFileRequest { File = stream, path = name, storageName = storage };
FilesUploadResult uploadResult = fileApi.UploadFile(uploadRequest);
Console.WriteLine("Files uploaded: " + uploadResult.Uploaded.Count);

var request = new SummarizeRequest(
    new SummarizeOptions
    {
        FileInfo = fileInfo,
        SummaryType = "Short",
        Language = language
    }
);

var response = rewriterApi.Summarize(request);
Console.WriteLine(response.Message);

// lưu tóm tắt tài liệu dưới định dạng tệp văn bản
File.WriteAllText("summary-output.txt", response.SummaryText);

Console.WriteLine("Summarized file saved");

Tóm tắt tài liệu qua cURL

Ngoài đoạn mã C#, bạn cũng có thể tóm tắt tài liệu bằng cách gọi GroupDocs.Rewriter Cloud API thông qua các lệnh cURL. Cách tiếp cận này rất hữu ích khi bạn thích phương pháp dòng lệnh hoặc yêu cầu xử lý theo lô.

1. Tạo Mã Truy Cập:

Điều kiện tiên quyết cho cách tiếp cận này là tạo một mã thông báo truy cập JWT dựa trên thông tin xác thực của khách hàng.

curl -v -X POST "https://api.groupdocs.cloud/connect/token" \
-d "grant_type=client_credentials&client_id=YOUR_CLIENT_ID&client_secret=YOUR_CLIENT_SECRET" \
-H "Content-Type: application/x-www-form-urlencoded"

2. Gọi API Tóm tắt cuộc gọi:

Bây giờ gọi API để tóm tắt tài liệu Word và trả về đầu ra dưới dạng đoạn trích.

curl -v -X POST "https://api.groupdocs.cloud/v1.0/rewriter/summarize" \
-H "authorization: Bearer {ACCESS_TOKEN}" \
-H "Content-Type: application/json" \
-d "{ "FileInfo": { "FilePath": "input/document.docx" }, "SummaryType": "Short", "Language": "en" }"

Thử Bộ Tóm Tắt Trực Tuyến Miễn Phí

Nếu bạn muốn trải nghiệm khả năng của Cloud API mà không cần lập trình hoặc sử dụng lệnh cURL, bạn có thể xem xét việc thử ứng dụng web Online Document Summarization được phát triển dựa trên GroupDocs.Rewriter Cloud API.

extract html text

Kết luận

Trong hướng dẫn này, bạn đã học cách tóm tắt nội dung tài liệu bằng cách sử dụng GroupDocs.Rewriter Cloud SDK cho .NET. API cung cấp một công cụ tóm tắt có khả năng mở rộng, được hỗ trợ bởi trí tuệ nhân tạo, có khả năng xử lý các tài liệu dài thành các tóm tắt ngắn gọn phù hợp cho việc đọc nhanh và phân tích.

Dù bạn cần tóm tắt cho tự động hóa doanh nghiệp, nghiên cứu hay quy trình nội dung—API này cung cấp một giải pháp sẵn sàng sử dụng.


Các Bài Viết Liên Quan