企业处理大量非结构化文本 — PDF,报告,Word 文档,以及 HTML 文件。手动提取关键点既耗时又低效。我们基于 REST 的 AI 提供摘要功能,帮助将长内容压缩成简短、有意义的摘要。

该指南解释了如何将 API 集成到您的 .NET 应用程序中,并总结文档。


为什么文档摘要?

摘要帮助您快速理解重要信息,而无需阅读全文。

你可以用它来:

  • 决策
  • 知识提取
  • 电子邮件和报告摘要
  • AI 训练管道
  • 文档管理工作流程

文档摘要 API

GroupDocs.Rewriter Cloud SDK 使文档摘要的简单和可扩展性成为可能,采用基于 REST 的方法。

关键特性

  • Summarize full documents
  • 提取重要洞察
  • 选择摘要详细级别
  • 支持多种语言
  • 与 .NET 应用程序的简单集成

借助我们的 .NET Cloud SDK,您可以自动总结包括 PDFDOC / DOCXHTMLMarkdownTXTRTF 文件在内的热门文件格式。


通过 NuGet 安装

dotnet add package GroupDocs.Rewriter-Cloud --version 25.7.0

总结文本使用 C#

以下是展示如何通过 GroupDocs.Rewriter Cloud API 对 Word 文档进行摘要的示例。

步骤 1 — 初始化 API

var config = new Configuration("YOUR_CLIENT_ID", "YOUR_CLIENT_SECRET");
var rewriterApi = new TextApi(config);
var fileApi = new FileApi(config);

步骤 2 — 上传文档

var uploadRequest = new UploadFileRequest("input/document.docx", File.OpenRead("document.docx"));
fileApi.UploadFile(uploadRequest);

步骤 3 — 总结内容

var fileInfo = new FileInfo { FilePath = "input/document.docx" };

var request = new SummarizeRequest(
    new SummarizeOptions
    {
        FileInfo = fileInfo,
        SummaryType = "Short",
        Language = "en"
    }
);

var response = rewriterApi.Summarize(request);
Console.WriteLine(response.SummaryText);

步骤 4 — 保存摘要输出

File.WriteAllText("summary-output.txt", response.SummaryText);

// 对于更多示例,请访问 https://github.com/groupdocs-rewriter-cloud/groupdocs-rewriter-cloud-dotnet/tree/main/GroupDocs.Rewriter.Cloud.SDK.Net.Demo

Configuration conf = new Configuration();
conf.ClientId = "XXXXXX-XXXXXX";
conf.ClientSecret = "XXXXXXXXXX";
            
// 请求参数用于重写
string name = "test.docx";
string folder = "";
string language = "en";
string format = "docx";
string storage = ""; //add storage name of your app

// 本地路径用于上传和下载文件
string uploadPath = name;
string downloadPath = saveFile;

RewriterApi api = new RewriterApi(conf);
FileApi fileApi = new FileApi(conf);

Stream stream = File.Open(uploadPath, FileMode.Open);

UploadFileRequest uploadRequest = new UploadFileRequest { File = stream, path = name, storageName = storage };
FilesUploadResult uploadResult = fileApi.UploadFile(uploadRequest);
Console.WriteLine("Files uploaded: " + uploadResult.Uploaded.Count);

var request = new SummarizeRequest(
    new SummarizeOptions
    {
        FileInfo = fileInfo,
        SummaryType = "Short",
        Language = language
    }
);

var response = rewriterApi.Summarize(request);
Console.WriteLine(response.Message);

// 将文档摘要保存为文本文件格式
File.WriteAllText("summary-output.txt", response.SummaryText);

Console.WriteLine("Summarized file saved");

通过 cURL 总结文档

除了 C# 代码片段,您还可以通过调用 GroupDocs.Rewriter Cloud API 的 cURL 命令来总结文档。当您更喜欢命令行方法或需要批处理时,这种方法非常有用。

1. 生成访问令牌:

这种方法的前提是根据客户端凭证生成一个 JWT 访问令牌。

curl -v -X POST "https://api.groupdocs.cloud/connect/token" \
-d "grant_type=client_credentials&client_id=YOUR_CLIENT_ID&client_secret=YOUR_CLIENT_SECRET" \
-H "Content-Type: application/x-www-form-urlencoded"

2. 调用摘要 API:

现在调用API来总结Word文档,并将输出作为摘录返回。

curl -v -X POST "https://api.groupdocs.cloud/v1.0/rewriter/summarize" \
-H "authorization: Bearer {ACCESS_TOKEN}" \
-H "Content-Type: application/json" \
-d "{ "FileInfo": { "FilePath": "input/document.docx" }, "SummaryType": "Short", "Language": "en" }"

尝试 免费在线摘要生成器

如果您想在没有编码或 cURL 命令的方法下体验 Cloud API 的功能,您可以考虑尝试我们基于 GroupDocs.Rewriter Cloud API 开发的 Online Document Summarization 网络应用程序。

extract html text

结论

在本指南中,您学习了如何使用 GroupDocs.Rewriter Cloud SDK for .NET 来总结文档内容。该 API 提供了一个可扩展的、基于 AI 的摘要引擎,能够将长文档处理成适合快速阅读和分析的简明摘要。

无论您是需要用于企业自动化、研究还是内容管道的摘要——此 API 提供了一个现成的解决方案。


相关文章