PDF 文档转换为 HTML 格式是非常重要的,尤其是当我们需要在线展示内容时,这样可以提高可访问性,并在 Web 应用程序中方便地重用内容。在本文中,您将学习如何使用 GroupDocs.Conversion Cloud SDK for .NET 将 PDF 转换为 HTML,同时保留文档布局、图像和格式。

本文涵盖以下主题:

PDF 转 HTML 转换 API

GroupDocs.Conversion Cloud SDK for .NET 提供了一个强大的 API,可以高精度地将 PDF 文档转换为 HTML。它允许您自定义输出的 HTML,定义页面范围,并控制图像质量,非常适合在您的 .NET 应用程序中集成文档到网页的工作流程。

安装

通过 NuGet 包管理器安装 SDK:

Install-Package GroupDocs.Conversion-Cloud -Version 24.2.0

或使用 .NET CLI:

dotnet add package GroupDocs.Conversion-Cloud --version 24.2.0

现在,您需要从 Aspose Cloud Dashboard 获取您的个性化客户端 ID 和客户端密钥,以验证 API 请求。

将 PDF 转换为 HTML 在 C# (.NET) 中

以下是将 PDF 转换为 HTML 的 C# 示例的逐步说明:

  1. 配置 API 凭据:
var config = new Configuration
{
    ClientId = "YOUR_CLIENT_ID",
    ClientSecret = "YOUR_CLIENT_SECRET"
};

var convertApi = new ConvertApi(config);
var fileApi = new FileApi(config);
  1. 将 PDF 文件上传到云存储:
using (var fileStream = File.OpenRead("sample.pdf"))
{
    var uploadRequest = new UploadFileRequest("sample.pdf", fileStream);
    fileApi.UploadFile(uploadRequest);
}
  1. 设置转换设置:
var settings = new ConvertSettings
{
    FilePath = "sample.pdf",
    Format = "html",
    OutputPath = "converted/resultant.html"
};
  1. 执行 PDF 到 HTML 转换:
var request = new ConvertDocumentRequest(settings);
convertApi.ConvertDocument(request);
using System;
using GroupDocs.Conversion.Cloud.Sdk.Api;
using GroupDocs.Conversion.Cloud.Sdk.Client;
using GroupDocs.Conversion.Cloud.Sdk.Model.Requests;
using System.IO;
using GroupDocs.Conversion.Cloud.Sdk.Model;

namespace GroupDocs.Conversion.CSharp
{
    // 执行 PDF 到 HTML 转换
    class PDFConversion

    {
        static void Main(string[] args)
        {

            try
            {
                // 获取您的 API 凭据 
                string clientId = "xxxxxxx-xxxx-xxxx-xxxx-xxxxxxxxxxxx";
                string clientSecret = "xxxxxxxxxxxxxxxxxxxxxxxxxxxxxx";
                string myStorage = "test";

                // 用客户端密钥和客户端ID实例化配置类的一个实例。 
                var configuration = new Configuration(clientId, clientSecret);
                // 定义 ApiBaseUrl 的值以设置 API 的基础 URL。
                configuration.ApiBaseUrl = "https://api.groupdocs.cloud";

                // 初始化一个 ConvertApi 类的对象,同时传入 Configuration 类的对象。
                var apiInstance = new ConvertApi(configuration);
                // 创建 ConvertSettings 类的实例。
                var settings = new ConvertSettings
                {
                    FilePath = "sample.pdf",
                    Format = "html",
                    OutputPath = "converted/resultant.html"
                };

                // 调用API以触发PDF到网页的转换。
                var response = apiInstance.ConvertDocument(new ConvertDocumentRequest(settings));
                Console.WriteLine("Successfully converted the PDF file to HTML format in C#: " + response[0].Url);
            }
            catch (Exception e)
            {
                Console.WriteLine("Exception when calling GroupDocs Api: " + e.Message);
            }

        }
    }
}
免费将 PDF 转换为 HTML 在线

图像:- PDF 转 HTML 的预览。

  • 在上述示例中使用的示例 PDF 可以从 input.pdf 下载。

使用 cURL 将 PDF 转换为网页

您还可以使用 GroupDocs.Conversion Cloud REST API 结合 cURL 进行快速命令行转换。

  • 生成带有您的凭据的 JWT 访问令牌。
  • Run the following cURL command:
curl -v "https://api.groupdocs.cloud/v2.0/conversion" \
-X POST \
-H "accept: application/json" \
-H "authorization: Bearer {accessToken}" \
-H "Content-Type: application/json" \
-d "{  \"StorageName\": \"default\",  \"FilePath\": \"{sourcePDF}\",  \"Format\": \"html\",  \"OutputPath\": \"{resultantFile}\"}"
  • 执行以下命令将 HTML 保存到本地驱动器:
curl -v "https://api.groupdocs.cloud/v2.0/conversion" \
-X POST \
-H "accept: application/json" \
-H "authorization: Bearer {accessToken}" \
-H "Content-Type: application/json" \
-d "{  \"StorageName\": \"default\",  \"FilePath\": \"{sourceFile}\",  \"Format\": \"html\"}" \
-o "{resultantFile}"
  • 替换: sourceFileresultantFileaccessToken 为实际值。

尝试我们的免费 PDF 转 HTML 转换器

试试我们的免费 PDF to HTML Converter 应用程序,看看转换质量,然后再将其集成到您的应用程序中。

免费的 PDF 转 HTML 在线转换器

有用的链接

结论

使用 GroupDocs.Conversion Cloud SDK for .NET,您可以轻松地将 PDF 转换为 HTML 集成到您的 .NET 项目中,实现高质量、兼容网页的输出,同时保持格式。无论您是在 C# 中使用 SDK 还是通过 cURL 直接进行 REST API 调用,过程都很简单且高度可定制。

推荐文章

我们强烈推荐阅读以下文章: