将 PDF 文档转换为 HTML 格式是非常重要的,尤其是当我们需要在线展示内容时,这样可以提高可访问性,并在 Web 应用程序中方便地重用内容。在本文中,您将学习如何使用 GroupDocs.Conversion Cloud SDK for .NET 将 PDF 转换为 HTML,同时保留文档布局、图像和格式。
本文涵盖以下主题:
PDF 转 HTML 转换 API
GroupDocs.Conversion Cloud SDK for .NET 提供了一个强大的 API,可以高精度地将 PDF 文档转换为 HTML。它允许您自定义输出的 HTML,定义页面范围,并控制图像质量,非常适合在您的 .NET 应用程序中集成文档到网页的工作流程。
安装
通过 NuGet 包管理器安装 SDK:
Install-Package GroupDocs.Conversion-Cloud -Version 24.2.0
或使用 .NET CLI:
dotnet add package GroupDocs.Conversion-Cloud --version 24.2.0
现在,您需要从 Aspose Cloud Dashboard 获取您的个性化客户端 ID 和客户端密钥,以验证 API 请求。
将 PDF 转换为 HTML 在 C# (.NET) 中
以下是将 PDF 转换为 HTML 的 C# 示例的逐步说明:
- 配置 API 凭据:
var config = new Configuration
{
ClientId = "YOUR_CLIENT_ID",
ClientSecret = "YOUR_CLIENT_SECRET"
};
var convertApi = new ConvertApi(config);
var fileApi = new FileApi(config);
- 将 PDF 文件上传到云存储:
using (var fileStream = File.OpenRead("sample.pdf"))
{
var uploadRequest = new UploadFileRequest("sample.pdf", fileStream);
fileApi.UploadFile(uploadRequest);
}
- 设置转换设置:
var settings = new ConvertSettings
{
FilePath = "sample.pdf",
Format = "html",
OutputPath = "converted/resultant.html"
};
- 执行 PDF 到 HTML 转换:
var request = new ConvertDocumentRequest(settings);
convertApi.ConvertDocument(request);
using System;
using GroupDocs.Conversion.Cloud.Sdk.Api;
using GroupDocs.Conversion.Cloud.Sdk.Client;
using GroupDocs.Conversion.Cloud.Sdk.Model.Requests;
using System.IO;
using GroupDocs.Conversion.Cloud.Sdk.Model;
namespace GroupDocs.Conversion.CSharp
{
// 执行 PDF 到 HTML 转换
class PDFConversion
{
static void Main(string[] args)
{
try
{
// 获取您的 API 凭据
string clientId = "xxxxxxx-xxxx-xxxx-xxxx-xxxxxxxxxxxx";
string clientSecret = "xxxxxxxxxxxxxxxxxxxxxxxxxxxxxx";
string myStorage = "test";
// 用客户端密钥和客户端ID实例化配置类的一个实例。
var configuration = new Configuration(clientId, clientSecret);
// 定义 ApiBaseUrl 的值以设置 API 的基础 URL。
configuration.ApiBaseUrl = "https://api.groupdocs.cloud";
// 初始化一个 ConvertApi 类的对象,同时传入 Configuration 类的对象。
var apiInstance = new ConvertApi(configuration);
// 创建 ConvertSettings 类的实例。
var settings = new ConvertSettings
{
FilePath = "sample.pdf",
Format = "html",
OutputPath = "converted/resultant.html"
};
// 调用API以触发PDF到网页的转换。
var response = apiInstance.ConvertDocument(new ConvertDocumentRequest(settings));
Console.WriteLine("Successfully converted the PDF file to HTML format in C#: " + response[0].Url);
}
catch (Exception e)
{
Console.WriteLine("Exception when calling GroupDocs Api: " + e.Message);
}
}
}
}

图像:- PDF 转 HTML 的预览。
- 在上述示例中使用的示例 PDF 可以从 input.pdf 下载。
使用 cURL 将 PDF 转换为网页
您还可以使用 GroupDocs.Conversion Cloud REST API 结合 cURL 进行快速命令行转换。
- 生成带有您的凭据的 JWT 访问令牌。
- Run the following cURL command:
curl -v "https://api.groupdocs.cloud/v2.0/conversion" \
-X POST \
-H "accept: application/json" \
-H "authorization: Bearer {accessToken}" \
-H "Content-Type: application/json" \
-d "{ \"StorageName\": \"default\", \"FilePath\": \"{sourcePDF}\", \"Format\": \"html\", \"OutputPath\": \"{resultantFile}\"}"
- 执行以下命令将 HTML 保存到本地驱动器:
curl -v "https://api.groupdocs.cloud/v2.0/conversion" \
-X POST \
-H "accept: application/json" \
-H "authorization: Bearer {accessToken}" \
-H "Content-Type: application/json" \
-d "{ \"StorageName\": \"default\", \"FilePath\": \"{sourceFile}\", \"Format\": \"html\"}" \
-o "{resultantFile}"
- 替换:
sourceFile
,resultantFile
和accessToken
为实际值。
尝试我们的免费 PDF 转 HTML 转换器
试试我们的免费 PDF to HTML Converter 应用程序,看看转换质量,然后再将其集成到您的应用程序中。

有用的链接
结论
使用 GroupDocs.Conversion Cloud SDK for .NET,您可以轻松地将 PDF 转换为 HTML 集成到您的 .NET 项目中,实现高质量、兼容网页的输出,同时保持格式。无论您是在 C# 中使用 SDK 还是通过 cURL 直接进行 REST API 调用,过程都很简单且高度可定制。
推荐文章
我们强烈推荐阅读以下文章: