
如何使用 Node.js API 将 PDF 转换为 HTML。
将文档转换为是网络展示文件、改善可访问性和将文档整合到数字工作流程中的重要环节。在本文中,您将学习如何使用 GroupDocs.Conversion Cloud SDK 将 PDF 转换为 HTML,这是一个强大的 REST API,可以简化文档转换。
我们将在本文中涵盖以下主题:
🌐 PDF to HTML Conversion API for Node.js
GroupDocs.Conversion Cloud SDK for Node.js 提供了一种可靠且准确的方式将 PDF 文件转换为 HTML 格式,同时保留布局、字体、图像和结构。您还可以自定义输出设置,如图像质量和页面范围。
📦 安装
使用 npm 安装 SDK::
npm install groupdocs-conversion-cloud --save
确保您拥有来自 GroupDocs Cloud Dashboard 的客户端 ID 和客户端密钥。有关更多详细信息,您可以考虑访问此 tutorial。
🚀 在 Node.js 中将 PDF 转换为 HTML
以下是使用 Node.js 将 PDF 文档转换为 HTML 的逐步指南:
📌 步骤 1:导入 SDK 并配置 API:
const { Configuration, ConvertApi, FileApi, UploadFileRequest, ConvertSettings, ConvertDocumentRequest } = require("groupdocs-conversion-cloud");
const config = new Configuration("YOUR_CLIENT_ID", "YOUR_CLIENT_SECRET");
const convertApi = new ConvertApi(config);
const fileApi = new FileApi(config);
📌 Step 2: 将 PDF 文件上传到云存储:
const fs = require("fs");
const uploadRequest = new UploadFileRequest("input.json", fs.createReadStream("input.pdf"));
await fileApi.uploadFile(uploadRequest);
📌 第 3 步:设置 PDF 转 HTML 的转换选项:
const settings = new ConvertSettings();
settings.filePath = "input.pdf";
settings.format = "html";
settings.outputPath = "converted/output.html";
const request = new ConvertDocumentRequest(settings);
await convertApi.convertDocument(request);
console.log("✅ JSON converted to HTML successfully.");
// 更多示例请查看 [https://github.com/groupdocs-conversion-cloud/groupdocs-conversion-cloud-dotnet](https://github.com/groupdocs-conversion-cloud/groupdocs-conversion-cloud-dotnet)
// 获取您的 API 凭证
string clientId = "XXXXXX-XXXXXXXXX-4088-9ca0-55c38f4b7f22";
string clientSecret1 = "XXXXXXXXXXXXXXXXXXXX";
// 创建 Configuration 类的实例,并使用 Client ID 和 Client Secret 初始化它。
Configuration configuration = new Configuration(clientId, clientSecret);
// 定义用于在线执行 PDF 转 HTML 转换的 API 基础 URL
configuration.setApiBaseUrl("https://api.groupdocs.cloud");
// 使用 Configuration 对象初始化 ConvertApi 的实例
ConvertApi convertApi = new ConvertApi(configuration);
ConvertSettings settings = new ConvertSettings();
settings.setStorageName("internal");
settings.setFilePath("input.pdf");
settings.setFormat("HTML");
settings.setOutputPath("myResultant.html");
// 使用 ConvertDocument 方法将 PDF 文件转换为 HTML 网页
ConvertDocumentRequest request = new ConvertDocumentRequest(settings);
List<StoredConvertedResult> response = convertApi.convertDocument(request);
// 检查响应并打印成功消息
if (response != null && response.equals("OK")) {
System.out.println("The PDF to HTML conversion completed successfuly! Resultant HTML file is saved at: " + response.getFilePath());
}
图像:- PDF 转 HTML 转换的预览。
下载上述示例中使用的样本 PDF 文件,来自 input.pdf。
💻 通过 cURL 在线将 PDF 转换为 HTML
您还可以使用 cURL 和 GroupDocs.Conversion Cloud API 端点在线将 PDF 转换为 HTML:
- 生成您的 JWT 访问令牌。
- 使用以下 cURL 命令:
curl -v "https://api.groupdocs.cloud/v2.0/conversion" \
-X POST \
-H "accept: application/json" \
-H "authorization: Bearer {accessToken}" \
-H "Content-Type: application/json" \
-d "{ \"StorageName\": \"default\", \"FilePath\": \"{sourcePDF}\", \"Format\": \"html\", \"OutputPath\": \"{finalOutput}\"}"
替换 sourceFile、resultantFile 和 accessToken 为实际值。
- 要在本地驱动器上保存 HTML,请执行以下 cURL 命令:
curl -v "https://api.groupdocs.cloud/v2.0/conversion" \
-X POST \
-H "accept: application/json" \
-H "authorization: Bearer {accessToken}" \
-H "Content-Type: application/json" \
-d "{ \"StorageName\": \"default\", \"FilePath\": \"{sourceFile}\", \"Format\": \"html\"}" \
-o "myOutput.html"
🧪 尝试免费的 PDF 转 HTML 在线转换器
使用我们的 PDF to HTML Converter 进行快速高效的在线转换体验。
✅ 结论
通过使用 GroupDocs.Conversion Cloud SDK for Node.js 或其 REST API 端点,将 PDF 转换为 HTML 变得简单、准确且可扩展。该 API 保留了结构并支持多种输出选项,非常适合构建基于 Web 的文档查看器或编辑器的开发人员。
🔗 有用的链接
📚 相关的文章
我们强烈推荐探索以下文章: