
开发 PDF 到 HTML 转换器,使用 Java REST API。
将 PDF 文档转换为 HTML 格式是网页开发、内容管理和提升可访问性的重要步骤。无论您是需要在线展示文档还是为基于网页的应用程序重新使用内容,通过 Java REST API 将 PDF 转换为 HTML 提供了一个简单而高效的解决方案。在本文中,我们将探讨使用 GroupDocs.Conversion Cloud SDK for Java 将 PDF 文件转换为 HTML 格式的逐步过程。
本文涵盖以下主题:
PDF转HTML转换的REST API
GroupDocs.Conversion Cloud SDK for Java 提供了一种强大且灵活的解决方案,用于高精准度地将 PDF 文档转换为 HTML 格式。该 API 保留了文档结构、图像和格式,同时允许自定义页面范围、输出结构和图像质量。
安装
要安装 GroupDocs.Conversion Cloud SDK for Java,请添加以下 Maven 依赖:
<repository>
<id>repository.groupdocs.cloud</id>
<name>repository.groupdocs.cloud</name>
<url>https://releases.groupdocs.cloud/java/repo/</url>
</repository>
<dependency>
<groupId>com.groupdocs</groupId>
<artifactId>groupdocs-conversion-cloud</artifactId>
<version>24.2.0</version>
</dependency>
确保您拥有有效的 API 凭证(客户端 ID 和客户端密钥)。按照此 tutorial 获取它们。
使用 Java 将 PDF 转换为 HTML
按照以下步骤在 Java 中自动转换 PDF 为 HTML:
- 初始化
Configuration
,使用 API 凭据:
Configuration configuration = new Configuration(clientId, clientSecret);
- 创建
ConvertApi
的实例:
ConvertApi convertApi = new ConvertApi(configuration);
- 将输入的 PDF 文件上传到云存储:
FileApi fileApi = new FileApi(configuration);
UploadFileRequest uploadRequest = new UploadFileRequest("marketing.pdf", new FileInputStream("marketing.pdf"), "internal");
fileApi.uploadFile(uploadRequest);
- 创建
ConvertSettings
类的实例,在其中定义输入 PDF 名称,输出格式为html
,以及结果文件的名称:
ConvertSettings settings = new ConvertSettings();
settings.setStorageName("internal");
settings.setFilePath("input.pdf");
settings.setFormat("html");
settings.setOutputPath("finalOutput.html");
- 使用
ConvertDocumentRequest
类执行 PDF 到 PPT 转换,在其中我们将ConvertSettings
对象作为参数传递:
ConvertDocumentRequest request = new ConvertDocumentRequest(settings);
convertApi.convertDocument(request);
// 更多示例请查看 [https://github.com/groupdocs-conversion-cloud/groupdocs-conversion-cloud-dotnet](https://github.com/groupdocs-conversion-cloud/groupdocs-conversion-cloud-dotnet)
// 获取您的 API 凭据
string clientId = "XXXXXX-XXXXXXXXX-4088-9ca0-55c38f4b7f22";
string clientSecret1 = "XXXXXXXXXXXXXXXXXXXX";
// 创建 Configuration 类的实例,并用 Client ID 和 Client Secret 进行初始化。
Configuration configuration = new Configuration(clientId, clientSecret);
// 定义用于PDF转HTML文件转换操作的API基础URL
configuration.setApiBaseUrl("https://api.groupdocs.cloud");
// 使用 Configuration 对象初始化 ConvertApi 的实例
ConvertApi convertApi = new ConvertApi(configuration);
ConvertSettings settings = new ConvertSettings();
settings.setStorageName("internal");
settings.setFilePath("input.pdf");
settings.setFormat("html");
settings.setOutputPath("myResultant.html");
// 调用 ConvertDocument API 进行 PDF 到 HTML 的转换
ConvertDocumentRequest request = new ConvertDocumentRequest(settings);
List<StoredConvertedResult> response = convertApi.convertDocument(request);
// 检查响应并打印成功消息
if (response != null && response.equals("OK")) {
System.out.println("The PDF to HTML file conversion completed successfully!");
}
图像:- PDF 转 HTML 转换的预览。
下载上面示例中使用的样本 PDF 文件 input.pdf。
使用 cURL 命令将 PDF 转换为网页
对于命令行用户,GroupDocs.Conversion Cloud API 允许通过 cURL 命令进行 PDF 到 HTML 的转换,使自动化变得无缝。
- 使用您的凭据生成 JWT 访问令牌。
- Run the following cURL command:
curl -v "https://api.groupdocs.cloud/v2.0/conversion" \
-X POST \
-H "accept: application/json" \
-H "authorization: Bearer {accessToken}" \
-H "Content-Type: application/json" \
-d "{ \"StorageName\": \"default\", \"FilePath\": \"{sourcePDF}\", \"Format\": \"html\", \"OutputPath\": \"{finalOutput}\"}"
将 sourceFile、resultantFile 和 accessToken 替换为实际值。
- 如果您需要将生成的 HTML 文件保存在本地驱动器上,请执行以下 cURL 命令:
curl -v "https://api.groupdocs.cloud/v2.0/conversion" \
-X POST \
-H "accept: application/json" \
-H "authorization: Bearer {accessToken}" \
-H "Content-Type: application/json" \
-d "{ \"StorageName\": \"default\", \"FilePath\": \"{sourceFile}\", \"Format\": \"html\"}" \
-o "myFinaloutput.html"
尝试我们的免费 PDF 转 HTML 转换器
使用我们的 PDF to HTML Converter 进行快速高效的在线转换体验。
有用的链接
结论
无论是使用 GroupDocs.Conversion Cloud SDK for Java 还是 cURL 命令,这两种方法都提供了一种快速、准确和灵活的方式将 PDF 转换为 HTML。借助基于云的处理、高度定制和开发者友好的 API,GroupDocs.Conversion Cloud 简化了文档转换。今天就试试我们的 Java SDK,实现无缝的 PDF 到 HTML 自动化!
推荐文章
我们强烈建议您浏览以下文章: