如何使用 REST API 在 Java 中将 PDF 文件转换为 HTML 文档

使用 REST API 在 Java 中将 PDF 转换为 HTML

作为 Java 开发人员,您可以使用 GroupDocs.Conversion REST API 以编程方式将 PDF(便携式文档格式)文档转换为 HTML(超文本标记语言)网页。在某些情况下,您可能需要将 PDF 转换为 HTML 文件。例如,您需要在社交网络上共享 PDF 文档或在网络上在线发布 PDF 内容。在 HTML 中,您可以使用表单、链接和其他交互元素,它使文档更具交互性。因此,在本文中,我将演示如何使用 REST API 在 Java 中将 PDF 转换为 HTML。

本教程应涵盖以下主题:

Java PDF to HTML Converter REST API - Java SDK 安装

为了将 PDF 文件转换为 HTML 格式,我将使用 GroupDocs.Conversion Cloud API 的 Java SDK。它可以帮助您包含 GroupDocs。快速轻松地在您的 Java 应用程序中转换云服务。这是最好的 PDF 到 HTML 转换器 API,它保留了文档的原始文本格式和布局。 Groupdocs 转换 API 还允许您将任何支持的文件格式 的文件和图像转换为您需要的任何格式。您可以轻松地在 Word、PDF、PowerPoint, Excel、HTML、CAD、光栅图像等 50 多种文档和图像之间进行转换。

您可以下载 API 的 JAR 文件或使用 Maven 配置进行安装。将存储库和依赖项添加到项目的 POM.xml。以下是 Maven 的说明:

Maven 存储库:

<repository>
    <id>groupdocs-artifact-repository</id>
    <name>GroupDocs Artifact Repository</name>
    <url>https://repository.groupdocs.cloud/repo</url>
</repository>

Maven 依赖项:

 <dependency>
    <groupId>com.groupdocs</groupId
    <artifactId>groupdocs-conversion-cloud</artifactId>
    <version>23.4</version>
    <scope>compile</scope>
</dependency>

在开始执行这些步骤和可用的代码示例之前,请从 仪表板 获取您的 客户端 ID 和客户端密码。获得 ID 和密码后,请输入下面显示的代码:

# 免费注册后,从 https://dashboard.groupdocs.cloud 获取您的 client_id 和 client_secret。

String ClientId = "xxxxxxx-xxxx-xxxx-xxxx-xxxxxxxxxxxx";
String ClientSecret = "xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx";
String MyStorage = "test-internal-storage";
Configuration configuration = new Configuration(ClientId, ClientSecret);

使用 REST API 在 Java 中将 PDF 文件转换为 HTML 文档

将 PDF 文档转换为 HTML 网页可以使内容更易于访问、搜索、兼容、编辑和共享。以下是将 PDF 文档转换为 HTML 的步骤,如下所述:

上传文件

首先,使用下面给出的代码片段将 PDF 文档上传到云存储:

package com.groupdocsdev.classes;

import com.groupdocs.cloud.conversion.api.*;
import com.groupdocs.cloud.conversion.model.*;
import com.groupdocs.cloud.conversion.model.requests.*;
import com.groupdocs.cloud.conversion.client.Configuration;
import com.groupdocs.cloud.conversion.client.ApiException;

import java.io.File;

// 使用 Java 上传文件到云存储
public class App {

	public static void main(String[] args) {
				
		// 创建转换 API 的实例					
		FileApi apiInstance = new FileApi(configuration);
		try {
			File fileStream = new File("H:\\groupdocs-cloud-data\\input-sample-file.pdf");
			UploadFileRequest request = new UploadFileRequest("java-testing\\input-sample-file.pdf", fileStream, MyStorage);
			FilesUploadResult response = apiInstance.uploadFile(request);
			System.out.println("Expected response type is FilesUploadResult: " + response.getUploaded().size());
		} catch (ApiException e) {
			System.err.println("Exception while calling FileApi:");
			e.printStackTrace();
		}
		
	}
}

因此,上传的 PDF 文件将在云端仪表盘的 文件部分 中可用。

在 Java 中将 PDF 转换为 HTML

本节介绍如何按照以下步骤以编程方式将 PDF 文件转换为 HTML 页面而不丢失格式:

  • 首先,创建 ConvertApi 的实例
  • 其次,创建 ConvertSettings 的实例
  • 第三,提供云存储名称
  • 将输入 PDF 文件路径和输出文件格式设置为“html”
  • 现在,设置输出 HTML 文件路径
  • 使用 ConvertSettings 创建 ConvertDocumentRequest
  • 最后,用 ConvertDocumentRequest 调用 convertdocument() 方法

以下代码片段显示了如何使用 REST API 在线将 PDF 文件更改为 HTML 格式:

package com.groupdocsdev.classes;

import com.groupdocs.cloud.conversion.api.*;
import com.groupdocs.cloud.conversion.model.*;
import com.groupdocs.cloud.conversion.model.requests.*;
import com.groupdocs.cloud.conversion.client.Configuration;
import com.groupdocs.cloud.conversion.client.ApiException;
import java.util.List;

// 如何在 Java 中将 PDF 转换为 HTML 文件。
public class App {

	public static void main(String[] args) {
		
		// 创建转换 API 的实例
		ConvertApi apiInstance = new ConvertApi(configuration);
					
		try {
			 
			// 准备转换设置
			ConvertSettings settings = new ConvertSettings();
			settings.setStorageName(MyStorage);
			settings.setFilePath("java-testing/input-sample-file.pdf");
			settings.setFormat("html");
			
			settings.setOutputPath("java-testing/output-sample-file.html");
		
			// 转换为指定格式
			List<StoredConvertedResult> response = apiInstance.convertDocument(new ConvertDocumentRequest(settings));
			System.out.println("Document converted successfully: " + response);
			
		} catch (ApiException e) {
			System.err.println("Exception while calling Java API: ");
			e.printStackTrace();
		}
	}
}

下载转换后的文件

上面的代码示例会将转换后的 HTML 文件页面保存到云端。您可以使用以下代码片段下载它:

package com.groupdocsdev.classes;

import com.groupdocs.cloud.conversion.api.*;
import com.groupdocs.cloud.conversion.model.requests.*;
import com.groupdocs.cloud.conversion.client.Configuration;
import com.groupdocs.cloud.conversion.client.ApiException;

import java.io.File;

// 使用 Java 从云存储下载文件
public class App {

	public static void main(String[] args) {
				
		// 创建转换 API 的实例					
		FileApi apiInstance = new FileApi(configuration);
		try {
			DownloadFileRequest request = new DownloadFileRequest("java-testing\\output-sample-file.html", MyStorage, null);
			File response = apiInstance.downloadFile(request);
			System.err.println("Expected response type is File: " + response.length());
		} catch (ApiException e) {
			System.err.println("Exception while calling FileApi:");
			e.printStackTrace();
		}
		
	}
}

这就是 Java 中 PDF 到 HTML 转换器库的工作原理。在下一节中,让我们使用 Java API 探索更高级的转换设置。

使用高级选项在 Java 中将 PDF 转换为 HTML 页面

在本节中,您将学习如何使用一些高级选项以编程方式将 PDF 文件转换为 HTML 文档,方法是按照以下步骤和代码片段进行操作:

  • 首先,创建一个 ConvertApi 类的实例
  • 创建 ConvertSettings 类的实例
  • 接下来,提供云存储名称
  • 设置输入PDF文件路径和输出文件格式为“html”
  • 现在,创建 HtmlConvertOptions 类的一个实例
  • 设置各种转换选项,如 setFromPage、setPagesCount、setFixedLayout 等。
  • 然后,设置转换选项和输出文件路径
  • 接下来,使用 ConvertSettings 创建 ConvertDocumentRequest
  • 最后,使用带有 ConvertDocumentRequest 的 convertdocument() 方法执行转换

以下代码示例显示如何使用高级设置将 PDF 文件转换为 HTML 页面。

package com.groupdocsdev.classes;

import com.groupdocs.cloud.conversion.api.*;
import com.groupdocs.cloud.conversion.model.*;
import com.groupdocs.cloud.conversion.model.requests.*;
import com.groupdocs.cloud.conversion.client.Configuration;
import com.groupdocs.cloud.conversion.client.ApiException;
import java.util.List;

// Java 使用附加选项将 PDF 文件转换为 HTML 页面。
public class App {

	public static void main(String[] args) {
		
		// 创建转换 API 的实例
		ConvertApi apiInstance = new ConvertApi(configuration);
					
		try {
			 
			// 准备转换设置
			ConvertSettings settings = new ConvertSettings();
			settings.setStorageName(MyStorage);
			settings.setFilePath("java-testing/input-sample-file.pdf");
			settings.setFormat("html");
			
			HtmlConvertOptions convertOptions = new HtmlConvertOptions();
			convertOptions.setFromPage(1);
			convertOptions.setPagesCount(2);
			convertOptions.setFixedLayout(true);

			settings.setConvertOptions(convertOptions);
			settings.setOutputPath("java-testing/output-sample-file.html");
			
			// 转换为指定格式
			List<StoredConvertedResult> response = apiInstance.convertDocument(new ConvertDocumentRequest(settings));
			System.out.println("Document conveted successfully: " + response);
			
		} catch (ApiException e) {
			System.err.println("Exception while calling Java API: ");
			e.printStackTrace();
		}
	}
}

请按照前面提到的步骤上传和下载文件。

在线 PDF 到 HTML 转换器免费

如何免费在线将 PDF 转换为 HTML 文件?请尝试在线 PDF 到 HTML 转换器 以免费在线从 PDF 创建 HTML。它是使用上述 API 开发的,可以免费在线将 PDF 转换为 HTML。

结论

这使我们结束了本文。在本文中,我们了解到:

  • 如何以编程方式将 PDF 转换为 Java 中的 HTML 文档;
  • 如何使用 Java 中的一些高级设置将 PDF 文件转换为 HTML 文件;
  • 以编程方式将 PDF 文件上传到云端,然后从云端下载转换后的 HTML 文件;
  • 使用 PDF 到 HTML 转换器软件免费在线将 PDF 转换为 HTML;

此外,您可以使用 文档 了解有关 GroupDocs.Conversion 文件转换 API 的更多信息。我们还提供了一个 API 参考 部分,让您可以直接通过浏览器可视化我们的 API 并与之通信。 Java SDK 的完整源代码可在 Github 上免费获得。请查看 GroupDocs.Conversion Cloud SDK for Java 此处示例

最后,groupdocs.cloud 正在撰写有关使用 REST API 进行不同文件格式转换的新博客文章。因此,请保持联系以获取定期更新。

问一个问题

有关 PDF to HTML Converter API 的任何疑问/讨论,请随时通过免费支持 论坛 与我们联系。

常见问题

如何在 Java 中将 PDF 转换为 HTML?

请按照 此链接 学习 Java 代码片段,了解如何快速轻松地将 PDF 文件转换为 HTML 页面。

我可以使用 REST API 在 Java 中将 PDF 转换为 HTML 吗?

是的,您可以在 Java 中将 PDF 更改为 HTML。首先,创建一个 ConvertApi 的实例,设置转换设置的值,并使用 ConvertDocumentRequest 调用 convertDocument 方法将 PDF 转换为 HTML 网页。

如何免费在线将 PDF 转换为 HTML?

PDF 到 HTML 免费在线转换器 让您可以免费、快速、轻松地将 PDF 转换为 HTML。 PDF 到 HTML 的在线转换完成后,您可以立即将转换后的 HTML 文件下载到您的 PC 上。

如何在线将 PDF 转换为 HTML?

  • 打开免费的 PDF 到 HTML 在线转换器
  • 在文件放置区域内单击以上传 PDF 文件或拖放 PDF 文件。
  • 单击立即转换按钮,免费的在线 PDF 到 HTML 转换器将免费在线将 PDF 文件转换为 HTML。
  • 免费将 PDF 文件转换为 HTML 文档后,将立即提供输出 HTML 文件的下载链接。

如何安装 PDF to HTML Java 库?

您可以下载并安装 Java PDF 到 HTML 转换器库,以编程方式在 Java 中从 PDF 处理、操作和创建 HTML。

如何在 Windows 中将 PDF 转换为 HTML?

请访问 此链接 下载适用于 Windows 的 PDF 到 HTML 离线转换器。此 PDF 到 HTML 转换器免费下载软件可用于在 Windows 中快速将 PDF 导出到 HTML,只需单击一下。

也可以看看

我们建议您访问以下文章以了解: