如何在不丢失格式的情况下将pdf转换为html

如何以编程方式将 PDF 转换为 HTML

PDF(便携式文档格式)是一种安全文档格式,包含图形、文本、3D 模型、图像等。PDF 格式经过压缩,比其他可共享文件格式更小。 HTML 是一种广泛使用的纯文本轻量级标记语言。每个浏览器都支持它,并且加载速度很快。 PDF 和 HTML 两种文件格式都有利于可访问性,但 HTML 通常更适合通过 Web 提供信息。因此,在本文中,我们将演示如何在 Node.js 中在线将 PDF 转换为 HTML。

本文将涵盖以下主题:

PDF 到 HTML 页面转换 REST API 和 Node.js SDK

GroupDocs.Conversion 的Node.js SDK 是一个在线的NodeJS 转换库,可让您在线进行PDF 到HTML 的转换。它是一个独立于平台的库和文档转换解决方案。它允许您将任何支持的文件格式的文档和图像无缝转换为您需要的任何格式。您可以轻松转换Word、PowerPoint, Excel、PDF、HTML、CAD、光栅图像等50多种文档和图像。它还支持.NET、Java、PHP、Ruby、Android和Python SDK作为其文档转换家族成员 为 Cloud API。

可以在 Node.js 控制台中使用以下命令安装 GroupDocs.Conversion Cloud:

npm install groupdocs-conversion-cloud

接下来,在开始执行步骤和可用代码示例之前,从 仪表板 获取您的客户端 ID 和客户端密码。获得 ID 和密码后,请添加如下所示的代码:

# 从 http://api.groupdocs.cloud 在您的节点应用程序中导入 Node.js SDK
global.groupdocs_conversion_cloud = require("groupdocs-conversion-cloud");
global.fs = require("fs");

// 从 https://dashboard.groupdocs.cloud 获取 clientId 和 clientSecret(需要免费注册)。
global.clientId = "xxxxxxx-xxxx-xxxx-xxxx-xxxxxxxxxxxx";
global.clientSecret = "xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx";
global.myStorage = "test-internal-storage";
const config = new groupdocs_conversion_cloud.Configuration(clientId, clientSecret);
config.apiBaseUrl = "https://api.groupdocs.cloud";

如何使用 REST API 在 Node.js 中将 PDF 转换为 HTML 格式

下面给出的步骤将使您能够使用 Nodejs 将 PDF 文件转换为 HTML。

  1. 上传PDF文件到云端
  2. 转换 PDF 文件为 HTML 格式
  3. 下载转换后的HTML文件

上传 PDF 文件

以下代码示例可用于将 PDF 文件上传到云端:

// 从系统驱动器打开 IOStream 中的文件。
var resourcesFolder = 'H:\\groupdocs-cloud-data\\sample-file.pdf';
// 读取文件
fs.readFile(resourcesFolder, (err, fileStream) => {
  // 构建FileApi
  var fileApi = groupdocs_conversion_cloud.FileApi.fromConfig(config);
  // 创建上传文件请求
  var request = new groupdocs_conversion_cloud.UploadFileRequest("sample-file.pdf", fileStream, myStorage);
  // 上传文件
  fileApi.uploadFile(request)
    .then(function (response) {
      console.log("Expected response type is FilesUploadResult: " + response.uploaded.length);
    })
    .catch(function (error) {
      console.log("Error: " + error.message);
    });
});

上传的 PDF 文件位于仪表板的 文件部分 中。

在 Node.js 中将 PDF 转换为 HTML 文档

使用此 Node.js 库将 PDF 转换为 HTML 只需几行源代码。您可以按照以下步骤和代码段进行操作:

  • 创建 ConvertApi 的实例
  • 创建 ConvertSettings 的实例
  • 设置存储名称和输入PDF文件路径
  • 接下来,将“html”分配给格式
  • 现在,提供输出 HTML 文件路径
  • 使用 ConvertSettings 创建 ConvertDocumentRequest
  • 最后,通过使用 ConvertDocumentRequest 调用 convertDocument() 方法进行转换

以下代码示例展示了如何使用 REST API 在 Nodejs 中在线将 PDF 转换为 HTML:

// 如何使用 REST API 在 Node.js 中将 PDF 转换为 HTML 格式
const convert = async () => {
  const convertApi = groupdocs_conversion_cloud.ConvertApi.fromKeys(clientId, clientSecret);

  const settings = new groupdocs_conversion_cloud.ConvertSettings();
  settings.storageName = myStorage;
  settings.filePath = "nodejs-testing/sample-file.pdf";
  settings.format = "html";
  settings.outputPath = "nodejs-testing/sample-file.html";

  try {
    // 创建转换文档请求
    const request = new groupdocs_conversion_cloud.ConvertDocumentRequest(settings);
    await convertApi.convertDocument(request);
  }
  catch (err) {
    throw err;
  }
}

convert()
.then(() => {
  console.log("Successfully converted PDF to HTML file format.");
})
.catch((err) => {
  console.log("Error occurred while converting the PDF file:", err);
})

下载转换后的文件

上面的代码示例会将转换后的 HTML 文件保存在云端。现在您知道了如何使用 Node.js 将 PDF 转换为 HTML 格式。接下来,使用以下代码示例下载 HTML 文件:

// 构建 FileApi 以下载转换后的文件
var fileApi = groupdocs_conversion_cloud.FileApi.fromConfig(config);
// 创建下载文件请求
let request = new groupdocs_conversion_cloud.DownloadFileRequest("nodejs-testing/sample-file.html", myStorage);
// 下载文件和响应类型 Stream
fileApi.downloadFile(request)
    .then(function (response) {
        // 将文件保存在系统目录中
        fs.writeFile("H:\\groupdocs-cloud-data\\sample-file.html", response, "binary", function (err) { });
        console.log("Expected response type is Stream: " + response.length);
    })
    .catch(function (error) {
        console.log("Error: " + error.message);
    });

使用 REST API 在 Node.js 中将 PDF 的特定页面转换为 HTML

您可以按照以下步骤和代码片段在您的 Node.js 应用程序中使用一些高级设置将 PDF 转换为 HTML:

请按照以下步骤操作:

  • 首先,创建 ConvertApi 的实例
  • 创建 ConvertSettings 的实例
  • 设置存储名称和输入PDF文件路径
  • 接下来,将“html”分配给格式
  • 创建 HtmlConvertOptions 类的实例
  • 设置各种转换选项,如 fromPage、pagesCount、fixedLayout 等。
  • 现在,提供输出转换选项和 HTML 文件路径
  • 使用 ConvertSettings 创建 ConvertDocumentRequest
  • 最后,通过使用 ConvertDocumentRequest 调用 convertDocument() 方法进行转换

以下代码示例显示了如何使用高级选项在 Node.js 中将 PDF 转换为 HTML:

// 如何使用 REST API 在 Node.js 中将特定页面的 PDF 转换为 HTML
const convert = async () => {
  const convertApi = groupdocs_conversion_cloud.ConvertApi.fromKeys(clientId, clientSecret);

  const settings = new groupdocs_conversion_cloud.ConvertSettings();
  settings.storageName = myStorage;
  settings.filePath = "nodejs-testing/sample-file.pdf";
  settings.format = "html";
  
  let convertOptions = new conversion_cloud.HtmlConvertOptions();
  convertOptions.fromPage = 1;
  convertOptions.pagesCount = 1;
  convertOptions.fixedLayout = true;
 
  settings.convertOptions = convertOptions
  settings.outputPath = "nodejs-testing/sample-file.html";

  try {
    // 创建转换文档请求
    const request = new groupdocs_conversion_cloud.ConvertDocumentRequest(settings);
    await convertApi.convertDocument(request);
  }
  catch (err) {
    throw err;
  }
}

convert()
.then(() => {
  console.log("Successfully converted PDF to HTML file format.");
})
.catch((err) => {
  console.log("Error occurred while converting the PDF file:", err);
})

免费在线 PDF 到 HTML 转换器

如何免费在线将 PDF 转换为 HTML 格式?请尝试以下 PDF 到 HTML 免费在线转换器。本在线PDF转HTML5转换器是使用上述API开发的,可以快速在线将PDF转HTML表格。

结论

PDF 和 HTML 文件广泛用于存储和传输数据。因此,本文介绍了如何在 Node.js 应用程序中将 PDF 转换为 HTML 格式。现在你知道了:

  • 如何使用 REST API 在 Node.js 中将 PDF 转换为 HTML 格式;
  • 如何使用 REST API 在 Node.js 中将特定页面的 PDF 转换为 HTML
  • 免费的在线 PDF 到 HTML 在线转换器;

此外,您可以使用 文档GitHub 上提供的示例了解有关 GroupDocs.Conversion Cloud API 的更多信息。我们还提供了一个 API 参考 部分,您可以在其中直接使用 Web 浏览器与 API 进行交互。您可以查看我们的入门指南页面

此外,Groupdocs.cloud 也不断更新新主题。因此,请及时了解最新信息。

问一个问题

欢迎您通过我们的 免费支持论坛 提出有关 PDF 到 HTML Node.js 转换器的问题。

常见问题

如何在 Node.js 中将 PDF 转换为 HTML?

请点击 此链接 了解如何使用 javascript 快速方便地从 HTML 生成 PDF 的代码片段。

如何使用 REST API 从 HTML Node.js 生成 PDF?

创建ConvertApi,的实例设置转换设置的值,并使用ConvertDocumentRequest调用convertDocument方法生成PDF来自 HTML 文件。

如何免费在线将 PDF 转换为 HTML?

免费在线 PDF 到 HTML 代码转换器 允许您快速轻松地将 PDF 转换为 HTML 文件格式。转换完成后,您可以下载 HTML 文件。

如何离线将 PDF 转换为 HTML?

请访问 此链接 在 Windows 中下载免费的 PDF 到 HTML 转换器软件。此在线 PDF 到 HTML 转换器免费下载软件可用于在 Windows 中快速将 PDF 转换为 HTML,只需单击一下。

也可以看看

我们建议您阅读以下文章以了解更多信息: