使用 Node.js 将 PDF 转换为可编辑的 Word 文档

您可以通过编程轻松地将任何 PDF 文档转换为可编辑的 Word 文档。此转换将允许您使用 Microsoft Word 更新 PDF 文档的内容。作为 Node.js 开发人员,您可以在云端以编程方式将 PDF 文件转换为 Word 文档(DOC 或 DOCX)。在本文中,您将了解如何使用 Node.js 中的 REST API 将 PDF 转换为可编辑的 Word 文档。

本文应涵盖以下主题:

PDF 转换 REST API 和 Node.js SDK

为了将 PDF 转换为 DOCX,我将使用 GroupDocs.Conversion Cloud 的 Node.js SDK API。它是一个独立于平台的文档和图像转换解决方案,不依赖于任何工具或软件。它使您能够快速可靠地将任何 supp 的图像和文档转换为您需要的任何格式。 Word、PowerPoint, Excel、PDF、HTML、CAD、光栅图像等50多种文档和图像之间轻松转换。它还提供.NET、Java、PHP、Ruby、Android和Python SDK作为其文档转换家族成员 为 Cloud API。

您可以在控制台中使用以下命令将 GroupDocs.Conversion Cloud 安装到您的 Node.js 项目:

npm install groupdocs-conversion-cloud

在开始执行步骤和可用代码示例之前,请从 仪表板 获取您的客户端 ID 和客户端密码。获得 ID 和密码后,请添加如下所示的代码:

global.clientId = "112f0f38-9dae-42d5-b4fc-cc84ae644972";
global.clientSecret = "16ad3fe0bdc39c910f57d2fd48a5d618";
global.myStorage = "";

const config = new groupdocs_conversion_cloud.Configuration(clientId, clientSecret);
config.apiBaseUrl = "https://api.groupdocs.cloud";

使用 Node.js 中的 REST API 将 PDF 转换为可编辑的 Word 文档

您可以通过以下简单步骤在云端以编程方式将 PDF 文档转换为可编辑的 Word 文档:

  1. 上传PDF文件到云端
  2. 使用 Node.js 将 PDF 转换为 DOCX
  3. 下载转换后的DOCX文件

上传 PDF 文件

首先,使用以下代码示例将 PDF 文件上传到云端:

var resourcesFolder = 'C:\\Files\\sample.pdf';
fs.readFile(resourcesFolder, (err, fileStream) => {
  // 构建FileApi
  var fileApi = groupdocs_conversion_cloud.FileApi.fromConfig(config);
  // 创建上传文件请求
  var request = new groupdocs_conversion_cloud.UploadFileRequest("sample.pdf", fileStream, myStorage);
  // 上传文件
  fileApi.uploadFile(request);
});

因此,上传的 PDF 文件将在云端仪表板的 文件部分 中可用。

使用 Node.js 将 PDF 转换为 DOCX

您可以按照下面提到的步骤以编程方式轻松地将 PDF 转换为 DOCX 文档:

  • 创建 ConvertApi 的实例
  • 创建 ConvertSettings 的实例
  • 设置PDF文件路径
  • 将“docx”分配给格式
  • 提供输出文件路径
  • 使用 ConvertSettings 创建 ConvertDocumentRequest
  • 通过使用 ConvertDocumentRequest 调用 convertDocument() 方法进行转换

以下代码示例展示了如何在 Node.js 中使用 REST API 将 PDF 转换为 Word 文档。

// 初始化接口
let convertApi = groupdocs_conversion_cloud.ConvertApi.fromKeys(clientId, clientSecret);

// 定义转换设置
let settings = new groupdocs_conversion_cloud.ConvertSettings();
settings.filePath = "sample.pdf"; // input file path on the cloud
settings.format = "docx";         // output format
settings.outputPath = "output";   // output file folder on the cloud

// 创建转换文档请求
let request = new groupdocs_conversion_cloud.ConvertDocumentRequest(settings);

// 转换文档
let result = await convertApi.convertDocument(request);
console.log("Document converted successfully: " + result[0].url);
使用 Node.js 中的 REST API 将 PDF 转换为可编辑的 Word

使用 Node.js 中的 REST API 将 PDF 转换为可编辑的 Word

下载转换后的文件

上面的代码示例会将转换后的 DOCX 文件保存在云端。您可以使用以下代码示例下载它:

// 构建FileApi
var fileApi = groupdocs_conversion_cloud.FileApi.fromConfig(config);

// 创建下载文件请求
let request = new groupdocs_conversion_cloud.DownloadFileRequest("output/sample.docx", myStorage);

// 下载文件
let response = await fileApi.downloadFile(request);

// 将文件保存在您的工作目录中
fs.writeFile("C:\\Files\\sample.docx", response, "binary", function (err) { });
console.log(response);

在 Node.js 中将 PDF 的特定页面转换为 DOCX

您可以按照下面提到的步骤以编程方式轻松地将 PDF 文档的特定页面转换为 Word 文档:

  • 创建 ConvertApi 的实例
  • 创建 ConvertSettings 的实例
  • 设置PDF文件路径
  • 将“docx”分配给格式
  • 提供输出文件路径
  • 创建 DocxConvertOptions 的实例
  • 提供要转换的特定页码
  • 将 DocxConvertOptions 分配给 ConvertSettings
  • 使用 ConvertSettings 创建 ConvertDocumentRequest
  • 通过使用 ConvertDocumentRequest 调用 convertDocument() 方法进行转换

以下代码示例显示如何使用 Node.js 中的 REST API 将 PDF 的特定页面转换为 Word 文档。请按照前面提到的步骤上传和下载文件。

// 初始化接口
let convertApi = groupdocs_conversion_cloud.ConvertApi.fromKeys(clientId, clientSecret);

// 定义转换设置
let settings = new groupdocs_conversion_cloud.ConvertSettings();
settings.filePath = "sample.pdf";
settings.format = "docx";

// 定义 docx 转换选项
let convertOptions = new groupdocs_conversion_cloud.DocxConvertOptions();
convertOptions.pages = [1,2]; // set page numbers to convert

settings.convertOptions = convertOptions
settings.outputPath = "specific_pages.docx";

// 创建转换文档请求
let request = new groupdocs_conversion_cloud.ConvertDocumentRequest(settings);

// 转换文档
let result = await convertApi.convertDocument(request);
console.log("Document converted successfully: " + result[0].url);

以下代码示例展示了如何使用 Node.js 中的 REST API 将一系列页面从 PDF 文档转换为 Word 文档。

// 初始化接口
let convertApi = groupdocs_conversion_cloud.ConvertApi.fromKeys(clientId, clientSecret);

// 定义转换设置
let settings = new groupdocs_conversion_cloud.ConvertSettings();
settings.filePath = "sample.pdf";
settings.format = "docx";

// 定义 docx 转换选项
let convertOptions = new groupdocs_conversion_cloud.DocxConvertOptions();
convertOptions.fromPage = 1;    // set start page number
convertOptions.pagesCount = 2;  // total pages to convert

settings.convertOptions = convertOptions
settings.outputPath = "range_of_pages.docx";

// 创建转换文档请求
let request = new groupdocs_conversion_cloud.ConvertDocumentRequest(settings);

// 转换文档
let result = await convertApi.convertDocument(request);
console.log("Document converted successfully: " + result[0].url);

不使用云存储的 PDF 到 Word 转换

您可以在不使用云存储的情况下转换 PDF 文档,方法是在请求正文中传递它并在 API 响应中接收输出文件。请按照以下步骤在不使用云存储的情况下将 PDF 转换为 DOCX。

  • 创建 ConvertApi 的实例
  • 从本地路径读取输入 PDF 文件
  • 创建 ConvertDocumentDirectRequest
  • 提供目标格式和输入文件路径作为输入参数
  • 使用 ConvertDocumentDirectRequest 调用 convertDocumentDirect() 方法获取结果
  • 使用 FileStream.writeFile() 方法将输出文件保存到本地路径

以下代码示例演示如何在不使用云存储的情况下将 PDF 转换为 Word 文档。

// 从本地磁盘读取文件
let file = fs.readFileSync('C:\\Files\\sample.pdf');

// 创建转换文档直接请求
let request = new groupdocs_conversion_cloud.ConvertDocumentDirectRequest("docx", file);

// 直接转换文档
let result = await convertApi.convertDocumentDirect(request);

// 将文件保存在工作目录中
fs.writeFile("C:\\Files\\Conversion\\sample_direct.docx", result, "binary", function (err) { });
console.log("Document converted: " + result.length);

在线试用

请试用以下免费的在线 PDF 到 DOCX 转换工具,它是使用上述 API 开发的。 https://products.groupdocs.app/conversion/pdf-to-docx

结论

在本文中,您了解了如何将 PDF 转换为云端的 Word 文档。您还学习了如何使用 Node.js 将 PDF 的特定页面转换为 Word 文档。此外,您还学习了如何以编程方式将一系列页面从 PDF 转换为 DOCX。本文还介绍了如何以编程方式将 PDF 文件上传到云端,然后从云端下载转换后的 DOCX 文件。您可以使用 文档 了解有关 GroupDocs.Conversion Cloud API 的更多信息。我们还提供了一个 API 参考 部分,让您可以直接通过浏览器可视化我们的 API 并与之交互。如有任何歧义,请随时在论坛上与我们联系。

也可以看看