如何使用 Node.js 在线将 PDF 转换为 TEXT 格式

使用 Node.js 在线将 PDF 转换为 TEXT 格式

可移植文档格式(PDF)是一种包含文本、图像、数据等的文档文件格式。当您需要保存无法修改的文件时,使用PDF格式。而 Text 文件是以行的形式存储纯文本的纯文本文档。它是一个不可执行的文件,用于在各种应用程序中创建快速笔记。有时您只需要 .txt 格式的纯文本。因此,您可能需要将 PDF 转换为 TEXT 格式。本文介绍如何使用 Node.js 在线将 PDF 转换为 TEXT 格式。

本文要讨论的主题包括:

PDF 到文本转换 REST API 和 Node.js SDK

GroupDocs.Conversion 的 Node.js SDK 是一个在线 NodeJS 转换库,可让您在线将 PDF 转换为文本。它是一个独立于平台的库和文档转换解决方案。它允许您将任何支持的文件格式的文档和图像无缝转换为您需要的任何格式。您可以轻松转换Word、PowerPoint, Excel、PDF、HTML、CAD、光栅图像等50多种文档和图像。它还提供.NET、Java、PHP、Ruby、Android和Python SDK作为其Cloud API 的文档转换家族成员

您可以在控制台中使用以下命令在您的 Node.js 项目上安装 GroupDocs.Convert Cloud:

npm install groupdocs-conversion-cloud

在开始执行步骤和可用代码示例之前,请从 dashboard 获取您的客户端 ID 和客户端密码。获得 ID 和密码后,请添加如下所示的代码:

# 从 http://api.groupdocs.cloud 在您的节点应用程序中导入 Node.js SDK
global.groupdocs_conversion_cloud = require("groupdocs-conversion-cloud");
global.fs = require("fs");

// 从 https://dashboard.groupdocs.cloud 获取 clientId 和 clientSecret(需要免费注册)。
global.clientId = "xxxxxxx-xxxx-xxxx-xxxx-xxxxxxxxxxxx";
global.clientSecret = "xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx";
global.myStorage = "test-internal-storage";
const config = new groupdocs_conversion_cloud.Configuration(clientId, clientSecret);
config.apiBaseUrl = "https://api.groupdocs.cloud";

如何使用 REST API 在 Node.js 中将 PDF 转换为文本文件

您可以按照以下步骤在云端以编程方式将 PDF 转换为 Nodejs 中的文本:

  1. 上传PDF文件到云端
  2. 转换 PDF 文件为文本格式
  3. 下载转换后的文本文件

上传 PDF 文件

首先,使用以下代码示例将 PDF 文件上传到云端:

// 从系统驱动器打开 IOStream 中的文件。
var resourcesFolder = 'H:\\groupdocs-cloud-data\\sample-file.pdf';
// 读取文件
fs.readFile(resourcesFolder, (err, fileStream) => {
  // 构造FileApi
  var fileApi = groupdocs_conversion_cloud.FileApi.fromConfig(config);
  // 创建上传文件请求
  var request = new groupdocs_conversion_cloud.UploadFileRequest("sample-file.pdf", fileStream, myStorage);
  // 上传文件
  fileApi.uploadFile(request)
    .then(function (response) {
      console.log("Expected response type is FilesUploadResult: " + response.uploaded.length);
    })
    .catch(function (error) {
      console.log("Error: " + error.message);
    });
});

因此,上传的文本文件将在云端仪表板的 文件部分 中可用。

在 Node.js 中将 PDF 转换为 TXT 格式

  • 首先,创建一个 ConvertApi 的实例
  • 其次,创建 ConvertSettings 的实例
  • 然后,设置存储名称和输入的PDF文件路径
  • 接下来,将“txt”分配给格式
  • 现在,提供输出 pdf 文件路径
  • 然后,使用 ConvertSettings 创建 ConvertDocumentRequest
  • 最后,通过使用 ConvertDocumentRequest 调用 convertDocument() 方法进行转换

以下代码示例显示了如何使用 Nodejs REST API 将 PDF 格式转换为 TEXT 文件:

下载转换后的文件

上面的代码示例会将转换后的文本文件保存在云端。现在您知道了如何使用 Node.js 将 PDF 转换为文本格式。接下来,使用以下代码示例下载文本文件:

// 构建 FileApi 以下载转换后的文件
var fileApi = groupdocs_conversion_cloud.FileApi.fromConfig(config);
// 创建下载文件请求
let request = new groupdocs_conversion_cloud.DownloadFileRequest("nodejs-testing/sample-file.txt", myStorage);
// 下载文件和响应类型 Stream
fileApi.downloadFile(request)
    .then(function (response) {
        // 将文件保存在系统目录中
        fs.writeFile("H:\\groupdocs-cloud-data\\sample-file.txt", response, "binary", function (err) { });
        console.log("Expected response type is Stream: " + response.length);
    })
    .catch(function (error) {
        console.log("Error: " + error.message);
    });

PDF 到文本文件转换器在线免费

如何免费在线将 PDF 转换为文本文件?请尝试以下使用上述 API 开发的免费在线 PDF 到文本转换器

结论

我们在这里结束这篇博文。 PDF 和文本文件广泛用于存储和传输数据。因此,本文介绍了如何将 PDF 转换为文本格式的 Node.js 应用程序。现在你知道了:

  • 如何使用 Node.js 将 PDF 转换为文本格式;
  • 免费的在线 PDF 到文本转换器;

此外,您可以使用 文档 了解有关 GroupDocs.Conversion Cloud API 的更多信息。我们还提供了一个 API 参考 部分,让您可以直接通过浏览器可视化我们的 API 并与之交互。有关详细示例,请导航至 GitHub

您可以在我们的 入门页面 上找到更多信息。

此外,Groupdocs.cloud 不断更新新主题。因此,请随时了解最新的 API 信息。

问一个问题

您可以通过我们的 免费支持论坛 询问有关如何将 PDF 转换为文本格式的问题

常见问题

如何在 Node.js 中将 PDF 转换为文本?

请按照 此链接 学习如何使用 node.js 快速方便地将 PDF 转换为文本文件的代码片段。

如何使用 REST API 在 Node.js 中从 PDF 创建文本文件?

创建一个ConvertApi,的实例,设置转换设置的值,并调用convertDocument方法和ConvertDocumentRequest来转换PDF在线阅读文本。

我可以免费在线将 PDF 转换为文本吗?

免费在线 PDF 到文本转换器 允许您快速轻松地将 PDF 转换为文本免费文件格式。转换完成后,您可以下载文本文件。

如何离线将 PDF 转换为可读文本?

请访问 pdftotext 下载链接 下载适用于 windows 的 PDF 到文本转换器。这个在线 PDF 到文本转换器免费下载软件用于在 Windows 中快速将 PDF 转换为 TXT,只需单击一下。

也可以看看

要了解更多信息:我们建议阅读以下文章: