如何使用 Node.js 在線將 PDF 轉換為 TEXT 格式

使用 Node.js 在線將 PDF 轉換為 TEXT 格式

可移植文檔格式(PDF)是一種包含文本、圖像、數據等的文檔文件格式。當您需要保存無法修改的文件時,使用PDF格式。而 Text 文件是以行的形式存儲純文本的純文本文檔。它是一個不可執行的文件,用於在各種應用程序中創建快速筆記。有時您只需要 .txt 格式的純文本。因此,您可能需要將 PDF 轉換為 TEXT 格式。本文介紹如何使用 Node.js 在線將 PDF 轉換為 TEXT 格式。

本文要討論的主題包括:

PDF 到文本轉換 REST API 和 Node.js SDK

GroupDocs.Conversion 的 Node.js SDK 是一個在線 NodeJS 轉換庫,可讓您在線將 PDF 轉換為文本。它是一個獨立於平台的庫和文檔轉換解決方案。它允許您將任何支持的文件格式的文檔和圖像無縫轉換為您需要的任何格式。您可以輕鬆轉換Word、PowerPoint, Excel、PDF、HTML、CAD、光柵圖像等50多種文檔和圖像。它還提供.NET、Java、PHP、Ruby、Android和Python SDK作為其Cloud API 的文檔轉換家族成員

您可以在控制台中使用以下命令在您的 Node.js 項目上安裝 GroupDocs.Convert Cloud:

npm install groupdocs-conversion-cloud

在開始執行步驟和可用代碼示例之前,請從 dashboard 獲取您的客戶端 ID 和客戶端密碼。獲得 ID 和密碼後,請添加如下所示的代碼:

# 從 http://api.groupdocs.cloud 在您的節點應用程序中導入 Node.js SDK
global.groupdocs_conversion_cloud = require("groupdocs-conversion-cloud");
global.fs = require("fs");

// 從 https://dashboard.groupdocs.cloud 獲取 clientId 和 clientSecret(需要免費註冊)。
global.clientId = "xxxxxxx-xxxx-xxxx-xxxx-xxxxxxxxxxxx";
global.clientSecret = "xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx";
global.myStorage = "test-internal-storage";
const config = new groupdocs_conversion_cloud.Configuration(clientId, clientSecret);
config.apiBaseUrl = "https://api.groupdocs.cloud";

如何使用 REST API 在 Node.js 中將 PDF 轉換為文本文件

您可以按照以下步驟在雲端以編程方式將 PDF 轉換為 Nodejs 中的文本:

  1. 上傳PDF文件到雲端
  2. 轉換 PDF 文件為文本格式
  3. 下載轉換後的文本文件

上傳 PDF 文件

首先,使用以下代碼示例將 PDF 文件上傳到雲端:

// 從系統驅動器打開 IOStream 中的文件。
var resourcesFolder = 'H:\\groupdocs-cloud-data\\sample-file.pdf';
// 讀取文件
fs.readFile(resourcesFolder, (err, fileStream) => {
  // 構建FileApi
  var fileApi = groupdocs_conversion_cloud.FileApi.fromConfig(config);
  // 創建上傳文件請求
  var request = new groupdocs_conversion_cloud.UploadFileRequest("sample-file.pdf", fileStream, myStorage);
  // 上傳文件
  fileApi.uploadFile(request)
    .then(function (response) {
      console.log("Expected response type is FilesUploadResult: " + response.uploaded.length);
    })
    .catch(function (error) {
      console.log("Error: " + error.message);
    });
});

因此,上傳的文本文件將在雲端儀表板的 文件部分 中可用。

在 Node.js 中將 PDF 轉換為 TXT 格式

  • 首先,創建一個 ConvertApi 的實例
  • 其次,創建 ConvertSettings 的實例
  • 然後,設置存儲名稱和輸入的PDF文件路徑
  • 接下來,將“txt”分配給格式
  • 現在,提供輸出 pdf 文件路徑
  • 然後,使用 ConvertSettings 創建 ConvertDocumentRequest
  • 最後,通過使用 ConvertDocumentRequest 調用 convertDocument() 方法進行轉換

以下代碼示例顯示瞭如何使用 Nodejs REST API 將 PDF 格式轉換為 TEXT 文件:

下載轉換後的文件

上面的代碼示例會將轉換後的文本文件保存在雲端。現在您知道瞭如何使用 Node.js 將 PDF 轉換為文本格式。接下來,使用以下代碼示例下載文本文件:

// 構建 FileApi 以下載轉換後的文件
var fileApi = groupdocs_conversion_cloud.FileApi.fromConfig(config);
// 創建下載文件請求
let request = new groupdocs_conversion_cloud.DownloadFileRequest("nodejs-testing/sample-file.txt", myStorage);
// 下載文件和響應類型 Stream
fileApi.downloadFile(request)
    .then(function (response) {
        // 將文件保存在系統目錄中
        fs.writeFile("H:\\groupdocs-cloud-data\\sample-file.txt", response, "binary", function (err) { });
        console.log("Expected response type is Stream: " + response.length);
    })
    .catch(function (error) {
        console.log("Error: " + error.message);
    });

PDF 到文本文件轉換器在線免費

如何免費在線將 PDF 轉換為文本文件?請嘗試以下使用上述 API 開發的免費在線 PDF 到文本轉換器

結論

我們在這裡結束這篇博文。 PDF 和文本文件廣泛用於存儲和傳輸數據。因此,本文介紹瞭如何將 PDF 轉換為文本格式的 Node.js 應用程序。現在你知道了:

  • 如何使用 Node.js 將 PDF 轉換為文本格式;
  • 免費的在線 PDF 到文本轉換器;

此外,您可以使用 文檔 了解有關 GroupDocs.Conversion Cloud API 的更多信息。我們還提供了一個 API 參考 部分,讓您可以直接通過瀏覽器可視化我們的 API 並與之交互。有關詳細示例,請導航至 GitHub

您可以在我們的 入門頁面 上找到更多信息。

此外,Groupdocs.cloud 不斷更新新主題。因此,請隨時了解最新的 API 信息。

問一個問題

您可以通過我們的 免費支持論壇 詢問有關如何將 PDF 轉換為文本格式的問題

常見問題

如何在 Node.js 中將 PDF 轉換為文本?

請按照 此鏈接 學習如何使用 node.js 快速方便地將 PDF 轉換為文本文件的代碼片段。

如何使用 REST API 在 Node.js 中從 PDF 創建文本文件?

創建一個ConvertApi,的實例,設置轉換設置的值,並調用convertDocument方法和ConvertDocumentRequest來轉換PDF在線閱讀文本。

我可以免費在線將 PDF 轉換為文本嗎?

免費在線 PDF 到文本轉換器 允許您快速輕鬆地將 PDF 轉換為文本免費文件格式。轉換完成後,您可以下載文本文件。

如何離線將 PDF 轉換為可讀文本?

請訪問 pdftotext 下載鏈接 下載適用於 windows 的 PDF 到文本轉換器。這個在線 PDF 到文本轉換器免費下載軟件用於在 Windows 中快速將 PDF 轉換為 TXT,只需單擊一下。

也可以看看

要了解更多信息:我們建議閱讀以下文章: