使用 Node.js 將 PDF 轉換為可編輯的 Word 文檔

您可以通過編程輕鬆地將任何 PDF 文檔轉換為可編輯的 Word 文檔。此轉換將允許您使用 Microsoft Word 更新 PDF 文檔的內容。作為 Node.js 開發人員,您可以在雲端以編程方式將 PDF 文件轉換為 Word 文檔(DOC 或 DOCX)。在本文中,您將了解如何使用 Node.js 中的 REST API 將 PDF 轉換為可編輯的 Word 文檔。

本文應涵蓋以下主題:

PDF 轉換 REST API 和 Node.js SDK

為了將 PDF 轉換為 DOCX,我將使用 GroupDocs.Conversion Cloud 的 Node.js SDK API。它是一個獨立於平台的文檔和圖像轉換解決方案,不依賴於任何工具或軟件。它使您能夠快速可靠地將任何 supp 的圖像和文檔轉換為您需要的任何格式。 Word、PowerPoint, Excel、PDF、HTML、CAD、光柵圖像等50多種文檔和圖像之間輕鬆轉換。它還提供.NET、Java、PHP、Ruby、Android和Python SDK作為其文檔轉換家族成員 為 Cloud API。

您可以在控制台中使用以下命令將 GroupDocs.Conversion Cloud 安裝到您的 Node.js 項目:

npm install groupdocs-conversion-cloud

在開始執行步驟和可用代碼示例之前,請從 儀表板 獲取您的客戶端 ID 和客戶端密碼。獲得 ID 和密碼後,請添加如下所示的代碼:

global.clientId = "112f0f38-9dae-42d5-b4fc-cc84ae644972";
global.clientSecret = "16ad3fe0bdc39c910f57d2fd48a5d618";
global.myStorage = "";

const config = new groupdocs_conversion_cloud.Configuration(clientId, clientSecret);
config.apiBaseUrl = "https://api.groupdocs.cloud";

使用 Node.js 中的 REST API 將 PDF 轉換為可編輯的 Word 文檔

您可以通過以下簡單步驟在雲端以編程方式將 PDF 文檔轉換為可編輯的 Word 文檔:

  1. 上傳PDF文件到雲端
  2. 使用 Node.js 將 PDF 轉換為 DOCX
  3. 下載轉換後的DOCX文件

上傳 PDF 文件

首先,使用以下代碼示例將 PDF 文件上傳到雲端:

var resourcesFolder = 'C:\\Files\\sample.pdf';
fs.readFile(resourcesFolder, (err, fileStream) => {
  // 構建FileApi
  var fileApi = groupdocs_conversion_cloud.FileApi.fromConfig(config);
  // 創建上傳文件請求
  var request = new groupdocs_conversion_cloud.UploadFileRequest("sample.pdf", fileStream, myStorage);
  // 上傳文件
  fileApi.uploadFile(request);
});

因此,上傳的 PDF 文件將在雲端儀表板的 文件部分 中可用。

使用 Node.js 將 PDF 轉換為 DOCX

您可以按照下面提到的步驟以編程方式輕鬆地將 PDF 轉換為 DOCX 文檔:

  • 創建 ConvertApi 的實例
  • 創建 ConvertSettings 的實例
  • 設置PDF文件路徑
  • 將“docx”分配給格式
  • 提供輸出文件路徑
  • 使用 ConvertSettings 創建 ConvertDocumentRequest
  • 通過使用 ConvertDocumentRequest 調用 convertDocument() 方法進行轉換

以下代碼示例展示瞭如何在 Node.js 中使用 REST API 將 PDF 轉換為 Word 文檔。

// 初始化接口
let convertApi = groupdocs_conversion_cloud.ConvertApi.fromKeys(clientId, clientSecret);

// 定義轉換設置
let settings = new groupdocs_conversion_cloud.ConvertSettings();
settings.filePath = "sample.pdf"; // input file path on the cloud
settings.format = "docx";         // output format
settings.outputPath = "output";   // output file folder on the cloud

// 創建轉換文檔請求
let request = new groupdocs_conversion_cloud.ConvertDocumentRequest(settings);

// 轉換文檔
let result = await convertApi.convertDocument(request);
console.log("Document converted successfully: " + result[0].url);
使用 Node.js 中的 REST API 將 PDF 轉換為可編輯的 Word

使用 Node.js 中的 REST API 將 PDF 轉換為可編輯的 Word

下載轉換後的文件

上面的代碼示例會將轉換後的 DOCX 文件保存在雲端。您可以使用以下代碼示例下載它:

// 構建FileApi
var fileApi = groupdocs_conversion_cloud.FileApi.fromConfig(config);

// 創建下載文件請求
let request = new groupdocs_conversion_cloud.DownloadFileRequest("output/sample.docx", myStorage);

// 下載文件
let response = await fileApi.downloadFile(request);

// 將文件保存在您的工作目錄中
fs.writeFile("C:\\Files\\sample.docx", response, "binary", function (err) { });
console.log(response);

在 Node.js 中將 PDF 的特定頁面轉換為 DOCX

您可以按照下面提到的步驟以編程方式輕鬆地將 PDF 文檔的特定頁面轉換為 Word 文檔:

  • 創建 ConvertApi 的實例
  • 創建 ConvertSettings 的實例
  • 設置PDF文件路徑
  • 將“docx”分配給格式
  • 提供輸出文件路徑
  • 創建 DocxConvertOptions 的實例
  • 提供要轉換的特定頁碼
  • 將 DocxConvertOptions 分配給 ConvertSettings
  • 使用 ConvertSettings 創建 ConvertDocumentRequest
  • 通過使用 ConvertDocumentRequest 調用 convertDocument() 方法進行轉換

以下代碼示例顯示如何使用 Node.js 中的 REST API 將 PDF 的特定頁面轉換為 Word 文檔。請按照前面提到的步驟上傳和下載文件。

// 初始化接口
let convertApi = groupdocs_conversion_cloud.ConvertApi.fromKeys(clientId, clientSecret);

// 定義轉換設置
let settings = new groupdocs_conversion_cloud.ConvertSettings();
settings.filePath = "sample.pdf";
settings.format = "docx";

// 定義 docx 轉換選項
let convertOptions = new groupdocs_conversion_cloud.DocxConvertOptions();
convertOptions.pages = [1,2]; // set page numbers to convert

settings.convertOptions = convertOptions
settings.outputPath = "specific_pages.docx";

// 創建轉換文檔請求
let request = new groupdocs_conversion_cloud.ConvertDocumentRequest(settings);

// 轉換文檔
let result = await convertApi.convertDocument(request);
console.log("Document converted successfully: " + result[0].url);

以下代碼示例展示瞭如何使用 Node.js 中的 REST API 將一系列頁面從 PDF 文檔轉換為 Word 文檔。

// 初始化接口
let convertApi = groupdocs_conversion_cloud.ConvertApi.fromKeys(clientId, clientSecret);

// 定義轉換設置
let settings = new groupdocs_conversion_cloud.ConvertSettings();
settings.filePath = "sample.pdf";
settings.format = "docx";

// 定義 docx 轉換選項
let convertOptions = new groupdocs_conversion_cloud.DocxConvertOptions();
convertOptions.fromPage = 1;    // set start page number
convertOptions.pagesCount = 2;  // total pages to convert

settings.convertOptions = convertOptions
settings.outputPath = "range_of_pages.docx";

// 創建轉換文檔請求
let request = new groupdocs_conversion_cloud.ConvertDocumentRequest(settings);

// 轉換文檔
let result = await convertApi.convertDocument(request);
console.log("Document converted successfully: " + result[0].url);

不使用雲存儲的 PDF 到 Word 轉換

您可以在不使用雲存儲的情況下轉換 PDF 文檔,方法是在請求正文中傳遞它並在 API 響應中接收輸出文件。請按照以下步驟在不使用雲存儲的情況下將 PDF 轉換為 DOCX。

  • 創建 ConvertApi 的實例
  • 從本地路徑讀取輸入 PDF 文件
  • 創建 ConvertDocumentDirectRequest
  • 提供目標格式和輸入文件路徑作為輸入參數
  • 使用 ConvertDocumentDirectRequest 調用 convertDocumentDirect() 方法獲取結果
  • 使用 FileStream.writeFile() 方法將輸出文件保存到本地路徑

以下代碼示例演示如何在不使用雲存儲的情況下將 PDF 轉換為 Word 文檔。

// 從本地磁盤讀取文件
let file = fs.readFileSync('C:\\Files\\sample.pdf');

// 創建轉換文檔直接請求
let request = new groupdocs_conversion_cloud.ConvertDocumentDirectRequest("docx", file);

// 直接轉換文件
let result = await convertApi.convertDocumentDirect(request);

// 將文件保存在工作目錄中
fs.writeFile("C:\\Files\\Conversion\\sample_direct.docx", result, "binary", function (err) { });
console.log("Document converted: " + result.length);

在線試用

請試用以下免費的在線 PDF 到 DOCX 轉換工具,它是使用上述 API 開發的。 https://products.groupdocs.app/conversion/pdf-to-docx

結論

在本文中,您了解瞭如何將 PDF 轉換為雲端的 Word 文檔。您還學習瞭如何使用 Node.js 將 PDF 的特定頁面轉換為 Word 文檔。此外,您還學習瞭如何以編程方式將一系列頁面從 PDF 轉換為 DOCX。本文還介紹瞭如何以編程方式將 PDF 文件上傳到雲端,然後從雲端下載轉換後的 DOCX 文件。您可以使用 文檔 了解有關 GroupDocs.Conversion Cloud API 的更多信息。我們還提供了一個 API 參考 部分,讓您可以直接通過瀏覽器可視化我們的 API 並與之交互。如有任何歧義,請隨時在論壇上與我們聯繫。

也可以看看