如何在不丟失格式的情況下將pdf轉換為html

如何以編程方式將 PDF 轉換為 HTML

PDF(便攜式文檔格式)是一種安全文檔格式,包含圖形、文本、3D 模型、圖像等。PDF 格式經過壓縮,比其他可共享文件格式更小。 HTML 是一種廣泛使用的純文本輕量級標記語言。每個瀏覽器都支持它,並且加載速度很快。 PDF 和 HTML 兩種文件格式都有利於可訪問性,但 HTML 通常更適合通過 Web 提供信息。因此,在本文中,我們將演示如何在 Node.js 中在線將 PDF 轉換為 HTML。

本文將涵蓋以下主題:

PDF 到 HTML 頁面轉換 REST API 和 Node.js SDK

GroupDocs.Conversion 的Node.js SDK 是一個在線的NodeJS 轉換庫,可讓您在線進行PDF 到HTML 的轉換。它是一個獨立於平台的庫和文檔轉換解決方案。它允許您將任何支持的文件格式的文檔和圖像無縫轉換為您需要的任何格式。您可以輕鬆轉換Word、PowerPoint, Excel、PDF、HTML、CAD、光柵圖像等50多種文檔和圖像。它還支持.NET、Java、PHP、Ruby、Android和Python SDK作為其文檔轉換家族成員 為 Cloud API。

可以在 Node.js 控制台中使用以下命令安裝 GroupDocs.Conversion Cloud:

npm install groupdocs-conversion-cloud

接下來,在開始執行步驟和可用代碼示例之前,從 儀表板 獲取您的客戶端 ID 和客戶端密碼。獲得 ID 和密碼後,請添加如下所示的代碼:

# 從 http://api.groupdocs.cloud 在您的節點應用程序中導入 Node.js SDK
global.groupdocs_conversion_cloud = require("groupdocs-conversion-cloud");
global.fs = require("fs");

// 從 https://dashboard.groupdocs.cloud 獲取 clientId 和 clientSecret(需要免費註冊)。
global.clientId = "xxxxxxx-xxxx-xxxx-xxxx-xxxxxxxxxxxx";
global.clientSecret = "xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx";
global.myStorage = "test-internal-storage";
const config = new groupdocs_conversion_cloud.Configuration(clientId, clientSecret);
config.apiBaseUrl = "https://api.groupdocs.cloud";

如何使用 REST API 在 Node.js 中將 PDF 轉換為 HTML 格式

下面給出的步驟將使您能夠使用 Nodejs 將 PDF 文件轉換為 HTML。

  1. 上傳PDF文件到雲端
  2. 轉換 PDF 文件為 HTML 格式
  3. 下載轉換後的HTML文件

上傳 PDF 文件

以下代碼示例可用於將 PDF 文件上傳到雲端:

// 從系統驅動器打開 IOStream 中的文件。
var resourcesFolder = 'H:\\groupdocs-cloud-data\\sample-file.pdf';
// 讀取文件
fs.readFile(resourcesFolder, (err, fileStream) => {
  // 構建FileApi
  var fileApi = groupdocs_conversion_cloud.FileApi.fromConfig(config);
  // 創建上傳文件請求
  var request = new groupdocs_conversion_cloud.UploadFileRequest("sample-file.pdf", fileStream, myStorage);
  // 上傳文件
  fileApi.uploadFile(request)
    .then(function (response) {
      console.log("Expected response type is FilesUploadResult: " + response.uploaded.length);
    })
    .catch(function (error) {
      console.log("Error: " + error.message);
    });
});

上傳的 PDF 文件位於儀表板的 文件部分 中。

在 Node.js 中將 PDF 轉換為 HTML 文檔

使用此 Node.js 庫將 PDF 轉換為 HTML 只需幾行源代碼。您可以按照以下步驟和代碼段進行操作:

  • 創建 ConvertApi 的實例
  • 創建 ConvertSettings 的實例
  • 設置存儲名稱和輸入PDF文件路徑
  • 接下來,將“html”分配給格式
  • 現在,提供輸出 HTML 文件路徑
  • 使用 ConvertSettings 創建 ConvertDocumentRequest
  • 最後,通過使用 ConvertDocumentRequest 調用 convertDocument() 方法進行轉換

以下代碼示例展示瞭如何使用 REST API 在 Nodejs 中在線將 PDF 轉換為 HTML:

// 如何使用 REST API 在 Node.js 中將 PDF 轉換為 HTML 格式
const convert = async () => {
  const convertApi = groupdocs_conversion_cloud.ConvertApi.fromKeys(clientId, clientSecret);

  const settings = new groupdocs_conversion_cloud.ConvertSettings();
  settings.storageName = myStorage;
  settings.filePath = "nodejs-testing/sample-file.pdf";
  settings.format = "html";
  settings.outputPath = "nodejs-testing/sample-file.html";

  try {
    // 創建轉換文檔請求
    const request = new groupdocs_conversion_cloud.ConvertDocumentRequest(settings);
    await convertApi.convertDocument(request);
  }
  catch (err) {
    throw err;
  }
}

convert()
.then(() => {
  console.log("Successfully converted PDF to HTML file format.");
})
.catch((err) => {
  console.log("Error occurred while converting the PDF file:", err);
})

下載轉換後的文件

上面的代碼示例會將轉換後的 HTML 文件保存在雲端。現在您知道瞭如何使用 Node.js 將 PDF 轉換為 HTML 格式。接下來,使用以下代碼示例下載 HTML 文件:

// 構建 FileApi 以下載轉換後的文件
var fileApi = groupdocs_conversion_cloud.FileApi.fromConfig(config);
// 創建下載文件請求
let request = new groupdocs_conversion_cloud.DownloadFileRequest("nodejs-testing/sample-file.html", myStorage);
// 下載文件和響應類型 Stream
fileApi.downloadFile(request)
    .then(function (response) {
        // 將文件保存在系統目錄中
        fs.writeFile("H:\\groupdocs-cloud-data\\sample-file.html", response, "binary", function (err) { });
        console.log("Expected response type is Stream: " + response.length);
    })
    .catch(function (error) {
        console.log("Error: " + error.message);
    });

使用 REST API 在 Node.js 中將 PDF 的特定頁面轉換為 HTML

您可以按照以下步驟和代碼片段在您的 Node.js 應用程序中使用一些高級設置將 PDF 轉換為 HTML:

請按照以下步驟操作:

  • 首先,創建 ConvertApi 的實例
  • 創建 ConvertSettings 的實例
  • 設置存儲名稱和輸入PDF文件路徑
  • 接下來,將“html”分配給格式
  • 創建 HtmlConvertOptions 類的實例
  • 設置各種轉換選項,如 fromPage、pagesCount、fixedLayout 等。
  • 現在,提供輸出轉換選項和 HTML 文件路徑
  • 使用 ConvertSettings 創建 ConvertDocumentRequest
  • 最後,通過使用 ConvertDocumentRequest 調用 convertDocument() 方法進行轉換

以下代碼示例顯示瞭如何使用高級選項在 Node.js 中將 PDF 轉換為 HTML:

// 如何使用 REST API 在 Node.js 中將特定頁面的 PDF 轉換為 HTML
const convert = async () => {
  const convertApi = groupdocs_conversion_cloud.ConvertApi.fromKeys(clientId, clientSecret);

  const settings = new groupdocs_conversion_cloud.ConvertSettings();
  settings.storageName = myStorage;
  settings.filePath = "nodejs-testing/sample-file.pdf";
  settings.format = "html";
  
  let convertOptions = new conversion_cloud.HtmlConvertOptions();
  convertOptions.fromPage = 1;
  convertOptions.pagesCount = 1;
  convertOptions.fixedLayout = true;
 
  settings.convertOptions = convertOptions
  settings.outputPath = "nodejs-testing/sample-file.html";

  try {
    // 創建轉換文檔請求
    const request = new groupdocs_conversion_cloud.ConvertDocumentRequest(settings);
    await convertApi.convertDocument(request);
  }
  catch (err) {
    throw err;
  }
}

convert()
.then(() => {
  console.log("Successfully converted PDF to HTML file format.");
})
.catch((err) => {
  console.log("Error occurred while converting the PDF file:", err);
})

免費在線 PDF 到 HTML 轉換器

如何免費在線將 PDF 轉換為 HTML 格式?請嘗試以下 PDF 到 HTML 免費在線轉換器。本在線PDF轉HTML5轉換器是使用上述API開發的,可以快速在線將PDF轉HTML表格。

結論

PDF 和 HTML 文件廣泛用於存儲和傳輸數據。因此,本文介紹瞭如何在 Node.js 應用程序中將 PDF 轉換為 HTML 格式。現在你知道了:

  • 如何使用 REST API 在 Node.js 中將 PDF 轉換為 HTML 格式;
  • 如何使用 REST API 在 Node.js 中將特定頁面的 PDF 轉換為 HTML
  • 免費的在線 PDF 到 HTML 在線轉換器;

此外,您可以使用 文檔GitHub 上提供的示例了解有關 GroupDocs.Conversion Cloud API 的更多信息。我們還提供了一個 API 參考 部分,您可以在其中直接使用 Web 瀏覽器與 API 進行交互。您可以查看我們的入門指南頁面

此外,Groupdocs.cloud 也不斷更新新主題。因此,請及時了解最新信息。

問一個問題

歡迎您通過我們的 免費支持論壇 提出有關 PDF 到 HTML Node.js 轉換器的問題。

常見問題

如何在 Node.js 中將 PDF 轉換為 HTML?

請點擊 此鏈接 了解如何使用 javascript 快速方便地從 HTML 生成 PDF 的代碼片段。

如何使用 REST API 從 HTML Node.js 生成 PDF?

創建一個ConvertApi,的實例設置轉換設置的值,並調用convertDocument方法與ConvertDocumentRequest生成PDF來自 HTML 文件。

如何免費在線將 PDF 轉換為 HTML?

免費在線 PDF 到 HTML 代碼轉換器 允許您快速輕鬆地將 PDF 轉換為 HTML 文件格式。轉換完成後,您可以下載 HTML 文件。

如何離線將 PDF 轉換為 HTML?

請訪問 此鏈接 在 Windows 中下載免費的 PDF 到 HTML 轉換器軟件。此在線 PDF 到 HTML 轉換器免費下載軟件可用於在 Windows 中快速將 PDF 轉換為 HTML,只需單擊一下。

也可以看看

我們建議您閱讀以下文章以了解更多信息: