PDF 是當今最常用的文件格式之一,可提供跨平台支持。但是很難鏈接到 PDF 文檔中的特定頁面,而且 PDF 文件也不容易在社交網絡上共享。您可以將 PDF 文檔的外觀保持為可以快速操作的 HTML 格式。在本文中,我們將學習如何在 Python 中將 PDF 文件轉換為 HTML。

本文應涵蓋以下主題:

Python PDF to HTML Converter API – 安裝

為了將 PDF 文件轉換為 HTML 網頁,我們將使用 GroupDocs.Conversion Cloud 的 Python SDK API。它是一個功能豐富、獨立於平台的文檔和圖像轉換 Python 庫。它提供了將任何支持的文件格式 的圖像和文檔快速轉換為任何高質量格式的功能。

您可以在控制台中使用以下命令將 PDF 到 HTML 轉換 Python 庫安裝並集成到您的 Python 應用程序中:

pip install groupdocs_conversion_cloud

在執行上述步驟之前,請從儀表板獲取您的客戶端 ID 和密碼。獲得 ID 和密碼後,在 Python 應用程序中添加代碼:

# 在 python 應用程序中加載用於 PDF 到 HTML 轉換的 Python 庫
import groupdocs_conversion_cloud

# 免費註冊後,從 https://dashboard.groupdocs.cloud 獲取 client_id 和 client_secret。
client_id = "xxxxxxx-xxxx-xxxx-xxxx-xxxxxxxxxxxx"
client_secret = "xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx"

# 獲取不同的配置
configuration = groupdocs_conversion_cloud.Configuration(client_id, client_secret)
configuration.api_base_url = "https://api.groupdocs.cloud"
your_storage = "groupdocs-storage-name"

現在,讓我們演示如何在 Python 中使用 REST API 逐步將 pdf 格式轉換為 html 格式。

如何使用 REST API 在 Python 中在線將 PDF 轉換為 HTML

我們可以按照下面給出的簡單步驟以編程方式將 pdf 文件轉換為 html 格式:

  • 首先,創建 ConvertApi 的實例
  • 然後,使用 ConvertSettings 創建轉換設置實例
  • 接下來,提供文件存儲名稱
  • 將輸入 PDF 文件路徑和輸出格式設置為“html”
  • 接下來,創建 PdfLoadOptions 的實例。
  • 提供PDF文件密碼
  • 然後,設置 output\path 和 load\options
  • 之後,使用 ConvertSettings 作為參數創建 ConvertDocumentRequest
  • 最後,通過使用 ConvertDocumentRequest 調用 convert\document() 將 pdf 轉換為 html

以下代碼示例顯示瞭如何在 Python 中將 pdf 格式更改為 html 格式:

# 如何使用 Python 在線將 PDF 轉換為 HTML
try:
  # 創建 API 實例
  convert_api = groupdocs_conversion_cloud.ConvertApi.from_keys(client_id, client_secret)

  # 定義轉換設置
  settings = groupdocs_conversion_cloud.ConvertSettings()
  settings.storage_name = your_storage
  settings.file_path = "python-testing/sample-pdf-file.pdf"
  settings.format = "html"

  loadOptions = groupdocs_conversion_cloud.PdfLoadOptions()
  loadOptions.password = "password"

  settings.load_options = loadOptions
  settings.output_path = "python-testing"

  # 創建轉換文檔請求
  request = groupdocs_conversion_cloud.ConvertDocumentRequest(settings)

  # 將 .pdf 文件轉換為 HTML 網頁
  result = convert_api.convert_document(request)
  print("pdf File converted to html successfully: " + result[0].path)

except groupdocs_conversion_cloud.ApiException as e:
  print("Exception when calling convert_document: {0}".format(e.message))

最後,上面的代碼示例會將 HTML 文件保存在雲端。這是將 pdf 轉換為 html 文檔的最佳方法。

如何在 Python 中將 PDF 文件轉換為 HTML

如何在 Python 中將 PDF 文件轉換為 HTML

在 Python 中將頁面範圍從 PDF 文件轉換為 HTML 文件

我們可以按照以下步驟將 PDF 文檔的頁面範圍轉換為 HTML:

  • 首先,創建 ConvertApi 的實例
  • 然後,使用 ConvertSettings 創建轉換設置實例
  • 接下來,提供您的雲存儲名稱
  • 將輸入 PDF 文件路徑和輸出格式設置為“html”
  • 接下來,創建 HtmlConvertOptions 的實例
  • 設置 from\page 和 pages\count 選項
  • 然後,設置輸出路徑和convertOptions
  • 現在,使用 ConvertSettings 作為參數創建 ConvertDocumentRequest
  • 最後用ConvertDocumentRequest調用convert\document()方法在線將pdf轉成html代碼

以下代碼示例顯示瞭如何使用 Python 將一系列頁面從 PDF 文檔轉換為 HTML 文件:

# 如何在 Python 中將頁面範圍從 PDF 轉換為 HTML
# 創建 API 實例
convert_api = groupdocs_conversion_cloud.ConvertApi.from_keys(client_id, client_secret)

# 準備 html 轉換設置
settings = groupdocs_conversion_cloud.ConvertSettings()
settings.storage_name = your_storage
settings.file_path = "python-testing/sample-pdf-file.pdf"
settings.format = "html"

# PDF 轉換選項:要轉換的起始頁碼和總頁數
convertOptions = groupdocs_conversion_cloud.HtmlConvertOptions()
convertOptions.from_page = 1 
convertOptions.pages_count = 1

settings.convert_options = convertOptions
settings.output_path = "python-testing"

# 創建轉換文檔請求
request = groupdocs_conversion_cloud.ConvertDocumentRequest(settings)

# 將 PDF 頁面轉換為 HTML 文件
result = convert_api.convert_document(request)
print("Converted range of pages from PDF to HTML web page: " + result[0].path)

最後,上面的代碼示例將文檔從pdf在線轉換為html後保存在雲端。

在 Python 中將特定頁面從 PDF 格式轉換為 HTML 格式

我們可以按照以下步驟使用帶有圖像的最佳 pdf 到 html 在線轉換器將 PDF 文檔的特定頁面轉換為 HTML:

  • 首先,創建 ConvertApi 的實例
  • 然後,使用 ConvertSettings 創建轉換設置實例
  • 接下來,提供您的雲存儲名稱
  • 將輸入 PDF 文件路徑和輸出格式設置為“html”
  • 接下來,創建 HtmlConvertOptions 的實例
  • 添加要轉換為數組格式的頁碼
  • 然後,設置輸出路徑和convertOptions
  • 現在,使用 ConvertSettings 作為參數創建 ConvertDocumentRequest
  • 最後用ConvertDocumentRequest調用convert\document()方法在線將pdf轉成html代碼

以下代碼示例顯示瞭如何使用 Python 將 PDF 文檔的某些頁面導出到 HTML 文件:

# 如何在Python中將PDF文件的特定頁面轉換為HTML網頁格式
# 創建 API 實例
convert_api = groupdocs_conversion_cloud.ConvertApi.from_keys(client_id, client_secret)

# 定義轉換設置
settings = groupdocs_conversion_cloud.ConvertSettings()
settings.storage_name = your_storage
settings.file_path = "python-testing/sample-pdf-file.pdf"
settings.format = "html"

# PDF 轉換選項:要轉換的頁碼
convertOptions = groupdocs_conversion_cloud.HtmlConvertOptions()
convertOptions.pages = [1, 3, 5]

settings.convert_options = convertOptions
settings.output_path = "python-testing"

# 創建轉換文檔請求
request = groupdocs_conversion_cloud.ConvertDocumentRequest(settings)

# 將 PDF 文件轉換為 HTML 文件
result = convert_api.convert_document(request)
print("Successfully converted PDF file to HTML document: " + result[0].path)

最後,上面的代碼示例將 pdf 轉換為帶有云端圖像的 html。有一個在線 pdf 到 html 代碼轉換器,如下所述。

免費在線 PDF 到 HTML 轉換器

什麼是最好的 PDF 到 HTML 轉換器? Groupdocs.Conversion 提供最好的免費在線 pdf 到 html 轉換器,供您將 PDF 轉換為 HTML 格式。它是使用 Groupdocs.Conversion 在線 pdf 到 html API 開發的。

結論

在本文中,您已了解:

  • 如何在不丟失 Python 格式的情況下將 pdf 轉換為 html;
  • 如何使用 Python 按範圍將 pdf 文件轉換為 html 文件;
  • 在 Python 中將特定的 PDF 頁面轉換為 HTML 格式;
  • 免費在線 pdf 到 html 轉換器;

此外,您可以使用 文檔 了解有關 GroupDocs.Conversion 文件格式轉換 API 的更多信息。

問一個問題

您可以通過我們的 免費支持論壇 詢問有關如何將 pdf 文件轉換為 html 格式的問題

也可以看看