將 PDF 文件轉換為 HTML 格式的能力對於各種目的(例如 Web 開發或內容管理)至關重要。無論您是尋求增強網站可訪問性的開發人員,還是希望重新利用PDF 內容以供在線使用的內容創建者,掌握使用C# .NET 將PDF 轉換為HTML 的過程都可以顯著簡化您的工作流程並提高效率。在本文中,我們將探討使用 .NET REST API 將 PDF 轉換為 HTML 的所有細節,涵蓋從基本概念到進階技術的所有內容。
本文涵蓋以下主題:
用於 PDF 到 HTML 轉換的 REST API
GroupDocs.Conversion Cloud SDK for .NET 提供了一個強大且多功能的解決方案,用於將 PDF 文件無縫轉換為 HTML 格式。 SDK 還提供高級自訂選項,可讓您根據特定要求指定轉換設置,例如頁面範圍、映像品質和輸出檔案結構。為了使用 SDK,第一步是安裝。因此,請在 NuGet 套件管理器中搜尋 GroupDocs.Conversion-Cloud 並點擊「安裝」按鈕。另一種選擇是在套件管理器控制台中執行以下命令。
NuGet\Install-Package GroupDocs.Conversion-Cloud -Version 24.2.0
成功安裝 REST API 後,請確保您擁有 API 憑證(即用戶端 ID 和用戶端金鑰)。您可以存取這個簡短的教學來了解如何取得 API 憑證。
使用 C# .NET 將 PDF 轉換為 HTML
以下部分詳細介紹如何利用 Cloud SDK 的強大功能,並使用 C# .NET 以程式設計方式自動執行 PDF 到 HTML 轉換任務。
- 建立「Configuration」類別的實例,我們在其中傳遞客戶端憑證作為參數。
var configurations = new Configuration(clientId, clientSecret1);
- 初始化
ConvertApi
,我們將 Configuration 物件作為輸入參數傳遞。
var apiInstance = new ConvertApi(configurations);
- 將輸入 PDF 檔案上傳到雲端存儲,同時傳遞輸入 PDF 文件的名稱。
fileUpload.UploadFile(new UploadFileRequest("input.pdf", stream));
- 建立一個實例“ConvertSettings”,在其中指定輸入 PDF 的名稱、輸出格式“html”以及產生的 HTML 檔案的名稱。
var settings = new ConvertSettings{...}
- 呼叫ConvertDocumentRequest介面將PDF格式轉換為HTML格式。成功轉換後,產生的 HTML 儲存在雲端儲存中。
var response = apiInstance.ConvertDocument(new ConvertDocumentRequest(settings));
// 更多範例請參閱 https://github.com/groupdocs-conversion-cloud/groupdocs-conversion-cloud-dotnet
// 取得您的 API 憑證
string clientId = "4bdefca3-f08c-4088-9ca0-55c38f4b7f22";
string clientSecret1 = "a43c8b4365246a062688a259abe5b469";
// 建立配置類別的實例並使用客戶端 ID 和客戶端金鑰對其進行初始化。
var configurations = new GroupDocs.Conversion.Cloud.Sdk.Client.Configuration(clientId, clientSecret1);
// 定義 ApiBaseUrl 的值以設定 html 到 PDF 轉換器 API 的基本 url。
configuration.ApiBaseUrl = "https://api.groupdocs.cloud";
// 使用 Configuration 類別的物件初始化 ConvertApi 類別的實例。
var apiInstance = new GroupDocs.Conversion.Cloud.Sdk.Api.ConvertApi(configurations);
// 從本機磁碟機載入 HTML 文件
using (var stream = System.IO.File.OpenRead("input.pdf"))
{
// 建立 FileApi 的實例
var fileUpload = new FileApi(configurations);
// 將輸入的PDF檔案上傳到雲端存儲
fileUpload.UploadFile(new UploadFileRequest("input.pdf", stream));
// 建立 ConvertSettings,在其中定義輸入 PDF 和產生的 HTML 的名稱
var settings = new ConvertSettings
{
StorageName = "internal",
FilePath = "input.pdf",
Format = "html",
OutputPath = "resultant.html"
};
// 呼叫 ConvertDocument 方法以程式設計方式將 PDF 轉換為 HTML。
var response = apiInstance.ConvertDocument(new GroupDocs.Conversion.Cloud.Sdk.Model.Requests.ConvertDocumentRequest(settings));
if (response != null && response.Equals("OK"))
{
// 列印成功訊息
Console.WriteLine("The PDF file successfully converted to HTML !");
}
}
上例中使用的範例 PDF 檔案可以從 input.pdf 下載。
使用 cURL 指令將 PDF 轉換為網頁
使用 GroupDocs.Conversion Cloud 和 cURL 命令將 PDF 轉換為 HTML 為自動執行文件轉換任務提供了方便且可編寫腳本的解決方案。這種方法的主要優點之一是它簡單且易於整合到現有工作流程和自動化管道中。只需幾個簡單的命令,您就可以啟動和管理轉換過程,而不需要複雜的程式碼或額外的庫。
此方法的第一步是取得您的個人化憑證(應用程式金鑰和應用程式 SID)並產生 JWT 存取權杖。一旦我們有了 JWT 令牌,請執行以下 cURL 命令將 PDF 轉換為 HTML 格式。以下命令會新增範例字串作為浮水印,但它是可選的。
curl -v "https://api.groupdocs.cloud/v2.0/conversion" \
-X POST \
-H "accept: application/json" \
-H "authorization: Bearer {accessToken}" \
-H "Content-Type: application/json" \
-d "{ \"FilePath\": \"{sourceFile}\", \"Format\": \"html\", \"LoadOptions\": { \"Format\": \"pdf\" }, \"ConvertOptions\": { \"FromPage\": 1, \"PagesCount\": 3, \"Pages\": [ 1,2,3 ], \"WatermarkOptions\": { \"Text\": \"Hello World !\", \"FontName\": \"Arial\", \"FontSize\": 10, \"Bold\": true, \"Italic\": true, \"Color\": \"Yellow\", \"Width\": 0, \"Height\": 0, \"Top\": 0, \"Left\": 0, \"RotationAngle\": 20, \"Transparency\": .5, \"Background\": true, \"AutoAlign\": true } }, \"OutputPath\": \"{resultantFile}\"}" -v
請將「sourceFile」替換為雲端儲存中可用的輸入 PDF 檔案的名稱,將「resultantFile」替換為要產生的輸出 HTML 格式的名稱,將「accessToken」替換為上面產生的 JWT 令牌。成功轉換後,產生的檔案儲存在雲端儲存中。
如果您想將產生的 HTML 儲存到本機驅動器,請使用下列命令。
curl -v "https://api.groupdocs.cloud/v2.0/conversion" \
-X POST \
-H "accept: application/json" \
-H "authorization: Bearer {accessToken}" \
-H "Content-Type: application/json" \
-d "{ \"FilePath\": \"{sourceFile}\", \"Format\": \"html\", \"LoadOptions\": { \"Format\": \"pdf\" }, \"ConvertOptions\": { \"FromPage\": 1, \"PagesCount\": 3, \"Pages\": [ 1,2,3 ], \"WatermarkOptions\": { \"Text\": \"Hello World !\", \"FontName\": \"Arial\", \"FontSize\": 10, \"Bold\": true, \"Italic\": true, \"Color\": \"Yellow\", \"Width\": 0, \"Height\": 0, \"Top\": 0, \"Left\": 0, \"RotationAngle\": 20, \"Transparency\": .5, \"Background\": true, \"AutoAlign\": true } } }" \
-o "resultant.html"
免費 PDF 到 HTML 轉換應用程式
您可以考慮使用我們在 GroupDocs.Conversion API 之上開發的免費、輕量且超高效的 PDF 到 HTML 轉換器。
有用的連結
結論
總而言之,無論您選擇使用適用於 .NET 的 GroupDocs.Conversion Cloud SDK 還是將 GroupDocs.Conversion Cloud 與 cURL 命令集成,將 PDF 轉換為 HTML 都將成為一個無縫且高效的過程。這兩種方法都提供了自動化文件轉換任務的多功能解決方案,使您能夠輕鬆彌合 PDF 和 HTML 格式之間的差距。整體而言,無論您喜歡 SDK 的便利性還是 cURL 指令的靈活性,這兩種方法都可以讓您有效率地將 PDF 轉換為 HTML,並充滿信心地優化文件處理工作流程。
相關文章
我們強烈建議訪問以下連結以了解更多資訊: