PDF do HTML

Opracuj konwerter plików PDF na HTML za pomocą języka C# .NET.

Możliwość konwersji dokumentów PDF do formatu HTML jest niezbędna do różnych celów, takich jak tworzenie stron internetowych lub zarządzanie treścią. Niezależnie od tego, czy jesteś programistą chcącym zwiększyć dostępność witryny internetowej, czy twórcą treści, który chce zmienić przeznaczenie treści PDF do użytku online, opanowanie procesu konwersji plików PDF na HTML przy użyciu języka C# .NET może znacznie usprawnić przepływ pracy i poprawić wydajność. W tym artykule omówimy wszystkie szczegóły konwersji plików PDF na HTML przy użyciu interfejsu API .NET REST, obejmując wszystko, od podstawowych koncepcji po zaawansowane techniki.

W tym artykule omówiono następujące tematy:

API REST do konwersji plików PDF na HTML

GroupDocs.Conversion Cloud SDK dla .NET zapewnia solidne i wszechstronne rozwiązanie do płynnej konwersji dokumentów PDF do formatu HTML. Pakiet SDK zapewnia także zaawansowane opcje dostosowywania, umożliwiające określenie ustawień konwersji, takich jak zakres stron, jakość obrazu i struktura pliku wyjściowego, zgodnie z konkretnymi wymaganiami. Aby skorzystać z SDK, pierwszym krokiem jest jego instalacja. Zatem wyszukaj GroupDocs.Conversion-Cloud w menedżerze pakietów NuGet i kliknij przycisk Instaluj. Inną opcją jest wykonanie następującego polecenia w konsoli menedżera pakietów.

NuGet\Install-Package GroupDocs.Conversion-Cloud -Version 24.2.0

Po pomyślnym zainstalowaniu interfejsu API REST upewnij się, że masz poświadczenia interfejsu API (tj. identyfikator klienta i klucz tajny klienta).Możesz odwiedzić ten krótki [samouczek], aby dowiedzieć się, jak uzyskać dane uwierzytelniające API.

Konwertuj pliki PDF na HTML przy użyciu języka C# .NET

W poniższej sekcji wyjaśniono szczegółowo, w jaki sposób możemy wykorzystać potężne możliwości pakietu Cloud SDK i programowo zautomatyzować zadanie konwersji pliku PDF na HTML przy użyciu języka C# .NET.

  1. Utwórz instancję klasy Configuration, w której przekazujemy referencje klienta jako argumenty.
var configurations = new Configuration(clientId, clientSecret1);
  1. Zainicjuj ConvertApi, w którym przekazujemy obiekt konfiguracyjny jako argument wejściowy.
var apiInstance = new ConvertApi(configurations);
  1. Prześlij wejściowy plik PDF do magazynu w chmurze, przekazując nazwę wejściowego dokumentu PDF.
fileUpload.UploadFile(new UploadFileRequest("input.pdf", stream));
  1. Utwórz instancję „ConvertSettings”, w której określimy nazwę wejściowego pliku PDF, format wyjściowy jako „html” i nazwę wynikowego pliku HTML.
var settings = new ConvertSettings{...}
  1. Wywołaj interfejs API ConvertDocumentRequest, aby przekonwertować plik PDF na format HTML. Po udanej konwersji powstały kod HTML jest przechowywany w chmurze.
var response = apiInstance.ConvertDocument(new ConvertDocumentRequest(settings));
// Więcej przykładów na https://github.com/groupdocs-conversion-cloud/groupdocs-conversion-cloud-dotnet
// Uzyskaj dane uwierzytelniające API 
string clientId = "4bdefca3-f08c-4088-9ca0-55c38f4b7f22";
string clientSecret1 = "a43c8b4365246a062688a259abe5b469";

// Utwórz instancję klasy Konfiguracja i zainicjuj ją za pomocą identyfikatora klienta i klucza tajnego klienta. 
var configurations = new GroupDocs.Conversion.Cloud.Sdk.Client.Configuration(clientId, clientSecret1);
// Zdefiniuj wartość ApiBaseUrl, aby ustawić podstawowy adres URL interfejsu API konwertera HTML na PDF.
configuration.ApiBaseUrl = "https://api.groupdocs.cloud";

// Zainicjuj instancję klasy ConvertApi obiektem klasy Configuration.
var apiInstance = new GroupDocs.Conversion.Cloud.Sdk.Api.ConvertApi(configurations);
             
// załaduj plik HTML z dysku lokalnego             
using (var stream = System.IO.File.OpenRead("input.pdf"))
{
    // utwórz instancję FileApi
    var fileUpload = new FileApi(configurations);
    // prześlij wejściowy plik PDF do magazynu w chmurze
    fileUpload.UploadFile(new UploadFileRequest("input.pdf", stream));

    // utwórz ConvertSettings, w którym definiujemy wejściowy plik PDF i nazwę wynikowego kodu HTML
    var settings = new ConvertSettings
    {
        StorageName = "internal",
        FilePath = "input.pdf",
        Format = "html",
        OutputPath = "resultant.html"
    };
    
    // Wywołaj metodę ConvertDocument, aby programowo przekonwertować plik PDF na HTML.
    var response = apiInstance.ConvertDocument(new GroupDocs.Conversion.Cloud.Sdk.Model.Requests.ConvertDocumentRequest(settings));
    if (response != null && response.Equals("OK"))
    {
        // wydrukuj wiadomość o powodzeniu
        Console.WriteLine("The PDF file successfully converted to HTML !");
    }
}
PDF do HTML.

Obraz: – Podgląd konwersji pliku PDF na HTML.

Przykładowy plik PDF użyty w powyższym przykładzie można pobrać z input.pdf.

Konwertuj plik PDF na stronę internetową za pomocą poleceń cURL

Konwersja plików PDF na HTML za pomocą poleceń [GroupDocs.Conversion Cloud] i cURL oferuje wygodne i skryptowe rozwiązanie do automatyzacji zadań konwersji dokumentów. Jedną z kluczowych zalet tego podejścia jest jego prostota i łatwość integracji z istniejącymi przepływami pracy i potokami automatyzacji. Za pomocą kilku prostych poleceń możesz zainicjować proces konwersji i zarządzać nim bez konieczności stosowania skomplikowanego kodu lub dodatkowych bibliotek.

Pierwszym krokiem w tym podejściu jest uzyskanie spersonalizowanych poświadczeń (klucza aplikacji i identyfikatora SID aplikacji) oraz wygenerowanie tokenu dostępu JWT. Gdy już będziemy mieć token JWT, wykonaj następujące polecenie cURL, aby zamienić plik PDF na format HTML. Poniższe polecenie dodaje przykładowy ciąg znaków jako znak wodny, ale jest to opcjonalne.

curl -v "https://api.groupdocs.cloud/v2.0/conversion" \
-X POST \
-H "accept: application/json" \
-H "authorization: Bearer {accessToken}" \
-H "Content-Type: application/json" \
-d "{  \"FilePath\": \"{sourceFile}\",  \"Format\": \"html\",  \"LoadOptions\": {    \"Format\": \"pdf\"  },  \"ConvertOptions\": {    \"FromPage\": 1,    \"PagesCount\": 3,    \"Pages\": [      1,2,3    ],    \"WatermarkOptions\": {      \"Text\": \"Hello World !\",      \"FontName\": \"Arial\",      \"FontSize\": 10,      \"Bold\": true,      \"Italic\": true,      \"Color\": \"Yellow\",      \"Width\": 0,      \"Height\": 0,      \"Top\": 0,      \"Left\": 0,      \"RotationAngle\": 20,      \"Transparency\": .5,      \"Background\": true,      \"AutoAlign\": true    }  },  \"OutputPath\": \"{resultantFile}\"}" -v

Zastąp „sourceFile” nazwą wejściowego pliku PDF dostępnego w chmurze, „resultantFile” nazwą wyjściowego formatu HTML, który ma zostać wygenerowany, a „accessToken” wygenerowanym powyżej tokenem JWT. Po pomyślnej konwersji powstały plik jest przechowywany w chmurze.

Jeśli chcesz zapisać wynikowy kod HTML na dysku lokalnym, użyj następującego polecenia.

curl -v "https://api.groupdocs.cloud/v2.0/conversion" \
-X POST \
-H "accept: application/json" \
-H "authorization: Bearer {accessToken}" \
-H "Content-Type: application/json" \
-d "{  \"FilePath\": \"{sourceFile}\",  \"Format\": \"html\",  \"LoadOptions\": {    \"Format\": \"pdf\"  },  \"ConvertOptions\": {    \"FromPage\": 1,    \"PagesCount\": 3,    \"Pages\": [      1,2,3    ],    \"WatermarkOptions\": {      \"Text\": \"Hello World !\",      \"FontName\": \"Arial\",      \"FontSize\": 10,      \"Bold\": true,      \"Italic\": true,      \"Color\": \"Yellow\",      \"Width\": 0,      \"Height\": 0,      \"Top\": 0,      \"Left\": 0,      \"RotationAngle\": 20,      \"Transparency\": .5,      \"Background\": true,      \"AutoAlign\": true  }  } }" \
-o "resultant.html"

Bezpłatna aplikacja do konwersji plików PDF na HTML

Możesz rozważyć skorzystanie z naszego bezpłatnego, lekkiego i superwydajnego konwertera plików PDF na HTML opracowanego w oparciu o interfejs API GroupDocs.Conversion.

bezpłatna aplikacja PDF do HTML

Przydatne linki

Wniosek

Podsumowując, niezależnie od tego, czy zdecydujesz się na korzystanie z pakietu SDK GroupDocs.Conversion Cloud dla .NET, czy na integrację GroupDocs.Conversion Cloud z poleceniami cURL, konwersja plików PDF na HTML stanie się płynnym i wydajnym procesem. Obydwa podejścia oferują wszechstronne rozwiązania do automatyzacji zadań konwersji dokumentów, umożliwiając bezproblemowe wypełnienie luki pomiędzy formatami PDF i HTML. Ogólnie rzecz biorąc, niezależnie od tego, czy wolisz wygodę pakietu SDK, czy elastyczność poleceń cURL, oba podejścia umożliwiają wydajną konwersję plików PDF na HTML i bezpieczną optymalizację procesów przetwarzania dokumentów.

Powiązane artykuły

Zdecydowanie zalecamy odwiedzenie poniższych łączy, aby dowiedzieć się więcej na temat: