PDF zu HTM

Entwickeln Sie einen PDF zu HTML-Konverter mit C# .NET.

Die Fähigkeit, PDF Dokumente in das HTML-Format zu konvertieren, ist für eine Vielzahl von Zwecken unerlässlich, beispielsweise für die Webentwicklung oder das Content-Management. Egal, ob Sie Entwickler sind und die Zugänglichkeit von Websites verbessern möchten, oder Content-Ersteller, der PDF-Inhalte für die Online-Nutzung wiederverwenden möchte: Wenn Sie den Prozess der PDF zu HTML-Konvertierung mit C# .NET beherrschen, können Sie Ihren Workflow erheblich optimieren und die Effizienz steigern. In diesem Artikel werden wir alle Details der PDF zu HTML-Konvertierung mit .NET REST API untersuchen und dabei alles von grundlegenden Konzepten bis hin zu fortgeschrittenen Techniken abdecken.

Dieser Artikel behandelt die folgenden Themen:

REST-API für die Konvertierung von PDF in HTML

GroupDocs.Conversion Cloud SDK für .NET bietet eine robuste und vielseitige Lösung für die nahtlose Konvertierung von PDF Dokumenten in das HTML-Format. Das SDK bietet auch erweiterte Anpassungsoptionen, mit denen Sie Konvertierungseinstellungen wie Seitenbereich, Bildqualität und Ausgabedateistruktur entsprechend Ihren spezifischen Anforderungen festlegen können. Um das SDK verwenden zu können, ist der erste Schritt dessen Installation. Suchen Sie also im NuGet-Paketmanager nach GroupDocs.Conversion-Cloud und klicken Sie auf die Schaltfläche Installieren. Eine andere Möglichkeit besteht darin, den folgenden Befehl in der Paketmanagerkonsole auszuführen.

NuGet\Install-Package GroupDocs.Conversion-Cloud -Version 24.2.0

Sobald die REST-API erfolgreich installiert wurde, stellen Sie sicher, dass Sie über die API-Anmeldeinformationen (d. h. Client-ID und Client-Geheimnis) verfügen. In diesem kurzen Tutorial erfahren Sie, wie Sie die API-Anmeldeinformationen erhalten.

Konvertieren Sie PDF in HTML mit C# .NET

Im folgenden Abschnitt wird im Detail erläutert, wie wir die leistungsstarken Funktionen von Cloud SDK nutzen und die Konvertierung von PDF in HTML mit C# .NET programmgesteuert automatisieren können.

  1. Erstellen Sie eine Instanz der Klasse „Konfiguration“, in der wir Client-Anmeldeinformationen als Argumente übergeben.
var configurations = new Configuration(clientId, clientSecret1);
  1. Initialisieren Sie „ConvertApi“, wobei wir das Konfigurationsobjekt als Eingabeargument übergeben.
var apiInstance = new ConvertApi(configurations);
  1. Laden Sie die PDF-Eingabedatei in den Cloud-Speicher hoch und übergeben Sie dabei den Namen für das PDF-Eingabedokument.
fileUpload.UploadFile(new UploadFileRequest("input.pdf", stream));
  1. Erstellen Sie eine Instanz „ConvertSettings“, in der wir den Namen für das Eingabe-PDF, das Ausgabeformat als „html“ und den Namen für die resultierende HTML-Datei angeben.
var settings = new ConvertSettings{...}
  1. Rufen Sie die API ConvertDocumentRequest auf, um PDF in das HTML-Format zu konvertieren. Nach erfolgreicher Konvertierung wird das resultierende HTML im Cloud-Speicher gespeichert.
var response = apiInstance.ConvertDocument(new ConvertDocumentRequest(settings));
// Weitere Beispiele unter https://github.com/groupdocs-conversion-cloud/groupdocs-conversion-cloud-dotnet
// Erhalten Sie Ihre API-Anmeldeinformationen 
string clientId = "4bdefca3-f08c-4088-9ca0-55c38f4b7f22";
string clientSecret1 = "a43c8b4365246a062688a259abe5b469";

// Erstellen Sie eine Instanz der Konfigurationsklasse und initialisieren Sie sie mit der Client-ID und dem Client-Geheimnis. 
var configurations = new GroupDocs.Conversion.Cloud.Sdk.Client.Configuration(clientId, clientSecret1);
// Definieren Sie den Wert von ApiBaseUrl, um die Basis-URL der HTML zu PDF-Konverter-API festzulegen.
configuration.ApiBaseUrl = "https://api.groupdocs.cloud";

// Initialisieren Sie eine Instanz der ConvertApi Klasse mit dem Objekt der Configuration Klasse.
var apiInstance = new GroupDocs.Conversion.Cloud.Sdk.Api.ConvertApi(configurations);
             
// Laden Sie die HTML-Datei vom lokalen Laufwerk             
using (var stream = System.IO.File.OpenRead("input.pdf"))
{
    // Erstellen Sie eine Instanz von FileApi
    var fileUpload = new FileApi(configurations);
    // Laden Sie die Eingabe-PDF-Datei in den Cloud-Speicher hoch
    fileUpload.UploadFile(new UploadFileRequest("input.pdf", stream));

    // Erstellen Sie ConvertSettings, in denen wir das Eingabe-PDF und den Namen für das resultierende HTML definieren
    var settings = new ConvertSettings
    {
        StorageName = "internal",
        FilePath = "input.pdf",
        Format = "html",
        OutputPath = "resultant.html"
    };
    
    // Rufen Sie die Methode ConvertDocument auf, um PDF programmgesteuert in HTML zu konvertieren.
    var response = apiInstance.ConvertDocument(new GroupDocs.Conversion.Cloud.Sdk.Model.Requests.ConvertDocumentRequest(settings));
    if (response != null && response.Equals("OK"))
    {
        // Erfolgsmeldung drucken
        Console.WriteLine("The PDF file successfully converted to HTML !");
    }
}
PDF zu HTML.

Bild: – Vorschau der Konvertierung von PDF in HTML.

Die im obigen Beispiel verwendete Beispiel-PDF-Datei kann von input.pdf heruntergeladen werden.

Konvertieren Sie PDF mit cURL-Befehlen in eine Webseite

Die Konvertierung von PDF in HTML mithilfe von GroupDocs.Conversion Cloud und cURL-Befehlen bietet eine praktische und skriptfähige Lösung zur Automatisierung von Dokumentkonvertierungsaufgaben. Einer der Hauptvorteile dieses Ansatzes ist seine Einfachheit und einfache Integration in vorhandene Arbeitsabläufe und Automatisierungspipelines. Mit nur wenigen einfachen Befehlen können Sie den Konvertierungsprozess starten und verwalten, ohne dass komplexer Code oder zusätzliche Bibliotheken erforderlich sind.

Der erste Schritt bei diesem Ansatz besteht darin, Ihre personalisierten Anmeldeinformationen (App-Schlüssel und App-SID) abzurufen und ein JWT-Zugriffstoken zu generieren. Sobald wir das JWT-Token haben, führen Sie bitte den folgenden cURL-Befehl aus, um PDF in das HTML-Format umzuwandeln. Der folgende Befehl fügt eine Beispielzeichenfolge als Wasserzeichen hinzu, dies ist jedoch optional.

curl -v "https://api.groupdocs.cloud/v2.0/conversion" \
-X POST \
-H "accept: application/json" \
-H "authorization: Bearer {accessToken}" \
-H "Content-Type: application/json" \
-d "{  \"FilePath\": \"{sourceFile}\",  \"Format\": \"html\",  \"LoadOptions\": {    \"Format\": \"pdf\"  },  \"ConvertOptions\": {    \"FromPage\": 1,    \"PagesCount\": 3,    \"Pages\": [      1,2,3    ],    \"WatermarkOptions\": {      \"Text\": \"Hello World !\",      \"FontName\": \"Arial\",      \"FontSize\": 10,      \"Bold\": true,      \"Italic\": true,      \"Color\": \"Yellow\",      \"Width\": 0,      \"Height\": 0,      \"Top\": 0,      \"Left\": 0,      \"RotationAngle\": 20,      \"Transparency\": .5,      \"Background\": true,      \"AutoAlign\": true    }  },  \"OutputPath\": \"{resultantFile}\"}" -v

Bitte ersetzen Sie sourceFile durch den Namen der im Cloud-Speicher verfügbaren PDF-Eingabedatei, resultantFile durch den Namen des zu generierenden HTML-Ausgabeformats und accessToken durch das oben generierte JWT-Token. Nach erfolgreicher Konvertierung wird die resultierende Datei im Cloud-Speicher gespeichert.

Falls Sie das resultierende HTML auf dem lokalen Laufwerk speichern möchten, verwenden Sie bitte den folgenden Befehl.

curl -v "https://api.groupdocs.cloud/v2.0/conversion" \
-X POST \
-H "accept: application/json" \
-H "authorization: Bearer {accessToken}" \
-H "Content-Type: application/json" \
-d "{  \"FilePath\": \"{sourceFile}\",  \"Format\": \"html\",  \"LoadOptions\": {    \"Format\": \"pdf\"  },  \"ConvertOptions\": {    \"FromPage\": 1,    \"PagesCount\": 3,    \"Pages\": [      1,2,3    ],    \"WatermarkOptions\": {      \"Text\": \"Hello World !\",      \"FontName\": \"Arial\",      \"FontSize\": 10,      \"Bold\": true,      \"Italic\": true,      \"Color\": \"Yellow\",      \"Width\": 0,      \"Height\": 0,      \"Top\": 0,      \"Left\": 0,      \"RotationAngle\": 20,      \"Transparency\": .5,      \"Background\": true,      \"AutoAlign\": true  }  } }" \
-o "resultant.html"

Kostenlose App zur Konvertierung von PDF in HTML

Sie können unseren kostenlosen, leichten und äußerst effizienten PDF to HTML Converter verwenden, der auf Basis der GroupDocs.Conversion API entwickelt wurde.

kostenlose PDF zu HTML-App

Abschluss

Zusammenfassend lässt sich sagen, dass die Konvertierung von PDF in HTML ein nahtloser und effizienter Prozess wird, unabhängig davon, ob Sie GroupDocs.Conversion Cloud SDK für .NET verwenden oder GroupDocs.Conversion Cloud mit cURL-Befehlen integrieren. Beide Ansätze bieten vielseitige Lösungen zur Automatisierung von Dokumentkonvertierungsaufgaben und ermöglichen Ihnen, die Lücke zwischen PDF und HTML-Formaten mühelos zu schließen. Unabhängig davon, ob Sie den Komfort eines SDK oder die Flexibilität von cURL-Befehlen bevorzugen, ermöglichen Ihnen beide Ansätze eine effiziente Konvertierung von PDF in HTML und die zuverlässige Optimierung Ihrer Dokumentverarbeitungsabläufe.

In Verbindung stehende Artikel

Wir empfehlen Ihnen dringend, die folgenden Links zu besuchen, um mehr zu erfahren über: