PDF en HTML

Développez un convertisseur PDF en HTML avec C# .NET.

La possibilité de convertir des documents PDF au format HTML est essentielle à diverses fins, telles que le développement Web ou la gestion de contenu. Que vous soyez un développeur cherchant à améliorer l’accessibilité d’un site Web ou un créateur de contenu cherchant à réutiliser le contenu PDF pour une consommation en ligne, maîtriser le processus de conversion PDF en HTML à l’aide de C# .NET peut considérablement rationaliser votre flux de travail et améliorer votre efficacité. Dans cet article, nous explorerons tous les détails de la conversion PDF en HTML à l’aide de l’API .NET REST, couvrant tout, des concepts essentiels aux techniques avancées.

Cet article couvre les sujets suivants :

API REST pour la conversion PDF en HTML

GroupDocs.Conversion Cloud SDK for .NET fournit une solution robuste et polyvalente pour convertir de manière transparente des documents PDF au format HTML. Le SDK fournit également des options de personnalisation avancées, vous permettant de spécifier les paramètres de conversion tels que la plage de pages, la qualité de l’image et la structure du fichier de sortie en fonction de vos besoins spécifiques. Pour utiliser le SDK, la première étape est son installation. Alors, recherchez GroupDocs.Conversion-Cloud dans le gestionnaire de packages NuGet et cliquez sur le bouton Installer. Une autre option consiste à exécuter la commande suivante dans la console du gestionnaire de packages.

NuGet\Install-Package GroupDocs.Conversion-Cloud -Version 24.2.0

Une fois l’API REST installée avec succès, assurez-vous que vous disposez des informations d’identification de l’API (c’est-à-dire l’ID client et le secret client).Vous pouvez visiter ce court tutoriel pour voir comment obtenir les informations d’identification de l’API.

Convertir un PDF en HTML à l’aide de C# .NET

La section suivante explique en détail comment nous pouvons exploiter les puissantes capacités du SDK Cloud et automatiser par programme la tâche de conversion PDF en HTML, à l’aide de C# .NET.

  1. Créez une instance de la classe « Configuration » où nous transmettons les informations d’identification du client comme arguments.
var configurations = new Configuration(clientId, clientSecret1);
  1. Initialisez le ConvertApi où nous passons l’objet Configuration comme argument d’entrée.
var apiInstance = new ConvertApi(configurations);
  1. Téléchargez le fichier PDF d’entrée sur le stockage cloud tout en transmettant le nom du document PDF d’entrée.
fileUpload.UploadFile(new UploadFileRequest("input.pdf", stream));
  1. Créez une instance « ConvertSettings » où nous spécifions le nom du PDF d’entrée, le format de sortie comme « html » et le nom du fichier HTML résultant.
var settings = new ConvertSettings{...}
  1. Appelez l’API ConvertDocumentRequest pour convertir le PDF au format HTML. Après une conversion réussie, le HTML résultant est stocké dans le stockage cloud.
var response = apiInstance.ConvertDocument(new ConvertDocumentRequest(settings));
// Plus d'exemples sur https://github.com/groupdocs-conversion-cloud/groupdocs-conversion-cloud-dotnet
// Obtenez vos identifiants API 
string clientId = "4bdefca3-f08c-4088-9ca0-55c38f4b7f22";
string clientSecret1 = "a43c8b4365246a062688a259abe5b469";

// Créez une instance de la classe Configuration et initialisez-la avec l'ID client et le secret client. 
var configurations = new GroupDocs.Conversion.Cloud.Sdk.Client.Configuration(clientId, clientSecret1);
// Définissez la valeur de ApiBaseUrl pour définir l'URL de base de l'API du convertisseur HTML en PDF.
configuration.ApiBaseUrl = "https://api.groupdocs.cloud";

// Initialisez une instance de la classe ConvertApi avec l'objet de la classe Configuration.
var apiInstance = new GroupDocs.Conversion.Cloud.Sdk.Api.ConvertApi(configurations);
             
// charger le fichier HTML à partir du lecteur local             
using (var stream = System.IO.File.OpenRead("input.pdf"))
{
    // créer une instance de FileApi
    var fileUpload = new FileApi(configurations);
    // télécharger le fichier PDF d'entrée sur le stockage cloud
    fileUpload.UploadFile(new UploadFileRequest("input.pdf", stream));

    // créer ConvertSettings où nous définissons le PDF d'entrée et le nom du HTML résultant
    var settings = new ConvertSettings
    {
        StorageName = "internal",
        FilePath = "input.pdf",
        Format = "html",
        OutputPath = "resultant.html"
    };
    
    // Appelez la méthode ConvertDocument pour convertir un PDF en HTML par programmation.
    var response = apiInstance.ConvertDocument(new GroupDocs.Conversion.Cloud.Sdk.Model.Requests.ConvertDocumentRequest(settings));
    if (response != null && response.Equals("OK"))
    {
        // imprimer le message de réussite
        Console.WriteLine("The PDF file successfully converted to HTML !");
    }
}
PDF en HTML.

Image : - Aperçu de la conversion PDF en HTML.

L’exemple de fichier PDF utilisé dans l’exemple ci-dessus peut être téléchargé à partir de input.pdf.

Convertir un PDF en page Web à l’aide des commandes cURL

La conversion de PDF en HTML à l’aide des commandes GroupDocs.Conversion Cloud et cURL offre une solution pratique et scriptable pour automatiser les tâches de conversion de documents. L’un des principaux avantages de cette approche est sa simplicité et sa facilité d’intégration dans les flux de travail et les pipelines d’automatisation existants. Avec seulement quelques commandes simples, vous pouvez lancer et gérer le processus de conversion sans avoir besoin de code complexe ou de bibliothèques supplémentaires.

La première étape de cette approche consiste à obtenir vos informations d’identification personnalisées (App Key et App SID) et à générer un jeton d’accès JWT. Une fois que nous avons le jeton JWT, veuillez exécuter la commande cURL suivante pour transformer le PDF au format HTML. La commande suivante ajoute un exemple de chaîne en filigrane, mais elle est facultative.

curl -v "https://api.groupdocs.cloud/v2.0/conversion" \
-X POST \
-H "accept: application/json" \
-H "authorization: Bearer {accessToken}" \
-H "Content-Type: application/json" \
-d "{  \"FilePath\": \"{sourceFile}\",  \"Format\": \"html\",  \"LoadOptions\": {    \"Format\": \"pdf\"  },  \"ConvertOptions\": {    \"FromPage\": 1,    \"PagesCount\": 3,    \"Pages\": [      1,2,3    ],    \"WatermarkOptions\": {      \"Text\": \"Hello World !\",      \"FontName\": \"Arial\",      \"FontSize\": 10,      \"Bold\": true,      \"Italic\": true,      \"Color\": \"Yellow\",      \"Width\": 0,      \"Height\": 0,      \"Top\": 0,      \"Left\": 0,      \"RotationAngle\": 20,      \"Transparency\": .5,      \"Background\": true,      \"AutoAlign\": true    }  },  \"OutputPath\": \"{resultantFile}\"}" -v

Veuillez remplacer « sourceFile » par le nom du fichier PDF d’entrée disponible dans le stockage cloud, « resultantFile » par le nom du format HTML de sortie à générer et « accessToken » par le jeton JWT généré ci-dessus. Après une conversion réussie, le fichier résultant est stocké dans le stockage cloud.

Si vous souhaitez enregistrer le HTML résultant sur le lecteur local, veuillez utiliser la commande suivante.

curl -v "https://api.groupdocs.cloud/v2.0/conversion" \
-X POST \
-H "accept: application/json" \
-H "authorization: Bearer {accessToken}" \
-H "Content-Type: application/json" \
-d "{  \"FilePath\": \"{sourceFile}\",  \"Format\": \"html\",  \"LoadOptions\": {    \"Format\": \"pdf\"  },  \"ConvertOptions\": {    \"FromPage\": 1,    \"PagesCount\": 3,    \"Pages\": [      1,2,3    ],    \"WatermarkOptions\": {      \"Text\": \"Hello World !\",      \"FontName\": \"Arial\",      \"FontSize\": 10,      \"Bold\": true,      \"Italic\": true,      \"Color\": \"Yellow\",      \"Width\": 0,      \"Height\": 0,      \"Top\": 0,      \"Left\": 0,      \"RotationAngle\": 20,      \"Transparency\": .5,      \"Background\": true,      \"AutoAlign\": true  }  } }" \
-o "resultant.html"

Application gratuite de conversion PDF en HTML

Vous pouvez envisager d’utiliser notre Convertisseur PDF en HTML gratuit, léger et ultra-efficace développé sur l’API GroupDocs.Conversion.

application gratuite pdf en html

Liens utiles

Conclusion

En conclusion, que vous choisissiez d’utiliser le SDK GroupDocs.Conversion Cloud pour .NET ou d’intégrer GroupDocs.Conversion Cloud aux commandes cURL, la conversion de PDF en HTML devient un processus transparent et efficace. Les deux approches offrent des solutions polyvalentes pour automatiser les tâches de conversion de documents, vous permettant de combler sans effort le fossé entre les formats PDF et HTML. Dans l’ensemble, que vous préfériez la commodité d’un SDK ou la flexibilité des commandes cURL, les deux approches vous permettent de convertir efficacement des PDF en HTML et d’optimiser vos flux de traitement de documents en toute confiance.

Articles Liés

Nous vous recommandons fortement de visiter les liens suivants pour en savoir plus sur :