Convertir PDF documentos a HTML formato es bastante esencial, especialmente cuando necesitamos mostrar el contenido en línea, mejorando la accesibilidad y permitiendo la reutilización fácil del contenido en aplicaciones web. En este artículo, aprenderás cómo convertir PDF a HTML usando GroupDocs.Conversion Cloud SDK para .NET, preservando el diseño del documento, imágenes y formato.

Este artículo cubre los siguientes temas:

API de conversión de PDF a HTML

GroupDocs.Conversion Cloud SDK for .NET ofrece una API robusta para convertir documentos PDF a HTML con alta precisión. Le permite personalizar el HTML de salida, definir rangos de páginas y controlar la calidad de las imágenes, lo que lo hace ideal para integrar flujos de trabajo de documentos a la web en sus aplicaciones .NET.

Instalación

Instalar el SDK a través del Administrador de paquetes NuGet:

Install-Package GroupDocs.Conversion-Cloud -Version 24.2.0

O usando .NET CLI:

dotnet add package GroupDocs.Conversion-Cloud --version 24.2.0

Ahora, necesitas obtener tu ID de cliente personalizado y secreto de cliente del Aspose Cloud Dashboard para autenticar las solicitudes de API.

Convertir PDF a HTML en C# (.NET)

Aquí hay un ejemplo paso a paso en C# para convertir un PDF a HTML:

  1. Configurar Credenciales de API:
var config = new Configuration
{
    ClientId = "YOUR_CLIENT_ID",
    ClientSecret = "YOUR_CLIENT_SECRET"
};

var convertApi = new ConvertApi(config);
var fileApi = new FileApi(config);
  1. Sube el archivo PDF al Cloud Storage:
using (var fileStream = File.OpenRead("sample.pdf"))
{
    var uploadRequest = new UploadFileRequest("sample.pdf", fileStream);
    fileApi.UploadFile(uploadRequest);
}
  1. Establecer Configuración de Conversión:
var settings = new ConvertSettings
{
    FilePath = "sample.pdf",
    Format = "html",
    OutputPath = "converted/resultant.html"
};
  1. Realizar conversión de PDF a HTML:
var request = new ConvertDocumentRequest(settings);
convertApi.ConvertDocument(request);
using System;
using GroupDocs.Conversion.Cloud.Sdk.Api;
using GroupDocs.Conversion.Cloud.Sdk.Client;
using GroupDocs.Conversion.Cloud.Sdk.Model.Requests;
using System.IO;
using GroupDocs.Conversion.Cloud.Sdk.Model;

namespace GroupDocs.Conversion.CSharp
{
    // Realizar conversión de PDF a HTML
    class PDFConversion

    {
        static void Main(string[] args)
        {

            try
            {
                // Obtén tus credenciales de API 
                string clientId = "xxxxxxx-xxxx-xxxx-xxxx-xxxxxxxxxxxx";
                string clientSecret = "xxxxxxxxxxxxxxxxxxxxxxxxxxxxxx";
                string myStorage = "test";

                // Instanciar una instancia de la clase Configuration con el Client Secret & Client ID. 
                var configuration = new Configuration(clientId, clientSecret);
                // Define el valor de ApiBaseUrl para establecer la URL base de la API.
                configuration.ApiBaseUrl = "https://api.groupdocs.cloud";

                // Inicializa un objeto de la clase ConvertApi con el objeto de la clase Configuration.
                var apiInstance = new ConvertApi(configuration);
                // Crea una instancia de la clase ConvertSettings.
                var settings = new ConvertSettings
                {
                    FilePath = "sample.pdf",
                    Format = "html",
                    OutputPath = "converted/resultant.html"
                };

                // llama a la API para activar la conversión de PDF a página web.
                var response = apiInstance.ConvertDocument(new ConvertDocumentRequest(settings));
                Console.WriteLine("Successfully converted the PDF file to HTML format in C#: " + response[0].Url);
            }
            catch (Exception e)
            {
                Console.WriteLine("Exception when calling GroupDocs Api: " + e.Message);
            }

        }
    }
}
free pdf to html online

Imagen: - Una vista previa de la conversión de PDF a HTML.

  • El PDF de muestra utilizado en el ejemplo anterior se puede descargar desde input.pdf.

Convertir PDF a página web usando cURL

También puedes usar la GroupDocs.Conversion Cloud API REST con cURL para una rápida conversión en la línea de comandos.

  • Genera un token de acceso JWT con tus credenciales.
  • Run the following cURL command:
curl -v "https://api.groupdocs.cloud/v2.0/conversion" \
-X POST \
-H "accept: application/json" \
-H "authorization: Bearer {accessToken}" \
-H "Content-Type: application/json" \
-d "{  \"StorageName\": \"default\",  \"FilePath\": \"{sourcePDF}\",  \"Format\": \"html\",  \"OutputPath\": \"{resultantFile}\"}"
  • Ejecute el siguiente comando para guardar el HTML en el disco local:
curl -v "https://api.groupdocs.cloud/v2.0/conversion" \
-X POST \
-H "accept: application/json" \
-H "authorization: Bearer {accessToken}" \
-H "Content-Type: application/json" \
-d "{  \"StorageName\": \"default\",  \"FilePath\": \"{sourceFile}\",  \"Format\": \"html\"}" \
-o "{resultantFile}"
  • Reemplace: sourceFile, resultantFile, y accessToken con valores reales.

Prueba nuestro convertidor gratuito de PDF a HTML

Pruebe nuestra aplicación gratuita PDF to HTML Converter para ver la calidad de conversión antes de integrarla en su aplicación.

Convertidor de PDF a HTML gratuito en línea

Enlaces útiles

Conclusión

Usando GroupDocs.Conversion Cloud SDK para .NET, puedes integrar fácilmente la conversión de PDF a HTML en tus proyectos .NET, lo que permite obtener salidas de alta calidad y compatibles con la web, manteniendo el formato. Ya sea que uses el SDK en C# o realices llamadas REST API directas a través de cURL, el proceso es simple y altamente personalizable.

Artículos recomendados

Recomendamos encarecidamente explorar los siguientes artículos: