Da PDF a HTM

Sviluppa convertitore da PDF a HTML con C# .NET.

La possibilità di convertire documenti PDF nel formato HTML è essenziale per una varietà di scopi, come lo sviluppo web o la gestione dei contenuti. Che tu sia uno sviluppatore che cerca di migliorare l’accessibilità del sito Web o un creatore di contenuti che desidera riutilizzare i contenuti PDF per la fruizione online, padroneggiare il processo di conversione da PDF a HTML utilizzando C# .NET può semplificare in modo significativo il flusso di lavoro e migliorare l’efficienza. In questo articolo esploreremo tutti i dettagli della conversione da PDF a HTML utilizzando l’API REST .NET, coprendo tutto, dai concetti essenziali alle tecniche avanzate.

Questo articolo tratta i seguenti argomenti:

API REST per la conversione da PDF a HTML

GroupDocs.Conversion Cloud SDK per .NET fornisce una soluzione solida e versatile per convertire facilmente documenti PDF in formato HTML. L’SDK fornisce inoltre opzioni di personalizzazione avanzate, che ti consentono di specificare impostazioni di conversione come intervallo di pagine, qualità dell’immagine e struttura del file di output in base ai tuoi requisiti specifici. Per utilizzare l’SDK, il primo passo è la sua installazione. Quindi, cerca GroupDocs.Conversion-Cloud nel gestore pacchetti NuGet e fai clic sul pulsante Installa. Un’altra opzione è eseguire il seguente comando nella console del gestore pacchetti.

NuGet\Install-Package GroupDocs.Conversion-Cloud -Version 24.2.0

Una volta installata correttamente l’API REST, assicurati di disporre delle credenziali API (ad esempio ID client e segreto client).Puoi visitare questo breve tutorial per vedere come ottenere le credenziali API.

Converti PDF in HTML utilizzando C# .NET

La sezione seguente spiega i dettagli su come possiamo sfruttare le potenti funzionalità di Cloud SDK e automatizzare a livello di codice l’attività di conversione da PDF a HTML, utilizzando C# .NET.

  1. Crea un’istanza della classe “Configuration” in cui passiamo le credenziali del client come argomenti.
var configurations = new Configuration(clientId, clientSecret1);
  1. Inizializza ConvertApi dove passiamo l’oggetto Configuration come argomento di input.
var apiInstance = new ConvertApi(configurations);
  1. Carica il file PDF di input nell’archivio cloud passando il nome per il documento PDF di input.
fileUpload.UploadFile(new UploadFileRequest("input.pdf", stream));
  1. Crea un’istanza “ConvertSettings” in cui specifichiamo il nome per il PDF di input, il formato di output come “html” e il nome per il file HTML risultante.
var settings = new ConvertSettings{...}
  1. Chiama l’API ConvertDocumentRequest per convertire il PDF in formato HTML. Una volta completata con successo la conversione, l’HTML risultante viene archiviato nel cloud storage.
var response = apiInstance.ConvertDocument(new ConvertDocumentRequest(settings));
// Altri esempi su https://github.com/groupdocs-conversion-cloud/groupdocs-conversion-cloud-dotnet
// Ottieni le tue credenziali API 
string clientId = "4bdefca3-f08c-4088-9ca0-55c38f4b7f22";
string clientSecret1 = "a43c8b4365246a062688a259abe5b469";

// Crea un'istanza della classe Configuration e inizializzala con l'ID client e il segreto client. 
var configurations = new GroupDocs.Conversion.Cloud.Sdk.Client.Configuration(clientId, clientSecret1);
// Definire il valore di ApiBaseUrl per impostare l'URL di base dell'API del convertitore da HTML a PDF.
configuration.ApiBaseUrl = "https://api.groupdocs.cloud";

// Inizializza un'istanza della classe ConvertApi con l'oggetto della classe Configuration.
var apiInstance = new GroupDocs.Conversion.Cloud.Sdk.Api.ConvertApi(configurations);
             
// caricare il file HTML dall'unità locale             
using (var stream = System.IO.File.OpenRead("input.pdf"))
{
    // creare un'istanza di FileApi
    var fileUpload = new FileApi(configurations);
    // caricare il file PDF di input nell'archivio cloud
    fileUpload.UploadFile(new UploadFileRequest("input.pdf", stream));

    // creare ConvertSettings in cui definiamo il PDF di input e il nome per l'HTML risultante
    var settings = new ConvertSettings
    {
        StorageName = "internal",
        FilePath = "input.pdf",
        Format = "html",
        OutputPath = "resultant.html"
    };
    
    // Richiamare il metodo ConvertDocument per convertire PDF in HTML a livello di codice.
    var response = apiInstance.ConvertDocument(new GroupDocs.Conversion.Cloud.Sdk.Model.Requests.ConvertDocumentRequest(settings));
    if (response != null && response.Equals("OK"))
    {
        // stampare il messaggio di successo
        Console.WriteLine("The PDF file successfully converted to HTML !");
    }
}
Da PDF a HTML.

Immagine: - Anteprima della conversione da PDF a HTML.

Il file PDF di esempio utilizzato nell’esempio precedente può essere scaricato da input.pdf.

Converti PDF in pagine web utilizzando i comandi cURL

La conversione di PDF in HTML utilizzando GroupDocs.Conversion Cloud e i comandi cURL offre una soluzione comoda e programmabile per automatizzare le attività di conversione dei documenti. Uno dei principali vantaggi di questo approccio è la sua semplicità e facilità di integrazione nei flussi di lavoro e nelle pipeline di automazione esistenti. Con pochi semplici comandi puoi avviare e gestire il processo di conversione senza la necessità di codice complesso o librerie aggiuntive.

Il primo passo in questo approccio è ottenere le credenziali personalizzate (chiave app e SID app) e generare token di accesso JWT. Una volta ottenuto il token JWT, esegui il seguente comando cURL per trasformare il PDF in formato HTML. Il comando seguente aggiunge una stringa di esempio come filigrana ma è facoltativo.

curl -v "https://api.groupdocs.cloud/v2.0/conversion" \
-X POST \
-H "accept: application/json" \
-H "authorization: Bearer {accessToken}" \
-H "Content-Type: application/json" \
-d "{  \"FilePath\": \"{sourceFile}\",  \"Format\": \"html\",  \"LoadOptions\": {    \"Format\": \"pdf\"  },  \"ConvertOptions\": {    \"FromPage\": 1,    \"PagesCount\": 3,    \"Pages\": [      1,2,3    ],    \"WatermarkOptions\": {      \"Text\": \"Hello World !\",      \"FontName\": \"Arial\",      \"FontSize\": 10,      \"Bold\": true,      \"Italic\": true,      \"Color\": \"Yellow\",      \"Width\": 0,      \"Height\": 0,      \"Top\": 0,      \"Left\": 0,      \"RotationAngle\": 20,      \"Transparency\": .5,      \"Background\": true,      \"AutoAlign\": true    }  },  \"OutputPath\": \"{resultantFile}\"}" -v

Sostituisci “sourceFile” con il nome del file PDF di input disponibile nell’archivio cloud, “resultantFile” con il nome del formato HTML di output da generare e “accessToken” con il token JWT generato sopra. Una volta completata con successo la conversione, il file risultante viene archiviato nell’archivio cloud.

Nel caso in cui desideri salvare l’HTML risultante sull’unità locale, utilizza il seguente comando.

curl -v "https://api.groupdocs.cloud/v2.0/conversion" \
-X POST \
-H "accept: application/json" \
-H "authorization: Bearer {accessToken}" \
-H "Content-Type: application/json" \
-d "{  \"FilePath\": \"{sourceFile}\",  \"Format\": \"html\",  \"LoadOptions\": {    \"Format\": \"pdf\"  },  \"ConvertOptions\": {    \"FromPage\": 1,    \"PagesCount\": 3,    \"Pages\": [      1,2,3    ],    \"WatermarkOptions\": {      \"Text\": \"Hello World !\",      \"FontName\": \"Arial\",      \"FontSize\": 10,      \"Bold\": true,      \"Italic\": true,      \"Color\": \"Yellow\",      \"Width\": 0,      \"Height\": 0,      \"Top\": 0,      \"Left\": 0,      \"RotationAngle\": 20,      \"Transparency\": .5,      \"Background\": true,      \"AutoAlign\": true  }  } }" \
-o "resultant.html"

App gratuita per la conversione da PDF a HTML

Potresti prendere in considerazione l’utilizzo del nostro convertitore da PDF a HTML gratuito, leggero e super efficiente, sviluppato sulla base dell’API GroupDocs.Conversion.

app gratuita da pdf a html

Conclusione

In conclusione, sia che tu scelga di utilizzare GroupDocs.Conversion Cloud SDK per .NET o di integrare GroupDocs.Conversion Cloud con comandi cURL, convertire PDF in HTML diventa un processo semplice ed efficiente. Entrambi gli approcci offrono soluzioni versatili per automatizzare le attività di conversione dei documenti, consentendoti di colmare facilmente il divario tra i formati PDF e HTML. Nel complesso, che tu preferisca la comodità di un SDK o la flessibilità dei comandi cURL, entrambi gli approcci ti consentono di convertire in modo efficiente PDF in HTML e di ottimizzare con sicurezza i flussi di lavoro di elaborazione dei documenti.

articoli Correlati

Ti consigliamo vivamente di visitare i seguenti link per saperne di più su: