PDF est l’un des formats de fichiers les plus couramment utilisés aujourd’hui qui offre une prise en charge multiplateforme. Mais il est difficile de créer un lien vers une page spécifique dans un document PDF et les fichiers PDF ne sont pas facilement partagés sur les réseaux sociaux. Vous pouvez conserver l’apparence d’un document PDF au format HTML qui peut être manipulé rapidement. Dans cet article, nous allons apprendre à convertir des fichiers PDF en HTML en Python.

Les sujets suivants seront traités dans cet article :

API de conversion Python PDF vers HTML – Installation

Afin de convertir un fichier PDF en pages Web HTML, nous utiliserons l’API Python SDK of GroupDocs.Conversion Cloud. Il s’agit d’une bibliothèque Python de conversion de documents et d’images riche en fonctionnalités et indépendante de la plate-forme. Il fournit une conversion rapide des images et des documents de n’importe quel format de fichier pris en charge vers n’importe quel format en haute qualité.

Vous pouvez installer et intégrer la bibliothèque Python de conversion PDF vers HTML dans vos applications Python à l’aide de la commande suivante dans la console :

pip install groupdocs_conversion_cloud

Veuillez obtenir votre ID client et votre secret à partir du tableau de bord avant de suivre les étapes mentionnées. Une fois que vous avez votre identifiant et votre secret, ajoutez du code dans votre application python :

# Charger la bibliothèque Python pour la conversion PDF en HTML dans l'application Python
import groupdocs_conversion_cloud

# Obtenez client_id et client_secret depuis https://dashboard.groupdocs.cloud après une inscription gratuite.
client_id = "xxxxxxx-xxxx-xxxx-xxxx-xxxxxxxxxxxx"
client_secret = "xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx"

# Obtenez différentes configurations
configuration = groupdocs_conversion_cloud.Configuration(client_id, client_secret)
configuration.api_base_url = "https://api.groupdocs.cloud"
your_storage = "groupdocs-storage-name"

Maintenant, montrons comment convertir le format pdf au format html étape par étape à l’aide de l’API REST en Python.

Comment convertir un PDF en HTML en ligne en Python à l’aide de l’API REST

Nous pouvons convertir un fichier pdf au format html par programme en suivant les étapes simples ci-dessous :

  • Tout d’abord, créez une instance de ConvertApi
  • Ensuite, créez une instance de paramètres de conversion à l’aide de ConvertSettings
  • Ensuite, indiquez le nom de stockage des fichiers
  • Définissez le chemin du fichier PDF d’entrée et le format de sortie sur “html”
  • Ensuite, créez une instance de PdfLoadOptions.
  • Indiquez le mot de passe du fichier PDF
  • Ensuite, définissez les options output\path et load\
  • Après cela, créez le ConvertDocumentRequest avec ConvertSettings comme argument
  • Enfin, convertissez pdf en html en appelant le convert\document() avec ConvertDocumentRequest

L’exemple de code suivant montre comment changer le format pdf en html en Python :

# Comment Python convertir un PDF en HTML en ligne
try:
  # Créer une instance de l'API
  convert_api = groupdocs_conversion_cloud.ConvertApi.from_keys(client_id, client_secret)

  # Définir les paramètres de conversion
  settings = groupdocs_conversion_cloud.ConvertSettings()
  settings.storage_name = your_storage
  settings.file_path = "python-testing/sample-pdf-file.pdf"
  settings.format = "html"

  loadOptions = groupdocs_conversion_cloud.PdfLoadOptions()
  loadOptions.password = "password"

  settings.load_options = loadOptions
  settings.output_path = "python-testing"

  # Créer une demande de conversion de document
  request = groupdocs_conversion_cloud.ConvertDocumentRequest(settings)

  # Convertir un fichier .pdf en page Web HTML
  result = convert_api.convert_document(request)
  print("pdf File converted to html successfully: " + result[0].path)

except groupdocs_conversion_cloud.ApiException as e:
  print("Exception when calling convert_document: {0}".format(e.message))

Enfin, l’exemple de code ci-dessus enregistrera le fichier HTML sur le cloud. C’est le meilleur moyen de convertir un document pdf en document html.

Comment convertir des fichiers PDF en HTML en Python

Comment convertir des fichiers PDF en HTML en Python

Convertir une plage de pages d’un fichier PDF en un fichier HTML en Python

Nous pouvons convertir une plage de pages d’un document PDF en HTML en suivant les étapes ci-dessous :

  • Tout d’abord, créez une instance de ConvertApi
  • Ensuite, créez une instance de paramètres de conversion à l’aide de ConvertSettings
  • Ensuite, indiquez le nom de votre stockage cloud
  • Définissez le chemin d’accès au fichier PDF d’entrée et le format de sortie en “html”
  • Ensuite, créez une instance de HtmlConvertOptions
  • Définissez les options from\page et pages\count
  • Ensuite, définissez le chemin de sortie et convertOptions
  • Maintenant, créez le ConvertDocumentRequest avec ConvertSettings comme argument
  • Enfin, convertissez le pdf en code html en ligne en appelant la méthode convert\document() avec ConvertDocumentRequest

L’exemple de code suivant montre comment convertir une plage de pages d’un document PDF en un fichier HTML à l’aide de Python :

# Comment convertir une plage de pages de PDF en HTML en Python
# Créer une instance d'API
convert_api = groupdocs_conversion_cloud.ConvertApi.from_keys(client_id, client_secret)

# Préparer les paramètres de conversion html
settings = groupdocs_conversion_cloud.ConvertSettings()
settings.storage_name = your_storage
settings.file_path = "python-testing/sample-pdf-file.pdf"
settings.format = "html"

# Options de conversion PDF : numéro de page de départ et nombre total de pages à convertir
convertOptions = groupdocs_conversion_cloud.HtmlConvertOptions()
convertOptions.from_page = 1 
convertOptions.pages_count = 1

settings.convert_options = convertOptions
settings.output_path = "python-testing"

# Créer une demande de conversion de document
request = groupdocs_conversion_cloud.ConvertDocumentRequest(settings)

# Convertir des pages de PDF en fichier HTML
result = convert_api.convert_document(request)
print("Converted range of pages from PDF to HTML web page: " + result[0].path)

Enfin, l’exemple de code ci-dessus enregistrera le document après la conversion de pdf en html en ligne sur le cloud.

Convertir des pages spécifiques du format PDF au format HTML en Python

Nous pouvons convertir des pages spécifiques d’un document PDF en HTML en utilisant le meilleur convertisseur pdf en html en ligne avec des images en suivant les étapes ci-dessous :

  • Tout d’abord, créez une instance de ConvertApi
  • Ensuite, créez une instance de paramètres de conversion à l’aide de ConvertSettings
  • Ensuite, indiquez le nom de votre stockage cloud
  • Définissez le chemin d’accès au fichier PDF d’entrée et le format de sortie en “html”
  • Ensuite, créez une instance de HtmlConvertOptions
  • Ajoutez le numéro de page à convertir au format tableau
  • Ensuite, définissez le chemin de sortie et convertOptions
  • Maintenant, créez le ConvertDocumentRequest avec ConvertSettings comme argument
  • Enfin, convertissez le pdf en code html en ligne en appelant la méthode convert\document() avec ConvertDocumentRequest

L’exemple de code suivant montre comment exporter certaines pages d’un document PDF vers un fichier HTML à l’aide de Python :

# Comment convertir des pages spécifiques d'un fichier PDF au format de page Web HTML en Python
# Créer une instance d'API
convert_api = groupdocs_conversion_cloud.ConvertApi.from_keys(client_id, client_secret)

# Définir les paramètres de conversion
settings = groupdocs_conversion_cloud.ConvertSettings()
settings.storage_name = your_storage
settings.file_path = "python-testing/sample-pdf-file.pdf"
settings.format = "html"

# Options de conversion PDF : numéros de page à convertir
convertOptions = groupdocs_conversion_cloud.HtmlConvertOptions()
convertOptions.pages = [1, 3, 5]

settings.convert_options = convertOptions
settings.output_path = "python-testing"

# Créer une demande de conversion de document
request = groupdocs_conversion_cloud.ConvertDocumentRequest(settings)

# Convertir un fichier PDF en fichier HTML
result = convert_api.convert_document(request)
print("Successfully converted PDF file to HTML document: " + result[0].path)

Enfin, l’exemple de code ci-dessus convertira le pdf en html avec des images sur le cloud. Il existe un convertisseur de code pdf en html en ligne, comme expliqué ci-dessous.

Convertisseur PDF en HTML en ligne gratuitement

Quel est le meilleur convertisseur PDF vers HTML ? Groupdocs.Conversion fournit meilleur convertisseur pdf en html en ligne gratuit pour vous permettre de convertir le format PDF au format HTML. Il a été développé à l’aide de l’API Groupdocs.Conversion pdf en html en ligne.

Conclusion

Dans cet article, vous avez appris :

  • comment convertir pdf en html sans perdre la mise en forme en Python ;
  • comment convertir un fichier pdf en html par plage à l’aide de Python ;
  • convertir des pages PDF spécifiques au format HTML en Python ;
  • convertisseur pdf en html gratuit en ligne;

En outre, vous pouvez en savoir plus sur l’API de conversion de format de fichier GroupDocs.Conversion à l’aide de la documentation.

poser une question

Vous pouvez poser vos questions sur la façon de convertir un fichier pdf au format html, via notre Forum d’assistance gratuit

Voir également