PDF jest obecnie jednym z najczęściej używanych formatów plików, który zapewnia obsługę wielu platform. Jednak trudno jest utworzyć łącze do określonej strony w dokumencie PDF, a pliki PDF nie są łatwo udostępniane w sieciach społecznościowych. Możesz zachować wygląd dokumentu PDF w formacie HTML, którym można szybko manipulować. W tym artykule dowiemy się, jak konwertować pliki PDF na HTML w Python.

W tym artykule zostaną omówione następujące tematy:

Python PDF to HTML Converter API – Instalacja

Aby przekonwertować plik PDF na strony internetowe HTML, użyjemy Python SDK of GroupDocs.Conversion Cloud API. Jest to bogata w funkcje, niezależna od platformy biblioteka Python do konwersji dokumentów i obrazów. Zapewnia szybką konwersję obrazów i dokumentów dowolnego obsługiwanego formatu plików do dowolnego formatu w wysokiej jakości.

Możesz zainstalować i zintegrować bibliotekę Python do konwersji plików PDF na HTML z aplikacjami Python, używając następującego polecenia w konsoli:

pip install groupdocs_conversion_cloud

Proszę pobierz swój identyfikator klienta i klucz tajny z pulpitu nawigacyjnego przed wykonaniem wspomnianych kroków. Gdy masz już swój identyfikator i sekret, dodaj kod w swojej aplikacji Python:

# Załaduj bibliotekę Python do konwersji PDF na HTML w aplikacji Python
import groupdocs_conversion_cloud

# Pobierz client_id i client_secret z https://dashboard.groupdocs.cloud po bezpłatnej rejestracji.
client_id = "xxxxxxx-xxxx-xxxx-xxxx-xxxxxxxxxxxx"
client_secret = "xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx"

# Uzyskaj różne konfiguracje
configuration = groupdocs_conversion_cloud.Configuration(client_id, client_secret)
configuration.api_base_url = "https://api.groupdocs.cloud"
your_storage = "groupdocs-storage-name"

Teraz zademonstrujemy, jak krok po kroku przekonwertować format pdf do formatu html za pomocą REST API w Python.

Jak przekonwertować PDF na HTML Online w Python przy użyciu REST API

Możemy programowo przekonwertować plik pdf na format html, wykonując proste czynności podane poniżej:

  • Najpierw utwórz instancję ConvertApi
  • Następnie utwórz instancję ustawień konwersji za pomocą ConvertSettings
  • Następnie podaj nazwę przechowywania plików
  • Ustaw ścieżkę wejściowego pliku PDF i format wyjściowy jako „html”
  • Następnie utwórz instancję pliku PdfLoadOptions.
  • Podaj hasło do pliku PDF
  • Następnie ustaw output\path i load\options
  • Następnie utwórz ConvertDocumentRequest z ConvertSettings jako argumentem
  • Na koniec przekonwertuj pdf na html, wywołując convert\document() z ConvertDocumentRequest

Poniższy przykładowy kod pokazuje, jak zmienić format pdf na html w Python:

# Jak w Python przekonwertować plik PDF na HTML online
try:
  # Utwórz instancję interfejsu API
  convert_api = groupdocs_conversion_cloud.ConvertApi.from_keys(client_id, client_secret)

  # Zdefiniuj ustawienia konwersji
  settings = groupdocs_conversion_cloud.ConvertSettings()
  settings.storage_name = your_storage
  settings.file_path = "python-testing/sample-pdf-file.pdf"
  settings.format = "html"

  loadOptions = groupdocs_conversion_cloud.PdfLoadOptions()
  loadOptions.password = "password"

  settings.load_options = loadOptions
  settings.output_path = "python-testing"

  # Utwórz żądanie konwersji dokumentu
  request = groupdocs_conversion_cloud.ConvertDocumentRequest(settings)

  # Konwertuj plik .pdf na stronę HTML
  result = convert_api.convert_document(request)
  print("pdf File converted to html successfully: " + result[0].path)

except groupdocs_conversion_cloud.ApiException as e:
  print("Exception when calling convert_document: {0}".format(e.message))

Na koniec powyższy przykładowy kod zapisze plik HTML w chmurze. To najlepszy sposób na konwersję dokumentu PDF na dokument HTML.

Jak konwertować pliki PDF na HTML w Python

Jak konwertować pliki PDF na HTML w Python

Konwertuj zakres stron z pliku PDF na plik HTML w Python

Możemy przekonwertować zakres stron dokumentu PDF na HTML, wykonując poniższe czynności:

  • Najpierw utwórz instancję ConvertApi
  • Następnie utwórz instancję ustawień konwersji za pomocą ConvertSettings
  • Następnie podaj nazwę magazynu w chmurze
  • Ustaw ścieżkę wejściowego pliku PDF i format wyjściowy jako „html”
  • Następnie utwórz wystąpienie HtmlConvertOptions
  • Ustaw opcje from\page i pages\count
  • Następnie ustaw ścieżkę wyjściową i convertOptions
  • Teraz utwórz ConvertDocumentRequest z ConvertSettings jako argumentem
  • Na koniec przekonwertuj kod pdf na html online, wywołując metodę convert\document() z ConvertDocumentRequest

Poniższy przykładowy kod pokazuje, jak przekonwertować zakres stron z dokumentu PDF na plik HTML za pomocą języka Python:

# Jak przekonwertować zakres stron z PDF na HTML w Python
# Utwórz instancję interfejsu API
convert_api = groupdocs_conversion_cloud.ConvertApi.from_keys(client_id, client_secret)

# Przygotuj ustawienia konwersji HTML
settings = groupdocs_conversion_cloud.ConvertSettings()
settings.storage_name = your_storage
settings.file_path = "python-testing/sample-pdf-file.pdf"
settings.format = "html"

# Opcje konwersji PDF: numer strony początkowej i łączna liczba stron do konwersji
convertOptions = groupdocs_conversion_cloud.HtmlConvertOptions()
convertOptions.from_page = 1 
convertOptions.pages_count = 1

settings.convert_options = convertOptions
settings.output_path = "python-testing"

# Utwórz żądanie konwersji dokumentu
request = groupdocs_conversion_cloud.ConvertDocumentRequest(settings)

# Konwertuj strony PDF na plik HTML
result = convert_api.convert_document(request)
print("Converted range of pages from PDF to HTML web page: " + result[0].path)

Na koniec powyższy przykładowy kod zapisze dokument po konwersji z pdf na html online w chmurze.

Konwertuj określone strony z formatu PDF na HTML w Python

Możemy przekonwertować określone strony dokumentu PDF na HTML za pomocą najlepszego konwertera pdf na html online z obrazami, wykonując czynności podane poniżej:

  • Najpierw utwórz instancję ConvertApi
  • Następnie utwórz instancję ustawień konwersji za pomocą ConvertSettings
  • Następnie podaj nazwę magazynu w chmurze
  • Ustaw ścieżkę wejściowego pliku PDF i format wyjściowy jako „html”
  • Następnie utwórz wystąpienie HtmlConvertOptions
  • Dodaj numer strony do konwersji w formacie tablicowym
  • Następnie ustaw ścieżkę wyjściową i convertOptions
  • Teraz utwórz ConvertDocumentRequest z ConvertSettings jako argumentem
  • Na koniec przekonwertuj kod pdf na kod html online, wywołując metodę convert\document() z ConvertDocumentRequest

Poniższy przykładowy kod pokazuje, jak wyeksportować określone strony dokumentu PDF do pliku HTML za pomocą języka Python:

# Jak przekonwertować określone strony pliku PDF na format strony internetowej HTML w Python
# Utwórz instancję interfejsu API
convert_api = groupdocs_conversion_cloud.ConvertApi.from_keys(client_id, client_secret)

# Zdefiniuj ustawienia konwersji
settings = groupdocs_conversion_cloud.ConvertSettings()
settings.storage_name = your_storage
settings.file_path = "python-testing/sample-pdf-file.pdf"
settings.format = "html"

# Opcje konwersji PDF: numery stron do konwersji
convertOptions = groupdocs_conversion_cloud.HtmlConvertOptions()
convertOptions.pages = [1, 3, 5]

settings.convert_options = convertOptions
settings.output_path = "python-testing"

# Utwórz żądanie konwersji dokumentu
request = groupdocs_conversion_cloud.ConvertDocumentRequest(settings)

# Konwertuj plik PDF na plik HTML
result = convert_api.convert_document(request)
print("Successfully converted PDF file to HTML document: " + result[0].path)

Na koniec powyższy przykładowy kod przekonwertuje plik pdf na html z obrazami w chmurze. Istnieje internetowy konwerter plików PDF na kod HTML, jak wyjaśniono poniżej.

Internetowy konwerter plików PDF na HTML za darmo

Jaki jest najlepszy konwerter plików PDF na HTML? Groupdocs.Conversion zapewnia najlepszy darmowy konwerter pdf na html online do konwersji plików PDF na format HTML. Został opracowany przy użyciu internetowego interfejsu API Groupdocs.Conversion pdf to html.

Wniosek

Z tego artykułu dowiedziałeś się:

  • jak przekonwertować pdf na html bez utraty formatowania w Python;
  • jak przekonwertować plik pdf na plik html według zakresu za pomocą Python;
  • konwertowanie określonych stron PDF do formatu HTML w Python;
  • darmowy konwerter plików pdf na html online;

Ponadto możesz dowiedzieć się więcej o interfejsie API konwersji formatu plików GroupDocs.Conversion, korzystając z dokumentacji.

Zadać pytanie

Możesz zadawać pytania dotyczące konwersji pliku PDF do formatu HTML za pośrednictwem naszego Bezpłatnego forum pomocy technicznej

Zobacz też