Jak przekonwertować PDF do Excela w Python przy użyciu REST API

Konwertuj PDF na Excel w Python za pomocą REST API

PDF to jeden z najczęściej używanych wszechstronnych formatów dokumentów do prezentacji dokumentów. Ale trudno jest edytować dokument PDF. Aby łatwo wyodrębnić tabelę lub edytować tekst w formacie arkusza kalkulacyjnego, musisz przekonwertować plik PDF na edytowalne arkusze kalkulacyjne Excel. Nie musisz więc tracić czasu na ręczne kopiowanie tekstu, a następnie jego edycję. Nasze interfejsy API konwertera plików PDF na XLS lub PDF na XLSX umożliwiają szybką konwersję plików PDF do formatu arkusza kalkulacyjnego Excel. W tym artykule dowiemy się, jak przekonwertować PDF do Excela w Python za pomocą REST API.

W tym artykule zostaną omówione następujące tematy:

Python PDF to Excel Converter API – Instalacja

Aby przekonwertować plik PDF do formatu Excel, użyjemy Python SDK of GroupDocs.Conversion Cloud API. Jest to bogata w funkcje, niezależna od platformy biblioteka Python do konwersji dokumentów i obrazów. Zapewnia szybką konwersję obrazów i dokumentów dowolnego obsługiwanego formatu pliku do dowolnego formatu w wysokiej jakości.

Możesz zainstalować bibliotekę Python do konwersji plików PDF na XLSX w swojej aplikacji Python za pomocą następującego polecenia w konsoli:

pip install groupdocs_conversion_cloud

Proszę pobierz swój identyfikator klienta i klucz tajny z pulpitu nawigacyjnego przed wykonaniem wspomnianych kroków. Gdy masz już swój identyfikator i sekret, dodaj kod w swojej aplikacji Python:

# Biblioteka Python do konwersji plików PDF na Excel w aplikacji Python
import groupdocs_conversion_cloud

# Pobierz client_id i client_secret z https://dashboard.groupdocs.cloud po bezpłatnej rejestracji.
client_id = "xxxxxxx-xxxx-xxxx-xxxx-xxxxxxxxxxxx"
client_secret = "xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx"

# Uzyskaj różne konfiguracje
configuration = groupdocs_conversion_cloud.Configuration(client_id, client_secret)
configuration.api_base_url = "https://api.groupdocs.cloud"
your_storage = "local-storage-name"

Teraz zademonstrujmy, jak krok po kroku przekonwertować pdf do formatu xlsx, używając REST API w Python.

Jak przekonwertować PDF na XLSX w Python za pomocą REST API

Możemy programowo przekonwertować plik pdf do formatu Excel, wykonując proste czynności podane poniżej:

  • Najpierw utwórz instancję ConvertApi
  • Następnie utwórz instancję ustawień konwersji za pomocą ConvertSettings
  • Następnie podaj nazwę przechowywania plików
  • Ustaw ścieżkę wejściowego pliku PDF i format wyjściowy jako „xlsx”
  • Następnie utwórz instancję pliku PdfLoadOptions.
  • Podaj hasło do pliku PDF
  • Następnie ustaw output\path i load\options
  • Następnie utwórz ConvertDocumentRequest z ConvertSettings jako argumentem
  • Na koniec przekonwertuj pdf na Excel, wywołując convert\document() z ConvertDocumentRequest

Poniższy przykładowy kod pokazuje, jak zmienić format PDF na format Excela w Python:

# Jak w Python przekonwertować plik PDF na Excel Online
try:
  # Utwórz instancję interfejsu API
  convert_api = groupdocs_conversion_cloud.ConvertApi.from_keys(client_id, client_secret)

  # Zdefiniuj ustawienia konwersji
  settings = groupdocs_conversion_cloud.ConvertSettings()
  settings.storage_name = your_storage
  settings.file_path = "python-testing/sample-pdf-file.pdf"
  settings.format = "xlsx"

  loadOptions = groupdocs_conversion_cloud.PdfLoadOptions()
  loadOptions.password = "password"

  settings.load_options = loadOptions
  settings.output_path = "python-testing"

  # Utwórz żądanie konwersji dokumentu
  request = groupdocs_conversion_cloud.ConvertDocumentRequest(settings)

  # Konwertuj plik .pdf na format .xlsx
  result = convert_api.convert_document(request)
  print("pdf File converted to xlsx successfully: " + result[0].path)

except groupdocs_conversion_cloud.ApiException as e:
  print("Exception when calling convert_document: {0}".format(e.message))

Na koniec powyższy przykładowy kod zapisze plik xlsx w chmurze. To najlepszy sposób na konwersję pliku PDF na dokument programu Excel.

Jak przekonwertować PDF na XLSX w Python za pomocą REST API

Jak przekonwertować PDF na XLSX w Python za pomocą REST API

Konwertuj zakres stron z pliku PDF na plik Excel w Python

Możemy przekonwertować zakres stron dokumentu PDF do programu Excel, wykonując następujące czynności:

  • Najpierw utwórz instancję ConvertApi
  • Następnie utwórz instancję ustawień konwersji za pomocą ConvertSettings
  • Następnie podaj nazwę magazynu w chmurze
  • Ustaw ścieżkę wejściowego pliku PDF i format wyjściowy jako „xlsx”
  • Następnie utwórz wystąpienie XlsConvertOptions
  • Ustaw opcje from\page i pages\count
  • Następnie ustaw ścieżkę wyjściową i convertOptions
  • Teraz utwórz ConvertDocumentRequest z ConvertSettings jako argumentem
  • Na koniec przekonwertuj pdf na kod programu Excel online, wywołując metodę convert\document() z ConvertDocumentRequest

Poniższy przykładowy kod pokazuje, jak przekonwertować zakres stron z dokumentu PDF na plik programu Excel za pomocą języka Python:

# Jak przekonwertować zakres stron z pliku PDF na Excel w Python
# Utwórz instancję interfejsu API
convert_api = groupdocs_conversion_cloud.ConvertApi.from_keys(client_id, client_secret)

# Przygotuj ustawienia konwersji programu Excel
settings = groupdocs_conversion_cloud.ConvertSettings()
settings.file_path = "python-testing/sample-pdf-file.pdf"
settings.format = "xlsx"

# Opcje konwersji PDF: numer strony początkowej i łączna liczba stron do konwersji
convertOptions = groupdocs_conversion_cloud.XlsConvertOptions()
convertOptions.from_page = 2 
convertOptions.pages_count = 3

settings.convert_options = convertOptions
settings.output_path = "python-testing"

# Utwórz żądanie konwersji dokumentu
request = groupdocs_conversion_cloud.ConvertDocumentRequest(settings)

# Konwertuj strony PDF do pliku Excel
result = convert_api.convert_document(request)
print("Converted range of pages from PDF to Excel file: " + result[0].path)

Na koniec powyższy przykładowy kod zapisze dokument po konwersji z pliku pdf do programu Excel online w chmurze.

Konwertuj określone strony PDF do formatu Excel w Python

Możemy przekonwertować określone strony dokumentu PDF do programu Excel za pomocą najlepszego konwertera pdf na xlsx online z obrazami, wykonując czynności podane poniżej:

  • Najpierw utwórz instancję ConvertApi
  • Następnie utwórz instancję ustawień konwersji za pomocą ConvertSettings
  • Następnie podaj nazwę magazynu w chmurze
  • Ustaw ścieżkę wejściowego pliku PDF i format wyjściowy jako „xlsx”
  • Następnie utwórz wystąpienie XlsConvertOptions
  • Dodaj numer strony do konwersji w formacie tablicowym
  • Następnie ustaw ścieżkę wyjściową i convertOptions
  • Teraz utwórz ConvertDocumentRequest z ConvertSettings jako argumentem
  • Na koniec przekonwertuj pdf na kod programu Excel online, wywołując metodę convert\document() z ConvertDocumentRequest

Poniższy przykładowy kod pokazuje, jak wyeksportować określone strony dokumentu PDF do pliku programu Excel przy użyciu języka Python:

# Jak przekonwertować określone strony pliku PDF do formatu Excel w Python
# Utwórz instancję interfejsu API
convert_api = groupdocs_conversion_cloud.ConvertApi.from_keys(client_id, client_secret)

# Zdefiniuj ustawienia konwersji
settings = groupdocs_conversion_cloud.ConvertSettings()
settings.file_path = "python-testing/sample-pdf-file.pdf"
settings.format = "xlsx"

# Opcje konwersji PDF: numery stron do konwersji
convertOptions = groupdocs_conversion_cloud.XlsConvertOptions()
convertOptions.pages = [1, 3, 5]

settings.convert_options = convertOptions
settings.output_path = "python-testing"

# Utwórz żądanie konwersji dokumentu
request = groupdocs_conversion_cloud.ConvertDocumentRequest(settings)

# Konwertuj plik PDF na plik Excel
result = convert_api.convert_document(request)
print("Successfully converted PDF file to XLSX document: " + result[0].path)

Na koniec powyższy przykładowy kod przekonwertuje pdf na xlsx z obrazami w chmurze. Istnieje internetowy konwerter plików pdf na kod xlsx, jak wyjaśniono poniżej.

Internetowy konwerter plików PDF do programu Excel za darmo

Jaki jest najlepszy konwerter plików PDF na Excel? Groupdocs.Conversion zapewnia najlepszy darmowy konwerter plików pdf na xlsx online, umożliwiający konwersję plików PDF do formatu Excel. Został opracowany przy użyciu interfejsu API Groupdocs.Conversion online pdf to xlsx.

Wniosek

Z tego artykułu dowiedziałeś się:

  • jak przekonwertować pdf na xls/xlsx bez utraty formatowania w Python;
  • jak przekonwertować plik pdf na plik Excela według zakresu za pomocą Python;
  • konwertowanie określonych stron PDF do formatu XLSX w Python;

Ponadto możesz dowiedzieć się więcej o interfejsie API konwersji formatu plików GroupDocs.Conversion, korzystając z dokumentacji.

Zadać pytanie

Możesz zadawać pytania dotyczące konwersji pliku PDF do formatu xlsx za pośrednictwem naszego Bezpłatnego forum pomocy technicznej

Zobacz też