Jak wyodrębnić strony z pliku PDF online w Python

Wyodrębnij strony z pliku PDF online w Python

W niektórych przypadkach może być konieczne wyodrębnienie stron PDF z dokumentów PDF lub rozdzielenie dużych dokumentów PDF na mniejsze pliki PDF. Jako programista Python możesz łatwo wyodrębniać określone strony z plików PDF online lub programowo wyodrębniać strony PDF według zakresu stron. W tym artykule dowiesz się, jak wyodrębnić strony z pliku PDF online w Python za pomocą REST API.

W tym artykule zostaną omówione następujące tematy:

Document Extractor REST API i Python SDK

Aby wyodrębnić strony PDF z plików PDF online, użyję Python SDK GroupDocs.Merger Cloud API. Jest to bogate w funkcje i wydajne Cloud SDK. Ten interfejs API języka Python umożliwia wyodrębnianie stron PDF z jednego dokumentu do wielu plików. SDK oferuje funkcje zmiany kolejności, usuwania, wymiany, obracania lub zmiany orientacji strony dla całego lub preferowanego zakresu stron. Obsługuje również inne manipulacje dla dowolnych obsługiwanych formatów plików, takich jak PDF, Word, PowerPoint, arkusze Excel itp. Obecnie obsługuje zestawy SDK .NET, Java, PHP, Ruby, Android i Node.js jako dokument [fuzja] 5] członków rodziny dla Cloud API.

Możesz zainstalować GroupDocs.Merger-Cloud w swoim projekcie Python za pomocą następującego polecenia w konsoli:

pip install groupdocs_merger_cloud

Zanim zaczniesz postępować zgodnie z instrukcjami i dostępnymi przykładami kodu, uzyskaj swój identyfikator klienta i klucz tajny klienta z pulpitu nawigacyjnego. Po uzyskaniu identyfikatora i tajnego kodu dodaj kod, jak pokazano poniżej:

# Zaimportuj pakiet SDK połączenia Groupdocs
import groupdocs_merger_cloud

# Uzyskaj app_sid i app_key z https://dashboard.groupdocs.cloud po bezpłatnej rejestracji.
app_sid = "xxxxxxx-xxxx-xxxx-xxxx-xxxxxxxxxxxx"
app_key = "xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx"

# Pobierz konfiguracje interfejsu API plików 
configuration = groupdocs_merger_cloud.Configuration(app_sid, app_key)
configuration.api_base_url = "https://api.groupdocs.cloud"
storage_name = "LocalStorage"

Jak wyodrębnić określone strony z pliku PDF w Python przy użyciu interfejsu API REST

Nasz interfejs API rozdzielacza plików PDF umożliwia wyświetlanie podglądu stron, które chcesz podzielić. Możesz wybrać strony, podając tylko liczbę stron, które chcesz wyodrębnić. Błyskawicznie podziel plik PDF na poszczególne strony lub wyodrębnij określone strony z nowego dokumentu PDF. Wyodrębnij strony PDF z plików PDF online, wykonując proste czynności wymienione poniżej:

  1. Prześlij plik PDF do chmury.
  2. Wyciąg Strony PDF według numerów stron w Python.
  3. Pobierz wyodrębnione pliki.

Prześlij dokument

Przede wszystkim prześlij wielostronicowy dokument PDF do chmury, korzystając z fragmentu kodu podanego poniżej:

# Prześlij plik PDF do magazynu w chmurze
# Utwórz instancję pliku API
file_api = groupdocs_merger_cloud.FileApi.from_config(configuration)

# Zadzwoń do przesłania pliku
request = groupdocs_merger_cloud.UploadFileRequest("python-testing\sample-file.pdf", "H:\\groupdocs-cloud-data\\sample-file.pdf", storage_name)

# Prześlij plik PDF do chmury
response = file_api.upload_file(request)
print(response.uploaded)

W rezultacie plik PDF zostanie przesłany do Cloud Storage i będzie dostępny w sekcji plików Twojego pulpitu nawigacyjnego. Usuwamy trwale wszystkie Twoje pliki z chmury w ciągu 24 godzin po przesłaniu.

Wyodrębnij określone strony według numerów stron za pomocą Python

Aby programowo wyodrębnić określoną stronę lub wiele stron z dokumentu PDF, wykonaj następujące czynności:

  • Najpierw utwórz instancję PagesApi.
  • Po drugie, podaj instancję ExtractOptions
  • Teraz ustaw ścieżkę pliku wejściowego za pomocą instancji FileInfo
  • Następnie ustaw ścieżkę katalogu wyjściowego
  • Następnie podaj rozdzielone przecinkami numery stron do wyodrębnienia
  • Następnie ustaw tryb na Strony
  • Następnie utwórz instancję ExtractRequest
  • Na koniec uzyskaj wyniki, wywołując klasę pagesApi.extract().

Poniższy przykład kodu pokazuje, jak wyodrębnić strony, podając określone numery stron z dokumentu PDF za pomocą interfejsu API REST:

# Jak wyodrębnić określone strony z pliku PDF w Python przy użyciu interfejsu API REST
try:
    # Utwórz instancję interfejsu API Pages
    pagesApi = groupdocs_merger_cloud.PagesApi.from_keys(app_sid, app_key)
     
    options = groupdocs_merger_cloud.ExtractOptions()
    options.file_info = groupdocs_merger_cloud.FileInfo("python-testing/sample-file.pdf")
    options.output_path = "python-testing"
    options.pages = [2, 4, 7]        
     
    result = pagesApi.extract(groupdocs_merger_cloud.ExtractRequest(options))
    print("Successfully extracted certain pages of PDF document: " + result[0].path)
except groupdocs_merger_cloud.ApiException as e:
  print("Exception while calling API: {0}".format(e.message))

Pobierz plik wyodrębnionych stron PDF

Powyższy przykładowy kod zapisze wyodrębnione strony w osobnych plikach PDF w chmurze. Możesz je pobrać, korzystając z następującego przykładowego kodu:

# Inicjalizacja API w celu pobrania przekonwertowanego pliku
import shutil
file_api = groupdocs_merger_cloud.FileApi.from_config(configuration)

# Utwórz żądanie pobrania pliku
request = groupdocs_merger_cloud.DownloadFileRequest("python-testing\sample-file.pdf", storage_name)

# Pobierz przekonwertowany plik
response = file_api.download_file(request)

# Przenieś pobrany plik do swojego katalogu
shutil.move(response, "H:\\groupdocs-cloud-data\\")

Wyodrębnij strony z pliku PDF według zakresu stron w Python przy użyciu interfejsu API REST

Wykonaj czynności wymienione poniżej, aby wyodrębnić strony z dokumentu PDF przez programowe podanie zakresu stron.

  • Najpierw utwórz instancję PagesApi.
  • Następnie ustaw ExtractOptions
  • Ustaw ścieżkę pliku wejściowego za pomocą instancji FileInfo
  • Następnie ustaw ścieżkę katalogu wyjściowego
  • Podaj zakres stron, ustawiając numer strony początkowej i numer strony końcowej do wyodrębnienia
  • Teraz ustaw interwał trybu na Strony
  • Ustaw tryb zakresu na EvenPages lub OddPages
  • Następnie utwórz instancję ExtractRequest
  • Na koniec uzyskaj wyniki, wywołując metodę pagesApi.extract().

Poniższy przykład kodu pokazuje, jak wyodrębnić strony, podając zakres stron z dokumentu PDF przy użyciu interfejsu API REST. Wykonaj czynności wymienione wcześniej, aby przesłać pliki.

# Jak wyodrębnić strony z pliku PDF według zakresu stron w Python przy użyciu interfejsu API REST
try:
    # Utwórz instancję Document API
    pagesApi = groupdocs_merger_cloud.PagesApi.from_keys(app_sid, app_key)
     
    options = groupdocs_merger_cloud.ExtractOptions()
    options.file_info = groupdocs_merger_cloud.FileInfo("python-testing\sample-file.pdf")
    options.output_path = "python-testing"
    options.start_page_number = 1
    options.end_page_number = 10
    options.range_mode = "EvenPages" # or set range_mode to "OddPages"
    options.mode = "Pages" # Mode Intervals
     
    result = pagesApi.extract(groupdocs_merger_cloud.ExtractRequest(options))
    print("Successfully extract selected pages from PDF by page range interval: " + result[0].path)
except groupdocs_merger_cloud.ApiException as e:
  print("Exception while calling API: {0}".format(e.message))

Darmowy internetowy ekstraktor stron PDF

Jak wyodrębnić strony z pdf za darmo? Wypróbuj następujące bezpłatne narzędzie online do wyodrębniania plików PDF, które zostało opracowane przy użyciu powyższego interfejsu API.

Podsumowując

To prowadzi nas do konkluzji wpisu na blogu. Mam nadzieję, że nauczyłeś się:

  • jak wyodrębnić określone strony z dokumentów PDF w Python;
  • programowo przesłać plik PDF, a następnie pobrać wyodrębnione pliki z chmury;
  • jak wyodrębnić strony pliku PDF przy użyciu zakresu stron za pomocą Python;

Możesz dowiedzieć się więcej o GroupDocs.Merger Cloud API korzystając z dokumentacji. Udostępniamy również sekcję Informacje o interfejsach API, która umożliwia wizualizację i interakcję z naszymi interfejsami API bezpośrednio w przeglądarce.

Na naszej stronie Getting Started możesz znaleźć więcej szczegółów.

Ponadto Groupdocs.cloud jest stale aktualizowany o nowe tematy. W rezultacie bądź na bieżąco z najnowszymi informacjami o interfejsach API.

Zadać pytanie

Możesz zadawać pytania dotyczące interfejsu API oprogramowania do wyodrębniania stron PDF za pośrednictwem naszego bezpłatnego Forum

Często zadawane pytania

Jak wyodrębnić strony z pliku PDF w Python?

Skorzystaj z tego łącza, aby poznać fragment kodu Python o tym, jak wyodrębniać strony z plików PDF w Python.

Jak wyodrębnić strony z dokumentów PDF online za pomocą REST API?

Utwórz instancję PagesApi, ustaw wartości ExtractOptions i wywołaj metodę pagesApi.extract() z ExtractRequest, aby zapisać online wybrane strony pliku PDF.

Jak zainstalować bezpłatną bibliotekę do pobierania stron PDF?

Łatwym sposobem na wyodrębnienie stron z pliku PDF jest użycie Python SDK. Możesz zainstalować bibliotekę Python do ekstraktora PDF, aby programowo wyodrębnić wiele stron z plików PDF.

Jak wyodrębnić strony PDF w trybie offline w systemie Windows?

Odwiedź ten link, aby pobrać oprogramowanie do wyodrębniania plików PDF dla systemu Windows. To bezpłatne oprogramowanie do pobierania plików PDF szybko podzieli strony PDF w oknach za pomocą jednego kliknięcia.

Zobacz też