Wyodrębnij określone strony z pliku PDF za pomocą Python

Może być konieczne wyodrębnienie określonych stron z dokumentów PDF lub podzielenie dużych dokumentów PDF na mniejsze części. Jako programista Python możesz łatwo programowo wyodrębnić określone strony z dokumentów PDF według numerów stron lub zakresu stron. W tym artykule dowiesz się, jak wyodrębnić określone strony z dokumentów PDF za pomocą REST API w Python.

W tym artykule zostaną omówione następujące tematy:

Document Splitter REST API i Python SDK
Wyodrębnij określone strony z pliku PDF za pomocą interfejsu API REST
Wyodrębnij strony według zakresu stron za pomocą Python

Document Splitter REST API i Python SDK

Do wyodrębniania stron z dokumentów PDF będę używał Python SDK of GroupDocs.Merger Cloud API. Jest to bogaty w funkcje i wydajny Cloud SDK służący do łączenia kilku dokumentów w jeden dokument. Umożliwia także podzielenie pojedynczego dokumentu na wiele dokumentów. SDK oferuje funkcje usuwania, wymiany, obracania lub zmiany orientacji strony dla całego lub preferowanego zakresu stron oraz łatwego wykonywania innych operacji dla dowolnych obsługiwanych formatów plików, takich jak PDF, Word, Powerpoint i arkusze kalkulacyjne Excel. Obecnie udostępnia również zestawy SDK .NET, Java, PHP, Ruby, Android i Node.js jako członkowie rodziny łączenia dokumentów dla Cloud API.

Możesz zainstalować GroupDocs.Merger-Cloud w swoim projekcie Python za pomocą następującego polecenia w konsoli:

pip install groupdocs_merger_cloud

Zanim zaczniesz postępować zgodnie z instrukcjami i dostępnymi przykładami kodu, uzyskaj swój identyfikator klienta i klucz tajny klienta z panelu nawigacyjnego. Po uzyskaniu identyfikatora i tajnego kodu dodaj kod, jak pokazano poniżej:

client_id = "da0c487d-c1c0-45ae-b7bf-43eaf53c5ad5"
client_secret = "479db2b01dcb93a3d4d20efb16dea971"

configuration = groupdocs_merger_cloud.Configuration(client_id, client_secret)
configuration.api_base_url = "https://api.groupdocs.cloud"
my_storage = ""

Wyodrębnij określone strony z pliku PDF za pomocą interfejsu API REST w języku Python

Możesz wyodrębnić określone strony z dokumentów PDF, wykonując proste czynności wymienione poniżej:

Prześlij plik PDF do chmury
Wyodrębnij określone strony według numerów stron z przesłanego pliku PDF
Pobierz wyodrębniony plik(i)

Prześlij dokument

Przede wszystkim prześlij wielostronicowy dokument PDF do chmury, korzystając z przykładowego kodu podanego poniżej:

# utwórz instancję API
file_api = groupdocs_merger_cloud.FileApi.from_config(configuration)
my_storage = ""

# wgraj przykładowe pliki
request = groupdocs_merger_cloud.UploadFileRequest("ten-pages.pdf", "C:\\Files\\ten-pages.pdf", my_storage)
response = file_api.upload_file(request)

W rezultacie plik PDF zostanie przesłany do Cloud Storage i będzie dostępny w sekcji plików Twojego pulpitu nawigacyjnego.

Wyodrębnij określone strony według numerów stron za pomocą Python

Wykonaj czynności wymienione poniżej, aby programowo wyodrębnić określoną stronę lub wiele stron z dokumentu PDF.

Utwórz instancję Document API.
Podaj opcje podziału
Ustaw ścieżkę pliku wejściowego
Ustaw ścieżkę katalogu wyjściowego
Podaj rozdzielone przecinkami numery stron do wyodrębnienia
Ustaw tryb na Strony
Utwórz SplitRequest
Uzyskaj wyniki, wywołując metodę DocumentApi.split().

Poniższy przykład kodu pokazuje, jak wyodrębnić strony, podając określone numery stron z dokumentu PDF przy użyciu interfejsu API REST.

# inicjalizacja API
documentApi = groupdocs_merger_cloud.DocumentApi.from_config(configuration)

# zdefiniuj opcje podziału
options = groupdocs_merger_cloud.SplitOptions()
options.file_info = groupdocs_merger_cloud.FileInfo("ten-pages.pdf")
options.output_path = "Output"
options.pages = [1, 3]
options.mode = "Pages"

# utwórz podzielone żądanie
split_request = groupdocs_merger_cloud.SplitRequest(options)
result = documentApi.split(split_request)        

print("Documents count = " + str(len(result.documents)))

Wyodrębnij określone strony z pliku PDF za pomocą Python

Pobierz wyodrębnione pliki strony

Powyższy przykładowy kod zapisze wyodrębnione strony w osobnych plikach PDF w chmurze. Możesz je pobrać, korzystając z następującego przykładowego kodu:

# inicjalizacja API
file_api = groupdocs_merger_cloud.FileApi.from_config(configuration)
my_storage = ""

# prośba o pobranie pliku
request = groupdocs_merger_cloud.DownloadFileRequest("Output\\ten-pages_1.pdf", my_storage)
response = file_api.download_file(request)

# przenieś pobrany plik do katalogu roboczego
shutil.move(response, "C:\\Files\\")

Wyodrębnij strony według zakresu stron za pomocą Python

Wykonaj czynności wymienione poniżej, aby wyodrębnić strony z dokumentu PDF przez programowe podanie zakresu stron.

Utwórz instancję Document API.
Podaj opcje podziału
Ustaw ścieżkę pliku wejściowego
Ustaw ścieżkę katalogu wyjściowego
Podaj zakres stron, ustawiając numer strony początkowej i numer strony końcowej do wyodrębnienia
Ustaw tryb na Strony
Utwórz SplitRequest
Uzyskaj wyniki, wywołując metodę DocumentApi.split().
Utwórz żądanie pobrania pliku
Pobierz plik, wywołując metodę FileApi.download\file().

Poniższy przykład kodu pokazuje, jak wyodrębnić strony, podając zakres stron z dokumentu PDF przy użyciu interfejsu API REST. Wykonaj czynności wymienione wcześniej, aby przesłać pliki.

# inicjalizacja API
documentApi = groupdocs_merger_cloud.DocumentApi.from_config(configuration)
file_api = groupdocs_merger_cloud.FileApi.from_config(configuration)
my_storage = ""

# zdefiniuj opcje podziału
options = groupdocs_merger_cloud.SplitOptions()
options.file_info = groupdocs_merger_cloud.FileInfo("ten-pages.pdf")
options.output_path = "Output"
options.start_page_number = 4
options.end_page_number = 7
options.mode = "Pages"

# utwórz podzielone żądanie
split_request = groupdocs_merger_cloud.SplitRequest(options)
result = documentApi.split(split_request)   

print("Documents count = " + str(len(result.documents)))

# pokaż wyniki i pobierz pliki jeden po drugim
for data in result.documents:
    print("Document Url = " + str(data))
    
    # utwórz żądanie pobrania pliku
    request = groupdocs_merger_cloud.DownloadFileRequest(data.path, my_storage)
    response = file_api.download_file(request)
    
    # Przenieś pobrany plik do katalogu roboczego
    shutil.move(response, "C:\\Files\\")

Wyodrębnij strony według zakresu stron za pomocą Python

Wypróbuj online

Wypróbuj następujące bezpłatne narzędzie do rozdzielania plików PDF online, które zostało opracowane przy użyciu powyższego interfejsu API. https://products.groupdocs.app/splitter/pdf

Wniosek

W tym artykule nauczyłeś się, jak wyodrębniać określone strony z dokumentów PDF w chmurze za pomocą Python. Nauczyłeś się również, jak programowo przesyłać plik PDF do chmury, a następnie pobierać wyodrębnione pliki z chmury. Możesz dowiedzieć się więcej o GroupDocs.Merger Cloud API korzystając z dokumentacji. Udostępniamy również sekcję Informacje o interfejsach API, która umożliwia wizualizację i interakcję z naszymi interfejsami API bezpośrednio w przeglądarce. W przypadku jakichkolwiek niejasności prosimy o kontakt na forum.

Zobacz też

Scal pliki PDF za pomocą interfejsu API REST

Document Splitter REST API i Python SDK#

Wyodrębnij określone strony z pliku PDF za pomocą interfejsu API REST w języku Python#

Prześlij dokument#

Wyodrębnij określone strony według numerów stron za pomocą Python#

Pobierz wyodrębnione pliki strony#

Wyodrębnij strony według zakresu stron za pomocą Python#

Wypróbuj online#

Wniosek#

Zobacz też#