Może być konieczne wyodrębnienie określonych stron z dokumentów PDF lub podzielenie dużych dokumentów PDF na mniejsze części. Jako programista Python możesz łatwo programowo wyodrębnić określone strony z dokumentów PDF według numerów stron lub zakresu stron. W tym artykule dowiesz się, jak wyodrębnić określone strony z dokumentów PDF za pomocą REST API w Python.
W tym artykule zostaną omówione następujące tematy:
- Document Splitter REST API i Python SDK
- Wyodrębnij określone strony z pliku PDF za pomocą interfejsu API REST
- Wyodrębnij strony według zakresu stron za pomocą Python
Document Splitter REST API i Python SDK
Do wyodrębniania stron z dokumentów PDF będę używał Python SDK of GroupDocs.Merger Cloud API. Jest to bogaty w funkcje i wydajny Cloud SDK służący do łączenia kilku dokumentów w jeden dokument. Umożliwia także podzielenie pojedynczego dokumentu na wiele dokumentów. SDK oferuje funkcje usuwania, wymiany, obracania lub zmiany orientacji strony dla całego lub preferowanego zakresu stron oraz łatwego wykonywania innych operacji dla dowolnych obsługiwanych formatów plików, takich jak PDF, Word, Powerpoint i arkusze kalkulacyjne Excel. Obecnie udostępnia również zestawy SDK .NET, Java, PHP, Ruby, Android i Node.js jako członkowie rodziny łączenia dokumentów dla Cloud API.
Możesz zainstalować GroupDocs.Merger-Cloud w swoim projekcie Python za pomocą następującego polecenia w konsoli:
pip install groupdocs_merger_cloud
Zanim zaczniesz postępować zgodnie z instrukcjami i dostępnymi przykładami kodu, uzyskaj swój identyfikator klienta i klucz tajny klienta z panelu nawigacyjnego. Po uzyskaniu identyfikatora i tajnego kodu dodaj kod, jak pokazano poniżej:
client_id = "da0c487d-c1c0-45ae-b7bf-43eaf53c5ad5"
client_secret = "479db2b01dcb93a3d4d20efb16dea971"
configuration = groupdocs_merger_cloud.Configuration(client_id, client_secret)
configuration.api_base_url = "https://api.groupdocs.cloud"
my_storage = ""
Wyodrębnij określone strony z pliku PDF za pomocą interfejsu API REST w języku Python
Możesz wyodrębnić określone strony z dokumentów PDF, wykonując proste czynności wymienione poniżej:
- Prześlij plik PDF do chmury
- Wyodrębnij określone strony według numerów stron z przesłanego pliku PDF
- Pobierz wyodrębniony plik(i)
Prześlij dokument
Przede wszystkim prześlij wielostronicowy dokument PDF do chmury, korzystając z przykładowego kodu podanego poniżej:
# utwórz instancję API
file_api = groupdocs_merger_cloud.FileApi.from_config(configuration)
my_storage = ""
# wgraj przykładowe pliki
request = groupdocs_merger_cloud.UploadFileRequest("ten-pages.pdf", "C:\\Files\\ten-pages.pdf", my_storage)
response = file_api.upload_file(request)
W rezultacie plik PDF zostanie przesłany do Cloud Storage i będzie dostępny w sekcji plików Twojego pulpitu nawigacyjnego.
Wyodrębnij określone strony według numerów stron za pomocą Python
Wykonaj czynności wymienione poniżej, aby programowo wyodrębnić określoną stronę lub wiele stron z dokumentu PDF.
- Utwórz instancję Document API.
- Podaj opcje podziału
- Ustaw ścieżkę pliku wejściowego
- Ustaw ścieżkę katalogu wyjściowego
- Podaj rozdzielone przecinkami numery stron do wyodrębnienia
- Ustaw tryb na Strony
- Utwórz SplitRequest
- Uzyskaj wyniki, wywołując metodę DocumentApi.split().
Poniższy przykład kodu pokazuje, jak wyodrębnić strony, podając określone numery stron z dokumentu PDF przy użyciu interfejsu API REST.
# inicjalizacja API
documentApi = groupdocs_merger_cloud.DocumentApi.from_config(configuration)
# zdefiniuj opcje podziału
options = groupdocs_merger_cloud.SplitOptions()
options.file_info = groupdocs_merger_cloud.FileInfo("ten-pages.pdf")
options.output_path = "Output"
options.pages = [1, 3]
options.mode = "Pages"
# utwórz podzielone żądanie
split_request = groupdocs_merger_cloud.SplitRequest(options)
result = documentApi.split(split_request)
print("Documents count = " + str(len(result.documents)))
Pobierz wyodrębnione pliki strony
Powyższy przykładowy kod zapisze wyodrębnione strony w osobnych plikach PDF w chmurze. Możesz je pobrać, korzystając z następującego przykładowego kodu:
# inicjalizacja API
file_api = groupdocs_merger_cloud.FileApi.from_config(configuration)
my_storage = ""
# prośba o pobranie pliku
request = groupdocs_merger_cloud.DownloadFileRequest("Output\\ten-pages_1.pdf", my_storage)
response = file_api.download_file(request)
# przenieś pobrany plik do katalogu roboczego
shutil.move(response, "C:\\Files\\")
Wyodrębnij strony według zakresu stron za pomocą Python
Wykonaj czynności wymienione poniżej, aby wyodrębnić strony z dokumentu PDF przez programowe podanie zakresu stron.
- Utwórz instancję Document API.
- Podaj opcje podziału
- Ustaw ścieżkę pliku wejściowego
- Ustaw ścieżkę katalogu wyjściowego
- Podaj zakres stron, ustawiając numer strony początkowej i numer strony końcowej do wyodrębnienia
- Ustaw tryb na Strony
- Utwórz SplitRequest
- Uzyskaj wyniki, wywołując metodę DocumentApi.split().
- Utwórz żądanie pobrania pliku
- Pobierz plik, wywołując metodę FileApi.download\file().
Poniższy przykład kodu pokazuje, jak wyodrębnić strony, podając zakres stron z dokumentu PDF przy użyciu interfejsu API REST. Wykonaj czynności wymienione wcześniej, aby przesłać pliki.
# inicjalizacja API
documentApi = groupdocs_merger_cloud.DocumentApi.from_config(configuration)
file_api = groupdocs_merger_cloud.FileApi.from_config(configuration)
my_storage = ""
# zdefiniuj opcje podziału
options = groupdocs_merger_cloud.SplitOptions()
options.file_info = groupdocs_merger_cloud.FileInfo("ten-pages.pdf")
options.output_path = "Output"
options.start_page_number = 4
options.end_page_number = 7
options.mode = "Pages"
# utwórz podzielone żądanie
split_request = groupdocs_merger_cloud.SplitRequest(options)
result = documentApi.split(split_request)
print("Documents count = " + str(len(result.documents)))
# pokaż wyniki i pobierz pliki jeden po drugim
for data in result.documents:
print("Document Url = " + str(data))
# utwórz żądanie pobrania pliku
request = groupdocs_merger_cloud.DownloadFileRequest(data.path, my_storage)
response = file_api.download_file(request)
# Przenieś pobrany plik do katalogu roboczego
shutil.move(response, "C:\\Files\\")
Wypróbuj online
Wypróbuj następujące bezpłatne narzędzie do rozdzielania plików PDF online, które zostało opracowane przy użyciu powyższego interfejsu API. https://products.groupdocs.app/splitter/pdf
Wniosek
W tym artykule nauczyłeś się, jak wyodrębniać określone strony z dokumentów PDF w chmurze za pomocą Python. Nauczyłeś się również, jak programowo przesyłać plik PDF do chmury, a następnie pobierać wyodrębnione pliki z chmury. Możesz dowiedzieć się więcej o GroupDocs.Merger Cloud API korzystając z dokumentacji. Udostępniamy również sekcję Informacje o interfejsach API, która umożliwia wizualizację i interakcję z naszymi interfejsami API bezpośrednio w przeglądarce. W przypadku jakichkolwiek niejasności prosimy o kontakt na forum.