W niektórych przypadkach może być konieczne wyodrębnienie stron PDF z dokumentów PDF lub rozdzielenie dużych dokumentów PDF na mniejsze pliki PDF. Jako programista Python możesz łatwo wyodrębniać określone strony z plików PDF online lub programowo wyodrębniać strony PDF według zakresu stron. W tym artykule dowiesz się, jak wyodrębnić strony z pliku PDF online w Python za pomocą REST API.
W tym artykule zostaną omówione następujące tematy:
- Document Extractor REST API i Python SDK
- Jak wyodrębnić określone strony z pliku PDF w Python przy użyciu interfejsu API REST
- Wyodrębnij strony z pliku PDF według zakresu stron w Python przy użyciu interfejsu API REST
Document Extractor REST API i Python SDK
Aby wyodrębnić strony PDF z plików PDF online, użyję Python SDK GroupDocs.Merger Cloud API. Jest to bogate w funkcje i wydajne Cloud SDK. Ten interfejs API języka Python umożliwia wyodrębnianie stron PDF z jednego dokumentu do wielu plików. SDK oferuje funkcje zmiany kolejności, usuwania, wymiany, obracania lub zmiany orientacji strony dla całego lub preferowanego zakresu stron. Obsługuje również inne manipulacje dla dowolnych obsługiwanych formatów plików, takich jak PDF, Word, PowerPoint, arkusze Excel itp. Obecnie obsługuje zestawy SDK .NET, Java, PHP, Ruby, Android i Node.js jako dokument [fuzja] 5] członków rodziny dla Cloud API.
Możesz zainstalować GroupDocs.Merger-Cloud w swoim projekcie Python za pomocą następującego polecenia w konsoli:
pip install groupdocs_merger_cloud
Zanim zaczniesz postępować zgodnie z instrukcjami i dostępnymi przykładami kodu, uzyskaj swój identyfikator klienta i klucz tajny klienta z pulpitu nawigacyjnego. Po uzyskaniu identyfikatora i tajnego kodu dodaj kod, jak pokazano poniżej:
# Zaimportuj pakiet SDK połączenia Groupdocs
import groupdocs_merger_cloud
# Uzyskaj app_sid i app_key z https://dashboard.groupdocs.cloud po bezpłatnej rejestracji.
app_sid = "xxxxxxx-xxxx-xxxx-xxxx-xxxxxxxxxxxx"
app_key = "xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx"
# Pobierz konfiguracje interfejsu API plików
configuration = groupdocs_merger_cloud.Configuration(app_sid, app_key)
configuration.api_base_url = "https://api.groupdocs.cloud"
storage_name = "LocalStorage"
Jak wyodrębnić określone strony z pliku PDF w Python przy użyciu interfejsu API REST
Nasz interfejs API rozdzielacza plików PDF umożliwia wyświetlanie podglądu stron, które chcesz podzielić. Możesz wybrać strony, podając tylko liczbę stron, które chcesz wyodrębnić. Błyskawicznie podziel plik PDF na poszczególne strony lub wyodrębnij określone strony z nowego dokumentu PDF. Wyodrębnij strony PDF z plików PDF online, wykonując proste czynności wymienione poniżej:
- Prześlij plik PDF do chmury.
- Wyciąg Strony PDF według numerów stron w Python.
- Pobierz wyodrębnione pliki.
Prześlij dokument
Przede wszystkim prześlij wielostronicowy dokument PDF do chmury, korzystając z fragmentu kodu podanego poniżej:
# Prześlij plik PDF do magazynu w chmurze
# Utwórz instancję pliku API
file_api = groupdocs_merger_cloud.FileApi.from_config(configuration)
# Zadzwoń do przesłania pliku
request = groupdocs_merger_cloud.UploadFileRequest("python-testing\sample-file.pdf", "H:\\groupdocs-cloud-data\\sample-file.pdf", storage_name)
# Prześlij plik PDF do chmury
response = file_api.upload_file(request)
print(response.uploaded)
W rezultacie plik PDF zostanie przesłany do Cloud Storage i będzie dostępny w sekcji plików Twojego pulpitu nawigacyjnego. Usuwamy trwale wszystkie Twoje pliki z chmury w ciągu 24 godzin po przesłaniu.
Wyodrębnij określone strony według numerów stron za pomocą Python
Aby programowo wyodrębnić określoną stronę lub wiele stron z dokumentu PDF, wykonaj następujące czynności:
- Najpierw utwórz instancję PagesApi.
- Po drugie, podaj instancję ExtractOptions
- Teraz ustaw ścieżkę pliku wejściowego za pomocą instancji FileInfo
- Następnie ustaw ścieżkę katalogu wyjściowego
- Następnie podaj rozdzielone przecinkami numery stron do wyodrębnienia
- Następnie ustaw tryb na Strony
- Następnie utwórz instancję ExtractRequest
- Na koniec uzyskaj wyniki, wywołując klasę pagesApi.extract().
Poniższy przykład kodu pokazuje, jak wyodrębnić strony, podając określone numery stron z dokumentu PDF za pomocą interfejsu API REST:
# Jak wyodrębnić określone strony z pliku PDF w Python przy użyciu interfejsu API REST
try:
# Utwórz instancję interfejsu API Pages
pagesApi = groupdocs_merger_cloud.PagesApi.from_keys(app_sid, app_key)
options = groupdocs_merger_cloud.ExtractOptions()
options.file_info = groupdocs_merger_cloud.FileInfo("python-testing/sample-file.pdf")
options.output_path = "python-testing"
options.pages = [2, 4, 7]
result = pagesApi.extract(groupdocs_merger_cloud.ExtractRequest(options))
print("Successfully extracted certain pages of PDF document: " + result[0].path)
except groupdocs_merger_cloud.ApiException as e:
print("Exception while calling API: {0}".format(e.message))
Pobierz plik wyodrębnionych stron PDF
Powyższy przykładowy kod zapisze wyodrębnione strony w osobnych plikach PDF w chmurze. Możesz je pobrać, korzystając z następującego przykładowego kodu:
# Inicjalizacja API w celu pobrania przekonwertowanego pliku
import shutil
file_api = groupdocs_merger_cloud.FileApi.from_config(configuration)
# Utwórz żądanie pobrania pliku
request = groupdocs_merger_cloud.DownloadFileRequest("python-testing\sample-file.pdf", storage_name)
# Pobierz przekonwertowany plik
response = file_api.download_file(request)
# Przenieś pobrany plik do swojego katalogu
shutil.move(response, "H:\\groupdocs-cloud-data\\")
Wyodrębnij strony z pliku PDF według zakresu stron w Python przy użyciu interfejsu API REST
Wykonaj czynności wymienione poniżej, aby wyodrębnić strony z dokumentu PDF przez programowe podanie zakresu stron.
- Najpierw utwórz instancję PagesApi.
- Następnie ustaw ExtractOptions
- Ustaw ścieżkę pliku wejściowego za pomocą instancji FileInfo
- Następnie ustaw ścieżkę katalogu wyjściowego
- Podaj zakres stron, ustawiając numer strony początkowej i numer strony końcowej do wyodrębnienia
- Teraz ustaw interwał trybu na Strony
- Ustaw tryb zakresu na EvenPages lub OddPages
- Następnie utwórz instancję ExtractRequest
- Na koniec uzyskaj wyniki, wywołując metodę pagesApi.extract().
Poniższy przykład kodu pokazuje, jak wyodrębnić strony, podając zakres stron z dokumentu PDF przy użyciu interfejsu API REST. Wykonaj czynności wymienione wcześniej, aby przesłać pliki.
# Jak wyodrębnić strony z pliku PDF według zakresu stron w Python przy użyciu interfejsu API REST
try:
# Utwórz instancję Document API
pagesApi = groupdocs_merger_cloud.PagesApi.from_keys(app_sid, app_key)
options = groupdocs_merger_cloud.ExtractOptions()
options.file_info = groupdocs_merger_cloud.FileInfo("python-testing\sample-file.pdf")
options.output_path = "python-testing"
options.start_page_number = 1
options.end_page_number = 10
options.range_mode = "EvenPages" # or set range_mode to "OddPages"
options.mode = "Pages" # Mode Intervals
result = pagesApi.extract(groupdocs_merger_cloud.ExtractRequest(options))
print("Successfully extract selected pages from PDF by page range interval: " + result[0].path)
except groupdocs_merger_cloud.ApiException as e:
print("Exception while calling API: {0}".format(e.message))
Darmowy internetowy ekstraktor stron PDF
Jak wyodrębnić strony z pdf za darmo? Wypróbuj następujące bezpłatne narzędzie online do wyodrębniania plików PDF, które zostało opracowane przy użyciu powyższego interfejsu API.
Podsumowując
To prowadzi nas do konkluzji wpisu na blogu. Mam nadzieję, że nauczyłeś się:
- jak wyodrębnić określone strony z dokumentów PDF w Python;
- programowo przesłać plik PDF, a następnie pobrać wyodrębnione pliki z chmury;
- jak wyodrębnić strony pliku PDF przy użyciu zakresu stron za pomocą Python;
Możesz dowiedzieć się więcej o GroupDocs.Merger Cloud API korzystając z dokumentacji. Udostępniamy również sekcję Informacje o interfejsach API, która umożliwia wizualizację i interakcję z naszymi interfejsami API bezpośrednio w przeglądarce.
Na naszej stronie Getting Started możesz znaleźć więcej szczegółów.
Ponadto Groupdocs.cloud jest stale aktualizowany o nowe tematy. W rezultacie bądź na bieżąco z najnowszymi informacjami o interfejsach API.
Zadać pytanie
Możesz zadawać pytania dotyczące interfejsu API oprogramowania do wyodrębniania stron PDF za pośrednictwem naszego bezpłatnego Forum
Często zadawane pytania
Jak wyodrębnić strony z pliku PDF w Python?
Skorzystaj z tego łącza, aby poznać fragment kodu Python o tym, jak wyodrębniać strony z plików PDF w Python.
Jak wyodrębnić strony z dokumentów PDF online za pomocą REST API?
Utwórz instancję PagesApi, ustaw wartości ExtractOptions i wywołaj metodę pagesApi.extract() z ExtractRequest, aby zapisać online wybrane strony pliku PDF.
Jak zainstalować bezpłatną bibliotekę do pobierania stron PDF?
Łatwym sposobem na wyodrębnienie stron z pliku PDF jest użycie Python SDK. Możesz zainstalować bibliotekę Python do ekstraktora PDF, aby programowo wyodrębnić wiele stron z plików PDF.
Jak wyodrębnić strony PDF w trybie offline w systemie Windows?
Odwiedź ten link, aby pobrać oprogramowanie do wyodrębniania plików PDF dla systemu Windows. To bezpłatne oprogramowanie do pobierania plików PDF szybko podzieli strony PDF w oknach za pomocą jednego kliknięcia.
Zobacz też
- Wyodrębnij tekst z pliku PDF za pomocą Python
- Połącz pliki PowerPoint PPT/PPTX online za pomocą interfejsu API REST w języku Ruby
- Wyodrębnij określone dane z pliku PDF za pomocą Python
- Konwertuj CSV na JSON i JSON na CSV w Python
- Scal pliki PDF za pomocą interfejsu API REST
- Konwertuj SVG na PNG wysokiej jakości w Python
- Konwertuj CSV na JSON i JSON na CSV w Python
- Jak przekonwertować PDF do Excela w Python przy użyciu REST API