PDF belgelerinden belirli sayfaları ayıklamanız veya büyük PDF belgelerini daha küçük parçalara ayırmanız gerekebilir. Bir Python geliştiricisi olarak, PDF belgelerinden belirli sayfaları sayfa numaralarına veya bir dizi sayfaya göre programlı olarak kolayca çıkarabilirsiniz. Bu makalede, Python’da bir REST API kullanarak PDF belgelerinden belirli sayfaları nasıl çıkaracağınızı öğreneceksiniz.
Bu yazıda aşağıdaki konular ele alınacaktır:
- Belge Ayırıcı REST API ve Python SDK
- Bir REST API kullanarak PDF’den Belirli Sayfaları Çıkarın
- Python kullanarak Sayfaları Sayfa Aralığına Göre Çıkarın
Belge Ayırıcı REST API ve Python SDK
PDF belgelerinden sayfa ayıklamak için GroupDocs.Merger Cloud’un Python SDK API’sini kullanacağım. Birkaç belgeyi tek bir belgede birleştirmek için kullanılan, zengin özelliklere sahip ve yüksek performanslı bir Bulut SDK’sıdır. Ayrıca, tek bir belgeyi birden çok belgeye bölmenizi sağlar. SDK, tüm veya tercih edilen bir sayfa aralığı için sayfa yönlendirmesini silme, değiştirme, döndürme veya değiştirme ve PDF, Word, Powerpoint ve Excel çalışma sayfaları gibi desteklenen herhangi bir dosya formatı için diğer manipülasyonları kolayca gerçekleştirme işlevi sunar. Şu anda, Bulut API’si için belge birleştirme ailesi üyeleri olarak .NET, Java, PHP, Ruby, Android ve Node.js SDK’ları da sağlamaktadır.
Konsolda aşağıdaki komutu kullanarak GroupDocs.Merger-Cloud’u Python projenize yükleyebilirsiniz:
pip install groupdocs_merger_cloud
Lütfen adımları ve mevcut kod örneklerini izlemeye başlamadan önce gösterge tablosundan İstemci Kimliğinizi ve İstemci Sırrınızı alın. Kimliğinizi ve sırrınızı aldıktan sonra, kodu aşağıda gösterildiği gibi ekleyin:
client_id = "da0c487d-c1c0-45ae-b7bf-43eaf53c5ad5"
client_secret = "479db2b01dcb93a3d4d20efb16dea971"
configuration = groupdocs_merger_cloud.Configuration(client_id, client_secret)
configuration.api_base_url = "https://api.groupdocs.cloud"
my_storage = ""
Python’da REST API kullanarak PDF’den Belirli Sayfaları Çıkarın
Aşağıda belirtilen basit adımları izleyerek PDF belgelerinden belirli sayfaları çıkarabilirsiniz:
- PDF dosyasını Buluta Yükle
- Belirli Sayfaları Sayfa Numaralarına Göre Çıkarın yüklenen PDF dosyasından
- Çıkarılan dosya(lar)ı İndir
Belgeyi Yükle
Her şeyden önce, aşağıda verilen kod örneğini kullanarak çok sayfalı PDF belgesini Bulut’a yükleyin:
# API örneğini oluştur
file_api = groupdocs_merger_cloud.FileApi.from_config(configuration)
my_storage = ""
# örnek dosyaları yükle
request = groupdocs_merger_cloud.UploadFileRequest("ten-pages.pdf", "C:\\Files\\ten-pages.pdf", my_storage)
response = file_api.upload_file(request)
Sonuç olarak, PDF dosyası Cloud Storage’a yüklenecek ve kontrol panelinizin dosyalar bölümünde mevcut olacaktır.
Python kullanarak Belirli Sayfaları Sayfa Numaralarına Göre Çıkarın
Bir PDF belgesinden belirli bir sayfayı veya birden çok sayfayı programlı olarak çıkarmak için lütfen aşağıda belirtilen adımları izleyin.
- Bir Document API örneği oluşturun
- SplitOptions sağlayın
- Giriş dosyası yolunu ayarla
- Çıkış dizini yolunu ayarla
- Ayıklamak için virgülle ayrılmış sayfa numaraları sağlayın
- Modu Sayfalar olarak ayarla
- Bölünmüş İstek Oluştur
- DocumentApi.split() yöntemini çağırarak sonuçları alın
Aşağıdaki kod örneği, bir REST API kullanarak bir PDF belgesinden belirli sayfa numaraları sağlayarak sayfaların nasıl çıkarılacağını gösterir.
# api başlatma
documentApi = groupdocs_merger_cloud.DocumentApi.from_config(configuration)
# bölme seçeneklerini tanımla
options = groupdocs_merger_cloud.SplitOptions()
options.file_info = groupdocs_merger_cloud.FileInfo("ten-pages.pdf")
options.output_path = "Output"
options.pages = [1, 3]
options.mode = "Pages"
# bölünmüş istek oluştur
split_request = groupdocs_merger_cloud.SplitRequest(options)
result = documentApi.split(split_request)
print("Documents count = " + str(len(result.documents)))
Ayıklanan Sayfa Dosyalarını İndirin
Yukarıdaki kod örneği, ayıklanan sayfaları bulutta ayrı PDF dosyalarına kaydedecektir. Aşağıdaki kod örneğini kullanarak bunları indirebilirsiniz:
# api başlatma
file_api = groupdocs_merger_cloud.FileApi.from_config(configuration)
my_storage = ""
# dosya isteğini indir
request = groupdocs_merger_cloud.DownloadFileRequest("Output\\ten-pages_1.pdf", my_storage)
response = file_api.download_file(request)
# indirilen dosyayı çalışma dizininize taşıyın
shutil.move(response, "C:\\Files\\")
Python kullanarak Sayfaları Sayfa Aralığına Göre Çıkarın
Programlı olarak bir sayfa aralığı sağlayarak bir PDF belgesinden sayfaları çıkarmak için lütfen aşağıda belirtilen adımları izleyin.
- Bir Document API örneği oluşturun
- SplitOptions sağlayın
- Giriş dosyası yolunu ayarla
- Çıkış dizini yolunu ayarla
- Ayıklamak için başlangıç sayfa numarasını ve bitiş sayfa numarasını ayarlayarak sayfa aralığı sağlayın
- Modu Sayfalar olarak ayarla
- Bölünmüş İstek Oluştur
- DocumentApi.split() yöntemini çağırarak sonuçları alın
- DownloadFileRequest Oluştur
- FileApi.download\file() yöntemini çağırarak dosyayı indirin
Aşağıdaki kod örneği, bir REST API kullanarak bir PDF belgesinden bir sayfa aralığı sağlayarak sayfaların nasıl çıkarılacağını gösterir. Dosyaları yüklemek için lütfen daha önce belirtilen adımları izleyin.
# api başlatma
documentApi = groupdocs_merger_cloud.DocumentApi.from_config(configuration)
file_api = groupdocs_merger_cloud.FileApi.from_config(configuration)
my_storage = ""
# bölme seçeneklerini tanımla
options = groupdocs_merger_cloud.SplitOptions()
options.file_info = groupdocs_merger_cloud.FileInfo("ten-pages.pdf")
options.output_path = "Output"
options.start_page_number = 4
options.end_page_number = 7
options.mode = "Pages"
# bölünmüş istek oluştur
split_request = groupdocs_merger_cloud.SplitRequest(options)
result = documentApi.split(split_request)
print("Documents count = " + str(len(result.documents)))
# sonuçları göster ve dosyaları tek tek indir
for data in result.documents:
print("Document Url = " + str(data))
# indirme dosyası isteği oluştur
request = groupdocs_merger_cloud.DownloadFileRequest(data.path, my_storage)
response = file_api.download_file(request)
# İndirilen dosyayı çalışma dizininize taşıyın
shutil.move(response, "C:\\Files\\")
Çevrimiçi Deneyin
Lütfen yukarıdaki API kullanılarak geliştirilen aşağıdaki ücretsiz çevrimiçi PDF bölme aracını deneyin. https://products.groupdocs.app/splitter/pdf
Çözüm
Bu makalede, Python kullanarak buluttaki PDF belgelerinden belirli sayfaları nasıl çıkaracağınızı öğrendiniz. Ayrıca, PDF dosyasını programlı olarak buluta nasıl yükleyeceğinizi ve ardından buluttan ayıklanan dosyaları nasıl indireceğinizi de öğrendiniz. Belgeleri kullanarak GroupDocs.Merger Cloud API hakkında daha fazla bilgi edinebilirsiniz. Ayrıca, API’lerimizi doğrudan tarayıcı aracılığıyla görselleştirmenize ve bunlarla etkileşimde bulunmanıza olanak tanıyan bir API Referansı bölümü de sağlıyoruz. Herhangi bir belirsizlik durumunda, lütfen forumda bizimle iletişime geçmekten çekinmeyin.