Python'u Kullanarak Belirli Sayfaları PDF'den Ayıklayın

PDF belgelerinden belirli sayfaları ayıklamanız veya büyük PDF belgelerini daha küçük parçalara ayırmanız gerekebilir. Bir Python geliştiricisi olarak, PDF belgelerinden belirli sayfaları sayfa numaralarına veya bir dizi sayfaya göre programlı olarak kolayca çıkarabilirsiniz. Bu makalede, Python’da bir REST API kullanarak PDF belgelerinden belirli sayfaları nasıl çıkaracağınızı öğreneceksiniz.

Bu yazıda aşağıdaki konular ele alınacaktır:

Belge Ayırıcı REST API ve Python SDK
Bir REST API kullanarak PDF’den Belirli Sayfaları Çıkarın
Python kullanarak Sayfaları Sayfa Aralığına Göre Çıkarın

Belge Ayırıcı REST API ve Python SDK

PDF belgelerinden sayfa ayıklamak için GroupDocs.Merger Cloud’un Python SDK API’sini kullanacağım. Birkaç belgeyi tek bir belgede birleştirmek için kullanılan, zengin özelliklere sahip ve yüksek performanslı bir Bulut SDK’sıdır. Ayrıca, tek bir belgeyi birden çok belgeye bölmenizi sağlar. SDK, tüm veya tercih edilen bir sayfa aralığı için sayfa yönlendirmesini silme, değiştirme, döndürme veya değiştirme ve PDF, Word, Powerpoint ve Excel çalışma sayfaları gibi desteklenen herhangi bir dosya formatı için diğer manipülasyonları kolayca gerçekleştirme işlevi sunar. Şu anda, Bulut API’si için belge birleştirme ailesi üyeleri olarak .NET, Java, PHP, Ruby, Android ve Node.js SDK’ları da sağlamaktadır.

Konsolda aşağıdaki komutu kullanarak GroupDocs.Merger-Cloud’u Python projenize yükleyebilirsiniz:

pip install groupdocs_merger_cloud

Lütfen adımları ve mevcut kod örneklerini izlemeye başlamadan önce gösterge tablosundan İstemci Kimliğinizi ve İstemci Sırrınızı alın. Kimliğinizi ve sırrınızı aldıktan sonra, kodu aşağıda gösterildiği gibi ekleyin:

client_id = "da0c487d-c1c0-45ae-b7bf-43eaf53c5ad5"
client_secret = "479db2b01dcb93a3d4d20efb16dea971"

configuration = groupdocs_merger_cloud.Configuration(client_id, client_secret)
configuration.api_base_url = "https://api.groupdocs.cloud"
my_storage = ""

Python’da REST API kullanarak PDF’den Belirli Sayfaları Çıkarın

Aşağıda belirtilen basit adımları izleyerek PDF belgelerinden belirli sayfaları çıkarabilirsiniz:

PDF dosyasını Buluta Yükle
Belirli Sayfaları Sayfa Numaralarına Göre Çıkarın yüklenen PDF dosyasından
Çıkarılan dosya(lar)ı İndir

Belgeyi Yükle

Her şeyden önce, aşağıda verilen kod örneğini kullanarak çok sayfalı PDF belgesini Bulut’a yükleyin:

# API örneğini oluştur
file_api = groupdocs_merger_cloud.FileApi.from_config(configuration)
my_storage = ""

# örnek dosyaları yükle
request = groupdocs_merger_cloud.UploadFileRequest("ten-pages.pdf", "C:\\Files\\ten-pages.pdf", my_storage)
response = file_api.upload_file(request)

Sonuç olarak, PDF dosyası Cloud Storage’a yüklenecek ve kontrol panelinizin dosyalar bölümünde mevcut olacaktır.

Python kullanarak Belirli Sayfaları Sayfa Numaralarına Göre Çıkarın

Bir PDF belgesinden belirli bir sayfayı veya birden çok sayfayı programlı olarak çıkarmak için lütfen aşağıda belirtilen adımları izleyin.

Bir Document API örneği oluşturun
SplitOptions sağlayın
Giriş dosyası yolunu ayarla
Çıkış dizini yolunu ayarla
Ayıklamak için virgülle ayrılmış sayfa numaraları sağlayın
Modu Sayfalar olarak ayarla
Bölünmüş İstek Oluştur
DocumentApi.split() yöntemini çağırarak sonuçları alın

Aşağıdaki kod örneği, bir REST API kullanarak bir PDF belgesinden belirli sayfa numaraları sağlayarak sayfaların nasıl çıkarılacağını gösterir.

# api başlatma
documentApi = groupdocs_merger_cloud.DocumentApi.from_config(configuration)

# bölme seçeneklerini tanımla
options = groupdocs_merger_cloud.SplitOptions()
options.file_info = groupdocs_merger_cloud.FileInfo("ten-pages.pdf")
options.output_path = "Output"
options.pages = [1, 3]
options.mode = "Pages"

# bölünmüş istek oluştur
split_request = groupdocs_merger_cloud.SplitRequest(options)
result = documentApi.split(split_request)        

print("Documents count = " + str(len(result.documents)))

Python kullanarak PDF'den Belirli Sayfaları Çıkarın — Python kullanarak PDF’den Belirli Sayfaları Çıkarın

Ayıklanan Sayfa Dosyalarını İndirin

Yukarıdaki kod örneği, ayıklanan sayfaları bulutta ayrı PDF dosyalarına kaydedecektir. Aşağıdaki kod örneğini kullanarak bunları indirebilirsiniz:

# api başlatma
file_api = groupdocs_merger_cloud.FileApi.from_config(configuration)
my_storage = ""

# dosya isteğini indir
request = groupdocs_merger_cloud.DownloadFileRequest("Output\\ten-pages_1.pdf", my_storage)
response = file_api.download_file(request)

# indirilen dosyayı çalışma dizininize taşıyın
shutil.move(response, "C:\\Files\\")

Python kullanarak Sayfaları Sayfa Aralığına Göre Çıkarın

Programlı olarak bir sayfa aralığı sağlayarak bir PDF belgesinden sayfaları çıkarmak için lütfen aşağıda belirtilen adımları izleyin.

Bir Document API örneği oluşturun
SplitOptions sağlayın
Giriş dosyası yolunu ayarla
Çıkış dizini yolunu ayarla
Ayıklamak için başlangıç sayfa numarasını ve bitiş sayfa numarasını ayarlayarak sayfa aralığı sağlayın
Modu Sayfalar olarak ayarla
Bölünmüş İstek Oluştur
DocumentApi.split() yöntemini çağırarak sonuçları alın
DownloadFileRequest Oluştur
FileApi.download\file() yöntemini çağırarak dosyayı indirin

Aşağıdaki kod örneği, bir REST API kullanarak bir PDF belgesinden bir sayfa aralığı sağlayarak sayfaların nasıl çıkarılacağını gösterir. Dosyaları yüklemek için lütfen daha önce belirtilen adımları izleyin.

# api başlatma
documentApi = groupdocs_merger_cloud.DocumentApi.from_config(configuration)
file_api = groupdocs_merger_cloud.FileApi.from_config(configuration)
my_storage = ""

# bölme seçeneklerini tanımla
options = groupdocs_merger_cloud.SplitOptions()
options.file_info = groupdocs_merger_cloud.FileInfo("ten-pages.pdf")
options.output_path = "Output"
options.start_page_number = 4
options.end_page_number = 7
options.mode = "Pages"

# bölünmüş istek oluştur
split_request = groupdocs_merger_cloud.SplitRequest(options)
result = documentApi.split(split_request)   

print("Documents count = " + str(len(result.documents)))

# sonuçları göster ve dosyaları tek tek indir
for data in result.documents:
    print("Document Url = " + str(data))
    
    # indirme dosyası isteği oluştur
    request = groupdocs_merger_cloud.DownloadFileRequest(data.path, my_storage)
    response = file_api.download_file(request)
    
    # İndirilen dosyayı çalışma dizininize taşıyın
    shutil.move(response, "C:\\Files\\")

Python kullanarak Sayfaları Sayfa Aralığına Göre Çıkarın

Çevrimiçi Deneyin

Lütfen yukarıdaki API kullanılarak geliştirilen aşağıdaki ücretsiz çevrimiçi PDF bölme aracını deneyin. https://products.groupdocs.app/splitter/pdf

Çözüm

Bu makalede, Python kullanarak buluttaki PDF belgelerinden belirli sayfaları nasıl çıkaracağınızı öğrendiniz. Ayrıca, PDF dosyasını programlı olarak buluta nasıl yükleyeceğinizi ve ardından buluttan ayıklanan dosyaları nasıl indireceğinizi de öğrendiniz. Belgeleri kullanarak GroupDocs.Merger Cloud API hakkında daha fazla bilgi edinebilirsiniz. Ayrıca, API’lerimizi doğrudan tarayıcı aracılığıyla görselleştirmenize ve bunlarla etkileşimde bulunmanıza olanak tanıyan bir API Referansı bölümü de sağlıyoruz. Herhangi bir belirsizlik durumunda, lütfen forumda bizimle iletişime geçmekten çekinmeyin.

Ayrıca bakınız

REST API kullanarak PDF Dosyalarını Birleştirin

Belge Ayırıcı REST API ve Python SDK#

Python’da REST API kullanarak PDF’den Belirli Sayfaları Çıkarın#

Belgeyi Yükle#

Python kullanarak Belirli Sayfaları Sayfa Numaralarına Göre Çıkarın#

Ayıklanan Sayfa Dosyalarını İndirin#

Python kullanarak Sayfaları Sayfa Aralığına Göre Çıkarın#

Çevrimiçi Deneyin#

Çözüm#

Ayrıca bakınız#