Python'da Çevrimiçi PDF Dosyasından Sayfalar Nasıl Çıkarılır

Python’da Çevrimiçi PDF Dosyasından Sayfaları Çıkarın

Bazı durumlarda, PDF belgelerinden PDF sayfaları çıkarmanız veya büyük PDF belgelerini daha küçük PDF dosyalarına ayırmanız gerekebilir. Bir Python geliştiricisi olarak, çevrimiçi olarak PDF dosyalarından belirli sayfaları kolayca çıkarabilir veya PDF sayfalarını programlı olarak sayfa aralığına göre çıkarabilirsiniz. Bu makalede, REST API kullanarak Python’da çevrimiçi PDF dosyasından sayfaların nasıl çıkarılacağını öğreneceksiniz.

Bu yazıda aşağıdaki konular ele alınacaktır:

Document Extractor REST API ve Python SDK

Çevrimiçi PDF dosyalarından PDF sayfalarını ayıklamak için GroupDocs.Merger Cloud API’nin Python SDK‘sını kullanacağım. Zengin özelliklere sahip ve yüksek performanslı bir Bulut SDK’sıdır. Bu Python API, PDF sayfalarını tek bir belgeden birden çok dosyaya çıkarmanıza olanak tanır. SDK, tüm veya tercih edilen sayfa aralığı için sayfa yönünü yeniden düzenlemek, silmek, değiştirmek, döndürmek veya değiştirmek için işlevsellik sunar. Ayrıca PDF, Word, PowerPoint, Excel çalışma sayfaları vb. desteklenen dosya biçimleri için diğer manipülasyonları da destekler. Şu anda, [birleşme] belgesi olarak .NET, Java, PHP, Ruby, Android ve Node.js SDK’lerini desteklemektedir. 5] Cloud API için aile üyeleri.

Konsolda aşağıdaki komutu kullanarak GroupDocs.Merger-Cloud’u Python projenize kurabilirsiniz:

pip install groupdocs_merger_cloud

Lütfen adımları ve mevcut kod örneklerini izlemeye başlamadan önce gösterge tablosundan İstemci Kimliğinizi ve İstemci Sırrınızı alın. Kimliğinizi ve sırrınızı aldıktan sonra, kodu aşağıda gösterildiği gibi ekleyin:

# Groupdocs birleştirme SDK'sını içe aktarın
import groupdocs_merger_cloud

# Ücretsiz kayıttan sonra https://dashboard.groupdocs.cloud adresinden app_sid ve app_key'i edinin.
app_sid = "xxxxxxx-xxxx-xxxx-xxxx-xxxxxxxxxxxx"
app_key = "xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx"

# Dosya API yapılandırmalarını edinin 
configuration = groupdocs_merger_cloud.Configuration(app_sid, app_key)
configuration.api_base_url = "https://api.groupdocs.cloud"
storage_name = "LocalStorage"

REST API kullanarak Python’da Belirli Sayfaları PDF’den Çıkarma

PDF ayırıcı API’miz, bölmek istediğiniz sayfaları önizlemenize olanak tanır. Ayıklamak istediğiniz sayfa sayısını sağlayarak sayfaları seçebilirsiniz. PDF’nizi anında ayrı sayfalara bölün veya yeni bir PDF belgesinden belirli sayfaları çıkarın. Aşağıda belirtilen basit adımları izleyerek PDF sayfalarını çevrimiçi olarak PDF dosyalarından çıkarın:

  1. PDF dosyasını Buluta Yükle.
  2. Ayıkla Python’da Sayfa Numaralarına Göre PDF Sayfaları.
  3. Ayıklanan dosyaları İndir.

Belgeyi Yükle

Öncelikle, aşağıda verilen kod parçacığını kullanarak çok sayfalı PDF belgesini Bulut’a yükleyin:

# PDF dosyasını bulut depolama alanına yükleyin
# Dosya API'sinin bir örneğini oluşturun
file_api = groupdocs_merger_cloud.FileApi.from_config(configuration)

# Çağrı yükleme dosyası isteği
request = groupdocs_merger_cloud.UploadFileRequest("python-testing\sample-file.pdf", "H:\\groupdocs-cloud-data\\sample-file.pdf", storage_name)

# PDF dosyasını buluta yükleyin
response = file_api.upload_file(request)
print(response.uploaded)

Sonuç olarak, PDF dosyası Cloud Storage’a yüklenecek ve kontrol panelinizin dosyalar bölümünde mevcut olacaktır. Yüklemeden 24 saat sonra tüm dosyalarınızı buluttan kalıcı olarak sileriz.

Python kullanarak Belirli Sayfaları Sayfa Numaralarına Göre Çıkarın

Bir PDF belgesinden belirli bir sayfayı veya birden çok sayfayı programlı olarak ayıklamak için aşağıda belirtilen adımları izleyin:

  • Öncelikle bir PagesApi örneği oluşturun
  • İkinci olarak, ExtractOptions örneğini sağlayın
  • Şimdi, girdi dosyası yolunu FileInfo örneğiyle ayarlayın
  • Ardından, Çıktı dizini yolunu ayarlayın
  • Ardından, ayıklamak için virgülle ayrılmış sayfa numaraları sağlayın.
  • Ardından, modu Sayfalar olarak ayarlayın
  • Ardından, ExtractRequest örneği oluşturun
  • Son olarak, pagesApi.extract() sınıfını çağırarak sonuçları alın.

Aşağıdaki kod örneği, REST API kullanarak PDF belgesinden belirli sayfa numaraları sağlayarak sayfaların nasıl çıkarılacağını gösterir:

# REST API kullanarak Python'da Belirli Sayfaları PDF'den Çıkarma
try:
    # Pages API'sinin bir örneğini oluşturun
    pagesApi = groupdocs_merger_cloud.PagesApi.from_keys(app_sid, app_key)
     
    options = groupdocs_merger_cloud.ExtractOptions()
    options.file_info = groupdocs_merger_cloud.FileInfo("python-testing/sample-file.pdf")
    options.output_path = "python-testing"
    options.pages = [2, 4, 7]        
     
    result = pagesApi.extract(groupdocs_merger_cloud.ExtractRequest(options))
    print("Successfully extracted certain pages of PDF document: " + result[0].path)
except groupdocs_merger_cloud.ApiException as e:
  print("Exception while calling API: {0}".format(e.message))

Ayıklanan PDF Sayfaları Dosyasını İndirin

Yukarıdaki kod örneği, ayıklanan sayfaları bulutta ayrı PDF dosyalarına kaydedecektir. Aşağıdaki kod örneğini kullanarak bunları indirebilirsiniz:

# Dönüştürülen dosyayı indirmek için API başlatma
import shutil
file_api = groupdocs_merger_cloud.FileApi.from_config(configuration)

# İndirme dosyası isteği oluştur
request = groupdocs_merger_cloud.DownloadFileRequest("python-testing\sample-file.pdf", storage_name)

# Dönüştürülen DOSYALARI indirin
response = file_api.download_file(request)

# İndirilen dosyayı dizininize taşıyın
shutil.move(response, "H:\\groupdocs-cloud-data\\")

REST API kullanarak Python’da Sayfa Aralığına göre PDF’den Sayfaları Çıkarın

Programlı olarak bir sayfa aralığı sağlayarak bir PDF belgesinden sayfaları çıkarmak için lütfen aşağıda belirtilen adımları izleyin.

  • Öncelikle bir PagesApi örneği oluşturun
  • Ardından, ExtractOptions’ı ayarlayın
  • Giriş dosyası yolunu FileInfo örneğiyle ayarlayın
  • Ardından, Çıktı dizini yolunu ayarlayın
  • Ayıklamak için başlangıç sayfa numarasını ve bitiş sayfa numarasını ayarlayarak bir sayfa aralığı sağlayın
  • Şimdi, mod aralığını Sayfalar olarak ayarlayın
  • Rangemode’u EvenPages veya OddPages olarak ayarlayın
  • Ardından, ExtractRequest örneği oluşturun
  • Son olarak, pagesApi.extract() yöntemini çağırarak sonuçları alın

Aşağıdaki kod örneği, REST API kullanarak PDF belgesinden sayfa aralığı sağlayarak sayfaların nasıl çıkarılacağını gösterir. Dosyaları yüklemek için lütfen daha önce belirtilen adımları izleyin.

# REST API kullanarak Python'da Sayfa Aralığına Göre PDF'den Sayfaları Çıkarma
try:
    # Belge API'sinin bir örneğini oluşturun
    pagesApi = groupdocs_merger_cloud.PagesApi.from_keys(app_sid, app_key)
     
    options = groupdocs_merger_cloud.ExtractOptions()
    options.file_info = groupdocs_merger_cloud.FileInfo("python-testing\sample-file.pdf")
    options.output_path = "python-testing"
    options.start_page_number = 1
    options.end_page_number = 10
    options.range_mode = "EvenPages" # or set range_mode to "OddPages"
    options.mode = "Pages" # Mode Intervals
     
    result = pagesApi.extract(groupdocs_merger_cloud.ExtractRequest(options))
    print("Successfully extract selected pages from PDF by page range interval: " + result[0].path)
except groupdocs_merger_cloud.ApiException as e:
  print("Exception while calling API: {0}".format(e.message))

Çevrimiçi PDF Sayfa Çıkarıcı Ücretsiz

Ücretsiz pdf’den sayfalar nasıl çıkarılır? Lütfen yukarıdaki API kullanılarak geliştirilen aşağıdaki ücretsiz çevrimiçi PDF çıkarma aracını deneyin.

Özetliyor

Bu da bizi blog yazısının sonuna getiriyor. Umarım öğrenmişsindir:

  • Python’da PDF belgelerinden belirli sayfaların nasıl çıkarılacağı;
  • PDF dosyasını programlı olarak yükleyin ve ardından ayıklanan dosyaları buluttan indirin;
  • Python kullanılarak sayfa aralığı kullanılarak PDF dosya sayfalarının nasıl çıkarılacağı;

Belgeleri kullanarak GroupDocs.Merger Cloud API hakkında daha fazla bilgi edinebilirsiniz. Ayrıca, doğrudan tarayıcı aracılığıyla API’lerimizi görselleştirmenize ve bunlarla etkileşimde bulunmanıza olanak tanıyan bir API Referansı bölümü de sağlıyoruz.

Başlarken sayfamızda daha fazla ayrıntı keşfedebilirsiniz.

Ayrıca, Groupdocs.cloud sürekli olarak yeni konularla güncellenir. Sonuç olarak, en son API bilgileri konusunda güncel kalın.

Bir soru sor

Ücretsiz Destek Forum aracılığıyla PDF sayfa çıkarma yazılımı API’si hakkındaki sorularınızı sorabilirsiniz.

SSS

Python’da PDF dosyasından sayfalar nasıl çıkarılır?

Python’da PDF dosyalarından sayfaların nasıl çıkarılacağına ilişkin Python kod parçacığını öğrenmek için lütfen bu bağlantıyı takip edin.

REST API kullanarak çevrimiçi PDF belgelerinden sayfalar nasıl çıkarılır?

Bir PagesApi örneği oluşturun, ExtractOptions’ın değerlerini ayarlayın ve PDF dosyasının seçili sayfalarını çevrimiçi kaydetmek için ExtractRequest ile pagesApi.extract() yöntemini çağırın.

PDF sayfa çıkarıcı ücretsiz indirme kitaplığı nasıl kurulur?

PDF’den sayfa çıkarmanın kolay bir yolu Python SDK kullanmaktır. PDF dosyalarından birden çok sayfayı programlı olarak ayıklamak için PDF çıkarıcı Python kitaplığını kurabilirsiniz.

PDF sayfalarını Windows’ta çevrimdışı olarak nasıl ayıklayabilirim?

Windows için PDF ayıklama yazılımını indirmek için lütfen bu bağlantıyı ziyaret edin. Bu PDF çıkarıcı ücretsiz indirme yazılımı, PDF sayfalarını pencerelerde tek bir tıklama ile hızlı bir şekilde böler.

Ayrıca bakınız