PDF Belgelerinden Görüntüleri Çıkarın

Yeniden kullanmak için PDF veya Word belgelerinizden görüntüleri çıkarmanız gerekebilir. PDF belgelerinden görüntüleri bulutta programlı olarak kolayca çıkarabilirsiniz. Bu makale, Python’da bir REST API kullanarak PDF belgelerinden görüntülerin nasıl çıkarılacağını açıklayacaktır.

Bu yazıda aşağıdaki konular ele alınacaktır:

Belge Ayrıştırıcı REST API ve Python SDK

Bir PDF belgesinden görüntüleri ayıklamak için GroupDocs.Parser Cloud’un Python SDK API’sini kullanacağım. Tüm popüler belge türlerinden verileri ayrıştırmanıza olanak tanır. SDK’yı kullanarak bir şablona göre metin, resim çıkarabilir ve verileri ayrıştırabilirsiniz. Ayrıca Cloud API için belge ayrıştırıcı aile üyeleri olarak .NET, Java, PHP, Ruby ve Node.js SDK’ları sağlar.

Konsolda aşağıdaki komutu kullanarak GroupDocs.Parser Cloud’u Python projenize pip (python için paket yükleyici) ile yükleyebilirsiniz:

pip install groupdocs_parser_cloud

Lütfen adımları ve mevcut kod örneklerini izlemeye başlamadan önce gösterge tablosundan İstemci Kimliğinizi ve İstemci Sırrınızı alın. Müşteri Kimliğinizi ve Sırrınızı aldıktan sonra, kodu aşağıda gösterildiği gibi ekleyin:

client_id = "112f0f38-9dae-42d5-b4fc-cc84ae644972"
client_secret = "16ad3fe0bdc39c910f57d2fd48a5d618"

configuration = groupdocs_parser_cloud.Configuration(client_id, client_secret)
configuration.api_base_url = "https://api.groupdocs.cloud"
my_storage = ""

Python’da bir REST API kullanarak PDF’den Görüntüleri Çıkarın

Aşağıda belirtilen basit adımları izleyerek görüntüleri PDF belgelerinden çıkarabilirsiniz:

Belgeyi Yükle

Öncelikle, aşağıda verilen kod örneğini kullanarak PDF belgesini Buluta yükleyin:

# api başlatma
file_api = groupdocs_parser_cloud.FileApi.from_config(configuration)
my_storage = ""

request = groupdocs_parser_cloud.UploadFileRequest("sample.pdf", "C:\\Files\\sample.pdf", my_storage)
response = file_api.upload_file(request)

Sonuç olarak, yüklenen PDF dosyası (sample.pdf), bulut üzerindeki kontrol panelinizin dosyalar bölümünde mevcut olacaktır.

Python kullanarak PDF Belgesinden Tüm Görüntüleri Çıkarın

Aşağıda belirtilen adımları izleyerek tüm görüntüleri programlı olarak PDF dosyasından kolayca çıkarabilirsiniz.

  • Bir ParseApi örneği oluşturun
  • ImageOptions’ı tanımlayın
  • PDF dosyasının yolunu ayarla
  • Görüntü İsteği Oluştur
  • ParseApi.images() yöntemini çağırarak sonuçları alın

Aşağıdaki kod örneği, bir REST API kullanarak bir PDF belgesindeki tüm görüntülerin nasıl çıkarılacağını gösterir.

# api başlatma
parseApi = groupdocs_parser_cloud.ParseApi.from_config(configuration)
# görüntü seçeneklerini tanımla
options = groupdocs_parser_cloud.ImagesOptions()
options.file_info = groupdocs_parser_cloud.FileInfo()
options.file_info.file_path = "sample.pdf"

# istek oluştur
request = groupdocs_parser_cloud.ImagesRequest(options)
result = parseApi.images(request)

for image in result.images:
    print("Image path in storage: " + image.path + ". Download url: " + image.download_url)
    print("Image format: " + image.file_format + ". Page index: " + str(image.page_index))
Tüm görüntüleri PDF belgesinden çıkarın.

Tüm görüntüleri PDF belgesinden çıkarın.

Ayıklanan Resimleri İndir

Yukarıdaki kod örneği, çıkarılan görüntüleri buluta kaydedecektir. Aşağıda verilen kod örneğini kullanarak bu görüntüleri indirebilirsiniz:

# api başlatma
file_api = groupdocs_parser_cloud.FileApi.from_config(configuration)
my_storage = ""
  
# Resmi indir 
request = groupdocs_parser_cloud.DownloadFileRequest(image.path, my_storage)
response = file_api.download_file(request)

# İndirilen dosyayı çalışma dizininize taşıyın
shutil.move(response, "C:\\Files\\Images")

Python Kullanarak PDF Belgelerinden Görüntüleri Sayfa Numaralarına Göre Kaydetme

Aşağıda belirtilen adımları izleyerek bir PDF dosyasının belirli sayfalarından görüntüleri programlı olarak kolayca çıkarabilirsiniz.

  • Bir ParseApi örneği oluşturun
  • ImageOptions’ı tanımlayın
  • PDF dosyasının yolunu sağlayın
  • Başlangıç sayfası numarasını ayarla
  • Ayıklanacak sayfa sayısını ayarlayın
  • Görüntü İsteği Oluştur
  • ParseApi.images() yöntemini çağırarak sonuçları alın

Aşağıdaki kod örneği, görüntülerin bir REST API kullanılarak bir PDF belgesinden sayfa numaraları aralığına göre nasıl çıkarılacağını gösterir. Ayıklanan görüntüleri indirmek için lütfen daha önce belirtilen adımları izleyin.

# api başlatma
parseApi = groupdocs_parser_cloud.ParseApi.from_config(configuration)
# görüntü seçeneklerini tanımla
options = groupdocs_parser_cloud.ImagesOptions()
options.file_info = groupdocs_parser_cloud.FileInfo()
options.file_info.file_path = "sample.pdf"
# sayfa aralığı tanımla
options.start_page_number = 1
options.count_pages_to_extract = 1

# istek oluştur
request = groupdocs_parser_cloud.ImagesRequest(options)
result = parseApi.images(request)

for page in result.pages:
    print("Images from " + str(page.page_index) + " page.")
   for image in page.images:
        print("Image path in storage: " + image.path + ". Download url: " + image.download_url)
        print("Image format: " + image.file_format + ". Page index: " + str(image.page_index))
Görüntüleri PDF belgesinden sayfa numarası aralığına göre çıkarın.

Görüntüleri PDF belgesinden sayfa numarası aralığına göre çıkarın.

Python Kullanarak PDF Ekli Belgeden Görüntüler Alın

Aşağıda belirtilen adımları izleyerek, bir PDF dosyasına ek olarak sunulan bir kap içindeki bir belgeden görüntüleri programlı olarak çıkarabilirsiniz.

  • Bir ParseApi örneği oluşturun
  • ImageOptions’ı tanımlayın
  • PDF dosyasının yolunu ayarla
  • ContainerItemInfo’yu tanımlayın
  • İç belgenin göreli yolunu sağlayın
  • Başlangıç sayfası numarasını ayarla
  • Ayıklanacak sayfa sayısını ayarlayın
  • Görüntü İsteği Oluştur
  • ParseApi.images() yöntemini çağırarak sonuçları alın

Aşağıdaki kod örneği, bir REST API kullanarak bir PDF belgesi içindeki bir belgeden görüntülerin nasıl çıkarılacağını gösterir. Ayıklanan görüntüleri indirmek için lütfen daha önce belirtilen adımları izleyin.

# api başlatma
parseApi = groupdocs_parser_cloud.ParseApi.from_config(configuration)

# görüntü seçeneklerini tanımla
options = groupdocs_parser_cloud.ImagesOptions()
options.file_info = groupdocs_parser_cloud.FileInfo()
options.file_info.file_path = "PDF_with_attachements.pdf"
options.file_info.password = "password"
# konteyner öğesini ayarla
container_info = groupdocs_parser_cloud.ContainerItemInfo()
container_info.relative_path = "template-document.pdf"
options.container_item_info = container_info
# sayfa aralığı tanımla
options.start_page_number = 2
options.count_pages_to_extract = 1

# istek oluştur
request = groupdocs_parser_cloud.ImagesRequest(options)
result = parseApi.images(request)

for page in result.pages:
    print("Images from " + str(page.page_index) + " page.")
   for image in page.images:
        print("Image path in storage: " + image.path + ". Download url: " + image.download_url)
        print("Image format: " + image.file_format + ". Page index: " + str(image.page_index))
PDF belgesine eklenen belgeden görüntüleri ayıklayın

PDF belgesine eklenen belgeden görüntüleri ayıklayın.

Çevrimiçi Deneyin

Lütfen yukarıdaki API kullanılarak geliştirilen aşağıdaki ücretsiz çevrimiçi PDF Ayrıştırma aracını deneyin. https://products.groupdocs.app/parser/pdf

Çözüm

Bu makalede, buluttaki PDF belgelerinden görüntüleri nasıl çıkaracağınızı öğrendiniz. Bu makale aynı zamanda bir PDF dosyasının programlı olarak buluta nasıl yükleneceğini de açıkladı. Ayrıca, SDK’yı kullanarak ayıklanan görüntüleri nasıl indireceğinizi de öğrendiniz. Belgeleri kullanarak GroupDocs.Parser Cloud API hakkında daha fazla bilgi edinebilirsiniz. Ayrıca, API’lerimizi doğrudan tarayıcı aracılığıyla görselleştirmenize ve bunlarla etkileşimde bulunmanıza olanak tanıyan bir API Referansı bölümü de sağlıyoruz. Herhangi bir belirsizlik durumunda, lütfen forumda bizimle iletişime geçmekten çekinmeyin.

Ayrıca bakınız