Dalam kasus tertentu, Anda mungkin perlu mengekstrak halaman PDF dari dokumen PDF atau mungkin perlu memisahkan dokumen PDF besar menjadi file PDF yang lebih kecil. Sebagai pengembang Python, Anda dapat dengan mudah mengekstrak halaman tertentu dari file PDF secara online atau mengekstrak halaman PDF berdasarkan rentang halaman secara terprogram. Pada artikel ini, Anda akan belajar cara mengekstrak halaman dari file PDF online dengan Python menggunakan REST API.
Topik-topik berikut akan dibahas dalam artikel ini:
- Document Extractor REST API dan Python SDK
- Cara Mengekstrak Halaman Tertentu dari PDF dengan Python menggunakan REST API
- Ekstrak Halaman dari PDF dengan Rentang Halaman dengan Python menggunakan REST API
Document Extractor REST API dan Python SDK
Untuk mengekstrak halaman PDF dari file PDF secara online, saya akan menggunakan Python SDK dari GroupDocs.Merger Cloud API. Ini adalah Cloud SDK yang kaya fitur dan berkinerja tinggi. API Python ini memungkinkan Anda untuk mengekstrak halaman PDF dari satu dokumen menjadi beberapa file. SDK menawarkan fungsionalitas untuk mengatur ulang, menghapus, menukar, memutar, atau mengubah orientasi halaman untuk keseluruhan atau rentang halaman yang disukai. Ini juga mendukung manipulasi lain untuk semua format file yang didukung seperti PDF, Word, PowerPoint, lembar kerja Excel, dll. Saat ini, mendukung .NET, Java, PHP, Ruby, Android, dan Node.js SDK sebagai dokumennya [penggabungan] 5] anggota keluarga untuk Cloud API.
Anda dapat menginstal GroupDocs.Merger-Cloud ke proyek Python Anda menggunakan perintah berikut di konsol:
pip install groupdocs_merger_cloud
Dapatkan ID Klien dan Rahasia Klien Anda dari dashboard sebelum Anda mulai mengikuti langkah-langkah dan contoh kode yang tersedia. Setelah Anda memiliki ID dan rahasia Anda, tambahkan kode seperti yang ditunjukkan di bawah ini:
# Impor SDK penggabungan groupdocs
import groupdocs_merger_cloud
# Dapatkan app_sid & app_key dari https://dashboard.groupdocs.cloud setelah pendaftaran gratis.
app_sid = "xxxxxxx-xxxx-xxxx-xxxx-xxxxxxxxxxxx"
app_key = "xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx"
# Dapatkan konfigurasi File API
configuration = groupdocs_merger_cloud.Configuration(app_sid, app_key)
configuration.api_base_url = "https://api.groupdocs.cloud"
storage_name = "LocalStorage"
Cara Mengekstrak Halaman Tertentu dari PDF dengan Python menggunakan REST API
API pembagi PDF kami memungkinkan Anda melihat pratinjau halaman yang ingin Anda pisahkan. Anda dapat memilih halaman hanya dengan memberikan jumlah halaman yang ingin Anda ekstrak. Bagi PDF Anda secara instan menjadi halaman individual, atau ekstrak halaman tertentu dari dokumen PDF baru. Ekstrak halaman PDF dari file PDF secara online dengan mengikuti langkah-langkah sederhana yang disebutkan di bawah ini:
- Unggah file PDF ke Cloud.
- Ekstrak Halaman PDF dengan Nomor Halaman dengan Python.
- Unduh file yang diekstraksi.
Unggah Dokumen
Pertama-tama, unggah dokumen PDF multi halaman ke Cloud menggunakan cuplikan kode yang diberikan di bawah ini:
# Unggah file PDF ke penyimpanan cloud
# Buat instance dari file API
file_api = groupdocs_merger_cloud.FileApi.from_config(configuration)
# Permintaan unggah file panggilan
request = groupdocs_merger_cloud.UploadFileRequest("python-testing\sample-file.pdf", "H:\\groupdocs-cloud-data\\sample-file.pdf", storage_name)
# Unggah file PDF ke cloud
response = file_api.upload_file(request)
print(response.uploaded)
Hasilnya, file PDF akan diunggah ke Cloud Storage dan akan tersedia di bagian file dasbor Anda. Kami menghapus semua file Anda secara permanen dari cloud dalam 24 jam setelah diunggah.
Ekstrak Halaman Tertentu berdasarkan Nomor Halaman menggunakan Python
Untuk mengekstrak halaman tertentu atau beberapa halaman dari dokumen PDF secara terprogram, ikuti langkah-langkah yang disebutkan di bawah ini:
- Pertama, buat instance PagesApi.
- Kedua, berikan instance ExtractOptions
- Sekarang, atur path file input dengan instance FileInfo
- Selanjutnya, atur jalur direktori Output
- Kemudian, berikan nomor halaman yang dipisahkan koma untuk diekstrak
- Selanjutnya, atur mode ke Pages
- Selanjutnya, buat instance ExtractRequest
- Terakhir, dapatkan hasil dengan memanggil kelas pagesApi.extract().
Contoh kode berikut menunjukkan cara mengekstrak halaman dengan memberikan nomor halaman tertentu dari dokumen PDF menggunakan REST API:
# Cara Mengekstrak Halaman Tertentu dari PDF dengan Python menggunakan REST API
try:
# Buat instance API Halaman
pagesApi = groupdocs_merger_cloud.PagesApi.from_keys(app_sid, app_key)
options = groupdocs_merger_cloud.ExtractOptions()
options.file_info = groupdocs_merger_cloud.FileInfo("python-testing/sample-file.pdf")
options.output_path = "python-testing"
options.pages = [2, 4, 7]
result = pagesApi.extract(groupdocs_merger_cloud.ExtractRequest(options))
print("Successfully extracted certain pages of PDF document: " + result[0].path)
except groupdocs_merger_cloud.ApiException as e:
print("Exception while calling API: {0}".format(e.message))
Unduh File Halaman PDF yang Diekstraksi
Contoh kode di atas akan menyimpan halaman yang diekstraksi dalam file PDF terpisah di cloud. Anda dapat mengunduhnya menggunakan contoh kode berikut:
# Inisialisasi API untuk mengunduh file yang dikonversi
import shutil
file_api = groupdocs_merger_cloud.FileApi.from_config(configuration)
# Buat permintaan file unduhan
request = groupdocs_merger_cloud.DownloadFileRequest("python-testing\sample-file.pdf", storage_name)
# Unduh file yang dikonversi
response = file_api.download_file(request)
# Pindahkan file yang diunduh ke direktori Anda
shutil.move(response, "H:\\groupdocs-cloud-data\\")
Ekstrak Halaman dari PDF dengan Rentang Halaman dengan Python menggunakan REST API
Silakan ikuti langkah-langkah yang disebutkan di bawah ini untuk mengekstrak halaman dari dokumen PDF dengan menyediakan rentang halaman secara terprogram.
- Pertama, buat instance PagesApi.
- Selanjutnya, atur ExtractOptions
- Tetapkan jalur file input dengan instance FileInfo
- Selanjutnya, atur jalur direktori Output
- Berikan rentang halaman dengan mengatur nomor halaman awal dan nomor halaman akhir yang akan diekstrak
- Sekarang, atur interval mode ke Pages
- Setel rangemode ke EvenPages atau OddPages
- Selanjutnya, buat instance ExtractRequest
- Terakhir, dapatkan hasil dengan memanggil metode pagesApi.extract().
Contoh kode berikut menunjukkan cara mengekstrak halaman dengan menyediakan rentang halaman dari dokumen PDF menggunakan REST API. Silakan ikuti langkah-langkah yang disebutkan sebelumnya untuk mengunggah file.
# Cara Mengekstrak Halaman dari PDF dengan Rentang Halaman dengan Python menggunakan REST API
try:
# Buat instance API Dokumen
pagesApi = groupdocs_merger_cloud.PagesApi.from_keys(app_sid, app_key)
options = groupdocs_merger_cloud.ExtractOptions()
options.file_info = groupdocs_merger_cloud.FileInfo("python-testing\sample-file.pdf")
options.output_path = "python-testing"
options.start_page_number = 1
options.end_page_number = 10
options.range_mode = "EvenPages" # or set range_mode to "OddPages"
options.mode = "Pages" # Mode Intervals
result = pagesApi.extract(groupdocs_merger_cloud.ExtractRequest(options))
print("Successfully extract selected pages from PDF by page range interval: " + result[0].path)
except groupdocs_merger_cloud.ApiException as e:
print("Exception while calling API: {0}".format(e.message))
Ekstraktor Halaman PDF Online Gratis
Bagaimana cara mengekstrak halaman dari pdf gratis? Silakan coba [alat ekstraktor PDF online gratis] berikut 15, yang dikembangkan menggunakan API di atas.
Menyimpulkan
Ini membawa kita ke kesimpulan dari posting blog. Saya harap Anda telah belajar:
- cara mengekstrak halaman tertentu dari dokumen PDF dengan Python;
- unggah file PDF secara terprogram dan kemudian unduh file yang diekstraksi dari cloud;
- cara mengekstrak halaman file PDF menggunakan rentang halaman menggunakan Python;
Anda dapat mempelajari lebih lanjut tentang GroupDocs.Merger Cloud API menggunakan dokumentasi. Kami juga menyediakan bagian Referensi API yang memungkinkan Anda memvisualisasikan dan berinteraksi dengan API kami secara langsung melalui browser.
Di [halaman Memulai] kami, 18 Anda dapat menemukan detail lebih lanjut.
Selain itu, Groupdocs.cloud terus diperbarui dengan topik-topik baru. Akibatnya, tetap up to date pada informasi API terbaru.
Berikan pertanyaan
Anda dapat mengajukan pertanyaan tentang API software ekstraktor halaman PDF, melalui [Forum Dukungan Gratis] kami (https://forum.groupdocs.cloud/c/conversion/11)
FAQ
Bagaimana cara mengekstrak halaman dari file PDF dengan Python?
Silakan ikuti tautan ini untuk mempelajari cuplikan kode Python tentang cara mengekstrak halaman dari file PDF dengan Python.
Bagaimana cara mengekstrak halaman dari dokumen PDF online menggunakan REST API?
Buat instance PagesApi, atur nilai ExtractOptions, dan aktifkan metode pagesApi.extract() dengan ExtractRequest untuk menyimpan halaman file PDF yang dipilih secara online.
Bagaimana cara menginstal perpustakaan unduhan gratis ekstraktor halaman PDF?
Cara mudah untuk mengekstrak halaman dari PDF menggunakan Python SDK. Anda dapat menginstal pustaka Python extractor PDF untuk mengekstrak banyak halaman dari file PDF secara terprogram.
Bagaimana cara mengekstrak halaman PDF secara offline di windows?
Kunjungi tautan ini untuk mengunduh software ekstraktor PDF untuk windows. Perangkat lunak unduhan gratis ekstraktor PDF ini akan membagi halaman PDF di windows dengan cepat, dengan satu klik.
Lihat juga
- Ekstrak Teks dari PDF menggunakan Python
- Gabungkan File PowerPoint PPT/PPTX Online menggunakan REST API di Ruby
- Ekstrak Data Tertentu dari PDF menggunakan Python
- Konversikan CSV ke JSON dan JSON ke CSV dengan Python
- Menggabungkan File PDF menggunakan REST API
- Konversikan SVG ke PNG Kualitas Tinggi dengan Python
- Konversikan CSV ke JSON dan JSON ke CSV dengan Python
- Cara Mengonversi PDF ke Excel dengan Python menggunakan REST API