Cara Mengekstrak Halaman Dari Dokumen Word dengan Python

Cara Mengekstrak Halaman Dari Dokumen Word dengan Python

Anda mungkin perlu membagi dokumen kata menjadi beberapa dokumen per halaman secara terprogram. Dengan memisahkan dokumen kata, Anda dapat dengan mudah mengekstrak halaman dari dokumen kata dan berbagi informasi atau data tertentu dengan pemangku kepentingan. Sebagai pengembang Python, Anda dapat membagi dokumen kata menjadi file terpisah secara online di cloud. Pada artikel ini, Anda akan belajar cara mengekstrak halaman dari dokumen kata dengan Python.

Topik-topik berikut akan dibahas dalam artikel pemisah halaman kata ini:

API REST Pemisah Dokumen Word - SDK Python

Untuk membagi file kata menjadi beberapa file, saya akan menggunakan Python SDK of GroupDocs.Merger Cloud API. Ini memungkinkan Anda untuk memutar, membagi, menggabungkan, menghapus, dan mengatur ulang satu halaman atau kumpulan halaman dari format dokumen yang didukung dari Word, Excel, gambar Visio, PDF, dan HTML. Python repositori kode sumber tersedia secara gratis di GitHub.

Unduhan gratis pemecah file Word tersedia. Anda dapat menginstal word doc splitter ke aplikasi Python Anda dengan PIP dari PyPI dengan menggunakan perintah berikut di terminal:

pip install groupdocs-merger-cloud

Harap dapatkan ID dan Rahasia Klien Anda dari dasbor sebelum mengikuti langkah-langkah yang disebutkan di bawah ini. Setelah Anda memiliki ID dan Rahasia, tambahkan kode di bawah ini ke dalam aplikasi Anda untuk membagi dokumen kata menjadi file terpisah seperti yang ditunjukkan di bawah ini:

# Impor SDK penggabungan groupdocs
import groupdocs_merger_cloud

# Dapatkan app_sid & app_key dari https://dashboard.groupdocs.cloud setelah pendaftaran gratis.
app_sid = "xxxxxxx-xxxx-xxxx-xxxx-xxxxxxxxxxxx"
app_key = "xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx"

# Dapatkan konfigurasi File API 
configuration = groupdocs_merger_cloud.Configuration(app_sid, app_key)
configuration.api_base_url = "https://api.groupdocs.cloud"
storage_name = "LocalStorage"

Cara Membagi Dokumen Word menjadi Dokumen Tunggal dengan Python

Anda dapat membagi docx secara terprogram di cloud dengan mengikuti langkah-langkah yang disebutkan di bawah ini.

  • Unggah file kata ke cloud
  • Split dokumen kata di cloud
  • Unduh dokumen yang diekstraksi

Unggah Dokumen Word

Pertama, kami akan mengunggah file kata ke cloud untuk mengekstrak halaman dari kata online menggunakan contoh kode di bawah ini:

# Unggah file Word ke penyimpanan cloud
# Buat instance dari file API
file_api = groupdocs_merger_cloud.FileApi.from_config(configuration)

# Permintaan unggah file panggilan
request = groupdocs_merger_cloud.UploadFileRequest("python-testing\word-file.docx", "H:\\groupdocs-cloud-data\\word-file.docx", storage_name)

# Unggah file kata ke cloud
response = file_api.upload_file(request)
print(response.uploaded)

Akibatnya, file yang diunggah akan tersedia di bagian file dasbor Anda di cloud.

Pisahkan Halaman Dokumen Word dengan Python

Anda dapat membagi halaman kata menjadi file terpisah secara terprogram dengan mengikuti langkah-langkah di bawah ini:

  • Pertama, buat instance dari DocumentApi.
  • Kemudian, buat instance dari SplitOptions
  • Sekarang, buat instance dari FileInfo
  • Lewati jalur file input sebagai argumen ke FileInfo
  • Selanjutnya, berikan jalur file keluaran
  • Tetapkan nomor halaman tertentu dalam larik yang dipisahkan koma
  • Sekarang, atur mode pisah docx ke Halaman. Ini memungkinkan untuk membagi nomor halaman dalam array yang dipisahkan koma
  • Buat SplitRequest dengan SplitOptions
  • Terakhir, panggil metode DocumentAPI.split() dengan SplitRequest sebagai argumen dan dapatkan hasilnya

Cuplikan kode berikut menunjukkan cara membagi file kata menjadi halaman terpisah menggunakan REST API dengan Python:

# Cara Membagi Dokumen Word menjadi Dokumen Tunggal dengan Python
try:
    # Buat instance API Dokumen
    documentApi = groupdocs_merger_cloud.DocumentApi.from_keys(app_sid, app_key)
     
    options = groupdocs_merger_cloud.SplitOptions()
    options.file_info = groupdocs_merger_cloud.FileInfo("python-testing\word-file.docx")
    options.output_path = "python-testing"
    options.pages = [1, 3]
    options.mode = "Pages"

    result = documentApi.split(groupdocs_merger_cloud.SplitRequest(options))
    print("Successfully split word docx to single page document: " + result[0].path)
except groupdocs_merger_cloud.ApiException as e:
  print("Exception while calling API: {0}".format(e.message))
Cara Membagi File Word menjadi Halaman Terpisah dengan Python

Cara Membagi File Word menjadi Halaman Terpisah dengan Python

Unduh File Tunggal

Terakhir, contoh kode di atas akan menyimpan file yang terpisah di cloud menggunakan python. Itu dapat diunduh menggunakan contoh kode berikut:

# Inisialisasi API untuk mengunduh file terpisah
import shutil
file_api = groupdocs_merger_cloud.FileApi.from_config(configuration)

# Buat permintaan file unduhan
request = groupdocs_merger_cloud.DownloadFileRequest("python-testing\word-file.docx", storage_name)

# Unduh file terpisah
response = file_api.download_file(request)

# Pindahkan file yang diunduh ke direktori Anda
shutil.move(response, "H:\\groupdocs-cloud-data\\")

Pisahkan Dokumen Word menjadi Satu dengan Rentang Halaman dengan Python

Anda dapat membagi dokumen kata menjadi beberapa dokumen per halaman secara online menggunakan langkah-langkah berikut di bawah ini:

  • Buat instance DocumentApi
  • Kemudian, buat instance dari SplitOptions
  • Sekarang, buat instance dari FileInfo
  • Lewati jalur file input sebagai argumen ke FileInfo
  • Selanjutnya, berikan jalur file keluaran as “python-testing”
  • Atur nilai start\page\number dan end\page\number
  • Setel mode pisah docx ke Halaman untuk membagi kata
  • Buat SplitRequest dengan SplitOptions
  • Terakhir, panggil metode DocumentAPI.split() dengan SplitRequest sebagai argumen

Cuplikan kode berikut menunjukkan cara mengekstrak halaman dari dokumen kata dengan Python menggunakan REST API:

# Cara Membagi Dokumen Word menjadi Satu dengan Rentang Halaman dengan Python
try:
    # Buat instance API Dokumen
    documentApi = groupdocs_merger_cloud.DocumentApi.from_keys(app_sid, app_key)
     
    options = groupdocs_merger_cloud.SplitOptions()
    options.file_info = groupdocs_merger_cloud.FileInfo("python-testing\word-file.docx")
    options.output_path = "python-testing"
    options.start_page_number = 3
    options.end_page_number = 7
    options.mode = "Pages"

    result = documentApi.split(groupdocs_merger_cloud.SplitRequest(options))
    print("Successfully split Word to single files by page range: " + result[0].path)
except groupdocs_merger_cloud.ApiException as e:
  print("Exception while calling API: {0}".format(e.message))

Pisahkan Dokumen Word menjadi File Terpisah dengan Menerapkan Filter

Anda dapat membagi dokumen kata menjadi beberapa dokumen per halaman secara online menggunakan mode jangkauan dan memfilter secara terprogram seperti yang ditunjukkan di bawah ini:

  • Buat instance dari DocumentApi
  • Kemudian, buat instance dari SplitOptions
  • Sekarang, buat instance dari FileInfo
  • Lewati jalur file input sebagai argumen ke FileInfo
  • Selanjutnya, berikan jalur file keluaran as “python-testing”
  • Atur nilai start\page\number dan end\page\number
  • Selanjutnya, atur range\mode ke “OddPages“
  • Setel mode pisah docx ke Halaman untuk membagi kata
  • Buat SplitRequest dengan SplitOptions
  • Terakhir, panggil metode DocumentAPI.split() dengan SplitRequest sebagai argumen

Cuplikan kode berikut menunjukkan cara mengekstrak halaman dokumen kata dengan menerapkan filter menggunakan REST API dengan Python:

# Cara Membagi Dokumen Word menjadi File Terpisah dengan Menerapkan Filter
try:
    # Buat instance API Dokumen
    documentApi = groupdocs_merger_cloud.DocumentApi.from_keys(app_sid, app_key)
     
    options = groupdocs_merger_cloud.SplitOptions()
    options.file_info = groupdocs_merger_cloud.FileInfo("python-testing\word-file.docx")
    options.output_path = "python-testing"
    options.start_page_number = 3
    options.end_page_number = 7
    options.range_mode = "OddPages"
    options.mode = "Pages" # mode Intervals

    result = documentApi.split(groupdocs_merger_cloud.SplitRequest(options))
    print("Successfully split Word by range of pages and using filter: " + result[0].path)
except groupdocs_merger_cloud.ApiException as e:
  print("Exception while calling API: {0}".format(e.message))

Cara Membagi Word Doc menjadi Banyak File menggunakan Python

Anda dapat membagi file kata menjadi beberapa dokumen secara terprogram dengan mengikuti langkah-langkah di bawah ini:

  • Buat instance dari DocumentApi
  • Kemudian, buat instance dari SplitOptions
  • Sekarang, buat instance dari FileInfo
  • Lewati jalur file input sebagai argumen ke FileInfo
  • Selanjutnya, berikan jalur file keluaran as “python-testing”
  • Kemudian, atur koleksi halaman dalam format array
  • Setel mode pisah docx ke Interval untuk membagi kata
  • Buat SplitRequest dengan SplitOptions
  • Terakhir, panggil metode DocumentAPI.split() dengan SplitRequest sebagai argumen

Cuplikan kode berikut menunjukkan cara membagi docx menjadi beberapa file menggunakan REST API dengan Python:

# Cara Membagi File Docx menjadi Banyak File menggunakan Python
try:
    # Buat instance API Dokumen
    documentApi = groupdocs_merger_cloud.DocumentApi.from_keys(app_sid, app_key)
     
    options = groupdocs_merger_cloud.SplitOptions()
    options.file_info = groupdocs_merger_cloud.FileInfo("python-testing\word-file.docx")
    options.output_path = "python-testing"
    options.pages = [3, 6, 8]
    options.mode = "Intervals"

    result = documentApi.split(groupdocs_merger_cloud.SplitRequest(options))
    print("Successfully split Word file to multiple files: " + result[0].path)
except groupdocs_merger_cloud.ApiException as e:
  print("Exception while calling API: {0}".format(e.message))

File Kata Terpisah Online

Bagaimana cara membagi dokumen kata menjadi beberapa file online gratis? Anda dapat mencoba [pembagi dokumen kata online] kami 22 untuk membagi dokumen kata menjadi beberapa file online gratis dengan jumlah halaman tetap atau dalam berbagai rentang halaman. Beberapa halaman dokumen kata dibagi menjadi beberapa file kata yang mempertahankan format dokumen asli.

Kesimpulan

Dalam tutorial ini, kita telah belajar:

  • cara membagi file kata menjadi dua dengan Python di cloud;
  • cara membagi file docx menjadi file terpisah dengan Python;
  • Secara terprogram cara membagi dokumen kata demi halaman dengan Python;
  • secara terprogram cara membagi dokumen kata menjadi beberapa dokumen online dengan Python;
  • cara membagi file kata online gratis menggunakan pembagi halaman kata online;

Selain itu, Anda dapat mempelajari lebih lanjut tentang GroupDocs.Merger Cloud API menggunakan dokumentasi. Kami juga menyediakan bagian Referensi API yang memungkinkan Anda memvisualisasikan dan berkomunikasi dengan API kami secara langsung melalui browser. Selain itu, silakan lihat SDK Cloud GroupDocs.Merger untuk Python Contoh di sini.

Berikan pertanyaan

Jika Anda memiliki pertanyaan tentang cara mengekstrak halaman dari dokumen word online, jangan ragu untuk bertanya kepada kami di Forum

FAQ

Bagaimana cara mengekstrak halaman dari dokumen kata online menggunakan docx splitter API?

Instal unduhan gratis pembagi dokumen perpustakaan Python untuk mengekstrak halaman kata online. Anda dapat mengunjungi dokumentasi untuk detail API lengkap.

Apa cara tercepat untuk membagi dokumen kata secara online gratis?

Word page extractor online bekerja sangat cepat dan Anda dapat membagi docx secara online dalam beberapa detik.

Bagaimana cara mengekstrak halaman dari kata online secara gratis?

  • Buka ekstraktor halaman kata online.
  • Klik di dalam area drop file untuk mengupload file word docx atau drag & drop file word.
  • Klik tombol Konversi. Dokumen Anda akan diunggah dan dikonversi ke format DOC.
  • Tautan unduhan file keluaran akan tersedia secara instan setelah pemisahan.

Apakah aman menggunakan pembagi dokumen online gratis?

Ya, kata pemisah dokumen aman dan tidak ada yang memiliki akses ke file yang Anda unggah. Kami menghapus file yang diunggah setelah 24 jam.

Lihat juga