Python mengekstrak atau menghapus anotasi dari file Word.

Sebagai pengembang Python, Anda dapat membuat anotasi file Word (.doc atau .docx) apa pun secara terprogram di cloud. Anda juga dapat mengekstrak atau menghapus semua anotasi dari file Word menggunakan Python. Anotasi mencakup komentar, munculan, dan berbagai objek grafis lainnya dalam dokumen yang memberikan informasi tambahan. Artikel ini akan berfokus pada cara mengekstrak atau menghapus anotasi dari file DOCX menggunakan REST API dengan Python.

Topik-topik berikut akan dibahas dalam artikel ini:

Dokumen Anotasi REST API dan Python SDK

Untuk mengekstraksi atau menghapus anotasi dari file DOC atau DOCX, saya akan menggunakan Python SDK of GroupDocs.Annotation Cloud API. Ini memungkinkan Anda untuk secara terprogram membuat dokumen online dan alat anotasi gambar. Alat semacam itu dapat digunakan untuk menambahkan anotasi, overlay tanda air, penggantian teks, redaksi, catatan tempel, dan markup teks ke dokumen bisnis dari semua format populer. Ini juga menyediakan SDK .NET, Java, PHP, Ruby, dan Node.js sebagai anggota keluarga anotasi dokumen untuk Cloud API.

Anda dapat menginstal GroupDocs.Annotation Cloud ke proyek Python Anda menggunakan perintah berikut di konsol:

pip install groupdocs_annotation_cloud

Dapatkan ID Klien dan Rahasia Klien Anda dari dashboard sebelum Anda mulai mengikuti langkah-langkah dan contoh kode yang tersedia. Setelah Anda memiliki ID dan rahasia Anda, tambahkan kode seperti yang ditunjukkan di bawah ini:

client_id = "da0c487d-c1c0-45ae-b7bf-43eaf53c5ad5"
client_secret = "479db2b01dcb93a3d4d20efb16dea971"

configuration = groupdocs_annotation_cloud.Configuration(client_id, client_secret)
configuration.api_base_url = "https://api.groupdocs.cloud"

Ekstrak atau Hapus Anotasi dari File DOCX menggunakan REST API dengan Python

Anda dapat mengekstrak atau menghapus semua anotasi dari file DOCX dengan mengikuti langkah-langkah sederhana yang disebutkan di bawah ini:

Unggah Dokumen

Pertama, unggah file DOCX ke Cloud menggunakan contoh kode di bawah ini:

# contoh api
file_api = groupdocs_annotation_cloud.FileApi.from_config(configuration)

# unggah data
request = groupdocs_annotation_cloud.UploadFileRequest("input.docx", "C:\\Files\\input.docx", my_storage)
response = file_api.upload_file(request)

Akibatnya, file DOCX yang diunggah (input.docx) akan tersedia di bagian file dasbor Anda di cloud.

Ekstrak Anotasi dari File DOCX dengan Python

Silakan ikuti langkah-langkah yang disebutkan di bawah ini untuk mengekstrak anotasi dari dokumen Word secara terprogram.

  • Buat instance AnnotateApi
  • Buat instance FileInfo
  • Tetapkan jalur file
  • Buat permintaan dengan memanggil metode ExtractRequest
  • Dapatkan hasil dengan memanggil metode AnnotateApi.extract().

Cuplikan kode berikut menunjukkan cara mengekstrak anotasi dari dokumen Word menggunakan REST API.

# contoh api
api = groupdocs_annotation_cloud.AnnotateApi.from_config(configuration)

# rincian file masukan
file_info = groupdocs_annotation_cloud.FileInfo()
file_info.file_path = "input.docx"

# ekstrak permintaan anotasi
request = groupdocs_annotation_cloud.ExtractRequest(file_info)
result = api.extract(request)        

print("ExtractAnnotations: annotations count: " + str(len(result)))

Contoh kode di atas akan mengembalikan larik semua anotasi dalam format JSON seperti yang ditunjukkan di bawah ini:

Ekstrak Anotasi dari File DOCX menggunakan Python

Ekstrak Anotasi dari File DOCX menggunakan Python

Hapus Anotasi dari File DOCX dengan Python

Silakan ikuti langkah-langkah yang disebutkan di bawah ini untuk menghapus anotasi dari dokumen Word secara terprogram.

  • Buat instance AnnotateApi
  • Buat instance FileInfo
  • Tetapkan jalur file
  • Tentukan RemoveOptions
  • Setel info file ke AnnotateOptions
  • Berikan ID anotasi untuk dihapus
  • Tetapkan jalur file keluaran
  • Buat permintaan dengan memanggil metode RemoveAnnotationsRequest
  • Dapatkan hasil dengan memanggil metode AnnotateApi.remove\annotations().

Cuplikan kode berikut menunjukkan cara menghapus anotasi dari dokumen Word menggunakan REST API. Anda perlu menyebutkan ID anotasi yang perlu dihapus dari dokumen.

# contoh api
api = groupdocs_annotation_cloud.AnnotateApi.from_keys(client_id, client_secret)

# rincian file masukan
file_info = groupdocs_annotation_cloud.FileInfo()
file_info.file_path = "input.docx"

# hapus opsi
options = groupdocs_annotation_cloud.RemoveOptions()
options.file_info = file_info
options.annotation_ids = [0,1,2,3,4,5,6,7,8,9,10,11]

# berkas keluaran
options.output_path = "output.docx"

# hapus permintaan
request = groupdocs_annotation_cloud.RemoveAnnotationsRequest(options)
result = api.remove_annotations(request)

print("RemoveAnnotations: Annotations removed: " + result['href'])
Hapus Anotasi dari File DOCX menggunakan Python

Hapus Anotasi dari File DOCX menggunakan Python

Unduh File Keluaran

Contoh kode di atas akan menyimpan file DOCX keluaran (output.docx) setelah menghapus anotasi di cloud. Anda dapat mengunduhnya menggunakan contoh kode berikut:

# contoh api
file_api = groupdocs_annotation_cloud.FileApi.from_config(configuration)

# permintaan file unduhan
request = groupdocs_annotation_cloud.DownloadFileRequest("output.docx", my_storage)
response = file_api.download_file(request)

# Pindahkan file yang diunduh ke direktori kerja Anda
shutil.move(response, "C:\\Files\\")

Coba Daring

Silakan coba alat anotasi DOCX online gratis berikut, yang dikembangkan menggunakan API di atas. https://products.groupdocs.app/annotation/docx

Kesimpulan

Pada artikel ini, Anda telah mempelajari cara mengekstrak atau menghapus anotasi dari dokumen Word di cloud menggunakan Python. Anda juga mempelajari cara mengunggah file DOCX secara terprogram di cloud dan mengunduh file dari cloud. Anda dapat mempelajari lebih lanjut tentang GroupDocs.Annotation Cloud API menggunakan dokumentasi. Kami juga menyediakan bagian Referensi API yang memungkinkan Anda memvisualisasikan dan berinteraksi dengan API kami secara langsung melalui browser. Jika ada ambiguitas, jangan ragu untuk menghubungi kami di forum.

Lihat juga