Parser DOCX Online Gratis dirancang untuk mengekstrak teks, gambar, dan gambar dari DOCX atau DOC.

Parsing Dokumen Word menggunakan REST API dengan Python

Dalam berbagai kasus, kita mungkin perlu mengurai dokumen Word dan mengekstrak gambar atau teks. Ekstraksi gambar dan teks dari dokumen Word dapat membantu menganalisis teks, menggunakan kembali, atau menggabungkannya ke dalam dokumen lain. Kami dapat dengan mudah mengurai file DOC atau DOCX dan mengekstrak semua gambar/teks secara terprogram di cloud. Pada artikel ini, kita akan mempelajari cara mengurai dokumen Word menggunakan REST API dengan Python.

Topik-topik berikut akan dibahas dalam artikel ini:

Word Document Parser REST API dan Python SDK

Untuk mem-parsing dokumen Word, kami akan menggunakan Python SDK of GroupDocs.Parser Cloud API. Silakan instal menggunakan perintah berikut di konsol untuk mem-parsing dokumen:

pip install groupdocs_parser_cloud

Harap dapatkan ID dan Rahasia Klien Anda dari dasbor sebelum mengikuti langkah-langkah yang disebutkan. Setelah Anda memiliki ID dan rahasia Anda, tambahkan kode seperti yang ditunjukkan di bawah ini:

client_id = "da0c487d-c1c0-45ae-b7bf-43eaf53c5ad5"
client_secret = "479db2b01dcb93a3d4d20efb16dea971"

configuration = groupdocs_parser_cloud.Configuration(client_id, client_secret)
configuration.api_base_url = "https://api.groupdocs.cloud"
my_storage = ""

Parsing Dokumen Word dan Ekstrak Gambar menggunakan REST API dengan Python

Kami dapat mengurai dokumen Word dan mengekstrak gambar secara terprogram dengan mengikuti langkah-langkah yang diberikan di bawah ini:

Unggah Dokumen

Pertama, kami akan mengunggah dokumen Word (DOCX) ke Cloud menggunakan contoh kode di bawah ini:

# Buat instance API
file_api = groupdocs_parser_cloud.FileApi.from_config(configuration)

# Buat permintaan unggah file
request = groupdocs_parser_cloud.UploadFileRequest("sample.docx", "C:\\Files\\parser\\sample.docx", my_storage)

# Unggah data
response = file_api.upload_file(request)

Akibatnya, file DOCX yang diunggah akan tersedia di bagian file dasbor di cloud.

Ekstrak Gambar dari Dokumen Word menggunakan Python

Kami dapat dengan mudah mengekstrak semua gambar dari dokumen Word secara terprogram dengan mengikuti langkah-langkah yang diberikan di bawah ini.

  • Pertama, buat instance ParseApi.
  • Selanjutnya, buat instance FileInfo.
  • Kemudian, atur path ke file DOCX input.
  • Selanjutnya, buat instance dari ImageOptions.
  • Kemudian, tetapkan FileInfo ke ImageOptions.
  • Setelah itu, buat ImagesRequest dengan ImageOptions sebagai argumen.
  • Terakhir, ekstrak gambar dengan memanggil metode ParseApi.images() dengan ImageRequest.

Contoh kode berikut menunjukkan cara mengekstrak gambar dari file DOCX menggunakan penguraian dokumen REST API dengan Python.

# inisialisasi API
parseApi = groupdocs_parser_cloud.ParseApi.from_config(configuration)

# Tentukan pilihan gambar
options = groupdocs_parser_cloud.ImagesOptions()
options.file_info = groupdocs_parser_cloud.FileInfo()
options.file_info.file_path = "sample.docx"

# Buat permintaan gambar
request = groupdocs_parser_cloud.ImagesRequest(options)

# Dapatkan gambar
result = parseApi.images(request)
Parse Word DOCX dan ekstrak Gambar menggunakan python parse word docx

Parsing Dokumen Word dan Ekstrak Gambar menggunakan Word Parser Online REST API dengan Python.

Unduh Gambar yang Diekstraksi

Contoh kode di atas akan menyimpan gambar yang diekstraksi dengan parser file kata di cloud. Kita dapat mengunduh gambar-gambar ini menggunakan contoh kode yang diberikan di bawah ini:

# inisialisasi API
file_api = groupdocs_parser_cloud.FileApi.from_config(configuration)
folder_api = groupdocs_parser_cloud.FolderApi.from_config(configuration)

# Dapatkan daftar file
request = groupdocs_parser_cloud.GetFilesListRequest("parser/images/sample_docx/", my_storage);
response = folder_api.get_files_list(request)

# Unduh gambar satu per satu
for data in response.value:
    # Buat permintaan file unduhan
    request = groupdocs_parser_cloud.DownloadFileRequest(data.path, my_storage)
    # Unduh berkas
    response = file_api.download_file(request)
    # Pindahkan file yang diunduh ke direktori kerja Anda
    shutil.move(response, "C:\\Files\\parser\\")

Ekstrak Teks dari Dokumen Word menggunakan REST API dengan Python

Kami dapat dengan mudah mengekstrak semua teks dari dokumen Word secara terprogram dengan mengikuti langkah-langkah yang diberikan di bawah ini.

  • Pertama, buat instance ParseApi.
  • Selanjutnya, buat instance FileInfo.
  • Kemudian, atur path ke file DOCX input.
  • Selanjutnya, buat instance dari TextOptions.
  • Kemudian, tetapkan FileInfo ke TextOptions.
  • Setelah itu, buat TextRequest dengan TextOptions sebagai argumen.
  • Terakhir, dapatkan hasil dengan memanggil metode ParseApi.text() dengan TextRequest.

Contoh kode berikut menunjukkan cara mengekstrak teks dari file DOCX menggunakan docx parser REST API.

# inisialisasi API
parseApi = groupdocs_parser_cloud.ParseApi.from_config(configuration)

# Tentukan pilihan teks
options = groupdocs_parser_cloud.TextOptions()
options.file_info = groupdocs_parser_cloud.FileInfo()
options.file_info.file_path = "sample.docx"

# Buat permintaan teks
request = groupdocs_parser_cloud.TextRequest(options)

# Dapatkan teks
result = parseApi.text(request)
print("Text: " + result.text)
Ekstrak Teks dari Dokumen Word DOCX menggunakan REST API dengan Python

Ekstrak Teks dari Dokumen Word menggunakan REST API dengan Python.

Coba Daring

Bagaimana cara menggunakan perangkat lunak parsing dokumen online gratis? Silakan coba alat Parsing DOCX online gratis berikut, yang dikembangkan menggunakan API python dokumen kata parse di atas. https://products.groupdocs.app/parser/docx

Kesimpulan

Pada artikel ini, kami telah mempelajari cara mengurai dokumen Word menggunakan pengurai kata di cloud. Kami juga telah melihat cara mengekstrak gambar dan teks dari file DOCX menggunakan parse docx Python. Artikel ini juga menjelaskan cara mengunggah file DOCX secara terprogram ke cloud dan mengunduh gambar yang diekstraksi dari Cloud. Selain itu, Anda dapat mempelajari lebih lanjut tentang GroupDocs.Parser Cloud API menggunakan dokumentasi. Kami juga menyediakan bagian Referensi API yang memungkinkan Anda memvisualisasikan dan berinteraksi dengan API kami secara langsung melalui browser. Jika ada ketidakjelasan tentang penguraian dokumen dan penguraian file, jangan ragu untuk menghubungi kami di forum.

Lihat juga