Extract Text from XML in Python using REST API.

XML(eXtensible Markup Language) adalah format data yang populer untuk menyimpan dan bertukar informasi yang terstruktur. Format ini banyak digunakan di berbagai bidang, termasuk pengembangan web, penyimpanan data, dan transfer data. Mengekstrak teks dari file XML sangat penting karena berbagai alasan. Ini memungkinkan kita untuk mengakses dan memanipulasi data aktual yang terdapat dalam dokumen XML. Dengan mengekstrak teks, kita dapat melakukan berbagai operasi, seperti analisis data, transformasi data, dan integrasi data. Dalam artikel ini, kita akan menjelajahi cara mengekstrak teks dari XML di Python menggunakan REST API.

Topik berikut akan dibahas dalam artikel ini:

Python REST API to Parse XML Document and SDK Installation

GroupDocs.Parser Cloud SDK for Python adalah alat yang kuat yang menyederhanakan ekstraksi teks dari XML dan format file lainnya. Ini menyediakan berbagai fitur, termasuk pemrosesan dokumen, ekstraksi teks, ekstraksi metadata, dan banyak lagi. Dengan API yang intuitif, pengembang dapat dengan mudah mengintegrasikan kemampuan ekstraksi teks ke dalam aplikasi Python mereka. Ini juga mendukung C# .NET, Java, PHP, Ruby, dan Node.js SDK sebagai anggota keluarga pemroses dokumen untuk Cloud API. SDK dapat diintegrasikan ke dalam aplikasi berbasis Python untuk menyederhanakan proses pengembangan Anda dan meningkatkan produktivitas.

Instal GroupDocs.Parser Cloud ke proyek Python Anda dengan pip (package installer for Python) menggunakan perintah berikut di konsol untuk mengekstrak informasi dari XML:

pip install groupdocs_parser_cloud

Sekarang, silakan ambil Client ID dan Client Secret Anda dari dashboard dan tambahkan kode seperti yang ditunjukkan di bawah ini:

# Import groupdocs parser SDK
import groupdocs_parser_cloud

# Dapatkan appsid & appkey dari https://dashboard.groupdocs.cloud setelah pendaftaran gratis.
app_sid = "xxxxxxx-xxxx-xxxx-xxxx-xxxxxxxxxxxx"
app_key = "xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx"

# Dapatkan konfigurasi API File.
configuration = groupdocs_parser_cloud.Configuration(app_sid, app_key)
configuration.api_base_url = "https://api.groupdocs.cloud"
storage_name = "LocalStorage"

Extract All Text from XML File in Python using REST API

Untuk mengekstrak teks dari dokumen XML di Python menggunakan GroupDocs.Parser Cloud SDK untuk Python, ikuti langkah-langkah berikut:

  • Upload file XML ke awan
  • Extract semua teks dari XML menggunakan Python

Upload the File

Pertama, unggah dokumen XML ke cloud menggunakan contoh kode yang diberikan di bawah ini:

# Buat instansi dari API file
file_api = groupdocs_parser_cloud.FileApi.from_config(configuration)

# Call upload file request
request = groupdocs_parser_cloud.UploadFileRequest("python-testing\input-sample-file.pdf", "H:\\groupdocs-cloud-data\\input-sample-file.pdf", storage_name)

# Unggah file ke cloud
response = file_api.upload_file(request)
print(response.uploaded)

Sebagai hasilnya, file XML yang diunggah akan tersedia di [files section][https://dashboard.groupdocs.cloud/files] dasbor Anda di cloud.

Extract all Text from XML data using Python

Dalam bagian ini, kami akan menulis langkah-langkah dan contoh cuplikan kode yang menunjukkan cara mengekstrak teks dari dokumen XML di Python menggunakan GroupDocs.Parser Cloud SDK untuk Python:

  • Pertama, buatlah sebuah instance dari kelas ParseApi.
  • Kedua, buatlah sebuah instance dari kelas TextOptions().
  • Ketiga, buatlah sebuah instance dari kelas FileInfo.
  • Dan, tetapkan ke metode fileInfo opsi teks.
  • Selanjutnya, atur jalan ke file XML sebagai input.
  • Sekarang, buat sebuah instansi dari kelas TextRequest() dan berikan parameter TextOptions.
  • Akhirnya, dapatkan hasil dengan memanggil metode ParseApi.text() dan meneruskan parameter TextRequest.

Kode contoh berikut menunjukkan cara mengekstrak teks dari dokumen XML di Python menggunakan REST API:

# Bagaimana Cara Mengekstrak Teks dari XML di Python Menggunakan REST API
try:
  # inialisasi api
  parseApi = groupdocs_parser_cloud.ParseApi.from_config(configuration)

  # tentukan opsi teks
  options = groupdocs_parser_cloud.TextOptions()
  options.file_info = groupdocs_parser_cloud.FileInfo()
  options.file_info.file_path = "python-testing/input-sample-file.xml"

  request = groupdocs_parser_cloud.TextRequest(options)
  result = parseApi.text(request)

  print("Successfully extracted text: " + result.text)
except groupdocs_parser_cloud.ApiException as e:
  print("Exception while calling API: {0}".format(e.message))

Anda dapat melihat outputnya di gambar di bawah ini:

Python Ekstrak Teks dari File XML

Extract all Text from XML data using Python.

Parser Dokumen Online Gratis

Bagaimana cara mengekstrak teks dari XML secara online secara gratis? Silakan coba online XML parser software untuk mengekstrak data dari file XML. Alat XML Parser ini dikembangkan menggunakan pustaka parser Python yang disebutkan di atas.

Kesimpulan

Sebagai kesimpulan, mengekstrak teks dari file XML adalah tugas dasar saat bekerja dengan data XML. Python, bersama dengan GroupDocs.Parser Cloud SDK, menyediakan solusi yang andal dan efisien untuk mengekstrak teks dari file XML. Berikut adalah apa yang telah Anda pelajari dari artikel ini:

  • Bagaimana cara mengekstrak semua teks dari dokumen XML di Python menggunakan REST API.
  • Programmatically upload an XML file to the cloud using Python.
  • Perangkat lunak ekstraksi data XML online untuk mem-parsing dokumen XML.

Selain itu, Anda dapat mempelajari lebih lanjut tentang GroupDocs.Parser Cloud API menggunakan documentation. Kami juga menyediakan bagian API Reference yang memungkinkan Anda memvisualisasikan dan berinteraksi dengan API kami langsung melalui browser. Kode sumber lengkap SDK Python tersedia secara gratis di Github.

Akhirnya, kami terus menulis artikel blog baru tentang berbagai format file dan penguraian menggunakan REST API. Jadi, silakan hubungi kami untuk pembaruan terbaru.

Ask a question

Dalam hal Anda memiliki pertanyaan atau kebingungan tentang parser dokumen XML, silakan hubungi kami melalui forum.

FAQs

Why do we need to extract text from XML files?

Mengambil teks dari file XML memungkinkan kita untuk mengakses dan memanipulasi data yang sebenarnya terkandung dalam dokumen XML.

How can I extract text from XML files using Python?

Anda dapat mengekstrak teks dari file XML menggunakan GroupDocs.Parser Cloud SDK for Python, yang menyediakan kemampuan ekstraksi teks yang kuat.

Apakah mungkin untuk mengekstrak metadata dari file XML menggunakan GroupDocs.Parser Cloud SDK untuk Python?

Ya, GroupDocs.Parser Cloud SDK untuk Python mendukung pengambilan metadata dari file XML. Anda dapat mengambil informasi metadata seperti penulis, tanggal pembuatan, tanggal modifikasi, dan lainnya.

Can I extract images embedded in XML files using GroupDocs.Parser Cloud SDK for Python?

Ya, GroupDocs.Parser Cloud SDK for Python memungkinkan Anda mengekstrak gambar yang disematkan dalam file XML dan mengonversinya ke format yang berbeda.

Lihat Juga

Berikut adalah beberapa artikel terkait yang mungkin Anda anggap berguna: