XML'den Metin Çekme Python ile REST API Kullanarak.

XML(eXtensible Markup Language) yapılandırılmış bilgiyi depolamak ve değiştirmek için popüler bir veri formatıdır. Web geliştirme, veri depolama ve veri transferi gibi çeşitli alanlarda yaygın olarak kullanılmaktadır. XML dosyalarından metin çıkartmak birçok nedenle önemlidir. Bu, XML belgeleri içinde bulunan gerçek verilere erişim sağlamak ve bunları manipüle etmek için olanak tanır. Metin çıkartarak, veri analizi, veri dönüşümü ve veri entegrasyonu gibi çeşitli işlemleri gerçekleştirebiliriz. Bu makalede, REST API kullanarak Python’da XML’den metin çıkartmanın yollarını keşfedeceğiz.

Aşağıdaki konular bu makalede ele alınacaktır:

Python REST API to Parse XML Document and SDK Installation

GroupDocs.Parser Cloud SDK for Python , XML ve diğer dosya formatlarından metin çıkarmayı basit hale getiren güçlü bir araçtır. Doküman ayrıştırma, metin çıkarma, meta verilerin çıkarılması ve daha birçok özellik sunar. Kullanımı kolay API’si ile geliştiriciler, metin çıkarma yeteneklerini Python uygulamalarına kolayca entegre edebilirler. Ayrıca, Cloud APIsi için [belge ayrıştırıcı aile üyeleri][4] olarak C# .NET, Java, PHP, Ruby ve Node.js SDKlarını da destekler. SDK , geliştirme sürecinizi basitleştirmek ve verimliliğinizi artırmak için Python tabanlı bir uygulamaya entegre edilebilir.

GroupDocs.Parser Cloud’ı Python projenize pip (Python için paket yöneticisi) ile aşağıdaki komutu kullanarak yükleyin ve XML’den bilgi çıkarın:

pip install groupdocs_parser_cloud

Şimdi, lütfen dashboard üzerinden Müşteri Kimliğinizi ve Müşteri Sırrınızı alın ve aşağıda gösterildiği gibi kodu ekleyin:

# Import groupdocs parser SDK
import groupdocs_parser_cloud

# Ücretsiz kayıt olduktan sonra https://dashboard.groupdocs.cloud adresinden appsid ve appkey alın.
app_sid = "xxxxxxx-xxxx-xxxx-xxxx-xxxxxxxxxxxx"
app_key = "xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx"

# Dosya API yapılandırmalarını al.
configuration = groupdocs_parser_cloud.Configuration(app_sid, app_key)
configuration.api_base_url = "https://api.groupdocs.cloud"
storage_name = "LocalStorage"

XML Dosyasından Tüm Metni Python ile REST API Kullanarak Çıkar

XML belgelerinden metin çıkarmak için Python’da GroupDocs.Parser Cloud SDK’sını kullanarak şu adımları izleyin:

  • Upload XML dosyasını buluta yükleyin
  • Extract tüm metni XML’den Python kullanarak alın.

Dosyayı Yükle

Öncelikle, aşağıda verilen kod örneğini kullanarak XML belgesini buluta yükleyin:

# Dosya API'sinin bir örneğini oluşturun
file_api = groupdocs_parser_cloud.FileApi.from_config(configuration)

# Dosya yükleme isteği çağrısı
request = groupdocs_parser_cloud.UploadFileRequest("python-testing\input-sample-file.pdf", "H:\\groupdocs-cloud-data\\input-sample-file.pdf", storage_name)

# Clouda dosya yükle
response = file_api.upload_file(request)
print(response.uploaded)

Sonuç olarak, yüklenen XML dosyası, bulutunuzdaki panelinizin [files section][https://dashboard.groupdocs.cloud/files] kısmında kullanılabilir olacaktır.

XML verilerinden tüm metni Python kullanarak çıkarın

Bu bölümde, GroupDocs.Parser Cloud SDK for Python kullanarak bir XML belgesinden metin çıkarmanın adımlarını ve bir örnek kod parçasını yazacağız:

  • Öncelikle, ParseApi sınıfının bir örneğini oluşturun.
  • İkincisi, TextOptions() sınıfının bir örneğini oluşturun.
  • Üçüncü olarak, FileInfo sınıfının bir örneğini oluşturun.
  • Ve, bunu metin seçenekleri dosyasının fileInfo yöntemine atayın.
  • Sonra, XML dosyasının yolunu girdi olarak ayarlayın.
  • Şimdi, TextRequest() sınıfının bir örneğini oluşturun ve TextOptions parametresini geçin.
  • Sonunda, ParseApi.text() metodunu çağırarak ve TextRequest parametresini geçirerek sonuçları alın.

Aşağıdaki kod örneği, REST API kullanarak Python’da bir XML belgesinden metin çıkarmanın nasıl yapılacağını gösterir:

# XML'den Python'da REST API kullanarak Metin Nasıl Çekilir
try:
  # api initialization
  parseApi = groupdocs_parser_cloud.ParseApi.from_config(configuration)

  # define text options
  options = groupdocs_parser_cloud.TextOptions()
  options.file_info = groupdocs_parser_cloud.FileInfo()
  options.file_info.file_path = "python-testing/input-sample-file.xml"

  request = groupdocs_parser_cloud.TextRequest(options)
  result = parseApi.text(request)

  print("Successfully extracted text: " + result.text)
except groupdocs_parser_cloud.ApiException as e:
  print("Exception while calling API: {0}".format(e.message))

Aşağıdaki resimde çıktıyı görebilirsiniz:

Python XML Dosyasından Metin Çıkarma

Extract all Text from XML data using Python.

Ücretsiz Çevrimiçi Belge Ayrıştırıcı

XML’den metin nasıl çıkarılır? Lütfen bir online XML parser software kullanarak XML dosyalarından veri çıkarmayı deneyin. Bu XML Parser aracı, yukarıda bahsedilen Python parser kütüphanesi kullanılarak geliştirilmiştir.

Sonuç

Sonuç olarak, XML dosyalarından metin çıkarmak, XML verileriyle çalışırken temel bir görevdir. Python, GroupDocs.Parser Cloud SDK ile birlikte, XML dosyalarından metin çıkarmak için güvenilir ve verimli bir çözüm sunar. Aşağıda bu makaleden öğrendikleriniz bulunmaktadır:

  • How to extract all text from XML documents in Python using REST API.
  • Programmatically upload an XML file to the cloud using Python.
  • Çevrimiçi XML veri çıkarımı yazılımı, XML belgelerini ayrıştırmak için.

Ayrıca, dokümantasyon kullanarak GroupDocs.Parser Cloud API hakkında daha fazla bilgi edinebilirsiniz. Tarayıcı aracılığıyla API’lerimizle doğrudan etkileşim kurmanızı sağlayan bir API Referansı bölümü de sunuyoruz. Python SDK’sının tamamı kaynak kodu Github üzerinde ücretsiz olarak mevcuttur.

Sonunda, farklı dosya formatları ve REST API kullanarak ayrıştırma üzerine yeni blog makaleleri yazmaya devam ediyoruz. Bu nedenle, lütfen en son güncellemeler için bizimle iletişime geçin.

Ask a question

XML belge ayrıştırıcısı hakkında herhangi bir sorunuz veya karışıklığınız varsa, lütfen forum üzerinden bizimle iletişime geçmekten çekinmeyin.

SSS

Why do we need to extract text from XML files?

XML dosyalarından metin çıkarmak, XML belgelerinde bulunan gerçek verilere erişmemizi ve bunları manipüle etmemizi sağlar.

How can I extract text from XML files using Python?

XML dosyalarından metin çıkartmak için GroupDocs.Parser Cloud SDK for Python kullanabilirsiniz; bu, güçlü metin çıkarım yetenekleri sunar.

XML dosyalarından metadata çıkarmak için GroupDocs.Parser Cloud SDK’sını Python ile kullanmak mümkün mü?

Evet, GroupDocs.Parser Cloud SDK for Python XML dosyalarından meta verileri çıkarmayı destekler. Yazar, oluşturulma tarihi, değiştirilme tarihi gibi meta veri bilgilerini alabilirsiniz.

Can I extract images embedded in XML files using GroupDocs.Parser Cloud SDK for Python?

Evet, GroupDocs.Parser Cloud SDK for Python XML dosyalarına gömülü görüntüleri çıkarmanıza ve bunları farklı formatlara dönüştürmenize olanak tanır.

Ayrıca Bakınız

İşte işinize yarayabilecek bazı ilgili makaleler: