XML(Genişletilebilir İşaretleme Dili), yapılandırılmış bilgileri depolamak ve değiş tokuş etmek için popüler bir veri biçimidir. Web geliştirme, veri depolama ve veri aktarımı dahil olmak üzere çeşitli alanlarda yaygın olarak kullanılmaktadır. XML dosyalarından metin ayıklamak birçok nedenden dolayı çok önemlidir. XML belgelerinde bulunan gerçek verilere erişmemizi ve bunları değiştirmemizi sağlar. Metin ayıklayarak veri analizi, veri dönüştürme ve veri entegrasyonu gibi çeşitli işlemleri gerçekleştirebiliriz. Bu yazıda, REST API kullanarak Python’da XML’den nasıl metin çıkarılacağını keşfedeceğiz.
Bu yazıda aşağıdaki konular ele alınacaktır:
- XML Belgesini ve SDK Kurulumunu Ayrıştırmak için Python REST API
- REST API kullanarak Python’daki XML Dosyasındaki Tüm Metni Çıkarın
XML Belgesini Ayrıştıracak Python REST API’si ve SDK Kurulumu
GroupDocs.Parser Cloud SDK for Python, XML ve diğer dosya biçimlerinden metin çıkarmayı basitleştiren güçlü bir araçtır. Belge ayrıştırma, metin çıkarma, meta veri çıkarma ve daha pek çok şey dahil olmak üzere çok çeşitli özellikler sunar. Sezgisel API’si ile geliştiriciler, metin çıkarma özelliklerini Python uygulamalarına kolayca entegre edebilirler. Ayrıca Cloud API için belge ayrıştırıcı aile üyeleri olarak C# .NET, Java, PHP, Ruby ve Node.js SDK’larını da destekler. SDK, geliştirme sürecinizi basitleştirmek ve üretkenliği artırmak için Python tabanlı bir uygulamaya entegre edilebilir.
XML’den bilgi ayıklamak için konsolda aşağıdaki komutu kullanarak pip (Python için paket yükleyici) ile GroupDocs.Parser Cloud’u Python projenize kurun:
pip install groupdocs_parser_cloud
Şimdi, lütfen Müşteri Kimliğinizi ve İstemci Sırrınızı gösterge tablosundan alın ve kodu aşağıda gösterildiği gibi ekleyin:
# groupdocs ayrıştırıcı SDK'sını içe aktar
import groupdocs_parser_cloud
# Ücretsiz kayıttan sonra https://dashboard.groupdocs.cloud adresinden app_sid ve app_key'i edinin.
app_sid = "xxxxxxx-xxxx-xxxx-xxxx-xxxxxxxxxxxx"
app_key = "xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx"
# Dosya API yapılandırmalarını edinin.
configuration = groupdocs_parser_cloud.Configuration(app_sid, app_key)
configuration.api_base_url = "https://api.groupdocs.cloud"
storage_name = "LocalStorage"
REST API kullanarak Python’daki XML Dosyasından Tüm Metni Çıkarın
Python’da GroupDocs.Parser Cloud SDK for Python kullanarak XML belgelerinden metin ayıklamak için şu adımları izleyin:
Dosyayı Yükle
Öncelikle, aşağıda verilen kod örneğini kullanarak XML belgesini buluta yükleyin:
# Dosya API'sinin bir örneğini oluşturun
file_api = groupdocs_parser_cloud.FileApi.from_config(configuration)
# Çağrı yükleme dosyası isteği
request = groupdocs_parser_cloud.UploadFileRequest("python-testing\input-sample-file.pdf", "H:\\groupdocs-cloud-data\\input-sample-file.pdf", storage_name)
# Dosyayı buluta yükleyin
response = file_api.upload_file(request)
print(response.uploaded)
Sonuç olarak, yüklenen XML dosyası, bulut üzerindeki kontrol panelinizin dosyalar bölümünde mevcut olacaktır.
Python kullanarak XML verilerinden tüm Metni çıkarın
Bu bölümde, Python’da GroupDocs.Parser Cloud SDK for Python kullanarak bir XML belgesinden nasıl metin çıkarılacağını gösteren adımları ve örnek bir kod parçacığını yazacağız:
- İlk olarak, ParseApi sınıfının bir örneğini oluşturun.
- İkinci olarak, TextOptions() sınıfının bir örneğini oluşturun.
- Üçüncüsü, FileInfo sınıfının bir örneğini oluşturun.
- Ve onu metin seçenekleri fileInfo yöntemine atayın.
- Ardından, XML dosyasının yolunu girdi olarak ayarlayın.
- Şimdi, TextRequest() sınıfının bir örneğini oluşturun ve TextOptions parametresini iletin.
- Son olarak, ParseApi.text() yöntemini çağırarak ve TextRequest parametresini ileterek sonuçları alın.
Aşağıdaki kod örneği, REST API kullanılarak Python’da bir XML belgesinden nasıl metin çıkarılacağını gösterir:
# REST API kullanarak Python'da XML'den Metin Çıkarma
try:
# api başlatma
parseApi = groupdocs_parser_cloud.ParseApi.from_config(configuration)
# metin seçeneklerini tanımla
options = groupdocs_parser_cloud.TextOptions()
options.file_info = groupdocs_parser_cloud.FileInfo()
options.file_info.file_path = "python-testing/input-sample-file.xml"
request = groupdocs_parser_cloud.TextRequest(options)
result = parseApi.text(request)
print("Successfully extracted text: " + result.text)
except groupdocs_parser_cloud.ApiException as e:
print("Exception while calling API: {0}".format(e.message))
Çıktıyı aşağıdaki resimde görebilirsiniz:
Ücretsiz Çevrimiçi Belge Ayrıştırıcı
Çevrimiçi olarak ücretsiz olarak XML’den metin nasıl çıkarılır? XML dosyalarından veri çıkarmak için lütfen bir çevrimiçi XML ayrıştırıcı yazılımı deneyin. Bu XML Ayrıştırıcı aracı, yukarıda belirtilen Python ayrıştırıcı kitaplığı kullanılarak geliştirilmiştir.
Çözüm
Sonuç olarak, XML dosyalarından metin çıkarmak, XML verileriyle çalışırken temel bir görevdir. GroupDocs.Parser Cloud SDK ile birlikte Python, XML dosyalarından metin ayıklamak için güvenilir ve verimli bir çözüm sunar. Bu makaleden öğrendikleriniz şunlardır:
- REST API kullanılarak Python’da XML belgelerinden tüm metinlerin nasıl çıkarılacağı;
- Python kullanarak programlı olarak bir XML dosyasını buluta yükleyin;
- ve XML belgelerini ayrıştırmak için çevrimiçi XML veri çıkarma yazılımı.
Ayrıca belgeleri kullanarak GroupDocs.Parser Cloud API hakkında daha fazla bilgi edinebilirsiniz. Ayrıca, API’lerimizi doğrudan tarayıcı aracılığıyla görselleştirmenize ve bunlarla etkileşimde bulunmanıza olanak tanıyan bir API Referansı bölümü de sağlıyoruz. Python SDK’nın eksiksiz kaynak kodu Github üzerinde ücretsiz olarak mevcuttur.
Son olarak, farklı dosya formatlarında yeni blog yazıları yazmaya ve REST API kullanarak ayrıştırmaya devam ediyoruz. Bu nedenle, en son güncellemeler için lütfen iletişime geçin.
Bir soru sor
XML belge ayrıştırıcısı hakkında herhangi bir sorunuz veya kafa karışıklığınız olması durumunda, lütfen forumumuz aracılığıyla bizimle iletişime geçmekten çekinmeyin.
SSS
Neden XML dosyalarından metin çıkarmamız gerekiyor?
XML dosyalarından metin çıkarmak, XML belgelerinde bulunan gerçek verilere erişmemizi ve bunları değiştirmemizi sağlar.
Python kullanarak XML dosyalarından nasıl metin ayıklayabilirim?
Güçlü metin çıkarma yetenekleri sağlayan GroupDocs.Parser Cloud SDK for Python kullanarak XML dosyalarından metin çıkarabilirsiniz.
Python için GroupDocs.Parser Cloud SDK kullanarak XML dosyalarından meta verileri çıkarmak mümkün müdür?
Evet, GroupDocs.Parser Cloud SDK for Python, XML dosyalarından meta verilerin çıkarılmasını destekler. Yazar, oluşturma tarihi, değişiklik tarihi ve daha fazlası gibi meta veri bilgilerini alabilirsiniz.
Python için GroupDocs.Parser Cloud SDK kullanarak XML dosyalarına katıştırılmış görüntüleri çıkarabilir miyim?
Evet, GroupDocs.Parser Cloud SDK for Python, XML dosyalarına gömülü görüntüleri ayıklamanıza ve bunları farklı biçimlere dönüştürmenize olanak tanır.
Ayrıca bakınız
Yararlı bulabileceğiniz bazı ilgili makaleler şunlardır:
- Belge Ayrıştırma - Java’daki PDF Dosyasından Metin Çıkarma
- Node.js’de REST API kullanarak PDF’den Veri Çıkarma
- Python’da REST API kullanarak Word Belgelerini Ayrıştırma
- Python Kullanarak PDF Belgelerinden Görüntüleri Çıkarın
- Python kullanarak PDF’den Metin Çıkarma
- Python kullanarak PDF’den Belirli Verileri Çıkarın
- Java DOM Ayrıştırıcı - Java kullanarak XML Belgelerinden Metin Çıkarın