Java DOM Ayrıştırıcı - Java kullanarak XML Belgelerinden Metin Çıkarın.

Günümüzün dijital çağında, XML(Genişletilebilir Biçimlendirme Dili) belgelerinden veri çıkarma, çeşitli endüstrilerde ve uygulamalarda önemli bir rol oynamaktadır. XML, yapılandırılmış verileri hiyerarşik bir biçimde depolamak ve düzenlemek için kullanılan popüler bir biçimlendirme dilidir. XML belgelerinden bilgi çıkarmak, işletmelerin veriler üzerinde veri analizi ve bilgi alma işlemleri gerçekleştirmesi için gereklidir. Bu makalede, Java için GroupDocs.Parser Cloud SDK kullanarak Java’daki XML belgelerinden nasıl metin çıkarılacağını keşfedeceğiz.

Bu yazıda aşağıdaki konular ele alınacaktır:

XML Dosyasını Ayrıştırmak için Java REST API’si ve SDK Kurulumu

GroupDocs.Parser Cloud SDK for Java, XML dahil olmak üzere çeşitli belge biçimlerinden zahmetsizce metin ayıklamak için güçlü, kullanıcı dostu ve kapsamlı bir çözümdür. Kapsamlı API’leri ile 50’den fazla belge biçiminden metin, meta veri, resim ve diğer bilgileri kolayca çıkarabilirsiniz. SDK, geliştirme sürecinizi basitleştirmek ve üretkenliği artırmak için Java tabanlı bir uygulamaya entegre edilebilir.

API’nin JAR dosyasını indirebilir veya projenizin pom.xml dosyasına aşağıdaki depoyu ve bağımlılığı ekleyerek Maven’i kullanarak yükleyebilirsiniz:

Maven Deposu:

<repository>
    <id>groupdocs-artifact-repository</id>
    <name>GroupDocs Artifact Repository</name>
    <url>https://repository.groupdocs.cloud/repo</url>
</repository>

Maven Bağımlılığı:

<dependency>
    <groupId>com.groupdocs</groupId>
    <artifactId>groupdocs-parser-cloud</artifactId>
    <version>23.3</version>
    <scope>compile</scope>
</dependency>

Şimdi, ücretsiz bir deneme hesabı için kaydolun veya GroupDocs web sitesinde bir abonelik planı satın alın ve API anahtarınızı alın. İstemci Kimliği ve İstemci Sırrı’na sahip olduğunuzda, Java tabanlı bir uygulamaya aşağıdaki kod parçacığını ekleyin:

# Kayıttan sonra client_id ve client_secret'inizi https://dashboard.groupdocs.cloud adresinden alın.

String ClientId = "xxxxxxxx-xxxx-xxxx-xxxx-xxxxxxxxxxxx";
String ClientSecret = "xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx";
String MyStorage = "test-internal-storage";
Configuration configuration = new Configuration(ClientId, ClientSecret);

REST API kullanarak Java’daki XML Dosyalarından Tüm Metni Çıkarma

Java için GroupDocs.Parser Cloud SDK kullanarak Java’daki XML belgelerinden metin ayıklamak için şu adımları izleyin:

Dosyayı Yükle

Öncelikle, aşağıda verilen kod örneğini kullanarak XML belgesini buluta yükleyin:

package com.groupdocsdev.classes;

import java.io.File;

import com.groupdocs.cloud.parser.api.FileApi;
import com.groupdocs.cloud.parser.client.ApiException;
import com.groupdocs.cloud.parser.client.Configuration;
import com.groupdocs.cloud.parser.model.*;
import com.groupdocs.cloud.parser.model.requests.UploadFileRequest;

// Java kullanarak Bulut Depolamaya dosya yükleyin
public class App {

	public static void main(String[] args) {

		FileApi apiInstance = new FileApi(configuration);
		try {
			File fileStream = new File("H:\\groupdocs-cloud-data\\input-sample-file.xml");
			UploadFileRequest request = new UploadFileRequest("java-testing\\input-sample-file.xml", fileStream, MyStorage);
			FilesUploadResult response = apiInstance.uploadFile(request);
			System.out.println("Expected response type is FilesUploadResult: " + response.getUploaded().size());
		} catch (ApiException e) {
			System.err.println("Exception while calling FileApi:");
			e.printStackTrace();
		}
	}
}

Sonuç olarak, yüklenen XML dosyası, bulut üzerindeki kontrol panelinizin dosyalar bölümünde mevcut olacaktır.

XML Dosyasını Java kullanarak ayrıştırın

Java için GroupDocs.Parser Cloud SDK kullanılarak Java’da bir XML belgesinden nasıl metin çıkarılacağını gösteren adımlar ve örnek bir kod parçacığı aşağıda verilmiştir:

  • Öncelikle, gerekli sınıfları Java dosyanıza aktarın.
  • İkinci olarak, ParseApi sınıfının bir örneğini oluşturun.
  • Üçüncü olarak, FileInfo sınıfının bir örneğini oluşturun.
  • Ardından, XML dosyasının yolunu girdi olarak ayarlayın.
  • Ardından, TextOptions() sınıfının bir örneğini oluşturun.
  • Ardından, setFileInfo yöntemine fileInfo atayın.
  • Şimdi, TextRequest() sınıfının bir örneğini oluşturun ve TextOptions parametresini iletin.
  • Son olarak, ParseApi.text() yöntemini çağırarak ve TextRequest parametresini ileterek sonuçları alın.

Aşağıdaki kod örneği, Java’da REST API kullanarak metnin nasıl ayıklanacağını ve bir XML belgesinin nasıl ayrıştırılacağını gösterir:

package com.groupdocsdev.classes;

import com.groupdocs.cloud.parser.api.ParseApi;
import com.groupdocs.cloud.parser.client.ApiException;
import com.groupdocs.cloud.parser.client.Configuration;
import com.groupdocs.cloud.parser.model.FileInfo;
import com.groupdocs.cloud.parser.model.*;
import com.groupdocs.cloud.parser.model.requests.TextRequest;

// Java'da bir XML dosyasından metin nasıl çıkarılır.
public class App {

	public static void main(String[] args) {
		
		// Ayrıştırma API'sinin bir örneğini oluşturun
		ParseApi apiInstance = new ParseApi(configuration);

		try {

			// ayarları hazırlayın
			FileInfo fileInfo = new FileInfo();
			fileInfo.setFilePath("java-testing/input-sample-file.xml");
			TextOptions options = new TextOptions();
			options.setFileInfo(fileInfo);

			TextRequest request = new TextRequest(options);
			TextResult response = apiInstance.text(request);

			// Çıktı dosyası yolunu al
			System.out.println("Output file path: " + response.getPath());
				
		} catch (ApiException e) {
			System.err.println("Exception while calling FileApi:");
			e.printStackTrace();
		}
		
	}
}

Çıktıyı aşağıdaki resimde görebilirsiniz:

Java, XML Belgelerinden Metin Çıkarma

Java’daki XML Belgesinden Metin Çıkarma

Ücretsiz Çevrimiçi XML Ayrıştırıcı

Çevrimiçi olarak XML’den ücretsiz olarak metin çıkarmanın en iyi yolu nedir? XML dosyalarını kazımak için lütfen bir çevrimiçi XML ayrıştırıcı yazılımı deneyin. Bu XML Ayrıştırıcı aracı, yukarıda belirtilen Java ayrıştırıcı kitaplığı kullanılarak geliştirilmiştir.

Çözüm

Sonuç olarak geliştiriciler, Java için GroupDocs.Parser Cloud SDK ile veri çıkarma sürecini basitleştirebilir ve XML belgelerindeki verilere verimli bir şekilde erişebilir. Bu makaleden öğrendikleriniz şunlardır:

  • REST API kullanılarak Java’daki XML belgelerinden tüm metinlerin nasıl çıkarılacağı;
  • Java kullanarak programlı olarak bir XML dosyasını buluta yükleyin;
  • ve XML belgelerini ayrıştırmak için çevrimiçi XML ayıklama aracı.

Ayrıca, belgeleri kullanarak GroupDocs.Parser Cloud API hakkında daha fazla bilgi edinebilirsiniz. Ayrıca, API’lerimizi doğrudan tarayıcı aracılığıyla görselleştirmenize ve bunlarla etkileşim kurmanıza olanak tanıyan bir API Referansı bölümü de sağlıyoruz. Java SDK’nın eksiksiz kaynak kodu Github üzerinde ücretsiz olarak mevcuttur.

Son olarak farklı dosya formatlarında yeni blog yazıları yazmaya ve REST API kullanarak ayrıştırmaya devam ediyoruz. Bu nedenle, en son güncellemeler için lütfen iletişime geçin.

Bir soru sor

XML veri ayrıştırıcısı hakkında herhangi bir sorunuz veya kafa karışıklığınız olması durumunda, lütfen forumumuz aracılığıyla bizimle iletişime geçmekten çekinmeyin.

SSS

Java kullanarak bir XML dosyasındaki tüm metni nasıl ayıklayabilirim?

Önce ParserApi sınıfını başlatırsınız ve GroupDocs.Parser Cloud SDK for Java kullanarak API kimlik bilgilerimizi ayarlarsınız. Ardından, bir ExtractOptions nesnesi oluşturun ve FileInfo’yu kullanarak XML belge dosyasını belirtin. Son olarak, ayıklama yöntemini çağırın, seçenekleri girin ve getText yöntemini kullanarak ayıklanan metni alın.

XML belgelerini Java kullanarak nasıl ayrıştırırım?

Java uygulamalarınızda GroupDocs.Parser Cloud SDK for Java kullanarak bir XML dosyasını ayrıştırabilirsiniz. Bu güçlü SDK, Java’daki XML dosyalarından veri ayıklamak için etkili ve basit bir yol sağlar.

Ayrıca bakınız

Yararlı bulabileceğiniz bazı ilgili makaleler şunlardır: