Java DOM Parser - Ekstrak Teks dari Dokumen XML menggunakan Java.

Di era digital saat ini, ekstraksi data dari dokumen XML(eXtensible Markup Language) memegang peranan penting dalam berbagai industri dan aplikasi. XML adalah bahasa markup populer yang digunakan untuk menyimpan dan mengatur data terstruktur dalam format hierarkis. Mengekstraksi informasi dari dokumen XML sangat penting bagi bisnis untuk melakukan analisis data dan operasi pencarian informasi pada data. Pada artikel ini, kita akan mempelajari cara mengekstrak teks dari dokumen XML di Java menggunakan GroupDocs.Parser Cloud SDK for Java.

Topik-topik berikut akan dibahas dalam artikel ini:

Java REST API untuk Parse File XML dan Instalasi SDK

GroupDocs.Parser Cloud SDK for Java adalah solusi yang andal, mudah digunakan, dan komprehensif untuk mengekstraksi teks dari berbagai format dokumen dengan mudah, termasuk XML. Dengan API yang komprehensif, Anda dapat dengan mudah mengekstrak teks, metadata, gambar, dan informasi lainnya dari lebih dari 50 format dokumen. SDK dapat diintegrasikan ke dalam aplikasi berbasis Java untuk menyederhanakan proses pengembangan dan meningkatkan produktivitas.

Anda dapat mengunduh file JAR API atau menginstalnya menggunakan Maven dengan menambahkan repositori dan ketergantungan berikut ke dalam file pom.xml proyek Anda:

Repositori Maven:

<repository>
    <id>groupdocs-artifact-repository</id>
    <name>GroupDocs Artifact Repository</name>
    <url>https://repository.groupdocs.cloud/repo</url>
</repository>

Ketergantungan Maven:

<dependency>
    <groupId>com.groupdocs</groupId>
    <artifactId>groupdocs-parser-cloud</artifactId>
    <version>23.3</version>
    <scope>compile</scope>
</dependency>

Sekarang, Anda perlu mendaftar untuk mendapatkan akun uji coba gratis atau membeli paket langganan di situs web GroupDocs dan dapatkan kunci API Anda. Setelah Anda memiliki Client Id dan Client Secret, tambahkan potongan kode di bawah ini ke aplikasi berbasis Java:

# Dapatkan client_id dan client_secret Anda dari https://dashboard.groupdocs.cloud setelah pendaftaran.

String ClientId = "xxxxxxxx-xxxx-xxxx-xxxx-xxxxxxxxxxxx";
String ClientSecret = "xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx";
String MyStorage = "test-internal-storage";
Configuration configuration = new Configuration(ClientId, ClientSecret);

Cara Mengekstrak Semua Teks dari File XML di Java menggunakan REST API

Untuk mengekstrak teks dari dokumen XML di Java menggunakan GroupDocs.Parser Cloud SDK for Java, ikuti langkah-langkah berikut:

Unggah File

Pertama, unggah dokumen XML ke cloud menggunakan contoh kode yang diberikan di bawah ini:

package com.groupdocsdev.classes;

import java.io.File;

import com.groupdocs.cloud.parser.api.FileApi;
import com.groupdocs.cloud.parser.client.ApiException;
import com.groupdocs.cloud.parser.client.Configuration;
import com.groupdocs.cloud.parser.model.*;
import com.groupdocs.cloud.parser.model.requests.UploadFileRequest;

// Unggah file ke Cloud Storage menggunakan Java
public class App {

	public static void main(String[] args) {

		FileApi apiInstance = new FileApi(configuration);
		try {
			File fileStream = new File("H:\\groupdocs-cloud-data\\input-sample-file.xml");
			UploadFileRequest request = new UploadFileRequest("java-testing\\input-sample-file.xml", fileStream, MyStorage);
			FilesUploadResult response = apiInstance.uploadFile(request);
			System.out.println("Expected response type is FilesUploadResult: " + response.getUploaded().size());
		} catch (ApiException e) {
			System.err.println("Exception while calling FileApi:");
			e.printStackTrace();
		}
	}
}

Hasilnya, file XML yang diunggah akan tersedia di files section dasbor Anda di cloud.

Parsing File XML menggunakan Java

Berikut adalah langkah-langkah dan cuplikan kode contoh yang menunjukkan cara mengekstrak teks dari dokumen XML di Java menggunakan GroupDocs.Parser Cloud SDK for Java:

  • Pertama, impor kelas yang diperlukan ke file Java Anda.
  • Kedua, buat instance dari kelas ParseApi.
  • Ketiga, buat instance dari kelas FileInfo.
  • Selanjutnya, setel path ke file XML sebagai input.
  • Kemudian, buat instance dari kelas TextOptions().
  • Selanjutnya, tetapkan fileInfo ke metode setFileInfo.
  • Sekarang, buat instance kelas TextRequest() dan berikan parameter TextOptions.
  • Terakhir, dapatkan hasil dengan memanggil metode ParseApi.text() dan meneruskan parameter TextRequest.

Contoh kode berikut menunjukkan cara mengekstrak teks dan mengurai dokumen XML di Java menggunakan REST API:

package com.groupdocsdev.classes;

import com.groupdocs.cloud.parser.api.ParseApi;
import com.groupdocs.cloud.parser.client.ApiException;
import com.groupdocs.cloud.parser.client.Configuration;
import com.groupdocs.cloud.parser.model.FileInfo;
import com.groupdocs.cloud.parser.model.*;
import com.groupdocs.cloud.parser.model.requests.TextRequest;

// Cara mengekstrak teks dari file XML di Java.
public class App {

	public static void main(String[] args) {
		
		// Buat instance Parse API
		ParseApi apiInstance = new ParseApi(configuration);

		try {

			// Siapkan pengaturan
			FileInfo fileInfo = new FileInfo();
			fileInfo.setFilePath("java-testing/input-sample-file.xml");
			TextOptions options = new TextOptions();
			options.setFileInfo(fileInfo);

			TextRequest request = new TextRequest(options);
			TextResult response = apiInstance.text(request);

			// Dapatkan jalur file keluaran
			System.out.println("Output file path: " + response.getPath());
				
		} catch (ApiException e) {
			System.err.println("Exception while calling FileApi:");
			e.printStackTrace();
		}
		
	}
}

Anda dapat melihat output pada gambar di bawah ini:

Ekstrak Java Teks dari Dokumen XML

Ekstrak Teks dari Dokumen XML di Java

Parser XML Online Gratis

Apa cara terbaik untuk mengekstrak teks dari XML online secara gratis? Silakan coba perangkat lunak parser XML online untuk mengikis file XML. Alat Parser XML ini dikembangkan menggunakan pustaka parser Java yang disebutkan di atas.

Kesimpulan

Kesimpulannya, pengembang dapat menyederhanakan proses ekstraksi data dan secara efisien mengakses data dalam dokumen XML dengan GroupDocs.Parser Cloud SDK untuk Java. Berikut ini adalah apa yang telah Anda pelajari dari artikel ini:

  • cara mengekstrak semua teks dari dokumen XML di Java menggunakan REST API;
  • unggah file XML secara terprogram ke cloud menggunakan Java;
  • dan alat ekstraksi XML online untuk mengurai dokumen XML.

Selain itu, Anda dapat mempelajari lebih lanjut tentang GroupDocs.Parser Cloud API menggunakan dokumentasi. Kami juga menyediakan bagian Referensi API yang memungkinkan Anda memvisualisasikan dan berinteraksi dengan API kami secara langsung melalui browser. Kode sumber lengkap Java SDK tersedia secara gratis di Github.

Terakhir, kami terus menulis artikel blog baru dalam berbagai format file dan mem-parsing menggunakan REST API. Jadi, silakan hubungi untuk pembaruan terbaru.

Berikan pertanyaan

Jika Anda memiliki pertanyaan atau kebingungan tentang parser data XML, jangan ragu untuk menghubungi kami melalui forum kami.

FAQ

Bagaimana cara mengekstrak semua teks dari file XML menggunakan Java?

Anda terlebih dahulu menginisialisasi kelas ParserApi dan menyetel kredensial API kami menggunakan GroupDocs.Parser Cloud SDK for Java. Kemudian, buat objek ExtractOptions dan tentukan file dokumen XML menggunakan FileInfo. Terakhir, panggil metode ekstrak, berikan opsi, dan ambil teks yang diekstraksi menggunakan metode getText.

Bagaimana cara mem-parsing dokumen XML menggunakan Java?

Anda dapat mengurai file XML menggunakan GroupDocs.Parser Cloud SDK for Java di aplikasi Java Anda. SDK yang kuat ini menyediakan cara yang efisien dan mudah untuk mengekstrak data dari file XML di Java.

Lihat juga

Berikut adalah beberapa artikel terkait yang mungkin bermanfaat bagi Anda: