تجزیه کننده جاوا DOM - استخراج متن از اسناد XML با استفاده از جاوا.

در عصر دیجیتال امروزی، استخراج داده ها از اسناد XML(EXtensible Markup Language) نقش مهمی در صنایع و برنامه های مختلف ایفا می کند. XML یک زبان نشانه گذاری محبوب است که برای ذخیره و سازماندهی داده های ساخت یافته در قالب سلسله مراتبی استفاده می شود. استخراج اطلاعات از اسناد XML برای کسب و کارها برای انجام تجزیه و تحلیل داده ها و عملیات بازیابی اطلاعات روی داده ها ضروری است. در این مقاله، نحوه استخراج متن از اسناد XML در جاوا با استفاده از GroupDocs.Parser Cloud SDK برای جاوا را بررسی خواهیم کرد.

موضوعات زیر باید در این مقاله پوشش داده شود:

Java REST API برای تجزیه فایل XML و نصب SDK

GroupDocs.Parser Cloud SDK for Java یک راه حل قدرتمند، کاربر پسند و جامع برای استخراج متن از فرمت های مختلف اسناد بدون دردسر، از جمله XML است. با API های جامع آن، می توانید به راحتی متن، ابرداده، تصاویر و سایر اطلاعات را از بیش از 50 [فرمت سند] استخراج کنید. SDK را می توان در یک برنامه کاربردی مبتنی بر جاوا ادغام کرد تا فرآیند توسعه شما را ساده کرده و بهره وری را افزایش دهد.

می توانید فایل JAR API را دانلود یا با استفاده از Maven با افزودن مخزن و وابستگی زیر به فایل pom.xml پروژه خود نصب کنید:

مخزن Maven:

<repository>
    <id>groupdocs-artifact-repository</id>
    <name>GroupDocs Artifact Repository</name>
    <url>https://repository.groupdocs.cloud/repo</url>
</repository>

وابستگی Maven:

<dependency>
    <groupId>com.groupdocs</groupId>
    <artifactId>groupdocs-parser-cloud</artifactId>
    <version>23.3</version>
    <scope>compile</scope>
</dependency>

اکنون، باید برای یک حساب آزمایشی رایگان ثبت نام کنید یا یک طرح اشتراک را خریداری کنید در وب‌سایت GroupDocs و کلید API خود را دریافت کنید. هنگامی که Client Id و Client Secret را دارید، قطعه کد زیر را به یک برنامه مبتنی بر جاوا اضافه کنید:

# پس از ثبت نام، client_id و client_secret خود را از https://dashboard.groupdocs.cloud دریافت کنید.

String ClientId = "xxxxxxxx-xxxx-xxxx-xxxx-xxxxxxxxxxxx";
String ClientSecret = "xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx";
String MyStorage = "test-internal-storage";
Configuration configuration = new Configuration(ClientId, ClientSecret);

نحوه استخراج تمام متن از فایل‌های XML در جاوا با استفاده از REST API

برای استخراج متن از اسناد XML در جاوا با استفاده از GroupDocs.Parser Cloud SDK برای جاوا، این مراحل را دنبال کنید:

  • آپلود فایل XML در ابر
  • 10 متن را از XML با استفاده از جاوا استخراج کنید

آپلود فایل

ابتدا سند XML را با استفاده از مثال کد زیر در ابر آپلود کنید:

package com.groupdocsdev.classes;

import java.io.File;

import com.groupdocs.cloud.parser.api.FileApi;
import com.groupdocs.cloud.parser.client.ApiException;
import com.groupdocs.cloud.parser.client.Configuration;
import com.groupdocs.cloud.parser.model.*;
import com.groupdocs.cloud.parser.model.requests.UploadFileRequest;

// با استفاده از جاوا فایل را در فضای ذخیره سازی ابری آپلود کنید
public class App {

	public static void main(String[] args) {

		FileApi apiInstance = new FileApi(configuration);
		try {
			File fileStream = new File("H:\\groupdocs-cloud-data\\input-sample-file.xml");
			UploadFileRequest request = new UploadFileRequest("java-testing\\input-sample-file.xml", fileStream, MyStorage);
			FilesUploadResult response = apiInstance.uploadFile(request);
			System.out.println("Expected response type is FilesUploadResult: " + response.getUploaded().size());
		} catch (ApiException e) {
			System.err.println("Exception while calling FileApi:");
			e.printStackTrace();
		}
	}
}

در نتیجه، فایل XML آپلود شده در بخش فایل ها داشبورد شما در فضای ابری در دسترس خواهد بود.

تجزیه فایل XML با استفاده از جاوا

در اینجا مراحل و یک نمونه کد کد وجود دارد که نحوه استخراج متن از یک سند XML در جاوا را با استفاده از GroupDocs.Parser Cloud SDK برای جاوا نشان می دهد:

  • ابتدا کلاس های مورد نیاز را در فایل جاوا خود وارد کنید.
  • در مرحله دوم، یک نمونه از کلاس ParseApi ایجاد کنید.
  • سوم، یک نمونه از کلاس FileInfo ایجاد کنید.
  • سپس مسیر فایل XML را به عنوان ورودی تنظیم کنید.
  • سپس، یک نمونه از کلاس TextOptions() ایجاد کنید.
  • سپس fileInfo را به متد setFileInfo اختصاص دهید.
  • اکنون یک نمونه از کلاس TextRequest() بسازید و پارامتر TextOptions را پاس کنید.
  • در نهایت با فراخوانی متد ParseApi.text() و پاس دادن پارامتر TextRequest به نتیجه برسید.

نمونه کد زیر نحوه استخراج متن و تجزیه یک سند XML در جاوا را با استفاده از REST API نشان می دهد:

package com.groupdocsdev.classes;

import com.groupdocs.cloud.parser.api.ParseApi;
import com.groupdocs.cloud.parser.client.ApiException;
import com.groupdocs.cloud.parser.client.Configuration;
import com.groupdocs.cloud.parser.model.FileInfo;
import com.groupdocs.cloud.parser.model.*;
import com.groupdocs.cloud.parser.model.requests.TextRequest;

// نحوه استخراج متن از فایل XML در جاوا
public class App {

	public static void main(String[] args) {
		
		// یک نمونه از Parse API ایجاد کنید
		ParseApi apiInstance = new ParseApi(configuration);

		try {

			// تنظیمات را آماده کنید
			FileInfo fileInfo = new FileInfo();
			fileInfo.setFilePath("java-testing/input-sample-file.xml");
			TextOptions options = new TextOptions();
			options.setFileInfo(fileInfo);

			TextRequest request = new TextRequest(options);
			TextResult response = apiInstance.text(request);

			// دریافت مسیر فایل خروجی
			System.out.println("Output file path: " + response.getPath());
				
		} catch (ApiException e) {
			System.err.println("Exception while calling FileApi:");
			e.printStackTrace();
		}
		
	}
}

خروجی را در تصویر زیر مشاهده می کنید:

استخراج متن جاوا از اسناد XML

استخراج متن از سند XML در جاوا

تجزیه کننده XML آنلاین رایگان

بهترین راه برای استخراج متن از XML آنلاین به صورت رایگان چیست؟ لطفاً یک نرم افزار تجزیه کننده XML آنلاین را برای خراش دادن فایل های XML امتحان کنید. این ابزار تجزیه کننده XML با استفاده از کتابخانه تجزیه کننده جاوا که در بالا ذکر شد توسعه یافته است.

نتیجه

در نتیجه، توسعه‌دهندگان می‌توانند فرآیند استخراج داده‌ها را ساده کرده و با استفاده از GroupDocs.Parser Cloud SDK برای جاوا، به داده‌های درون اسناد XML دسترسی موثری داشته باشند. آنچه از این مقاله آموخته اید به شرح زیر است:

  • نحوه استخراج تمام متن از اسناد XML در جاوا با استفاده از REST API.
  • به صورت برنامه نویسی یک فایل XML را با استفاده از جاوا در فضای ابری آپلود کنید.
  • و ابزار استخراج آنلاین XML برای تجزیه اسناد XML.

علاوه بر این، می‌توانید با استفاده از مستندات درباره GroupDocs.Parser Cloud API اطلاعات بیشتری کسب کنید. ما همچنین یک بخش API Reference ارائه می‌کنیم که به شما امکان می‌دهد API‌های ما را مستقیماً از طریق مرورگر تجسم کنید و با آن‌ها تعامل داشته باشید. کد منبع کامل جاوا SDK به صورت رایگان در Github در دسترس است.

در نهایت، ما به نوشتن مقالات وبلاگ جدید در قالب‌های فایل مختلف و تجزیه با استفاده از REST API ادامه می‌دهیم. بنابراین، لطفا برای آخرین به روز رسانی تماس بگیرید.

سوال بپرس

در صورتی که در مورد تجزیه کننده داده XML سؤال یا ابهامی دارید، لطفاً از طریق [فروم 19 ما با ما تماس بگیرید.

سوالات متداول

چگونه می توانم تمام متن را از یک فایل XML با استفاده از جاوا استخراج کنم؟

ابتدا کلاس ParserApi را مقداردهی اولیه می کنید و اعتبار API ما را با استفاده از GroupDocs.Parser Cloud SDK for Java تنظیم می کنید. سپس، یک شی ExtractOptions ایجاد کنید و فایل سند XML را با استفاده از FileInfo مشخص کنید. در نهایت متد استخراج را فراخوانی کرده و گزینه ها را پاس داده و متن استخراج شده را با استفاده از متد getText بازیابی کنید.

چگونه اسناد XML را با استفاده از جاوا تجزیه کنم؟

می توانید یک فایل XML را با استفاده از GroupDocs.Parser Cloud SDK for Java در برنامه های جاوا خود تجزیه کنید. این SDK قدرتمند روشی کارآمد و ساده برای استخراج داده ها از فایل های XML در جاوا فراهم می کند.

همچنین ببینید

در اینجا چند مقاله مرتبط وجود دارد که ممکن است برای شما مفید باشد: