؛ Java DOM Parser - استخراج نص من مستندات XML باستخدام Java.

في العصر الرقمي الحالي ، يلعب استخراج البيانات من وثائق XML(لغة الترميز الموسعة) دورًا مهمًا في مختلف الصناعات والتطبيقات. XML هي لغة ترميز شائعة تستخدم لتخزين وتنظيم البيانات المهيكلة بتنسيق هرمي. يعد استخراج المعلومات من مستندات XML أمرًا ضروريًا للشركات لإجراء عمليات تحليل البيانات واسترجاع المعلومات على البيانات. في هذه المقالة ، سوف نستكشف كيفية استخراج نص من مستندات XML في Java باستخدام GroupDocs.Parser Cloud SDK لـ Java.

سيتم تناول الموضوعات التالية في هذه المقالة:

Java REST API لتحليل ملف XML وتثبيت SDK

GroupDocs.Parser Cloud SDK for Java هو حل قوي وسهل الاستخدام وشامل لاستخراج النص من تنسيقات المستندات المختلفة دون عناء ، بما في ذلك XML. باستخدام واجهات برمجة التطبيقات الشاملة ، يمكنك بسهولة استخراج النصوص والبيانات الوصفية والصور والمعلومات الأخرى من أكثر من 50 تنسيقات مستندات. يمكن دمج SDK في تطبيق قائم على Java لتبسيط عملية التطوير لديك وتعزيز الإنتاجية.

يمكنك إما تنزيل ملف JAR الخاص بواجهة برمجة التطبيقات أو تثبيته باستخدام Maven عن طريق إضافة المستودع التالي والتبعية إلى ملف pom.xml الخاص بمشروعك:

مستودع مافن:

<repository>
    <id>groupdocs-artifact-repository</id>
    <name>GroupDocs Artifact Repository</name>
    <url>https://repository.groupdocs.cloud/repo</url>
</repository>

تبعية المخضرم:

<dependency>
    <groupId>com.groupdocs</groupId>
    <artifactId>groupdocs-parser-cloud</artifactId>
    <version>23.3</version>
    <scope>compile</scope>
</dependency>

الآن ، تحتاج إلى التسجيل للحصول على حساب تجريبي مجاني أو شراء خطة اشتراك على موقع GroupDocs و الحصول على مفتاح API الخاص بك. بمجرد حصولك على معرف العميل وسر العميل ، أضف مقتطف الشفرة أدناه إلى تطبيق يستند إلى Java:

# احصل على client_id و client_secret من https://dashboard.groupdocs.cloud بعد التسجيل.

String ClientId = "xxxxxxxx-xxxx-xxxx-xxxx-xxxxxxxxxxxx";
String ClientSecret = "xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx";
String MyStorage = "test-internal-storage";
Configuration configuration = new Configuration(ClientId, ClientSecret);

كيفية استخراج كل النص من ملفات XML في جافا باستخدام واجهة برمجة تطبيقات REST

لاستخراج نص من مستندات XML في Java باستخدام GroupDocs.Parser Cloud SDK لـ Java ، اتبع الخطوات التالية:

تحميل الملف

أولاً ، قم بتحميل مستند XML إلى السحابة باستخدام مثال الرمز الموضح أدناه:

package com.groupdocsdev.classes;

import java.io.File;

import com.groupdocs.cloud.parser.api.FileApi;
import com.groupdocs.cloud.parser.client.ApiException;
import com.groupdocs.cloud.parser.client.Configuration;
import com.groupdocs.cloud.parser.model.*;
import com.groupdocs.cloud.parser.model.requests.UploadFileRequest;

// قم بتحميل الملف إلى Cloud Storage باستخدام Java
public class App {

	public static void main(String[] args) {

		FileApi apiInstance = new FileApi(configuration);
		try {
			File fileStream = new File("H:\\groupdocs-cloud-data\\input-sample-file.xml");
			UploadFileRequest request = new UploadFileRequest("java-testing\\input-sample-file.xml", fileStream, MyStorage);
			FilesUploadResult response = apiInstance.uploadFile(request);
			System.out.println("Expected response type is FilesUploadResult: " + response.getUploaded().size());
		} catch (ApiException e) {
			System.err.println("Exception while calling FileApi:");
			e.printStackTrace();
		}
	}
}

نتيجة لذلك ، سيكون ملف XML الذي تم تحميله متاحًا في قسم الملفات من لوحة المعلومات على السحابة.

تحليل ملف XML باستخدام Java

فيما يلي الخطوات ومثال مقتطف التعليمات البرمجية الذي يوضح كيفية استخراج نص من مستند XML في Java باستخدام GroupDocs.Parser Cloud SDK لـ Java:

  • أولاً ، قم باستيراد الفئات المطلوبة إلى ملف Java الخاص بك.
  • ثانيًا ، قم بإنشاء مثيل للفئة ParseApi.
  • ثالثًا ، قم بإنشاء مثيل للفئة FileInfo.
  • بعد ذلك ، قم بتعيين المسار إلى ملف XML كمدخل.
  • ثم قم بإنشاء مثيل لفئة TextOptions().
  • بعد ذلك ، قم بتعيين fileInfo إلى طريقة setFileInfo.
  • الآن ، قم بإنشاء مثيل لفئة TextRequest() وقم بتمرير معلمة TextOptions.
  • أخيرًا ، احصل على النتائج عن طريق استدعاء طريقة ParseApi.text() وتمرير معلمة TextRequest.

يوضح نموذج التعليمات البرمجية التالي كيفية استخراج نص وتحليل مستند XML في Java باستخدام REST API:

package com.groupdocsdev.classes;

import com.groupdocs.cloud.parser.api.ParseApi;
import com.groupdocs.cloud.parser.client.ApiException;
import com.groupdocs.cloud.parser.client.Configuration;
import com.groupdocs.cloud.parser.model.FileInfo;
import com.groupdocs.cloud.parser.model.*;
import com.groupdocs.cloud.parser.model.requests.TextRequest;

// كيفية استخراج نص من ملف XML في Java.
public class App {

	public static void main(String[] args) {
		
		// قم بإنشاء مثيل من Parse API
		ParseApi apiInstance = new ParseApi(configuration);

		try {

			// تحضير الإعدادات
			FileInfo fileInfo = new FileInfo();
			fileInfo.setFilePath("java-testing/input-sample-file.xml");
			TextOptions options = new TextOptions();
			options.setFileInfo(fileInfo);

			TextRequest request = new TextRequest(options);
			TextResult response = apiInstance.text(request);

			// الحصول على مسار ملف الإخراج
			System.out.println("Output file path: " + response.getPath());
				
		} catch (ApiException e) {
			System.err.println("Exception while calling FileApi:");
			e.printStackTrace();
		}
		
	}
}

يمكنك أن ترى الإخراج في الصورة أدناه:

جافا استخراج النص من مستندات XML

استخراج نص من مستند XML في جافا

محلل XML مجاني على الإنترنت

ما هي أفضل طريقة لاستخراج نص من XML عبر الإنترنت مجانًا؟ الرجاء محاولة برنامج محلل XML عبر الإنترنت لكشط ملفات XML. تم تطوير أداة محلل XML باستخدام مكتبة محلل Java المذكورة أعلاه.

خاتمة

في الختام ، يمكن للمطورين تبسيط عملية استخراج البيانات والوصول بكفاءة إلى البيانات داخل مستندات XML باستخدام GroupDocs.Parser Cloud SDK for Java. فيما يلي ما تعلمته من هذه المقالة:

  • كيفية استخراج كل النصوص من مستندات XML في Java باستخدام REST API ؛
  • تحميل ملف XML برمجيًا إلى السحابة باستخدام Java ؛
  • وأداة استخراج XML عبر الإنترنت لتحليل مستندات XML.

بالإضافة إلى ذلك ، يمكنك معرفة المزيد حول GroupDocs.Parser Cloud API باستخدام التوثيق. نوفر أيضًا قسم مرجع واجهة برمجة التطبيقات الذي يتيح لك تصور واجهات برمجة التطبيقات الخاصة بنا والتفاعل معها مباشرةً من خلال المتصفح. شفرة المصدر الكاملة لـ Java SDK متاحة مجانًا على Github.

أخيرًا ، نواصل كتابة مقالات مدونة جديدة حول تنسيقات ملفات مختلفة والتحليل باستخدام REST API. لذا ، يرجى التواصل معنا للحصول على آخر التحديثات.

طرح سؤال

في حال كان لديك أي استفسارات أو ارتباك حول محلل بيانات XML ، فلا تتردد في الاتصال بنا عبر المنتدى.

أسئلة وأجوبة

كيف يمكنني استخراج كل النص من ملف XML باستخدام Java؟

تقوم أولاً بتهيئة فئة ParserApi وتعيين بيانات اعتماد API الخاصة بنا باستخدام GroupDocs.Parser Cloud SDK for Java. بعد ذلك ، قم بإنشاء كائن ExtractOptions وحدد ملف مستند XML باستخدام FileInfo. أخيرًا ، قم باستدعاء طريقة extract ، وقم بتمرير الخيارات ، واسترجع النص المستخرج باستخدام طريقة getText.

كيف يمكنني تحليل مستندات XML باستخدام Java؟

يمكنك تحليل ملف XML باستخدام GroupDocs.Parser Cloud SDK for Java في تطبيقات Java الخاصة بك. يوفر SDK القوي هذا طريقة فعالة ومباشرة لاستخراج البيانات من ملفات XML في Java.

أنظر أيضا

فيما يلي بعض المقالات ذات الصلة التي قد تجدها مفيدة: