؛ Word Document Parser - استخراج الصور من Word File Online في Java

يعد تحليل المستندات مهمة حاسمة في العديد من الصناعات التي تتطلب استخراج البيانات من تنسيقات المستندات المختلفة. عند العمل باستخدام مستندات Word ، يمكن أن يكون استخراج الصور مفيدًا بشكل خاص في حالات مثل تحليل المحتوى أو التعرف على الصور أو تصور البيانات. يمكن أن يستغرق استخراج الصور يدويًا من مستندات Word الكبيرة وقتًا طويلاً. لذلك ، يمكن أن توفر لك أتمتة عملية استخراج الصور الوقت والجهد. في هذه المقالة ، سنشرح كيفية استخراج الصور من مستندات Word برمجيًا في Java.

سيتم تناول الموضوعات التالية في هذه المقالة:

Java REST API لاستخراج الصور من مستندات Word وتثبيت SDK

GroupDocs.Parser Cloud SDK for Java هي مكتبة Java قوية توفر طريقة بسيطة وفعالة لتحليل واستخراج البيانات من تنسيقات المستندات ، بما في ذلك مستندات Word. يوفر مجموعة واسعة من الميزات لتحليل المستندات ، مما يسمح للمطورين باستخراج الصور والنصوص والبيانات الوصفية والمزيد. توفر GroupDocs.Parser أيضًا C# .NET ، و Java ، و PHP ، و Ruby ، و Python SDK باعتبارها أعضاء عائلة محلل المستندات لواجهات برمجة التطبيقات السحابية.

للبدء ، تحتاج إلى تضمين GroupDocs.Parser Cloud SDK في مشروع Java الخاص بك. يمكنك إما تنزيل ملف JAR الخاص بواجهة برمجة التطبيقات أو تثبيته باستخدام Maven عن طريق إضافة المستودع التالي والتبعية إلى ملف pom.xml الخاص بمشروعك:

مستودع مافن:

<repository>
    <id>groupdocs-artifact-repository</id>
    <name>GroupDocs Artifact Repository</name>
    <url>https://repository.groupdocs.cloud/repo</url>
</repository>

تبعية المخضرم:

<dependency>
    <groupId>com.groupdocs</groupId>
    <artifactId>groupdocs-parser-cloud</artifactId>
    <version>23.3</version>
    <scope>compile</scope>
</dependency>

بعد ذلك ، تحتاج إلى التسجيل للحصول على حساب تجريبي مجاني أو شراء خطة اشتراك على موقع GroupDocs و الحصول على مفتاح API الخاص بك. بمجرد حصولك على معرف العميل وسر العميل ، أضف مقتطف الشفرة أدناه إلى تطبيق يستند إلى Java:

# احصل على client_id و client_secret من https://dashboard.groupdocs.cloud بعد التسجيل.

String ClientId = "xxxxxxxx-xxxx-xxxx-xxxx-xxxxxxxxxxxx";
String ClientSecret = "xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx";
String MyStorage = "test-internal-storage";
Configuration configuration = new Configuration(ClientId, ClientSecret);

كيفية استخراج جميع الصور من مستندات Word في Java باستخدام واجهة برمجة تطبيقات REST

لاستخراج الصور من مستندات Word في Java باستخدام GroupDocs.Parser Cloud SDK ، اتبع هذه الخطوات ومثال على مقتطف الشفرة:

  • أولاً ، قم باستيراد الفئات المطلوبة إلى ملف Java الخاص بك.
  • ثانيًا ، قم بإنشاء مثيل للفئة ParseApi.
  • ثالثًا ، قم بإنشاء مثيل للفئة FileInfo.
  • بعد ذلك ، قم بتعيين المسار إلى مستند Word الإدخال.
  • ثم قم بإنشاء مثيل لفئة ImagesOptions().
  • بعد ذلك ، قم بتعيين fileInfo إلى خيار الصورة setFileInfo.
  • الآن ، قم بإنشاء مثيل لفئة ImagesRequest() وقم بتمرير المعلمة ImagesOptions.
  • أخيرًا ، احصل على النتائج عن طريق استدعاء طريقة ParseApi.images() وتمرير المعلمة ImagesRequest.

يوضح نموذج التعليمات البرمجية التالي كيفية استخراج جميع الصور من مستند Word عبر الإنترنت في Java باستخدام REST API:

package com.groupdocsdev.classes;

import com.groupdocs.cloud.parser.api.ParseApi;
import com.groupdocs.cloud.parser.client.ApiException;
import com.groupdocs.cloud.parser.client.Configuration;
import com.groupdocs.cloud.parser.model.FileInfo;
import com.groupdocs.cloud.parser.model.ImagesOptions;
import com.groupdocs.cloud.parser.model.ImagesResult;
import com.groupdocs.cloud.parser.model.requests.ImagesRequest;

// كيفية استخراج الصور من مستند Word في Java.
public class App {

	public static void main(String[] args) {
		
		// قم بإنشاء مثيل من Parse API
		ParseApi apiInstance = new ParseApi(configuration);

		try {

			// تحضير الإعدادات
			FileInfo fileInfo = new FileInfo();
			fileInfo.setFilePath("java-testing/input-sample-file.docx");

			ImagesOptions options = new ImagesOptions();
			options.setFileInfo(fileInfo);
			ImagesRequest request = new ImagesRequest(options);
			ImagesResult response = apiInstance.images(request);

			// الحصول على مسار ملف الإخراج
			System.out.println("Output file path: " + response.getPath());
				
		} catch (ApiException e) {
			System.err.println("Exception while calling FileApi:");
			e.printStackTrace();
		}
		
	}
}

استخراج صور معينة من ملف Word في Java باستخدام رقم الصفحة

في هذا القسم ، سنكتب الخطوات ومثال مقتطف الشفرة لاستخراج صور معينة من مستند Word برمجيًا في Java:

  • أولاً ، قم باستيراد الفئات المطلوبة إلى ملف Java الخاص بك.
  • ثانيًا ، قم بإنشاء مثيل للفئة ParseApi.
  • ثالثًا ، قم بإنشاء مثيل للفئة FileInfo.
  • بعد ذلك ، قم بتعيين المسار إلى ملف Word كمدخل.
  • ثم قم بإنشاء مثيل لفئة ImagesOptions().
  • بعد ذلك ، قم بتعيين fileInfo إلى خيار الصورة setFileInfo.
  • بعد ذلك ، قم بتوفير قيمتي setStartPageNumber و setCountPagesToExtract.
  • الآن ، قم بإنشاء مثيل لفئة ImagesRequest() وقم بتمرير المعلمة ImagesOptions.
  • أخيرًا ، احصل على النتائج عن طريق استدعاء طريقة ParseApi.images() وتمرير المعلمة ImagesRequest.

يوضح نموذج التعليمات البرمجية التالي كيفية استخراج صور معينة من ملف Word حسب نطاق الصفحات في Java باستخدام REST API:

package com.groupdocsdev.classes;

import com.groupdocs.cloud.parser.api.ParseApi;
import com.groupdocs.cloud.parser.client.ApiException;
import com.groupdocs.cloud.parser.client.Configuration;
import com.groupdocs.cloud.parser.model.FileInfo;
import com.groupdocs.cloud.parser.model.ImagesOptions;
import com.groupdocs.cloud.parser.model.ImagesResult;
import com.groupdocs.cloud.parser.model.requests.ImagesRequest;

// استخرج الصور من ملف Word عبر الإنترنت حسب نطاق الصفحات في Java.
public class App {

	public static void main(String[] args) {
		
		// قم بإنشاء مثيل من Parse API
		ParseApi apiInstance = new ParseApi(configuration);

		try {

			// تحضير الإعدادات
			FileInfo fileInfo = new FileInfo();
			fileInfo.setFilePath("java-testing/input-sample-file.docx");

			ImagesOptions options = new ImagesOptions();
			options.setFileInfo(fileInfo);
			options.setStartPageNumber(1);
			options.setCountPagesToExtract(2);
			ImagesRequest request = new ImagesRequest(options);
			ImagesResult response = apiInstance.images(request);

			// الحصول على مسار ملف الإخراج
			System.out.println("Output file path: " + response.getPath());
				
		} catch (ApiException e) {
			System.err.println("Exception while calling FileApi:");
			e.printStackTrace();
		}
		
	}
}

مستخرج الصور على الإنترنت مجانًا

ما هي أفضل طريقة لاستخراج الصور من Word عبر الإنترنت مجانًا؟ الرجاء محاولة محلل مستندات Word عبر الإنترنت لاستخراج الصور من Word. تم تطوير أداة Word Parser هذه باستخدام مكتبة محلل Java المذكورة أعلاه.

خاتمة

في الختام ، يعد GroupDocs.Parser Cloud SDK حلاً ممتازًا لاستخراج الصور من مستندات Word ، مما يوفر الوقت والجهد مع ضمان نتائج دقيقة. فيما يلي ما تعلمته من هذه المقالة:

  • كيفية استخراج جميع الصور من Word DOCX برمجيًا في Java باستخدام REST API ؛
  • كيفية استخراج صور محددة من مستندات Word في Java باستخدام REST API ؛
  • وأداة استخراج الصور عبر الإنترنت لاستخراج الصور من مستندات Word.

بالإضافة إلى ذلك ، يمكنك معرفة المزيد حول GroupDocs.Parser Cloud API باستخدام التوثيق. نوفر أيضًا قسم مرجع واجهة برمجة التطبيقات الذي يتيح لك تصور واجهات برمجة التطبيقات الخاصة بنا والتفاعل معها مباشرةً من خلال المتصفح. شفرة المصدر الكاملة لـ Java SDK متاحة مجانًا على Github.

أخيرًا ، نواصل كتابة مقالات مدونة جديدة حول تنسيقات ملفات مختلفة وتحليلها باستخدام REST API. لذا ، يرجى التواصل معنا للحصول على آخر التحديثات.

طرح سؤال

في حال كان لديك أي استفسارات حول كيفية استخراج الصور من المستندات ، فلا تتردد في الاتصال بنا عبر المنتدى.

أسئلة وأجوبة

كيف يمكنني تحليل مستندات Word في Java؟

لاستخراج الصور أو النص ، تحتاج أولاً إلى تحميل مستند Word وتحليله باستخدام GroupDocs.Parser Cloud SDK. تتضمن هذه العملية تحديد مسار الملف واستدعاء طريقة التحليل لتحليل المستندات.

هل يمكن لـ GroupDocs.Parser Cloud SDK استخراج الصور من تنسيقات المستندات الأخرى؟

نعم ، GroupDocs.Parser Cloud SDK for Java تدعم استخراج الصور من تنسيقات المستندات المختلفة ، بما في ذلك Word و PDF و Excel و PowerPoint وغيرها الكثير.

هل تستطيع GroupDocs.Parser Cloud SDK استخراج صور متعددة من مستند Word واحد؟

نعم ، يمكن لـ SDK استخراج صور متعددة من مستند Word واحد ، مما يوفر لك جميع الصور الموجودة في المستند.

هل تحافظ مجموعة GroupDocs.Parser Cloud SDK على جودة الصورة الأصلية أثناء عملية الاستخراج؟

نعم ، تحافظ GroupDocs.Parser Cloud SDK for Java على جودة الصورة الأصلية أثناء استخراج الصور من مستندات Word.

أنظر أيضا

فيما يلي بعض المقالات ذات الصلة التي قد تجدها مفيدة: