محلل مستندات Word - استخراج الصور من ملف Word عبر الإنترنت باستخدام Java

parsing الوثائق مهمة حاسمة في العديد من الصناعات حيث يعد استخراج البيانات من تنسيقات الوثائق المختلفة أمرًا مطلوبًا. عند العمل مع Word، يمكن أن يكون استخراج الصور مفيدًا بشكل خاص في حالات مثل تحليل المحتوى، والتعرف على الصور، أو تصور البيانات. يمكن أن يكون استخراج الصور يدويًا من مستندات Word الكبيرة مستغرقًا للوقت. لذا، يمكن أن يوفر أتمتة عملية استخراج الصور الوقت والجهد. في هذه المقالة، سنقوم بشرح كيفية استخراج الصور من مستندات Word برمجيًا في Java.

سيتم تناول المواضيع التالية في هذه المقالة:

Java REST API to Extract Images from Word Documents and SDK Installation

GroupDocs.Parser Cloud SDK for Java هي مكتبة Java قوية توفر وسيلة بسيطة وفعالة لتحليل واستخراج البيانات من تنسيقات المستندات المختلفة، بما في ذلك مستندات وورد. تقدم مجموعة واسعة من الميزات لتحليل المستندات، مما يسمح للمطورين باستخراج الصور والنصوص والبيانات الوصفية والمزيد. كما توفر GroupDocs.Parser أيضًا SDKs لـ C#.NET، جافا، PHP، روبي، وبايثون كأعضاء في عائلة محلل المستندات APIs السحابية.

للبدء، تحتاج إلى تضمين مجموعة GroupDocs.Parser Cloud SDK في مشروع Java الخاص بك. يمكنك إما download ملف JAR الخاص بالواجهة البرمجية أو تثبيته باستخدام Maven عن طريق إضافة المستودع والاعتماد التاليين إلى ملف pom.xml الخاص بمشروعك:

مستودع مافن:

<repository>
    <id>groupdocs-artifact-repository</id>
    <name>GroupDocs Artifact Repository</name>
    <url>https://repository.groupdocs.cloud/repo</url>
</repository>

Maven Dependency:

<dependency>
    <groupId>com.groupdocs</groupId>
    <artifactId>groupdocs-parser-cloud</artifactId>
    <version>23.3</version>
    <scope>compile</scope>
</dependency>

بعد ذلك، تحتاج إلى sign up للحصول على حساب تجريبي مجاني أو purchase a subscription plan على موقع GroupDocs و get your API key. بمجرد أن تحصل على معرف العميل والسر السري للعميل، أضف شريحة الكود أدناه إلى تطبيق يعتمد على Java:

# احصل على clientid و clientsecret من https://dashboard.groupdocs.cloud بعد التسجيل.

String ClientId = "xxxxxxxx-xxxx-xxxx-xxxx-xxxxxxxxxxxx";
String ClientSecret = "xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx";
String MyStorage = "test-internal-storage";
Configuration configuration = new Configuration(ClientId, ClientSecret);

كيفية استخراج جميع الصور من مستندات Word في Java باستخدام واجهة برمجة التطبيقات REST

لاستخراج الصور من مستندات Word في Java باستخدام GroupDocs.Parser Cloud SDK، اتبع الخطوات التالية ومقتطف كود مثال:

  • أولاً، استورد الفئات المطلوبة في ملف Java الخاص بك.
  • ثانياً، قم بإنشاء نسخة من فئة ParseApi.
  • ثالثاً، أنشئ مثيلاً من فئة FileInfo.
  • التالي، قم بتعيين المسار إلى مستند Word المدخل.
  • ثم، قم بإنشاء مثيل من فئة ImagesOptions().
  • بعد ذلك، قم بتعيين fileInfo إلى خيار صورة setFileInfo.
  • الآن، أنشئ مثيلًا من فئة ImagesRequest() ومرر معامل ImagesOptions.
  • أخيرًا، احصل على النتائج عن طريق استدعاء ParseApi.images() method وتمرير معلمة ImagesRequest.

الكود العينة التالي يوضح كيفية استخراج جميع الصور من مستند وورد عبر الإنترنت باستخدام Java و REST API:

package com.groupdocsdev.classes;

import com.groupdocs.cloud.parser.api.ParseApi;
import com.groupdocs.cloud.parser.client.ApiException;
import com.groupdocs.cloud.parser.client.Configuration;
import com.groupdocs.cloud.parser.model.FileInfo;
import com.groupdocs.cloud.parser.model.ImagesOptions;
import com.groupdocs.cloud.parser.model.ImagesResult;
import com.groupdocs.cloud.parser.model.requests.ImagesRequest;

// كيف تستخرج الصور من مستند Word باستخدام Java.
public class App {

	public static void main(String[] args) {
		
		// إنشاء مثيل من واجهة برمجة تطبيقات Parse
		ParseApi apiInstance = new ParseApi(configuration);

		try {

			// جهز الإعدادات
			FileInfo fileInfo = new FileInfo();
			fileInfo.setFilePath("java-testing/input-sample-file.docx");

			ImagesOptions options = new ImagesOptions();
			options.setFileInfo(fileInfo);
			ImagesRequest request = new ImagesRequest(options);
			ImagesResult response = apiInstance.images(request);

			// احصل على مسار ملف الإخراج
			System.out.println("Output file path: " + response.getPath());
				
		} catch (ApiException e) {
			System.err.println("Exception while calling FileApi:");
			e.printStackTrace();
		}
		
	}
}

استخراج صور معينة من ملف Word في Java باستخدام رقم الصفحة

في هذا القسم، سنكتب خطوات ومثال على مقتطف شفرة لاستخراج صور محددة من مستند وورد برمجيًا بلغة جافا:

  • أولاً، استورد الفئات المطلوبة في ملف Java الخاص بك.
  • ثانياً، أنشئ نسخة من فئة ParseApi.
  • ثالثًا، أنشئ مثيلًا من فئة FileInfo.
  • بعد ذلك، قم بتعيين مسار ملف Word كإدخال.
  • ثم، قم بإنشاء مثيل من فئة ImagesOptions().
  • بعد ذلك، قم بتعيين fileInfo إلى خيار صورة setFileInfo.
  • ثم، قدم قيم setStartPageNumber و setCountPagesToExtract.
  • الآن، أنشئ مثيلًا من فئة ImagesRequest() ومرر معامل ImagesOptions.
  • أخيرًا، احصل على النتائج من خلال استدعاء ParseApi.images() الطريقة وتمرير معلمة ImagesRequest.

تظهر عينة الكود التالية كيفية استخراج صور معينة من ملف Word حسب نطاق الصفحات في Java باستخدام واجهة REST API:

package com.groupdocsdev.classes;

import com.groupdocs.cloud.parser.api.ParseApi;
import com.groupdocs.cloud.parser.client.ApiException;
import com.groupdocs.cloud.parser.client.Configuration;
import com.groupdocs.cloud.parser.model.FileInfo;
import com.groupdocs.cloud.parser.model.ImagesOptions;
import com.groupdocs.cloud.parser.model.ImagesResult;
import com.groupdocs.cloud.parser.model.requests.ImagesRequest;

// استخراج الصور من ملف Word عبر الإنترنت حسب نطاق الصفحات في Java.
public class App {

	public static void main(String[] args) {
		
		// إنشاء مثال من واجهة برمجة التطبيقات Parse
		ParseApi apiInstance = new ParseApi(configuration);

		try {

			// قم بإعداد الإعدادات
			FileInfo fileInfo = new FileInfo();
			fileInfo.setFilePath("java-testing/input-sample-file.docx");

			ImagesOptions options = new ImagesOptions();
			options.setFileInfo(fileInfo);
			options.setStartPageNumber(1);
			options.setCountPagesToExtract(2);
			ImagesRequest request = new ImagesRequest(options);
			ImagesResult response = apiInstance.images(request);

			// تحصل على مسار ملف الإخراج
			System.out.println("Output file path: " + response.getPath());
				
		} catch (ApiException e) {
			System.err.println("Exception while calling FileApi:");
			e.printStackTrace();
		}
		
	}
}

موصل استخراج الصور المجاني عبر الإنترنت

ما هي أفضل طريقة لاستخراج الصور من Word عبر الإنترنت مجانًا؟ يرجى تجربة أداة online Word document parser لاستخراج الصور من Word. تم تطوير أداة Word Parser هذه باستخدام مكتبة تحليل Java المذكورة أعلاه.

استنتاج

في الختام ، يعد GroupDocs.Parser Cloud SDK حلاً ممتازًا لاستخراج الصور من مستندات Word ، مما يوفر الوقت والجهد مع ضمان نتائج دقيقة. فيما يلي ما تعلمته من هذه المقالة:

  • how to extract all images from Word DOCX programmatically in Java using REST API;
  • كيف تستخرج صور معينة من مستندات Word في Java باستخدام واجهة برمجة التطبيقات REST؛
  • وأداة استخراج الصور عبر الإنترنت لاستخراج الصور من مستندات وورد.

بالإضافة إلى ذلك، يمكنك معرفة المزيد عن واجهة برمجة التطبيقات السحابية GroupDocs.Parser من خلال documentation. كما نقدم قسم API Reference الذي يسمح لك برؤية والتفاعل مع واجهات برمجة التطبيقات الخاصة بنا مباشرة عبر المتصفح. الكود المصدري الكامل لـ Java SDK متاح مجانًا على Github.

أخيرًا، نستمر في كتابة مقالات مدونة جديدة حول تنسيقات الملفات المختلفة وكيفية تحليلها باستخدام REST API. لذا، يرجى التواصل للحصول على أحدث التحديثات.

Ask a question

في حال كان لديك أي استفسارات حول كيفية استخراج الصور من الوثائق، فلا تتردد في الاتصال بنا عبر forum.

النشرات الشائعة

كيف أقوم بتحليل مستندات Word في Java؟

لاستخراج الصور أو النصوص، تحتاج أولاً إلى تحميل وتحليل مستند Word باستخدام GroupDocs.Parser Cloud SDK. تتضمن هذه العملية تحديد مسار الملف واستدعاء طريقة التحليل لتحليل المستندات.

هل يمكن لمجموعة GroupDocs.Parser Cloud SDK استخراج الصور من تنسيقات مستندات أخرى؟

نعم، GroupDocs.Parser Cloud SDK for Java يدعم استخراج الصور من تنسيقات مستندات متنوعة، بما في ذلك وورد، PDF، إكسل، باوربوينت، والعديد غيرها.

Can the GroupDocs.Parser Cloud SDK extract multiple images from a single Word document?

نعم، يمكن لــ SDK استخراج صور متعددة من مستند Word واحد، مما يوفر لك جميع الصور المحتواة ضمن المستند.

هل يحتفظ مجموعة GroupDocs.Parser Cloud SDK بجودة الصورة الأصلية أثناء عملية الاستخراج؟

نعم، GroupDocs.Parser Cloud SDK for Java يحافظ على جودة الصورة الأصلية أثناء استخراج الصور من مستندات Word.

انظر أيضا

إليك بعض المقالات ذات الصلة التي قد تجدها مفيدة: