برنامج تحليل ملفات PDF - استخراج الصور من ملفات PDF عبر الإنترنت بلغة Java

PDF(Portable Document Format) هو تنسيق ملف مستخدم على نطاق واسع لمشاركة المستندات والحفاظ عليها عبر الإنترنت. غالبًا ما يحتوي على أنواع مختلفة من المحتوى، بما في ذلك النصوص والصور والجداول والمزيد. استخراج محتوى محدد من ملفات PDF، مثل الصور، يمكن أن يكون مهمة صعبة دون أدوات موثوقة أو مكتبة. أحد هذه الأدوات هو GroupDocs.Parser Cloud SDK لـ Java، الذي يوفر وسيلة سلسة وفعالة لاستخراج الصور من ملفات PDF. في هذه المقالة، سنوضح كيفية استخراج الصور من ملفات PDF في Java باستخدام واجهة برمجة التطبيقات REST.

سيتم تناول المواضيع التالية في هذه المقالة:

Java REST API لفصل الصور عن PDF وتثبيت SDK

GroupDocs.Parser Cloud SDK for Java هو مكتبة Java قوية ومتعددة الاستخدامات توفر طريقة بسيطة وفعالة لتحليل واستخراج البيانات من تنسيقات المستندات المختلفة، بما في ذلك ملفات PDF. تقدم مجموعة واسعة من الميزات لتحليل المستندات، مما يسمح للمطورين باستخراج الصور والنصوص والبيانات الوصفية ومحتويات أخرى. كما توفر GroupDocs.Parser أيضًا C#.NET و Java و PHP و Ruby و Python SDKs كأعضاء في عائلة محلل المستندات الخاصة بها لواجهات برمجة التطبيقات السحابية.

للبدء، تحتاج إلى تضمين مجموعة GroupDocs.Parser Cloud SDK في مشروع Java الخاص بك. يمكنك إما download ملف JAR لواجهة البرمجة أو تثبيته باستخدام Maven عن طريق إضافة المستودع واعتماد التالي في ملف pom.xml الخاص بمشروعك:

مستودع مافن:

<repository>
    <id>groupdocs-artifact-repository</id>
    <name>GroupDocs Artifact Repository</name>
    <url>https://repository.groupdocs.cloud/repo</url>
</repository>

اعتماد مافن:

<dependency>
    <groupId>com.groupdocs</groupId>
    <artifactId>groupdocs-parser-cloud</artifactId>
    <version>23.3</version>
    <scope>compile</scope>
</dependency>

بعد ذلك، تحتاج إلى sign up للحصول على حساب تجريبي مجاني أو purchase a subscription plan على موقع GroupDocs و get your API key. بمجرد أن يكون لديك Client Id و Client Secret، أضف الشيفرة التالية إلى تطبيق قائم على Java:

# احصل على clientid و clientsecret الخاصين بك من https://dashboard.groupdocs.cloud بعد التسجيل.

String ClientId = "xxxxxxxx-xxxx-xxxx-xxxx-xxxxxxxxxxxx";
String ClientSecret = "xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx";
String MyStorage = "test-internal-storage";
Configuration configuration = new Configuration(ClientId, ClientSecret);

كيف لاستخراج جميع الصور من ملفات PDF في Java باستخدام واجهة برمجة التطبيقات REST

الآن، دعونا نكتب الخطوات ومثال على كود لاستخراج الصور من ملفات PDF باستخدام GroupDocs.Parser Cloud SDK لـ Java:

  • أولاً، قم باستيراد الفئات المطلوبة إلى ملف Java الخاص بك.
  • ثانياً، أنشئ مثيلاً من فئة ParseApi.
  • ثالثًا، أنشئ مثيلًا من فئة FileInfo.
  • التالي، قم بتعيين المسار إلى وثيقة PDF المدخلة.
  • ثم، أنشئ مثيلًا من فئة ImagesOptions().
  • بعد ذلك، قم بتعيين fileInfo إلى خيار صورة setFileInfo.
  • الآن، أنشئ نموذجًا من فئة ImagesRequest() ومرر باراميتر ImagesOptions.
  • أخيرًا، احصل على النتائج عن طريق استدعاء ParseApi.images() وتمرير معلمة ImagesRequest.

عينة الكود التالية توضح كيفية استخراج جميع الصور من ملف PDF عبر الإنترنت باستخدام Java و REST API:

package com.groupdocsdev.classes;

import com.groupdocs.cloud.parser.api.ParseApi;
import com.groupdocs.cloud.parser.client.ApiException;
import com.groupdocs.cloud.parser.client.Configuration;
import com.groupdocs.cloud.parser.model.FileInfo;
import com.groupdocs.cloud.parser.model.ImagesOptions;
import com.groupdocs.cloud.parser.model.ImagesResult;
import com.groupdocs.cloud.parser.model.requests.ImagesRequest;

// How to extract images from a PDF file in Java.
public class App {

	public static void main(String[] args) {
		
		// قم بإنشاء مثيل من واجهة برمجة تطبيقات Parse
		ParseApi apiInstance = new ParseApi(configuration);

		try {

			// قم بإعداد الإعدادات
			FileInfo fileInfo = new FileInfo();
			fileInfo.setFilePath("java-testing/input-sample-file.pdf");

			ImagesOptions options = new ImagesOptions();
			options.setFileInfo(fileInfo);
			ImagesRequest request = new ImagesRequest(options);
			ImagesResult response = apiInstance.images(request);

			// احصل على مسار ملف الإخراج
			System.out.println("Output file path: " + response.getPath());
				
		} catch (ApiException e) {
			System.err.println("Exception while calling FileApi:");
			e.printStackTrace();
		}
		
	}
}

استخراج صور معينة من ملفات PDF في Java باستخدام رقم الصفحة

في هذا القسم، سنقدم خطوات ومقتطف كود لاستخراج صور محددة من ملف PDF برمجيًا بلغة Java:

  • أولاً، قم باستيراد الفئات المطلوبة إلى ملف Java الخاص بك.
  • ثانياً، قم بإنشاء نسخة من فئة ParseApi.
  • ثالثاً، قم بإنشاء مثيل من فئة FileInfo.
  • التالي، قم بتعيين المسار إلى وثيقة PDF المدخلة.
  • ثم، أنشئ مثيلًا من فئة ImagesOptions().
  • بعد ذلك، قم بتعيين fileInfo إلى خيار صورة setFileInfo.
  • ثم، قدم قيم setStartPageNumber و setCountPagesToExtract.
  • الآن، أنشئ نموذجًا من فئة ImagesRequest() ومرر باراميتر ImagesOptions.
  • أخيرًا، احصل على النتائج عن طريق استدعاء ParseApi.images() وطريقة تمرير معلمة ImagesRequest.

عينة الكود التالية توضح كيفية استخراج صور محددة من ملف PDF حسب نطاق الصفحات في Java باستخدام واجهة برمجة التطبيقات REST:

package com.groupdocsdev.classes;

import com.groupdocs.cloud.parser.api.ParseApi;
import com.groupdocs.cloud.parser.client.ApiException;
import com.groupdocs.cloud.parser.client.Configuration;
import com.groupdocs.cloud.parser.model.FileInfo;
import com.groupdocs.cloud.parser.model.ImagesOptions;
import com.groupdocs.cloud.parser.model.ImagesResult;
import com.groupdocs.cloud.parser.model.requests.ImagesRequest;

// استخراج الصور من ملف PDF عبر الإنترنت حسب نطاق الصفحات في Java.
public class App {

	public static void main(String[] args) {
		
		// أنشئ مثيلًا لواجهة برمجة تطبيقات Parse
		ParseApi apiInstance = new ParseApi(configuration);

		try {

			// قم بإعداد الإعدادات
			FileInfo fileInfo = new FileInfo();
			fileInfo.setFilePath("java-testing/input-sample-file.pdf");

			ImagesOptions options = new ImagesOptions();
			options.setFileInfo(fileInfo);
			options.setStartPageNumber(1);
			options.setCountPagesToExtract(2);
			ImagesRequest request = new ImagesRequest(options);
			ImagesResult response = apiInstance.images(request);

			// الحصول على مسار ملف الإخراج
			System.out.println("Output file path: " + response.getPath());
				
		} catch (ApiException e) {
			System.err.println("Exception while calling FileApi:");
			e.printStackTrace();
		}
		
	}
}

مستخرج الصور المجانية عبر الإنترنت

ما هو أفضل طريقة لاستخراج الصور من PDF عبر الإنترنت مجانًا؟ يرجى تجربة online PDF File parser لاستخراج الصور من ملفات PDF. تم تطوير برنامج PDF Parser هذا باستخدام Java كما هو مذكور أعلاه في مكتبة parser.

استنتاج

في الختام، يوفر GroupDocs.Parser Cloud SDK لـ Java حلاً موثوقًا وفعالًا لاستخراج الصور من ملفات PDF بسهولة. ما يلي هو ما تعلمته من هذه المقالة:

  • How to extract all images from PDF files programmatically in Java using REST API;
  • كيف تستخرج صور معينة من مستندات PDF في Java باستخدام واجهة برمجة التطبيقات REST؛
  • أداة استخراج الصور عبر الإنترنت لاستخراج الصور من مستندات PDF.

بالإضافة إلى ذلك، يمكنك معرفة المزيد عن واجهة برمجة التطبيقات (API) السحابية لمجموعة مستندات المحلل باستخدام documentation. نحن نقدم أيضًا قسم API Reference الذي يتيح لك تصور والتفاعل مع واجهات برمجة التطبيقات لدينا مباشرة من خلال المتصفح. الكود المصدري الكامل لمجموعة تطوير Java متاح مجانًا على Github.

أخيرًا، نستمر في كتابة مقالات جديدة على المدونة حول تنسيقات الملفات المختلفة وتحليلها باستخدام REST API. لذا، يرجى التواصل للحصول على أحدث التحديثات.

اسأل سؤالاً

في حال كان لديك أي استفسارات حول كيفية تحليل المستندات، لا تتردد في الاتصال بنا عبر forum.

الأسئلة المتكررة

How do I parse PDF files using Java?

لاستخراج الصور أو النصوص أو البيانات الوصفية، تحتاج أولاً إلى تحميل وتحليل وثيقة PDF باستخدام GroupDocs.Parser Cloud SDK. تنطوي هذه العملية على تحديد مسار الملف واستدعاء طريقة Parse لتحليل ملفات PDF.

هل يدعم GroupDocs.Parser Cloud SDK لـ Java تنسيقات ملفات أخرى بخلاف PDF؟

نعم، بالإضافة إلى ملفات PDF، GroupDocs.Parser Cloud SDK for Java يدعم استخراج الصور من صيغ مستندات مختلفة، بما في ذلك Word و Excel و PowerPoint و HTML والمزيد.

Can I extract all images from a PDF file using GroupDocs.Parser Cloud SDK for Java?

نعم، يمكنك استخراج جميع الصور من ملف PDF باستخدام GroupDocs.Parser Cloud SDK for Java.

انظر أيضًا

إليك بعض المقالات ذات الصلة التي قد تجدها مفيدة: