؛ PDF File Parser - استخراج الصور من ملفات PDF عبر الإنترنت في Java

PDF(تنسيق المستند المحمول) هو تنسيق ملف يستخدم على نطاق واسع لمشاركة المستندات وحفظها عبر الإنترنت. غالبًا ما يحتوي على أنواع مختلفة من المحتوى ، بما في ذلك النصوص والصور والجداول والمزيد. يمكن أن يكون استخراج محتوى معين من ملفات PDF ، مثل الصور ، مهمة صعبة بدون أدوات موثوقة أو مكتبة. إحدى هذه الأدوات هي GroupDocs.Parser Cloud SDK for Java ، والتي توفر طريقة سلسة وفعالة لاستخراج الصور من ملفات PDF. في هذه المقالة ، سنشرح كيفية استخراج الصور من ملفات PDF في Java باستخدام REST API.

سيتم تناول الموضوعات التالية في هذه المقالة:

Java REST API لفصل الصور عن تثبيت PDF و SDK

GroupDocs.Parser Cloud SDK for Java هي مكتبة Java قوية ومتعددة الاستخدامات توفر طريقة بسيطة وفعالة لتحليل واستخراج البيانات من تنسيقات المستندات ، بما في ذلك ملفات PDF. يوفر مجموعة واسعة من الميزات لتحليل المستندات ، مما يسمح للمطورين باستخراج الصور والنصوص والبيانات الوصفية والمحتويات الأخرى. يوفر GroupDocs.Parser أيضًا C# .NET ، و Java ، و PHP ، و Ruby ، و Python SDK باعتبارها أعضاء عائلة محلل المستندات لواجهات برمجة التطبيقات السحابية.

للبدء ، تحتاج إلى تضمين GroupDocs.Parser Cloud SDK في مشروع Java الخاص بك. يمكنك إما تنزيل ملف JAR الخاص بواجهة برمجة التطبيقات أو تثبيته باستخدام Maven عن طريق إضافة المستودع التالي والتبعية إلى ملف pom.xml الخاص بمشروعك:

مستودع مافن:

<repository>
    <id>groupdocs-artifact-repository</id>
    <name>GroupDocs Artifact Repository</name>
    <url>https://repository.groupdocs.cloud/repo</url>
</repository>

تبعية المخضرم:

<dependency>
    <groupId>com.groupdocs</groupId>
    <artifactId>groupdocs-parser-cloud</artifactId>
    <version>23.3</version>
    <scope>compile</scope>
</dependency>

بعد ذلك ، تحتاج إلى التسجيل للحصول على حساب تجريبي مجاني أو شراء خطة اشتراك على موقع GroupDocs و الحصول على مفتاح API الخاص بك. بمجرد حصولك على معرف العميل وسر العميل ، أضف مقتطف الشفرة أدناه إلى تطبيق يستند إلى Java:

# احصل على client_id و client_secret من https://dashboard.groupdocs.cloud بعد التسجيل.

String ClientId = "xxxxxxxx-xxxx-xxxx-xxxx-xxxxxxxxxxxx";
String ClientSecret = "xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx";
String MyStorage = "test-internal-storage";
Configuration configuration = new Configuration(ClientId, ClientSecret);

كيفية استخراج جميع الصور من ملفات PDF في جافا باستخدام واجهة برمجة تطبيقات REST

الآن ، دعنا نكتب الخطوات ومثال مقتطف رمز لاستخراج الصور من ملفات PDF باستخدام GroupDocs.Parser Cloud SDK لجافا:

  • أولاً ، قم باستيراد الفئات المطلوبة إلى ملف Java الخاص بك.
  • ثانيًا ، قم بإنشاء مثيل للفئة ParseApi.
  • ثالثًا ، قم بإنشاء مثيل للفئة FileInfo.
  • بعد ذلك ، قم بتعيين المسار إلى مستند PDF المدخل.
  • ثم قم بإنشاء مثيل لفئة ImagesOptions().
  • بعد ذلك ، قم بتعيين fileInfo إلى خيار الصورة setFileInfo.
  • الآن ، قم بإنشاء مثيل لفئة ImagesRequest() وقم بتمرير المعلمة ImagesOptions.
  • أخيرًا ، احصل على النتائج عن طريق استدعاء طريقة ParseApi.images() وتمرير المعلمة ImagesRequest.

يوضح نموذج التعليمات البرمجية التالي كيفية استخراج جميع الصور من ملف PDF عبر الإنترنت في Java باستخدام REST API:

package com.groupdocsdev.classes;

import com.groupdocs.cloud.parser.api.ParseApi;
import com.groupdocs.cloud.parser.client.ApiException;
import com.groupdocs.cloud.parser.client.Configuration;
import com.groupdocs.cloud.parser.model.FileInfo;
import com.groupdocs.cloud.parser.model.ImagesOptions;
import com.groupdocs.cloud.parser.model.ImagesResult;
import com.groupdocs.cloud.parser.model.requests.ImagesRequest;

// كيفية استخراج الصور من ملف PDF بجافا.
public class App {

	public static void main(String[] args) {
		
		// قم بإنشاء مثيل من Parse API
		ParseApi apiInstance = new ParseApi(configuration);

		try {

			// تحضير الإعدادات
			FileInfo fileInfo = new FileInfo();
			fileInfo.setFilePath("java-testing/input-sample-file.pdf");

			ImagesOptions options = new ImagesOptions();
			options.setFileInfo(fileInfo);
			ImagesRequest request = new ImagesRequest(options);
			ImagesResult response = apiInstance.images(request);

			// الحصول على مسار ملف الإخراج
			System.out.println("Output file path: " + response.getPath());
				
		} catch (ApiException e) {
			System.err.println("Exception while calling FileApi:");
			e.printStackTrace();
		}
		
	}
}

استخراج صور معينة من ملفات PDF في جافا باستخدام رقم الصفحة

في هذا القسم ، سنقدم خطوات ومقتطف رمز لاستخراج صور معينة من ملف PDF برمجيًا في Java:

  • أولاً ، قم باستيراد الفئات المطلوبة إلى ملف Java الخاص بك.
  • ثانيًا ، قم بإنشاء مثيل للفئة ParseApi.
  • ثالثًا ، قم بإنشاء مثيل للفئة FileInfo.
  • بعد ذلك ، قم بتعيين المسار إلى مستند PDF المدخل.
  • ثم قم بإنشاء مثيل لفئة ImagesOptions().
  • بعد ذلك ، قم بتعيين fileInfo إلى خيار الصورة setFileInfo.
  • بعد ذلك ، قم بتوفير قيمتي setStartPageNumber و setCountPagesToExtract.
  • الآن ، قم بإنشاء مثيل لفئة ImagesRequest() وقم بتمرير المعلمة ImagesOptions.
  • أخيرًا ، احصل على النتائج عن طريق استدعاء طريقة ParseApi.images() وتمرير المعلمة ImagesRequest.

يوضح نموذج التعليمات البرمجية التالي كيفية استخراج صور معينة من ملف PDF حسب نطاق الصفحات في Java باستخدام REST API:

package com.groupdocsdev.classes;

import com.groupdocs.cloud.parser.api.ParseApi;
import com.groupdocs.cloud.parser.client.ApiException;
import com.groupdocs.cloud.parser.client.Configuration;
import com.groupdocs.cloud.parser.model.FileInfo;
import com.groupdocs.cloud.parser.model.ImagesOptions;
import com.groupdocs.cloud.parser.model.ImagesResult;
import com.groupdocs.cloud.parser.model.requests.ImagesRequest;

// استخرج الصور من ملف PDF عبر الإنترنت حسب نطاق الصفحات في Java.
public class App {

	public static void main(String[] args) {
		
		// قم بإنشاء مثيل من Parse API
		ParseApi apiInstance = new ParseApi(configuration);

		try {

			// تحضير الإعدادات
			FileInfo fileInfo = new FileInfo();
			fileInfo.setFilePath("java-testing/input-sample-file.pdf");

			ImagesOptions options = new ImagesOptions();
			options.setFileInfo(fileInfo);
			options.setStartPageNumber(1);
			options.setCountPagesToExtract(2);
			ImagesRequest request = new ImagesRequest(options);
			ImagesResult response = apiInstance.images(request);

			// الحصول على مسار ملف الإخراج
			System.out.println("Output file path: " + response.getPath());
				
		} catch (ApiException e) {
			System.err.println("Exception while calling FileApi:");
			e.printStackTrace();
		}
		
	}
}

مستخرج الصور المجانية على الإنترنت

ما هي أفضل طريقة لاستخراج الصور من PDF عبر الإنترنت مجانًا؟ الرجاء محاولة محلل ملفات PDF عبر الإنترنت لاستخراج الصور من ملفات PDF. تم تطوير برنامج محلل PDF باستخدام Java كما هو مذكور أعلاه مكتبة المحلل اللغوي.

خاتمة

في الختام ، يوفر GroupDocs.Parser Cloud SDK لـ Java حلاً موثوقًا وفعالًا لاستخراج الصور من ملفات PDF بسهولة. فيما يلي ما تعلمته من هذه المقالة:

  • كيفية استخراج جميع الصور من ملفات PDF برمجيًا في Java باستخدام REST API ؛
  • كيفية استخراج صور محددة من مستندات PDF في Java باستخدام REST API ؛
  • وأداة استخراج الصور عبر الإنترنت لاستخراج الصور من مستندات PDF.

بالإضافة إلى ذلك ، يمكنك معرفة المزيد حول GroupDocs.Parser Cloud API باستخدام التوثيق. نوفر أيضًا قسم مرجع واجهة برمجة التطبيقات الذي يتيح لك تصور واجهات برمجة التطبيقات الخاصة بنا والتفاعل معها مباشرةً من خلال المتصفح. شفرة المصدر الكاملة لـ Java SDK متاحة مجانًا على Github.

أخيرًا ، نواصل كتابة مقالات مدونة جديدة حول تنسيقات ملفات مختلفة وتحليلها باستخدام REST API. لذا ، يرجى التواصل معنا للحصول على آخر التحديثات.

طرح سؤال

في حالة وجود أي استفسارات حول كيفية تحليل المستندات ، فلا تتردد في الاتصال بنا عبر المنتدى.

أسئلة وأجوبة

كيف يمكنني تحليل ملفات PDF باستخدام Java؟

لاستخراج الصور أو النص أو البيانات الوصفية ، تحتاج أولاً إلى تحميل مستند PDF وتحليله باستخدام GroupDocs.Parser Cloud SDK. تتضمن هذه العملية تحديد مسار الملف واستدعاء طريقة التحليل لتحليل ملفات PDF.

هل يدعم GroupDocs.Parser Cloud SDK لـ Java تنسيقات الملفات الأخرى إلى جانب PDF؟

نعم ، بالإضافة إلى ملفات PDF ، تدعم GroupDocs.Parser Cloud SDK for Java استخراج الصور من تنسيقات المستندات المختلفة ، بما في ذلك Word و Excel و PowerPoint و HTML وغيرها الكثير.

هل يمكنني استخراج جميع الصور من ملف PDF باستخدام GroupDocs.Parser Cloud SDK لجافا؟

نعم ، يمكنك استخراج جميع الصور من ملف PDF باستخدام GroupDocs.Parser Cloud SDK لجافا.

أنظر أيضا

فيما يلي بعض المقالات ذات الصلة التي قد تجدها مفيدة: