تجزیه کننده فایل PDF - استخراج تصاویر از فایل های PDF آنلاین در جاوا

PDF(Portable Document Format) فرمت فایلی است که به طور گسترده برای به اشتراک گذاری و حفظ اسناد به صورت آنلاین استفاده می شود. اغلب حاوی انواع مختلفی از محتوا، از جمله متن، تصاویر، جداول و موارد دیگر است. استخراج محتوای خاص از فایل‌های PDF، مانند تصاویر، بدون ابزارهای قابل اعتماد یا کتابخانه می‌تواند یک کار چالش برانگیز باشد. یکی از این ابزارها GroupDocs.Parser Cloud SDK برای جاوا است که روشی یکپارچه و کارآمد برای استخراج تصاویر از فایل های PDF ارائه می دهد. در این مقاله نحوه استخراج تصاویر از فایل های PDF در جاوا با استفاده از REST API را نشان خواهیم داد.

موضوعات زیر در این مقاله پوشش داده خواهد شد:

Java REST API برای جدا کردن تصاویر از PDF و نصب SDK

GroupDocs.Parser Cloud SDK for Java یک کتابخانه قدرتمند و همه کاره جاوا است که راهی ساده و کارآمد برای تجزیه و استخراج داده ها از [فرمت های سند] مختلف، از جمله فایل های PDF، ارائه می دهد. طیف گسترده ای از ویژگی ها را برای تجزیه اسناد ارائه می دهد و به توسعه دهندگان اجازه می دهد تصاویر، متن، ابرداده و سایر محتواها را استخراج کنند. GroupDocs.Parser همچنین C#.NET، جاوا، PHP، Ruby و Python SDK را به عنوان [اعضای خانواده تجزیه کننده سند6 خود برای API های ابری ارائه می کند.

برای شروع، باید GroupDocs.Parser Cloud SDK را در پروژه جاوا خود قرار دهید. می توانید فایل JAR API را دانلود یا با استفاده از Maven با افزودن مخزن و وابستگی زیر به فایل pom.xml پروژه خود نصب کنید:

مخزن Maven:

<repository>
    <id>groupdocs-artifact-repository</id>
    <name>GroupDocs Artifact Repository</name>
    <url>https://repository.groupdocs.cloud/repo</url>
</repository>

وابستگی Maven:

<dependency>
    <groupId>com.groupdocs</groupId>
    <artifactId>groupdocs-parser-cloud</artifactId>
    <version>23.3</version>
    <scope>compile</scope>
</dependency>

در مرحله بعد، باید برای یک حساب آزمایشی رایگان ثبت نام کنید یا یک طرح اشتراک را خریداری کنید در وب‌سایت GroupDocs و کلید API خود را دریافت کنید. هنگامی که Client ID و Client Secret را دارید، قطعه کد زیر را به یک برنامه مبتنی بر جاوا اضافه کنید:

# پس از ثبت نام، client_id و client_secret خود را از https://dashboard.groupdocs.cloud دریافت کنید.

String ClientId = "xxxxxxxx-xxxx-xxxx-xxxx-xxxxxxxxxxxx";
String ClientSecret = "xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx";
String MyStorage = "test-internal-storage";
Configuration configuration = new Configuration(ClientId, ClientSecret);

نحوه استخراج همه تصاویر از فایل‌های PDF در جاوا با استفاده از REST API

اکنون، بیایید مراحل و یک نمونه کد کد را برای استخراج تصاویر از فایل‌های PDF با استفاده از GroupDocs.Parser Cloud SDK برای جاوا بنویسیم:

  • ابتدا کلاس های مورد نیاز را در فایل جاوا خود وارد کنید.
  • در مرحله دوم، یک نمونه از کلاس ParseApi ایجاد کنید.
  • سوم، یک نمونه از کلاس FileInfo ایجاد کنید.
  • سپس مسیر سند PDF ورودی را تنظیم کنید.
  • سپس، یک نمونه از کلاس ImagesOptions() ایجاد کنید.
  • سپس fileInfo را به گزینه setFileInfo image اختصاص دهید.
  • اکنون یک نمونه از کلاس ImagesRequest() بسازید و پارامتر ImagesOptions را پاس کنید.
  • در نهایت، با فراخوانی متد ParseApi.images() و پاس دادن پارامتر ImagesRequest به نتیجه برسید.

نمونه کد زیر نشان می دهد که چگونه می توان تمام تصاویر را از یک فایل PDF به صورت آنلاین در جاوا با استفاده از REST API استخراج کرد:

package com.groupdocsdev.classes;

import com.groupdocs.cloud.parser.api.ParseApi;
import com.groupdocs.cloud.parser.client.ApiException;
import com.groupdocs.cloud.parser.client.Configuration;
import com.groupdocs.cloud.parser.model.FileInfo;
import com.groupdocs.cloud.parser.model.ImagesOptions;
import com.groupdocs.cloud.parser.model.ImagesResult;
import com.groupdocs.cloud.parser.model.requests.ImagesRequest;

// نحوه استخراج تصاویر از فایل PDF در جاوا.
public class App {

	public static void main(String[] args) {
		
		// یک نمونه از Parse API ایجاد کنید
		ParseApi apiInstance = new ParseApi(configuration);

		try {

			// تنظیمات را آماده کنید
			FileInfo fileInfo = new FileInfo();
			fileInfo.setFilePath("java-testing/input-sample-file.pdf");

			ImagesOptions options = new ImagesOptions();
			options.setFileInfo(fileInfo);
			ImagesRequest request = new ImagesRequest(options);
			ImagesResult response = apiInstance.images(request);

			// دریافت مسیر فایل خروجی
			System.out.println("Output file path: " + response.getPath());
				
		} catch (ApiException e) {
			System.err.println("Exception while calling FileApi:");
			e.printStackTrace();
		}
		
	}
}

استخراج تصاویر خاص از فایل‌های PDF در جاوا با استفاده از شماره صفحه

در این بخش، مراحل و یک قطعه کد را برای استخراج تصاویر خاص از یک فایل PDF به صورت برنامه‌نویسی در جاوا ارائه می‌کنیم:

  • ابتدا کلاس های مورد نیاز را در فایل جاوا خود وارد کنید.
  • در مرحله دوم، یک نمونه از کلاس ParseApi ایجاد کنید.
  • سوم، یک نمونه از کلاس FileInfo ایجاد کنید.
  • سپس مسیر سند PDF ورودی را تنظیم کنید.
  • سپس، یک نمونه از کلاس ImagesOptions() ایجاد کنید.
  • سپس fileInfo را به گزینه setFileInfo image اختصاص دهید.
  • سپس مقادیر setStartPageNumber و setCountPagesToExtract را ارائه دهید.
  • اکنون یک نمونه از کلاس ImagesRequest() بسازید و پارامتر ImagesOptions را پاس کنید.
  • در نهایت، با فراخوانی متد ParseApi.images() و پاس دادن پارامتر ImagesRequest به نتیجه برسید.

نمونه کد زیر نحوه استخراج تصاویر خاص از یک فایل PDF را بر اساس محدوده صفحه در جاوا با استفاده از REST API نشان می دهد:

package com.groupdocsdev.classes;

import com.groupdocs.cloud.parser.api.ParseApi;
import com.groupdocs.cloud.parser.client.ApiException;
import com.groupdocs.cloud.parser.client.Configuration;
import com.groupdocs.cloud.parser.model.FileInfo;
import com.groupdocs.cloud.parser.model.ImagesOptions;
import com.groupdocs.cloud.parser.model.ImagesResult;
import com.groupdocs.cloud.parser.model.requests.ImagesRequest;

// استخراج تصاویر از یک فایل PDF به صورت آنلاین بر اساس محدوده صفحه در جاوا.
public class App {

	public static void main(String[] args) {
		
		// یک نمونه از Parse API ایجاد کنید
		ParseApi apiInstance = new ParseApi(configuration);

		try {

			// تنظیمات را آماده کنید
			FileInfo fileInfo = new FileInfo();
			fileInfo.setFilePath("java-testing/input-sample-file.pdf");

			ImagesOptions options = new ImagesOptions();
			options.setFileInfo(fileInfo);
			options.setStartPageNumber(1);
			options.setCountPagesToExtract(2);
			ImagesRequest request = new ImagesRequest(options);
			ImagesResult response = apiInstance.images(request);

			// دریافت مسیر فایل خروجی
			System.out.println("Output file path: " + response.getPath());
				
		} catch (ApiException e) {
			System.err.println("Exception while calling FileApi:");
			e.printStackTrace();
		}
		
	}
}

استخراج کننده تصاویر آنلاین رایگان

بهترین راه برای استخراج رایگان تصاویر از PDF به صورت آنلاین چیست؟ لطفاً یک تجزیه‌کننده آنلاین فایل PDF را برای استخراج تصاویر از فایل‌های PDF امتحان کنید. این نرم افزار تجزیه کننده PDF با استفاده از جاوا همانطور که در بالا ذکر شد، توسعه یافته است.

نتیجه

در نتیجه، GroupDocs.Parser Cloud SDK برای جاوا یک راه حل قابل اعتماد و کارآمد برای استخراج آسان تصاویر از فایل های PDF ارائه می دهد. آنچه از این مقاله آموخته اید به شرح زیر است:

  • چگونه با استفاده از REST API تمام تصاویر را از فایل های PDF به صورت برنامه نویسی در جاوا استخراج کنیم.
  • نحوه استخراج تصاویر خاص از اسناد PDF در جاوا با استفاده از REST API.
  • و ابزار استخراج تصویر آنلاین برای استخراج تصاویر از اسناد PDF.

علاوه بر این، می‌توانید با استفاده از مستندات درباره GroupDocs.Parser Cloud API اطلاعات بیشتری کسب کنید. ما همچنین یک بخش API Reference ارائه می‌کنیم که به شما امکان می‌دهد APIهای ما را مستقیماً از طریق مرورگر تجسم کرده و با آن‌ها تعامل داشته باشید. کد منبع کامل جاوا SDK به صورت رایگان در Github در دسترس است.

در نهایت، ما به نوشتن مقالات وبلاگ جدید در قالب‌های فایل مختلف و تجزیه آنها با استفاده از REST API ادامه می‌دهیم. بنابراین، لطفا برای آخرین به روز رسانی تماس بگیرید.

یه سوال بپرس

در صورتی که در مورد نحوه تجزیه اسناد سؤالی دارید، لطفاً از طریق [تالار گفتمان21 ما با ما تماس بگیرید.

سوالات متداول

چگونه فایل های PDF را با استفاده از جاوا تجزیه کنم؟

برای استخراج تصاویر، متن یا ابرداده، ابتدا باید سند PDF را با استفاده از GroupDocs.Parser Cloud SDK بارگیری و تجزیه کنید. این فرآیند شامل تعیین مسیر فایل و فراخوانی متد Parse برای تجزیه فایل‌های PDF است.

آیا GroupDocs.Parser Cloud SDK برای جاوا از فرمت های فایل دیگری به جز PDF پشتیبانی می کند؟

بله، علاوه بر فایل‌های PDF، GroupDocs.Parser Cloud SDK for Java از استخراج تصاویر از فرمت‌های اسناد مختلف، از جمله Word، Excel، PowerPoint، HTML و بسیاری موارد دیگر پشتیبانی می‌کند.

آیا می توانم همه تصاویر را از یک فایل PDF با استفاده از GroupDocs.Parser Cloud SDK برای جاوا استخراج کنم؟

بله، می‌توانید با استفاده از GroupDocs.Parser Cloud SDK for Java همه تصاویر را از یک فایل PDF استخراج کنید.

همچنین ببینید

در اینجا چند مقاله مرتبط وجود دارد که ممکن است برای شما مفید باشد: