پارس کردن فایل PDF – استخراج تصاویر از فایل های PDF آنلاین در جاوا

PDF(Portable Document Format) یک فرمت فایل به شدت مورد استفاده برای اشتراک و حفظ اسناد به صورت آنلاین است. این فرمت معمولاً شامل انواع مختلف محتوا، از جمله متن، تصاویر، جداول و موارد دیگر است. استخراج محتوای خاص از فایل‌های PDF، مانند تصاویر، می‌تواند بدون ابزارهای قابل اعتماد یا کتابخانه‌ای چالش‌برانگیز باشد. یکی از این ابزارها، GroupDocs.Parser Cloud SDK برای Java است که راهی یکپارچه و کارآمد برای استخراج تصاویر از فایل‌های PDF ارائه می‌دهد. در این مقاله، ما نشان خواهیم داد که چگونه می‌توان تصاویر را از فایل‌های PDF در Java با استفاده از REST API استخراج کرد.

موضوعات زیر در این مقاله مورد بررسی قرار خواهند گرفت:

Java REST API to Separate Images from PDF and SDK Installation

GroupDocs.Parser Cloud SDK for Java یک کتابخانه Java قدرتمند و چندمنظوره است که راهی ساده و کارآمد برای تجزیه و استخراج داده‌ها از انواع فرمت‌های سند، از جمله فایل‌های PDF ارائه می‌دهد. این کتابخانه مجموعه وسیعی از ویژگی‌ها را برای تجزیه اسناد ارائه می‌دهد و به توسعه‌دهندگان اجازه می‌دهد تصاویر، متن، متادیتا و محتوای دیگر را استخراج کنند. GroupDocs.Parser همچنین SDKهای C#.NET، Java، PHP، Ruby و Python را به عنوان اعضای خانواده تجزیه‌کننده اسناد خود برای APIهای ابری ارائه می‌دهد.

برای شروع، شما نیاز دارید که SDK ابری GroupDocs.Parser را در پروژه جاوای خود اضافه کنید. می‌توانید یا دانلود فایل JAR API را انجام دهید یا با افزودن مخزن و وابستگی زیر به فایل pom.xml پروژه‌تان، آن را با استفاده از Maven نصب کنید:

Maven Repository:

<repository>
    <id>groupdocs-artifact-repository</id>
    <name>GroupDocs Artifact Repository</name>
    <url>https://repository.groupdocs.cloud/repo</url>
</repository>

محدودیت Maven:

<dependency>
    <groupId>com.groupdocs</groupId>
    <artifactId>groupdocs-parser-cloud</artifactId>
    <version>23.3</version>
    <scope>compile</scope>
</dependency>

بعدی، شما نیاز دارید تا ثبت نام کنید برای یک حساب آزمایشی رایگان یا یک طرح اشتراک خریداری کنید در وب سایت GroupDocs و کلید API خود را بگیرید. پس از اینکه Client Id و Client Secret را داشتید، کد زیر را به یک برنامه مبتنی بر Java اضافه کنید:

# کد کلاینت و رمز کلاینت خود را از https://dashboard.groupdocs.cloud پس از ثبت نام دریافت کنید.

String ClientId = "xxxxxxxx-xxxx-xxxx-xxxx-xxxxxxxxxxxx";
String ClientSecret = "xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx";
String MyStorage = "test-internal-storage";
Configuration configuration = new Configuration(ClientId, ClientSecret);

چگونه تمام تصاویر را از فایل‌های PDF در Java با استفاده از REST API استخراج کنیم

حال بیایید مراحل و یک کد نمونه برای استخراج تصاویر از فایل‌های PDF با استفاده از GroupDocs.Parser Cloud SDK برای Java را بنویسیم:

  • ابتدا، کلاس‌های مورد نیاز را به فایل جاوای خود وارد کنید.
  • دوماً، یک نمونه از کلاس ParseApi ایجاد کنید.
  • در مرحله سوم، یک نمونه از کلاس FileInfo ایجاد کنید.
  • 次に、入力PDFドキュメントへのパスを設定します。
  • سپس، یک نمونه از کلاس ImagesOptions() را ایجاد کنید.
  • در مرحله بعد، fileInfo را به گزینه تصویر setFileInfo اختصاص دهید.
  • اکنون یک نمونه از کلاس ImagesRequest() ایجاد کرده و پارامتر ImagesOptions را پاس دهید.
  • در نهایت، نتایج را با فراخوانی متد ParseApi.images() و ارسال پارامتر ImagesRequest به دست آورید.

کد نمونه زیر نشان می‌دهد که چگونه می‌توان تمام تصاویر را از یک فایل PDF به صورت آنلاین در Java با استفاده از REST API استخراج کرد:

package com.groupdocsdev.classes;

import com.groupdocs.cloud.parser.api.ParseApi;
import com.groupdocs.cloud.parser.client.ApiException;
import com.groupdocs.cloud.parser.client.Configuration;
import com.groupdocs.cloud.parser.model.FileInfo;
import com.groupdocs.cloud.parser.model.ImagesOptions;
import com.groupdocs.cloud.parser.model.ImagesResult;
import com.groupdocs.cloud.parser.model.requests.ImagesRequest;

// چگونه تصاویر را از یک فایل PDF در Java استخراج کنیم.
public class App {

	public static void main(String[] args) {
		
		// یک نمونه از API پارس ایجاد کنید
		ParseApi apiInstance = new ParseApi(configuration);

		try {

			// تنظیمات را آماده کنید
			FileInfo fileInfo = new FileInfo();
			fileInfo.setFilePath("java-testing/input-sample-file.pdf");

			ImagesOptions options = new ImagesOptions();
			options.setFileInfo(fileInfo);
			ImagesRequest request = new ImagesRequest(options);
			ImagesResult response = apiInstance.images(request);

			// مسیر فایل خروجی را دریافت کنید
			System.out.println("Output file path: " + response.getPath());
				
		} catch (ApiException e) {
			System.err.println("Exception while calling FileApi:");
			e.printStackTrace();
		}
		
	}
}

تصاویر خاص را از فایل‌های PDF در Java با استفاده از شماره صفحه استخراج کنید

در این بخش، مراحل و یک کد نمونه برای استخراج تصاویر خاص از فایل PDF به صورت برنامه‌نویسی در Java ارائه خواهیم داد:

  • ابتدا، کلاس‌های مورد نیاز را به فایل جاوای خود وارد کنید.
  • ثانیاً، یک نمونه از کلاس ParseApi ایجاد کنید.
  • سوم، یک نمونه از کلاس FileInfo ایجاد کنید.
  • 次に、入力PDFドキュメントへのパスを設定します。
  • سپس، یک نمونه از کلاس ImagesOptions() را ایجاد کنید.
  • در مرحله بعد، fileInfo را به گزینه تصویر setFileInfo اختصاص دهید.
  • سپس، مقادیر setStartPageNumber و setCountPagesToExtract را ارائه دهید.
  • اکنون یک نمونه از کلاس ImagesRequest() ایجاد کرده و پارامتر ImagesOptions را پاس دهید.
  • Lastly, get results by calling the ParseApi.images() method and passing the ImagesRequest parameter.

نمونه کد زیر نشان می‌دهد که چگونه می‌توان تصاویر خاصی را از یک فایل PDF بر اساس بازه صفحات در Java با استفاده از API REST استخراج کرد:

package com.groupdocsdev.classes;

import com.groupdocs.cloud.parser.api.ParseApi;
import com.groupdocs.cloud.parser.client.ApiException;
import com.groupdocs.cloud.parser.client.Configuration;
import com.groupdocs.cloud.parser.model.FileInfo;
import com.groupdocs.cloud.parser.model.ImagesOptions;
import com.groupdocs.cloud.parser.model.ImagesResult;
import com.groupdocs.cloud.parser.model.requests.ImagesRequest;

// از یک فایل PDF به صورت آنلاین تصاویر را بر اساس محدوده صفحه در Java استخراج کنید.
public class App {

	public static void main(String[] args) {
		
		// یک نمونه از API تجزیه ایجاد کنید
		ParseApi apiInstance = new ParseApi(configuration);

		try {

			// تنظیمات را آماده کنید
			FileInfo fileInfo = new FileInfo();
			fileInfo.setFilePath("java-testing/input-sample-file.pdf");

			ImagesOptions options = new ImagesOptions();
			options.setFileInfo(fileInfo);
			options.setStartPageNumber(1);
			options.setCountPagesToExtract(2);
			ImagesRequest request = new ImagesRequest(options);
			ImagesResult response = apiInstance.images(request);

			// پ path فایل خروجی را بگیرید
			System.out.println("Output file path: " + response.getPath());
				
		} catch (ApiException e) {
			System.err.println("Exception while calling FileApi:");
			e.printStackTrace();
		}
		
	}
}

تجزیه کننده تصاویر آنلاین رایگان

بهترین راه برای استخراج تصاویر از PDF به صورت آنلاین و رایگان چیست؟ لطفاً سعی کنید از یک online PDF File parser برای استخراج تصاویر از فایل‌های PDF استفاده کنید. این نرم‌افزار PDF Parser با استفاده از کتابخانه پارسر Java که در بالا گفته شد، توسعه یافته است.

نتیجه‌گیری

در نتیجه، SDK ابری GroupDocs.Parser برای Java یک راه‌حل قابل اعتماد و کارآمد برای استخراج تصاویر از فایل‌های PDF با سهولت ارائه می‌دهد. موارد زیر آنچه شما از این مقاله آموخته‌اید:

  • How to extract all images from PDF files programmatically in Java using REST API;
  • چگونه می‌توان تصاویر خاصی را از اسناد PDF در Java با استفاده از REST API استخراج کرد؛
  • ابزار استخراج تصویر آنلاین برای استخراج تصاویر از اسناد PDF.

علاوه بر این، می‌توانید بیشتر در مورد GroupDocs.Parser Cloud API با استفاده از documentation یاد بگیرید. ما همچنین یک بخش API Reference ارائه می‌دهیم که به شما این امکان را می‌دهد که APIs ما را مستقیماً از طریق مرورگر مشاهده و با آن‌ها تعامل کنید. کد منبع کامل Java SDK به‌طور رایگان در Github در دسترس است.

در نهایت، ما به نوشتن مقالات جدید وبلاگ در مورد فرمت‌های مختلف فایل و تجزیه آن‌ها با استفاده از REST API ادامه می‌دهیم. بنابراین، لطفاً برای دریافت آخرین به‌روزرسانی‌ها با ما در تماس باشید.

سوالی بپرسید

در صورتی که سوالی در مورد چگونگی تجزیه اسناد دارید، لطفاً با کمال میل از طریق forum با ما تماس بگیرید.

سوالات متداول

How do I parse PDF files using Java?

برای استخراج تصاویر، متن یا متاداده، ابتدا باید سند PDF را با استفاده از GroupDocs.Parser Cloud SDK بارگذاری و تجزیه کنید. این فرآیند شامل مشخص کردن مسیر فایل و فراخوانی روش Parse برای تجزیه فایل‌های PDF است.

آیا SDK ابری GroupDocs.Parser برای Java از فرمت‌های فایل دیگری غیر از PDF پشتیبانی می‌کند؟

بله، به غیر از فایل‌های PDF، GroupDocs.Parser Cloud SDK for Java از استخراج تصاویر از فرمت‌های مختلف اسناد، از جمله Word، Excel، PowerPoint، HTML و بسیاری دیگر پشتیبانی می‌کند.

Can I extract all images from a PDF file using GroupDocs.Parser Cloud SDK for Java?

بله، شما می‌توانید تمام تصاویر را از یک فایل PDF با استفاده از GroupDocs.Parser Cloud SDK for Java استخراج کنید.

ببینید همچنین

در اینجا چند مقاله مرتبط وجود دارد که ممکن است به شما کمک کند: