
PDF(Portable Document Format) یک فرمت فایل به شدت مورد استفاده برای اشتراک و حفظ اسناد به صورت آنلاین است. این فرمت معمولاً شامل انواع مختلف محتوا، از جمله متن، تصاویر، جداول و موارد دیگر است. استخراج محتوای خاص از فایلهای PDF، مانند تصاویر، میتواند بدون ابزارهای قابل اعتماد یا کتابخانهای چالشبرانگیز باشد. یکی از این ابزارها، GroupDocs.Parser Cloud SDK برای Java است که راهی یکپارچه و کارآمد برای استخراج تصاویر از فایلهای PDF ارائه میدهد. در این مقاله، ما نشان خواهیم داد که چگونه میتوان تصاویر را از فایلهای PDF در Java با استفاده از REST API استخراج کرد.
موضوعات زیر در این مقاله مورد بررسی قرار خواهند گرفت:
- Java REST API برای جدا کردن تصاویر از PDF و نصب SDK
- چگونه همه تصاویر را از فایلهای PDF در Java با استفاده از REST API استخراج کنیم
- استخراج تصاویر خاص از فایلهای PDF در Java با استفاده از شماره صفحه
Java REST API to Separate Images from PDF and SDK Installation
GroupDocs.Parser Cloud SDK for Java یک کتابخانه Java قدرتمند و چندمنظوره است که راهی ساده و کارآمد برای تجزیه و استخراج دادهها از انواع فرمتهای سند، از جمله فایلهای PDF ارائه میدهد. این کتابخانه مجموعه وسیعی از ویژگیها را برای تجزیه اسناد ارائه میدهد و به توسعهدهندگان اجازه میدهد تصاویر، متن، متادیتا و محتوای دیگر را استخراج کنند. GroupDocs.Parser همچنین SDKهای C#.NET، Java، PHP، Ruby و Python را به عنوان اعضای خانواده تجزیهکننده اسناد خود برای APIهای ابری ارائه میدهد.
برای شروع، شما نیاز دارید که SDK ابری GroupDocs.Parser را در پروژه جاوای خود اضافه کنید. میتوانید یا دانلود فایل JAR API را انجام دهید یا با افزودن مخزن و وابستگی زیر به فایل pom.xml پروژهتان، آن را با استفاده از Maven نصب کنید:
Maven Repository:
<repository>
<id>groupdocs-artifact-repository</id>
<name>GroupDocs Artifact Repository</name>
<url>https://repository.groupdocs.cloud/repo</url>
</repository>
محدودیت Maven:
<dependency>
<groupId>com.groupdocs</groupId>
<artifactId>groupdocs-parser-cloud</artifactId>
<version>23.3</version>
<scope>compile</scope>
</dependency>
بعدی، شما نیاز دارید تا ثبت نام کنید برای یک حساب آزمایشی رایگان یا یک طرح اشتراک خریداری کنید در وب سایت GroupDocs و کلید API خود را بگیرید. پس از اینکه Client Id و Client Secret را داشتید، کد زیر را به یک برنامه مبتنی بر Java اضافه کنید:
# کد کلاینت و رمز کلاینت خود را از https://dashboard.groupdocs.cloud پس از ثبت نام دریافت کنید.
String ClientId = "xxxxxxxx-xxxx-xxxx-xxxx-xxxxxxxxxxxx";
String ClientSecret = "xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx";
String MyStorage = "test-internal-storage";
Configuration configuration = new Configuration(ClientId, ClientSecret);
چگونه تمام تصاویر را از فایلهای PDF در Java با استفاده از REST API استخراج کنیم
حال بیایید مراحل و یک کد نمونه برای استخراج تصاویر از فایلهای PDF با استفاده از GroupDocs.Parser Cloud SDK برای Java را بنویسیم:
- ابتدا، کلاسهای مورد نیاز را به فایل جاوای خود وارد کنید.
- دوماً، یک نمونه از کلاس ParseApi ایجاد کنید.
- در مرحله سوم، یک نمونه از کلاس FileInfo ایجاد کنید.
- 次に、入力PDFドキュメントへのパスを設定します。
- سپس، یک نمونه از کلاس ImagesOptions() را ایجاد کنید.
- در مرحله بعد، fileInfo را به گزینه تصویر setFileInfo اختصاص دهید.
- اکنون یک نمونه از کلاس ImagesRequest() ایجاد کرده و پارامتر ImagesOptions را پاس دهید.
- در نهایت، نتایج را با فراخوانی متد ParseApi.images() و ارسال پارامتر ImagesRequest به دست آورید.
کد نمونه زیر نشان میدهد که چگونه میتوان تمام تصاویر را از یک فایل PDF به صورت آنلاین در Java با استفاده از REST API استخراج کرد:
package com.groupdocsdev.classes;
import com.groupdocs.cloud.parser.api.ParseApi;
import com.groupdocs.cloud.parser.client.ApiException;
import com.groupdocs.cloud.parser.client.Configuration;
import com.groupdocs.cloud.parser.model.FileInfo;
import com.groupdocs.cloud.parser.model.ImagesOptions;
import com.groupdocs.cloud.parser.model.ImagesResult;
import com.groupdocs.cloud.parser.model.requests.ImagesRequest;
// چگونه تصاویر را از یک فایل PDF در Java استخراج کنیم.
public class App {
public static void main(String[] args) {
// یک نمونه از API پارس ایجاد کنید
ParseApi apiInstance = new ParseApi(configuration);
try {
// تنظیمات را آماده کنید
FileInfo fileInfo = new FileInfo();
fileInfo.setFilePath("java-testing/input-sample-file.pdf");
ImagesOptions options = new ImagesOptions();
options.setFileInfo(fileInfo);
ImagesRequest request = new ImagesRequest(options);
ImagesResult response = apiInstance.images(request);
// مسیر فایل خروجی را دریافت کنید
System.out.println("Output file path: " + response.getPath());
} catch (ApiException e) {
System.err.println("Exception while calling FileApi:");
e.printStackTrace();
}
}
}
تصاویر خاص را از فایلهای PDF در Java با استفاده از شماره صفحه استخراج کنید
در این بخش، مراحل و یک کد نمونه برای استخراج تصاویر خاص از فایل PDF به صورت برنامهنویسی در Java ارائه خواهیم داد:
- ابتدا، کلاسهای مورد نیاز را به فایل جاوای خود وارد کنید.
- ثانیاً، یک نمونه از کلاس ParseApi ایجاد کنید.
- سوم، یک نمونه از کلاس FileInfo ایجاد کنید.
- 次に、入力PDFドキュメントへのパスを設定します。
- سپس، یک نمونه از کلاس ImagesOptions() را ایجاد کنید.
- در مرحله بعد، fileInfo را به گزینه تصویر setFileInfo اختصاص دهید.
- سپس، مقادیر setStartPageNumber و setCountPagesToExtract را ارائه دهید.
- اکنون یک نمونه از کلاس ImagesRequest() ایجاد کرده و پارامتر ImagesOptions را پاس دهید.
- Lastly, get results by calling the ParseApi.images() method and passing the ImagesRequest parameter.
نمونه کد زیر نشان میدهد که چگونه میتوان تصاویر خاصی را از یک فایل PDF بر اساس بازه صفحات در Java با استفاده از API REST استخراج کرد:
package com.groupdocsdev.classes;
import com.groupdocs.cloud.parser.api.ParseApi;
import com.groupdocs.cloud.parser.client.ApiException;
import com.groupdocs.cloud.parser.client.Configuration;
import com.groupdocs.cloud.parser.model.FileInfo;
import com.groupdocs.cloud.parser.model.ImagesOptions;
import com.groupdocs.cloud.parser.model.ImagesResult;
import com.groupdocs.cloud.parser.model.requests.ImagesRequest;
// از یک فایل PDF به صورت آنلاین تصاویر را بر اساس محدوده صفحه در Java استخراج کنید.
public class App {
public static void main(String[] args) {
// یک نمونه از API تجزیه ایجاد کنید
ParseApi apiInstance = new ParseApi(configuration);
try {
// تنظیمات را آماده کنید
FileInfo fileInfo = new FileInfo();
fileInfo.setFilePath("java-testing/input-sample-file.pdf");
ImagesOptions options = new ImagesOptions();
options.setFileInfo(fileInfo);
options.setStartPageNumber(1);
options.setCountPagesToExtract(2);
ImagesRequest request = new ImagesRequest(options);
ImagesResult response = apiInstance.images(request);
// پ path فایل خروجی را بگیرید
System.out.println("Output file path: " + response.getPath());
} catch (ApiException e) {
System.err.println("Exception while calling FileApi:");
e.printStackTrace();
}
}
}
تجزیه کننده تصاویر آنلاین رایگان
بهترین راه برای استخراج تصاویر از PDF به صورت آنلاین و رایگان چیست؟ لطفاً سعی کنید از یک online PDF File parser برای استخراج تصاویر از فایلهای PDF استفاده کنید. این نرمافزار PDF Parser با استفاده از کتابخانه پارسر Java که در بالا گفته شد، توسعه یافته است.
نتیجهگیری
در نتیجه، SDK ابری GroupDocs.Parser برای Java یک راهحل قابل اعتماد و کارآمد برای استخراج تصاویر از فایلهای PDF با سهولت ارائه میدهد. موارد زیر آنچه شما از این مقاله آموختهاید:
- How to extract all images from PDF files programmatically in Java using REST API;
- چگونه میتوان تصاویر خاصی را از اسناد PDF در Java با استفاده از REST API استخراج کرد؛
- ابزار استخراج تصویر آنلاین برای استخراج تصاویر از اسناد PDF.
علاوه بر این، میتوانید بیشتر در مورد GroupDocs.Parser Cloud API با استفاده از documentation یاد بگیرید. ما همچنین یک بخش API Reference ارائه میدهیم که به شما این امکان را میدهد که APIs ما را مستقیماً از طریق مرورگر مشاهده و با آنها تعامل کنید. کد منبع کامل Java SDK بهطور رایگان در Github در دسترس است.
در نهایت، ما به نوشتن مقالات جدید وبلاگ در مورد فرمتهای مختلف فایل و تجزیه آنها با استفاده از REST API ادامه میدهیم. بنابراین، لطفاً برای دریافت آخرین بهروزرسانیها با ما در تماس باشید.
سوالی بپرسید
در صورتی که سوالی در مورد چگونگی تجزیه اسناد دارید، لطفاً با کمال میل از طریق forum با ما تماس بگیرید.
سوالات متداول
How do I parse PDF files using Java?
برای استخراج تصاویر، متن یا متاداده، ابتدا باید سند PDF را با استفاده از GroupDocs.Parser Cloud SDK بارگذاری و تجزیه کنید. این فرآیند شامل مشخص کردن مسیر فایل و فراخوانی روش Parse برای تجزیه فایلهای PDF است.
آیا SDK ابری GroupDocs.Parser برای Java از فرمتهای فایل دیگری غیر از PDF پشتیبانی میکند؟
بله، به غیر از فایلهای PDF، GroupDocs.Parser Cloud SDK for Java از استخراج تصاویر از فرمتهای مختلف اسناد، از جمله Word، Excel، PowerPoint، HTML و بسیاری دیگر پشتیبانی میکند.
Can I extract all images from a PDF file using GroupDocs.Parser Cloud SDK for Java?
بله، شما میتوانید تمام تصاویر را از یک فایل PDF با استفاده از GroupDocs.Parser Cloud SDK for Java استخراج کنید.
ببینید همچنین
در اینجا چند مقاله مرتبط وجود دارد که ممکن است به شما کمک کند: