
تحلیل اسناد یک وظیفه حیاتی در بسیاری از صنایع است که در آن استخراج دادهها از فرمتهای مختلف سند مورد نیاز است. هنگامی که با Word اسناد کار میکنیم، استخراج تصاویر میتواند به ویژه در مواردی مانند تحلیل محتوا، شناسایی تصویر، یا بصریسازی دادهها مفید باشد. استخراج تصاویر به صورت دستی از اسناد بزرگ Word میتواند زمانبر باشد. بنابراین، اتوماسیون فرآیند استخراج تصویر میتواند وقت و تلاش شما را صرفهجویی کند. در این مقاله، ما نشان خواهیم داد که چگونه میتوان به صورت برنامهنویسی تصاویر را از اسناد Word در Java استخراج کرد.
موضوعات زیر در این مقاله مورد بررسی قرار خواهند گرفت:
- Java REST API to Extract Images from Word Documents and SDK Installation
- چگونه تمام تصاویر را از مستندات ورد در Java با استفاده از REST API
- Extract Specific Images from Word File in Java using Page Number
Java REST API to Extract Images from Word Documents and SDK Installation
GroupDocs.Parser Cloud SDK for Java یک کتابخانه قدرتمند Java است که روشی ساده و کارآمد برای تجزیه و استخراج دادهها از فرمتهای مختلف document formats، از جمله اسناد ورد، فراهم میکند. این کتابخانه طیف گستردهای از ویژگیها را برای تجزیه اسناد ارائه میدهد و به توسعهدهندگان امکان استخراج تصاویر، متن، متاداده و بیشتر را میدهد. GroupDocs.Parser همچنین SDKهای C#.NET، Java، PHP، Ruby و Python را به عنوان document parser family members خود برای APIهای ابری ارائه میدهد.
برای شروع، شما نیاز دارید که SDK Cloud GroupDocs.Parser را در پروژه Java خود وارد کنید. میتوانید یا download فایل JAR این API را دانلود کنید یا آن را با استفاده از Maven نصب کنید و مخزن و وابستگی زیر را به فایل pom.xml پروژه خود اضافه کنید:
مخزن ماون
<repository>
<id>groupdocs-artifact-repository</id>
<name>GroupDocs Artifact Repository</name>
<url>https://repository.groupdocs.cloud/repo</url>
</repository>
وابستگی ماون:
<dependency>
<groupId>com.groupdocs</groupId>
<artifactId>groupdocs-parser-cloud</artifactId>
<version>23.3</version>
<scope>compile</scope>
</dependency>
بعدی، شما نیاز دارید که sign up برای یک حساب آزمایشی رایگان یا purchase a subscription plan در وبسایت GroupDocs و get your API key دریافت کنید. once you have the Client Id and Client Secret, add below code snippet to a Java-based application:
# کلید مشتری (clientid) و کلید امنیتی (clientsecret) خود را از https://dashboard.groupdocs.cloud پس از ثبت نام دریافت کنید.
String ClientId = "xxxxxxxx-xxxx-xxxx-xxxx-xxxxxxxxxxxx";
String ClientSecret = "xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx";
String MyStorage = "test-internal-storage";
Configuration configuration = new Configuration(ClientId, ClientSecret);
چگونه تمام تصاویر را از اسناد ورد در Java با استفاده از REST API استخراج کنیم
برای استخراج تصاویر از اسناد ورد در Java با استفاده از GroupDocs.Parser Cloud SDK، این مراحل و یک قطعه کد نمونه را دنبال کنید:
- ابتدا، کلاسهای مورد نیاز را به فایل جاوای خود وارد کنید.
- دوم، یک نمونه از کلاس ParseApi ایجاد کنید.
- سوم، یک نمونه از کلاس FileInfo ایجاد کنید.
- در ادامه، مسیر سند Word ورودی را تنظیم کنید.
- سپس، یک مورد از کلاس ImagesOptions() ایجاد کنید.
- در مرحله بعد،
fileInfo
را به گزینه تصویرsetFileInfo
اختصاص دهید. - حال یک نمونه از کلاس ImagesRequest() را ایجاد کرده و پارامتر ImagesOptions را پاس دهید.
- در نهایت، نتایج را با فراخوانی متد ParseApi.images() و عبور دادن پارامتر ImagesRequest دریافت کنید.
نمونه کد زیر نشان میدهد که چگونه میتوان تمام تصاویر را از یک سند Word به صورت آنلاین با استفاده از REST API در Java استخراج کرد:
package com.groupdocsdev.classes;
import com.groupdocs.cloud.parser.api.ParseApi;
import com.groupdocs.cloud.parser.client.ApiException;
import com.groupdocs.cloud.parser.client.Configuration;
import com.groupdocs.cloud.parser.model.FileInfo;
import com.groupdocs.cloud.parser.model.ImagesOptions;
import com.groupdocs.cloud.parser.model.ImagesResult;
import com.groupdocs.cloud.parser.model.requests.ImagesRequest;
// چگونه تصاویر را از یک سند Word در Java استخراج کنیم.
public class App {
public static void main(String[] args) {
// یک نمونه از API Parse ایجاد کنید
ParseApi apiInstance = new ParseApi(configuration);
try {
// تنظیمات را آماده کنید
FileInfo fileInfo = new FileInfo();
fileInfo.setFilePath("java-testing/input-sample-file.docx");
ImagesOptions options = new ImagesOptions();
options.setFileInfo(fileInfo);
ImagesRequest request = new ImagesRequest(options);
ImagesResult response = apiInstance.images(request);
// مسیر فایل خروجی را دریافت کنید
System.out.println("Output file path: " + response.getPath());
} catch (ApiException e) {
System.err.println("Exception while calling FileApi:");
e.printStackTrace();
}
}
}
تصویرهای خاص را از فایل Word در Java با استفاده از شماره صفحه استخراج کنید
در این بخش، ما مراحل و یک کد نمونه برای استخراج تصاویر خاص از یک سند Word به صورت برنامهنویسی در Java خواهیم نوشت:
- ابتدا، کلاسهای مورد نیاز را به فایل جاوای خود وارد کنید.
- به طور دوم، یک نمونه از کلاس ParseApi ایجاد کنید.
- سومیناً، یک نمونه از کلاس FileInfo ایجاد کنید.
- بعدی، مسیر فایل Word را به عنوان ورودی تنظیم کنید.
- سپس، یک مورد از کلاس ImagesOptions() ایجاد کنید.
- در مرحله بعد،
fileInfo
را به گزینه تصویرsetFileInfo
اختصاص دهید. - سپس مقادیر setStartPageNumber و setCountPagesToExtract را فراهم کنید.
- حال یک نمونه از کلاس ImagesRequest() را ایجاد کرده و پارامتر ImagesOptions را پاس دهید.
- در نهایت، با فراخوانی متد ParseApi.images() و ارسال پارامتر ImagesRequest نتایج را به دست آورید.
کد نمونه زیر نشان میدهد که چگونه میتوان تصاویر خاصی را از یک فایل ورد بر اساس دامنه صفحه در Java با استفاده از API REST استخراج کرد:
package com.groupdocsdev.classes;
import com.groupdocs.cloud.parser.api.ParseApi;
import com.groupdocs.cloud.parser.client.ApiException;
import com.groupdocs.cloud.parser.client.Configuration;
import com.groupdocs.cloud.parser.model.FileInfo;
import com.groupdocs.cloud.parser.model.ImagesOptions;
import com.groupdocs.cloud.parser.model.ImagesResult;
import com.groupdocs.cloud.parser.model.requests.ImagesRequest;
// از یک فایل ورد به صورت آنلاین تصاویری را بر اساس دامنه صفحات در Java استخراج کنید.
public class App {
public static void main(String[] args) {
// یک نمونه از API Parse ایجاد کنید
ParseApi apiInstance = new ParseApi(configuration);
try {
// تنظیمات را آماده کنید
FileInfo fileInfo = new FileInfo();
fileInfo.setFilePath("java-testing/input-sample-file.docx");
ImagesOptions options = new ImagesOptions();
options.setFileInfo(fileInfo);
options.setStartPageNumber(1);
options.setCountPagesToExtract(2);
ImagesRequest request = new ImagesRequest(options);
ImagesResult response = apiInstance.images(request);
// مسیر فایل خروجی را دریافت کنید
System.out.println("Output file path: " + response.getPath());
} catch (ApiException e) {
System.err.println("Exception while calling FileApi:");
e.printStackTrace();
}
}
}
ابزار استخراج تصویر آنلاین رایگان
بهترین راه برای استخراج تصاویر از ورد آنلاین به صورت رایگان چیست؟ لطفاً برای استخراج تصاویر از ورد، یک online Word document parser را امتحان کنید. این ابزار پارسر ورد با استفاده از کتابخانه پارسر جاوای ذکر شده در بالا توسعه یافته است.
نتیجه گیری
در نتیجه، GroupDocs.Parser Cloud SDK یک راهحل عالی برای استخراج تصاویر از اسناد ورد است که در عین صرفهجویی در زمان و تلاش، نتایج دقیقی را تضمین میکند. موارد زیر آنچه شما از این مقاله آموختهاید است:
- how to extract all images from Word DOCX programmatically in Java using REST API;
- چگونه می توان تصاویر خاصی را از اسناد ورد در Java با استفاده از REST API استخراج کرد؛
- و ابزاری برای استخراج تصویر آنلاین به منظور استخراج تصاویر از مدارک Word.
علاوه بر این، میتوانید اطلاعات بیشتری درباره GroupDocs.Parser Cloud API از documentation کسب کنید. همچنین ما یک بخش API Reference ارائه میدهیم که به شما امکان میدهد تا مستقیماً از طریق مرورگر با APIهای ما بصورت بصری تعامل کنید. کد منبع کامل SDK Java به صورت رایگان در Github در دسترس است.
Finally, we keep writing new blog articles on different file formats and parsing them using REST API. So, please get in touch for the latest updates.
سوالی بپرسید
در صورتی که سوالی درباره استخراج تصاویر از اسناد دارید، لطفاً با خیالی آسوده با ما از طریق forum تماس بگیرید.
سؤالات متداول
چگونه میتوانم اسناد ورد را در Java تجزیه کنم؟
برای استخراج تصاویر یا متن، ابتدا باید سند ورد را با استفاده از GroupDocs.Parser Cloud SDK بارگذاری و تجزیه کنید. این فرآیند شامل مشخص کردن مسیر فایل و فراخوانی روش Parse برای تجزیه اسناد است.
آیا SDK ابری GroupDocs.Parser میتواند تصاویر را از فرمتهای دیگر مدارک استخراج کند؟
بله، GroupDocs.Parser Cloud SDK for Java از استخراج تصاویر از فرمتهای مختلف اسناد، از جمله Word، PDF، Excel، PowerPoint و بسیاری دیگر پشتیبانی میکند.
آیا SDK ابری GroupDocs.Parser قادر به استخراج چندین تصویر از یک سند Word واحد است؟
بله، SDK میتواند چندین تصویر را از یک سند ورد استخراج کند و همه تصاویر موجود در سند را در اختیار شما قرار دهد.
آیا SDK گروه مستندات پارسر در Cloud کیفیت اصلی تصویر را در طول فرآیند استخراج حفظ میکند؟
بله، GroupDocs.Parser Cloud SDK for Java کیفیت تصویر اصلی را در حین استخراج تصاویر از اسناد ورد حفظ میکند.
همچنین ببینید
در اینجا مقالات مرتبطی وجود دارد که ممکن است برای شما مفید باشد: