تحلیلگر مستندات ورد – استخراج تصاویر از فایل ورد آنلاین به زبان جاوا

تحلیل اسناد یک وظیفه حیاتی در بسیاری از صنایع است که در آن استخراج داده‌ها از فرمت‌های مختلف سند مورد نیاز است. هنگامی که با Word اسناد کار می‌کنیم، استخراج تصاویر می‌تواند به ویژه در مواردی مانند تحلیل محتوا، شناسایی تصویر، یا بصری‌سازی داده‌ها مفید باشد. استخراج تصاویر به صورت دستی از اسناد بزرگ Word می‌تواند زمان‌بر باشد. بنابراین، اتوماسیون فرآیند استخراج تصویر می‌تواند وقت و تلاش شما را صرفه‌جویی کند. در این مقاله، ما نشان خواهیم داد که چگونه می‌توان به صورت برنامه‌نویسی تصاویر را از اسناد Word در Java استخراج کرد.

موضوعات زیر در این مقاله مورد بررسی قرار خواهند گرفت:

Java REST API to Extract Images from Word Documents and SDK Installation

GroupDocs.Parser Cloud SDK for Java یک کتابخانه قدرتمند Java است که روشی ساده و کارآمد برای تجزیه و استخراج داده‌ها از فرمت‌های مختلف document formats، از جمله اسناد ورد، فراهم می‌کند. این کتابخانه طیف گسترده‌ای از ویژگی‌ها را برای تجزیه اسناد ارائه می‌دهد و به توسعه‌دهندگان امکان استخراج تصاویر، متن، متاداده و بیشتر را می‌دهد. GroupDocs.Parser همچنین SDKهای C#.NET، Java، PHP، Ruby و Python را به عنوان document parser family members خود برای APIهای ابری ارائه می‌دهد.

برای شروع، شما نیاز دارید که SDK Cloud GroupDocs.Parser را در پروژه Java خود وارد کنید. می‌توانید یا download فایل JAR این API را دانلود کنید یا آن را با استفاده از Maven نصب کنید و مخزن و وابستگی زیر را به فایل pom.xml پروژه خود اضافه کنید:

مخزن ماون

<repository>
    <id>groupdocs-artifact-repository</id>
    <name>GroupDocs Artifact Repository</name>
    <url>https://repository.groupdocs.cloud/repo</url>
</repository>

وابستگی ماون:

<dependency>
    <groupId>com.groupdocs</groupId>
    <artifactId>groupdocs-parser-cloud</artifactId>
    <version>23.3</version>
    <scope>compile</scope>
</dependency>

بعدی، شما نیاز دارید که sign up برای یک حساب آزمایشی رایگان یا purchase a subscription plan در وبسایت GroupDocs و get your API key دریافت کنید. once you have the Client Id and Client Secret, add below code snippet to a Java-based application:

# کلید مشتری (clientid) و کلید امنیتی (clientsecret) خود را از https://dashboard.groupdocs.cloud پس از ثبت نام دریافت کنید.

String ClientId = "xxxxxxxx-xxxx-xxxx-xxxx-xxxxxxxxxxxx";
String ClientSecret = "xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx";
String MyStorage = "test-internal-storage";
Configuration configuration = new Configuration(ClientId, ClientSecret);

چگونه تمام تصاویر را از اسناد ورد در Java با استفاده از REST API استخراج کنیم

برای استخراج تصاویر از اسناد ورد در Java با استفاده از GroupDocs.Parser Cloud SDK، این مراحل و یک قطعه کد نمونه را دنبال کنید:

  • ابتدا، کلاس‌های مورد نیاز را به فایل جاوای خود وارد کنید.
  • دوم، یک نمونه از کلاس ParseApi ایجاد کنید.
  • سوم، یک نمونه از کلاس FileInfo ایجاد کنید.
  • در ادامه، مسیر سند Word ورودی را تنظیم کنید.
  • سپس، یک مورد از کلاس ImagesOptions() ایجاد کنید.
  • در مرحله بعد، fileInfo را به گزینه تصویر setFileInfo اختصاص دهید.
  • حال یک نمونه از کلاس ImagesRequest() را ایجاد کرده و پارامتر ImagesOptions را پاس دهید.
  • در نهایت، نتایج را با فراخوانی متد ParseApi.images() و عبور دادن پارامتر ImagesRequest دریافت کنید.

نمونه کد زیر نشان می‌دهد که چگونه می‌توان تمام تصاویر را از یک سند Word به صورت آنلاین با استفاده از REST API در Java استخراج کرد:

package com.groupdocsdev.classes;

import com.groupdocs.cloud.parser.api.ParseApi;
import com.groupdocs.cloud.parser.client.ApiException;
import com.groupdocs.cloud.parser.client.Configuration;
import com.groupdocs.cloud.parser.model.FileInfo;
import com.groupdocs.cloud.parser.model.ImagesOptions;
import com.groupdocs.cloud.parser.model.ImagesResult;
import com.groupdocs.cloud.parser.model.requests.ImagesRequest;

// چگونه تصاویر را از یک سند Word در Java استخراج کنیم.
public class App {

	public static void main(String[] args) {
		
		// یک نمونه از API Parse ایجاد کنید
		ParseApi apiInstance = new ParseApi(configuration);

		try {

			// تنظیمات را آماده کنید
			FileInfo fileInfo = new FileInfo();
			fileInfo.setFilePath("java-testing/input-sample-file.docx");

			ImagesOptions options = new ImagesOptions();
			options.setFileInfo(fileInfo);
			ImagesRequest request = new ImagesRequest(options);
			ImagesResult response = apiInstance.images(request);

			// مسیر فایل خروجی را دریافت کنید
			System.out.println("Output file path: " + response.getPath());
				
		} catch (ApiException e) {
			System.err.println("Exception while calling FileApi:");
			e.printStackTrace();
		}
		
	}
}

تصویرهای خاص را از فایل Word در Java با استفاده از شماره صفحه استخراج کنید

در این بخش، ما مراحل و یک کد نمونه برای استخراج تصاویر خاص از یک سند Word به صورت برنامه‌نویسی در Java خواهیم نوشت:

  • ابتدا، کلاس‌های مورد نیاز را به فایل جاوای خود وارد کنید.
  • به طور دوم، یک نمونه از کلاس ParseApi ایجاد کنید.
  • سومیناً، یک نمونه از کلاس FileInfo ایجاد کنید.
  • بعدی، مسیر فایل Word را به عنوان ورودی تنظیم کنید.
  • سپس، یک مورد از کلاس ImagesOptions() ایجاد کنید.
  • در مرحله بعد، fileInfo را به گزینه تصویر setFileInfo اختصاص دهید.
  • سپس مقادیر setStartPageNumber و setCountPagesToExtract را فراهم کنید.
  • حال یک نمونه از کلاس ImagesRequest() را ایجاد کرده و پارامتر ImagesOptions را پاس دهید.
  • در نهایت، با فراخوانی متد ParseApi.images() و ارسال پارامتر ImagesRequest نتایج را به دست آورید.

کد نمونه زیر نشان می‌دهد که چگونه می‌توان تصاویر خاصی را از یک فایل ورد بر اساس دامنه صفحه در Java با استفاده از API REST استخراج کرد:

package com.groupdocsdev.classes;

import com.groupdocs.cloud.parser.api.ParseApi;
import com.groupdocs.cloud.parser.client.ApiException;
import com.groupdocs.cloud.parser.client.Configuration;
import com.groupdocs.cloud.parser.model.FileInfo;
import com.groupdocs.cloud.parser.model.ImagesOptions;
import com.groupdocs.cloud.parser.model.ImagesResult;
import com.groupdocs.cloud.parser.model.requests.ImagesRequest;

// از یک فایل ورد به صورت آنلاین تصاویری را بر اساس دامنه صفحات در Java استخراج کنید.
public class App {

	public static void main(String[] args) {
		
		// یک نمونه از API Parse ایجاد کنید
		ParseApi apiInstance = new ParseApi(configuration);

		try {

			// تنظیمات را آماده کنید
			FileInfo fileInfo = new FileInfo();
			fileInfo.setFilePath("java-testing/input-sample-file.docx");

			ImagesOptions options = new ImagesOptions();
			options.setFileInfo(fileInfo);
			options.setStartPageNumber(1);
			options.setCountPagesToExtract(2);
			ImagesRequest request = new ImagesRequest(options);
			ImagesResult response = apiInstance.images(request);

			// مسیر فایل خروجی را دریافت کنید
			System.out.println("Output file path: " + response.getPath());
				
		} catch (ApiException e) {
			System.err.println("Exception while calling FileApi:");
			e.printStackTrace();
		}
		
	}
}

ابزار استخراج تصویر آنلاین رایگان

بهترین راه برای استخراج تصاویر از ورد آنلاین به صورت رایگان چیست؟ لطفاً برای استخراج تصاویر از ورد، یک online Word document parser را امتحان کنید. این ابزار پارسر ورد با استفاده از کتابخانه پارسر جاوای ذکر شده در بالا توسعه یافته است.

نتیجه گیری

در نتیجه، GroupDocs.Parser Cloud SDK یک راه‌حل عالی برای استخراج تصاویر از اسناد ورد است که در عین صرفه‌جویی در زمان و تلاش، نتایج دقیقی را تضمین می‌کند. موارد زیر آنچه شما از این مقاله آموخته‌اید است:

  • how to extract all images from Word DOCX programmatically in Java using REST API;
  • چگونه می توان تصاویر خاصی را از اسناد ورد در Java با استفاده از REST API استخراج کرد؛
  • و ابزاری برای استخراج تصویر آنلاین به منظور استخراج تصاویر از مدارک Word.

علاوه بر این، می‌توانید اطلاعات بیشتری درباره GroupDocs.Parser Cloud API از documentation کسب کنید. همچنین ما یک بخش API Reference ارائه می‌دهیم که به شما امکان می‌دهد تا مستقیماً از طریق مرورگر با APIهای ما بصورت بصری تعامل کنید. کد منبع کامل SDK Java به صورت رایگان در Github در دسترس است.

Finally, we keep writing new blog articles on different file formats and parsing them using REST API. So, please get in touch for the latest updates.

سوالی بپرسید

در صورتی که سوالی درباره استخراج تصاویر از اسناد دارید، لطفاً با خیالی آسوده با ما از طریق forum تماس بگیرید.

سؤالات متداول

چگونه می‌توانم اسناد ورد را در Java تجزیه کنم؟

برای استخراج تصاویر یا متن، ابتدا باید سند ورد را با استفاده از GroupDocs.Parser Cloud SDK بارگذاری و تجزیه کنید. این فرآیند شامل مشخص کردن مسیر فایل و فراخوانی روش Parse برای تجزیه اسناد است.

آیا SDK ابری GroupDocs.Parser می‌تواند تصاویر را از فرمت‌های دیگر مدارک استخراج کند؟

بله، GroupDocs.Parser Cloud SDK for Java از استخراج تصاویر از فرمت‌های مختلف اسناد، از جمله Word، PDF، Excel، PowerPoint و بسیاری دیگر پشتیبانی می‌کند.

آیا SDK ابری GroupDocs.Parser قادر به استخراج چندین تصویر از یک سند Word واحد است؟

بله، SDK می‌تواند چندین تصویر را از یک سند ورد استخراج کند و همه تصاویر موجود در سند را در اختیار شما قرار دهد.

آیا SDK گروه مستندات پارسر در Cloud کیفیت اصلی تصویر را در طول فرآیند استخراج حفظ می‌کند؟

بله، GroupDocs.Parser Cloud SDK for Java کیفیت تصویر اصلی را در حین استخراج تصاویر از اسناد ورد حفظ می‌کند.

همچنین ببینید

در اینجا مقالات مرتبطی وجود دارد که ممکن است برای شما مفید باشد: