تجزیه کننده اسناد Word - استخراج تصاویر از فایل Word به صورت آنلاین در جاوا

تجزیه اسناد در بسیاری از صنایع که استخراج داده ها از فرمت های مختلف اسناد مورد نیاز است، یک کار حیاتی است. هنگام کار با اسناد Word، استخراج تصاویر می تواند به ویژه در مواردی مانند تجزیه و تحلیل محتوا، تشخیص تصویر، یا تجسم داده ها مفید باشد. استخراج دستی تصاویر از اسناد بزرگ Word می تواند زمان بر باشد. بنابراین، خودکار کردن فرآیند استخراج تصویر می تواند در زمان و تلاش شما صرفه جویی کند. در این مقاله نحوه استخراج تصاویر از اسناد Word به صورت برنامه نویسی در جاوا را نشان خواهیم داد.

موضوعات زیر در این مقاله پوشش داده خواهد شد:

Java REST API برای استخراج تصاویر از اسناد Word و نصب SDK

GroupDocs.Parser Cloud SDK for Java یک کتابخانه قدرتمند جاوا است که راهی ساده و کارآمد برای تجزیه و استخراج داده ها از [فرمت های سند] مختلف، از جمله اسناد Word ارائه می دهد. طیف گسترده ای از ویژگی ها را برای تجزیه اسناد ارائه می دهد و به توسعه دهندگان اجازه می دهد تصاویر، متن، ابرداده و موارد دیگر را استخراج کنند. GroupDocs.Parser همچنین C#.NET، جاوا، PHP، Ruby و Python SDK را به عنوان [اعضای خانواده تجزیه کننده سند7 خود برای API های ابری ارائه می کند.

برای شروع، باید GroupDocs.Parser Cloud SDK را در پروژه جاوا خود قرار دهید. می‌توانید فایل JAR API را دانلود یا با استفاده از Maven با افزودن مخزن و وابستگی زیر به فایل pom.xml پروژه خود نصب کنید:

مخزن Maven:

<repository>
    <id>groupdocs-artifact-repository</id>
    <name>GroupDocs Artifact Repository</name>
    <url>https://repository.groupdocs.cloud/repo</url>
</repository>

وابستگی Maven:

<dependency>
    <groupId>com.groupdocs</groupId>
    <artifactId>groupdocs-parser-cloud</artifactId>
    <version>23.3</version>
    <scope>compile</scope>
</dependency>

در مرحله بعد، باید برای یک حساب آزمایشی رایگان ثبت نام کنید یا یک طرح اشتراک را خریداری کنید در وب‌سایت GroupDocs و کلید API خود را دریافت کنید. هنگامی که Client Id و Client Secret را دارید، قطعه کد زیر را به یک برنامه مبتنی بر جاوا اضافه کنید:

# پس از ثبت نام، client_id و client_secret خود را از https://dashboard.groupdocs.cloud دریافت کنید.

String ClientId = "xxxxxxxx-xxxx-xxxx-xxxx-xxxxxxxxxxxx";
String ClientSecret = "xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx";
String MyStorage = "test-internal-storage";
Configuration configuration = new Configuration(ClientId, ClientSecret);

نحوه استخراج همه تصاویر از اسناد Word در جاوا با استفاده از REST API

برای استخراج تصاویر از اسناد Word در جاوا با استفاده از GroupDocs.Parser Cloud SDK، این مراحل و یک نمونه کد کد را دنبال کنید:

  • ابتدا کلاس های مورد نیاز را در فایل جاوا خود وارد کنید.
  • در مرحله دوم، یک نمونه از کلاس ParseApi ایجاد کنید.
  • سوم، یک نمونه از کلاس FileInfo ایجاد کنید.
  • سپس مسیر سند ورودی Word را تنظیم کنید.
  • سپس، یک نمونه از کلاس ImagesOptions() ایجاد کنید.
  • سپس fileInfo را به گزینه setFileInfo image اختصاص دهید.
  • اکنون یک نمونه از کلاس ImagesRequest() بسازید و پارامتر ImagesOptions را پاس کنید.
  • در نهایت، با فراخوانی متد ParseApi.images() و پاس دادن پارامتر ImagesRequest به نتیجه برسید.

نمونه کد زیر نحوه استخراج همه تصاویر از یک سند Word را به صورت آنلاین در جاوا با استفاده از REST API نشان می دهد:

package com.groupdocsdev.classes;

import com.groupdocs.cloud.parser.api.ParseApi;
import com.groupdocs.cloud.parser.client.ApiException;
import com.groupdocs.cloud.parser.client.Configuration;
import com.groupdocs.cloud.parser.model.FileInfo;
import com.groupdocs.cloud.parser.model.ImagesOptions;
import com.groupdocs.cloud.parser.model.ImagesResult;
import com.groupdocs.cloud.parser.model.requests.ImagesRequest;

// نحوه استخراج تصاویر از یک سند Word در جاوا.
public class App {

	public static void main(String[] args) {
		
		// یک نمونه از Parse API ایجاد کنید
		ParseApi apiInstance = new ParseApi(configuration);

		try {

			// تنظیمات را آماده کنید
			FileInfo fileInfo = new FileInfo();
			fileInfo.setFilePath("java-testing/input-sample-file.docx");

			ImagesOptions options = new ImagesOptions();
			options.setFileInfo(fileInfo);
			ImagesRequest request = new ImagesRequest(options);
			ImagesResult response = apiInstance.images(request);

			// دریافت مسیر فایل خروجی
			System.out.println("Output file path: " + response.getPath());
				
		} catch (ApiException e) {
			System.err.println("Exception while calling FileApi:");
			e.printStackTrace();
		}
		
	}
}

استخراج تصاویر خاص از فایل Word در جاوا با استفاده از شماره صفحه

در این بخش، مراحل و نمونه کدی را برای استخراج تصاویر خاص از یک سند Word به صورت برنامه‌نویسی در جاوا می‌نویسیم:

  • ابتدا کلاس های مورد نیاز را در فایل جاوا خود وارد کنید.
  • در مرحله دوم، یک نمونه از کلاس ParseApi ایجاد کنید.
  • سوم، یک نمونه از کلاس FileInfo ایجاد کنید.
  • سپس مسیر فایل Word را به عنوان ورودی تنظیم کنید.
  • سپس، یک نمونه از کلاس ImagesOptions() ایجاد کنید.
  • سپس fileInfo را به گزینه setFileInfo image اختصاص دهید.
  • سپس مقادیر setStartPageNumber و setCountPagesToExtract را ارائه دهید.
  • اکنون یک نمونه از کلاس ImagesRequest() بسازید و پارامتر ImagesOptions را پاس کنید.
  • در نهایت با فراخوانی متد ParseApi.images() و پاس دادن پارامتر ImagesRequest به نتیجه برسید.

نمونه کد زیر نحوه استخراج تصاویر خاص از یک فایل Word را بر اساس محدوده صفحه در جاوا با استفاده از REST API نشان می دهد:

package com.groupdocsdev.classes;

import com.groupdocs.cloud.parser.api.ParseApi;
import com.groupdocs.cloud.parser.client.ApiException;
import com.groupdocs.cloud.parser.client.Configuration;
import com.groupdocs.cloud.parser.model.FileInfo;
import com.groupdocs.cloud.parser.model.ImagesOptions;
import com.groupdocs.cloud.parser.model.ImagesResult;
import com.groupdocs.cloud.parser.model.requests.ImagesRequest;

// استخراج تصاویر از یک فایل Word به صورت آنلاین بر اساس محدوده صفحه در جاوا.
public class App {

	public static void main(String[] args) {
		
		// یک نمونه از Parse API ایجاد کنید
		ParseApi apiInstance = new ParseApi(configuration);

		try {

			// تنظیمات را آماده کنید
			FileInfo fileInfo = new FileInfo();
			fileInfo.setFilePath("java-testing/input-sample-file.docx");

			ImagesOptions options = new ImagesOptions();
			options.setFileInfo(fileInfo);
			options.setStartPageNumber(1);
			options.setCountPagesToExtract(2);
			ImagesRequest request = new ImagesRequest(options);
			ImagesResult response = apiInstance.images(request);

			// دریافت مسیر فایل خروجی
			System.out.println("Output file path: " + response.getPath());
				
		} catch (ApiException e) {
			System.err.println("Exception while calling FileApi:");
			e.printStackTrace();
		}
		
	}
}

استخراج کننده تصویر آنلاین رایگان

بهترین راه برای استخراج رایگان تصاویر از Word آنلاین چیست؟ لطفاً یک تجزیه کننده آنلاین اسناد Word را برای استخراج تصاویر از Word امتحان کنید. این ابزار Word Parser با استفاده از کتابخانه تجزیه کننده جاوا که در بالا ذکر شد توسعه یافته است.

نتیجه

در نتیجه، GroupDocs.Parser Cloud SDK یک راه حل عالی برای استخراج تصاویر از اسناد Word، صرفه جویی در زمان و تلاش و حصول اطمینان از نتایج دقیق است. آنچه از این مقاله آموخته اید به شرح زیر است:

  • نحوه استخراج همه تصاویر از Word DOCX به صورت برنامه نویسی در جاوا با استفاده از REST API.
  • نحوه استخراج تصاویر خاص از اسناد Word در جاوا با استفاده از REST API.
  • و ابزار استخراج آنلاین تصویر برای استخراج تصاویر از اسناد Word.

علاوه بر این، می‌توانید با استفاده از مستندات درباره GroupDocs.Parser Cloud API اطلاعات بیشتری کسب کنید. ما همچنین یک بخش API Reference ارائه می‌کنیم که به شما امکان می‌دهد APIهای ما را مستقیماً از طریق مرورگر تجسم کرده و با آن‌ها تعامل داشته باشید. کد منبع کامل جاوا SDK به صورت رایگان در Github در دسترس است.

در نهایت، ما به نوشتن مقالات وبلاگ جدید در قالب‌های فایل مختلف و تجزیه آنها با استفاده از REST API ادامه می‌دهیم. بنابراین، لطفا برای آخرین به روز رسانی تماس بگیرید.

یه سوال بپرس

در صورتی که در مورد نحوه استخراج تصاویر از اسناد سؤالی دارید، لطفاً از طریق [فروم 22 ما با ما تماس بگیرید.

سوالات متداول

چگونه اسناد Word را در جاوا تجزیه کنم؟

برای استخراج تصاویر یا متن، ابتدا باید سند Word را با استفاده از GroupDocs.Parser Cloud SDK بارگیری و تجزیه کنید. این فرآیند شامل تعیین مسیر فایل و فراخوانی متد Parse برای تجزیه اسناد است.

آیا GroupDocs.Parser Cloud SDK می تواند تصاویر را از سایر قالب های سند استخراج کند؟

بله، GroupDocs.Parser Cloud SDK for Java از استخراج تصاویر از فرمت های مختلف سند، از جمله Word، PDF، Excel، PowerPoint و بسیاری موارد دیگر پشتیبانی می کند.

آیا GroupDocs.Parser Cloud SDK می تواند چندین تصویر را از یک سند Word استخراج کند؟

بله، SDK می‌تواند چندین تصویر را از یک سند Word استخراج کند و تمام تصاویر موجود در سند را در اختیار شما قرار دهد.

آیا GroupDocs.Parser Cloud SDK کیفیت تصویر اصلی را در طول فرآیند استخراج حفظ می کند؟

بله، GroupDocs.Parser Cloud SDK for Java کیفیت تصویر اصلی را در حین استخراج تصاویر از اسناد Word حفظ می کند.

همچنین ببینید

در اینجا چند مقاله مرتبط وجود دارد که ممکن است برای شما مفید باشد: