Word Document Parser – แยกรูปภาพออกจากไฟล์ Word Online ใน Java

การแยกวิเคราะห์เอกสารเป็นงานที่สำคัญในหลายอุตสาหกรรม ซึ่งจำเป็นต้องดึงข้อมูลจากรูปแบบเอกสารต่างๆ เมื่อทำงานกับเอกสาร Word การแยกรูปภาพจะมีประโยชน์อย่างยิ่งในกรณีต่างๆ เช่น การวิเคราะห์เนื้อหา การจดจำรูปภาพ หรือการแสดงข้อมูลเป็นภาพ การแยกรูปภาพด้วยตนเองจากเอกสาร Word ขนาดใหญ่อาจใช้เวลานาน ดังนั้น การทำกระบวนการแยกภาพโดยอัตโนมัติสามารถช่วยคุณประหยัดเวลาและความพยายาม ในบทความนี้ เราจะสาธิตวิธีการแยกรูปภาพจากเอกสาร Word โดยทางโปรแกรมใน Java

หัวข้อต่อไปนี้จะครอบคลุมในบทความนี้:

Java REST API เพื่อแยกรูปภาพจากเอกสาร Word และการติดตั้ง SDK

GroupDocs.Parser Cloud SDK สำหรับ Java เป็นไลบรารี Java ที่มีประสิทธิภาพซึ่งมอบวิธีที่ง่ายและมีประสิทธิภาพในการแยกวิเคราะห์และแยกข้อมูลจาก รูปแบบเอกสาร ต่างๆ รวมถึงเอกสาร Word นำเสนอคุณสมบัติที่หลากหลายสำหรับการแยกวิเคราะห์เอกสาร ช่วยให้นักพัฒนาสามารถแยกรูปภาพ ข้อความ ข้อมูลเมตา และอื่นๆ GroupDocs.Parser ยังมี C#.NET, Java, PHP, Ruby และ Python SDK เป็น สมาชิกตระกูลโปรแกรมแยกวิเคราะห์เอกสาร สำหรับ Cloud API

ในการเริ่มต้น คุณต้องรวม GroupDocs.Parser Cloud SDK ไว้ในโปรเจ็กต์ Java ของคุณ คุณสามารถ ดาวน์โหลด ไฟล์ JAR ของ API หรือติดตั้งโดยใช้ Maven โดยเพิ่มที่เก็บและการอ้างอิงต่อไปนี้ในไฟล์ pom.xml ของโปรเจ็กต์:

พื้นที่เก็บข้อมูล Maven:

<repository>
    <id>groupdocs-artifact-repository</id>
    <name>GroupDocs Artifact Repository</name>
    <url>https://repository.groupdocs.cloud/repo</url>
</repository>

การพึ่งพา Maven:

<dependency>
    <groupId>com.groupdocs</groupId>
    <artifactId>groupdocs-parser-cloud</artifactId>
    <version>23.3</version>
    <scope>compile</scope>
</dependency>

ต่อไป คุณต้อง ลงทะเบียน สำหรับบัญชีทดลองใช้ฟรีหรือ ซื้อแผนการสมัครสมาชิก บนเว็บไซต์ GroupDocs และ รับรหัส API ของคุณ เมื่อคุณมี Client Id และ Client Secret แล้ว ให้เพิ่มข้อมูลโค้ดด้านล่างลงในแอปพลิเคชันที่ใช้ Java:

# รับ client_id และ client_secret ของคุณจาก https://dashboard.groupdocs.cloud หลังจากลงทะเบียน

String ClientId = "xxxxxxxx-xxxx-xxxx-xxxx-xxxxxxxxxxxx";
String ClientSecret = "xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx";
String MyStorage = "test-internal-storage";
Configuration configuration = new Configuration(ClientId, ClientSecret);

วิธีแยกรูปภาพทั้งหมดจากเอกสาร Word ใน Java โดยใช้ REST API

หากต้องการแยกรูปภาพจากเอกสาร Word ใน Java โดยใช้ GroupDocs.Parser Cloud SDK ให้ทำตามขั้นตอนเหล่านี้และตัวอย่างข้อมูลโค้ด:

  • ขั้นแรก นำเข้าคลาสที่จำเป็นลงในไฟล์ Java ของคุณ
  • ประการที่สอง สร้างอินสแตนซ์ของคลาส ParseApi
  • ประการที่สาม สร้างอินสแตนซ์ของคลาส FileInfo
  • จากนั้นกำหนดเส้นทางไปยังเอกสาร Word ที่ป้อน
  • จากนั้น สร้างอินสแตนซ์ของคลาส ImagesOptions()
  • ถัดไป กำหนด fileInfo ให้กับตัวเลือกภาพ setFileInfo
  • ตอนนี้ สร้างอินสแตนซ์ของคลาส ImagesRequest() และส่งพารามิเตอร์ ImagesOptions
  • สุดท้าย รับผลลัพธ์โดยเรียกเมธอด ParseApi.images() และส่งพารามิเตอร์ ImagesRequest

ตัวอย่างโค้ดต่อไปนี้แสดงวิธีแยกรูปภาพทั้งหมดจากเอกสาร Word ทางออนไลน์ใน Java โดยใช้ REST API:

package com.groupdocsdev.classes;

import com.groupdocs.cloud.parser.api.ParseApi;
import com.groupdocs.cloud.parser.client.ApiException;
import com.groupdocs.cloud.parser.client.Configuration;
import com.groupdocs.cloud.parser.model.FileInfo;
import com.groupdocs.cloud.parser.model.ImagesOptions;
import com.groupdocs.cloud.parser.model.ImagesResult;
import com.groupdocs.cloud.parser.model.requests.ImagesRequest;

// วิธีดึงรูปภาพจากเอกสาร Word ในภาษาจาวา
public class App {

	public static void main(String[] args) {
		
		// สร้างอินสแตนซ์ของ Parse API
		ParseApi apiInstance = new ParseApi(configuration);

		try {

			// เตรียมการตั้งค่า
			FileInfo fileInfo = new FileInfo();
			fileInfo.setFilePath("java-testing/input-sample-file.docx");

			ImagesOptions options = new ImagesOptions();
			options.setFileInfo(fileInfo);
			ImagesRequest request = new ImagesRequest(options);
			ImagesResult response = apiInstance.images(request);

			// รับเส้นทางไฟล์เอาต์พุต
			System.out.println("Output file path: " + response.getPath());
				
		} catch (ApiException e) {
			System.err.println("Exception while calling FileApi:");
			e.printStackTrace();
		}
		
	}
}

แยกรูปภาพเฉพาะจากไฟล์ Word ใน Java โดยใช้หมายเลขหน้า

ในส่วนนี้ เราจะเขียนขั้นตอนและตัวอย่างข้อมูลโค้ดสำหรับการแยกรูปภาพเฉพาะจากเอกสาร Word โดยทางโปรแกรมใน Java:

  • ขั้นแรก นำเข้าคลาสที่จำเป็นลงในไฟล์ Java ของคุณ
  • ประการที่สอง สร้างอินสแตนซ์ของคลาส ParseApi
  • ประการที่สาม สร้างอินสแตนซ์ของคลาส FileInfo
  • จากนั้นกำหนดเส้นทางไปยังไฟล์ Word เป็นอินพุต
  • จากนั้น สร้างอินสแตนซ์ของคลาส ImagesOptions()
  • ถัดไป กำหนด fileInfo ให้กับตัวเลือกภาพ setFileInfo
  • จากนั้น ระบุค่า setStartPageNumber และ setCountPagesToExtract
  • ตอนนี้ สร้างอินสแตนซ์ของคลาส ImagesRequest() และส่งพารามิเตอร์ ImagesOptions
  • สุดท้าย รับผลลัพธ์โดยเรียกเมธอด ParseApi.images() และส่งพารามิเตอร์ ImagesRequest

ตัวอย่างโค้ดต่อไปนี้แสดงวิธีแยกรูปภาพเฉพาะจากไฟล์ Word ตามช่วงหน้าใน Java โดยใช้ REST API:

package com.groupdocsdev.classes;

import com.groupdocs.cloud.parser.api.ParseApi;
import com.groupdocs.cloud.parser.client.ApiException;
import com.groupdocs.cloud.parser.client.Configuration;
import com.groupdocs.cloud.parser.model.FileInfo;
import com.groupdocs.cloud.parser.model.ImagesOptions;
import com.groupdocs.cloud.parser.model.ImagesResult;
import com.groupdocs.cloud.parser.model.requests.ImagesRequest;

// แยกรูปภาพจากไฟล์ Word ทางออนไลน์ตามช่วงหน้าใน Java
public class App {

	public static void main(String[] args) {
		
		// สร้างอินสแตนซ์ของ Parse API
		ParseApi apiInstance = new ParseApi(configuration);

		try {

			// เตรียมการตั้งค่า
			FileInfo fileInfo = new FileInfo();
			fileInfo.setFilePath("java-testing/input-sample-file.docx");

			ImagesOptions options = new ImagesOptions();
			options.setFileInfo(fileInfo);
			options.setStartPageNumber(1);
			options.setCountPagesToExtract(2);
			ImagesRequest request = new ImagesRequest(options);
			ImagesResult response = apiInstance.images(request);

			// รับเส้นทางไฟล์เอาต์พุต
			System.out.println("Output file path: " + response.getPath());
				
		} catch (ApiException e) {
			System.err.println("Exception while calling FileApi:");
			e.printStackTrace();
		}
		
	}
}

โปรแกรมแยกรูปภาพออนไลน์ฟรี

วิธีที่ดีที่สุดในการดึงรูปภาพจาก Word ออนไลน์ฟรีคืออะไร โปรดลองใช้ ตัวแยกวิเคราะห์เอกสาร Word ออนไลน์ เพื่อแยกรูปภาพออกจาก Word เครื่องมือ Word Parser นี้ได้รับการพัฒนาโดยใช้ไลบรารีตัวแยกวิเคราะห์ Java ที่กล่าวถึงข้างต้น

บทสรุป

โดยสรุป GroupDocs.Parser Cloud SDK เป็นโซลูชันที่ยอดเยี่ยมสำหรับการแยกรูปภาพจากเอกสาร Word ช่วยประหยัดเวลาและความพยายามในขณะที่ให้ผลลัพธ์ที่แม่นยำ ต่อไปนี้คือสิ่งที่คุณได้เรียนรู้จากบทความนี้:

  • วิธีแยกรูปภาพทั้งหมดจาก Word DOCX โดยทางโปรแกรมใน Java โดยใช้ REST API
  • วิธีแยกรูปภาพเฉพาะจากเอกสาร Word ใน Java โดยใช้ REST API
  • และเครื่องมือแยกรูปภาพออนไลน์เพื่อแยกรูปภาพจากเอกสาร Word

นอกจากนี้ คุณสามารถเรียนรู้เพิ่มเติมเกี่ยวกับ GroupDocs.Parser Cloud API โดยใช้ เอกสารประกอบ นอกจากนี้ เรายังมีส่วน การอ้างอิง API ที่ช่วยให้คุณแสดงภาพและโต้ตอบกับ API ของเราได้โดยตรงผ่านเบราว์เซอร์ ซอร์สโค้ดที่สมบูรณ์ของ Java SDK มีให้ใช้งานฟรีบน Github

สุดท้าย เรายังคงเขียนบทความบล็อกใหม่ๆ ในรูปแบบไฟล์ต่างๆ และแยกวิเคราะห์โดยใช้ REST API ดังนั้น กรุณาติดต่อเพื่อรับการปรับปรุงล่าสุด

ถามคำถาม

ในกรณีที่คุณมีข้อสงสัยเกี่ยวกับวิธีแยกรูปภาพออกจากเอกสาร โปรดติดต่อเราผ่านทาง ฟอรัม

คำถามที่พบบ่อย

ฉันจะแยกวิเคราะห์เอกสาร Word ใน Java ได้อย่างไร

หากต้องการแยกรูปภาพหรือข้อความ ก่อนอื่นคุณต้องโหลดและแยกวิเคราะห์เอกสาร Word โดยใช้ GroupDocs.Parser Cloud SDK กระบวนการนี้เกี่ยวข้องกับการระบุเส้นทางของไฟล์และการเรียกใช้เมธอด Parse เพื่อแยกวิเคราะห์เอกสาร

GroupDocs.Parser Cloud SDK สามารถแยกรูปภาพจากรูปแบบเอกสารอื่นได้หรือไม่

ใช่ GroupDocs.Parser Cloud SDK for Java รองรับการแยกรูปภาพจากรูปแบบเอกสารต่างๆ รวมถึง Word, PDF, Excel, PowerPoint และอื่นๆ อีกมากมาย

GroupDocs.Parser Cloud SDK สามารถแยกรูปภาพหลายรูปจากเอกสาร Word เดียวได้หรือไม่

ได้ SDK สามารถแยกรูปภาพหลายรูปจากเอกสาร Word เดียว ให้คุณมีรูปภาพทั้งหมดที่อยู่ในเอกสาร

GroupDocs.Parser Cloud SDK รักษาคุณภาพของภาพต้นฉบับในระหว่างกระบวนการดึงข้อมูลหรือไม่

ใช่ GroupDocs.Parser Cloud SDK for Java รักษาคุณภาพของภาพต้นฉบับในขณะที่ดึงภาพจากเอกสาร Word

ดูสิ่งนี้ด้วย

ต่อไปนี้คือบทความที่เกี่ยวข้องบางส่วนที่คุณอาจพบว่ามีประโยชน์: