ดึงภาพจากเอกสาร PDF ใน Java

PDF File Parser – แยกภาพจากไฟล์ PDF ออนไลน์ใน Java

PDF(Portable Document Format) เป็นรูปแบบไฟล์ที่ใช้กันอย่างแพร่หลายสำหรับการแชร์และเก็บรักษาเอกสารออนไลน์ มันมักจะมีเนื้อหาหลายประเภท รวมถึงข้อความ รูปภาพ ตาราง และอื่นๆ การดึงเนื้อหาที่เฉพาะเจาะจงจากไฟล์ PDF เช่น รูปภาพ อาจเป็นงานที่ท้าทายโดยไม่มีเครื่องมือหรือห้องสมุดที่เชื่อถือได้ หนึ่งในเครื่องมือดังกล่าวคือ GroupDocs.Parser Cloud SDK สำหรับ Java ซึ่งให้วิธีที่ราบรื่นและมีประสิทธิภาพในการดึงรูปภาพจากไฟล์ PDF ในบทความนี้เราจะแสดงวิธีการดึงรูปภาพจากไฟล์ PDF ใน Java โดยใช้ REST API

หัวข้อดังต่อไปนี้จะถูกนำเสนอในบทความนี้:

Java REST API เพื่อแยกภาพจาก PDF และการติดตั้ง SDK
วิธีการดึงภาพทั้งหมดจากไฟล์ PDF ใน Java โดยใช้ REST API
Extract Specific Images from PDF Files in Java using Page Number

Java REST API to Separate Images from PDF and SDK Installation

GroupDocs.Parser Cloud SDK for Java เป็นไลบรารี Java ที่มีพลังและหลากหลายซึ่งให้วิธีที่ง่ายและมีประสิทธิภาพในการแยกวิเคราะห์และถอดข้อมูลจาก รูปแบบเอกสารต่างๆ รวมถึงไฟล์ PDF มันมีคุณสมบัติต่างๆ สำหรับการแยกวิเคราะห์เอกสาร ช่วยให้นักพัฒนาสามารถดึงภาพ ข้อความ เมทาดาต้า และเนื้อหาอื่นๆ ออกมาได้ GroupDocs.Parser ยังมี C#.NET, Java, PHP, Ruby และ Python SDKs ซึ่งเป็น สมาชิกในครอบครัวตัวแยกวิเคราะห์เอกสาร สำหรับ Cloud APIs.

ในการเริ่มต้น คุณต้องรวม GroupDocs.Parser Cloud SDK เข้าในโครงการ Java ของคุณ คุณสามารถ ดาวน์โหลด ไฟล์ JAR ของ API หรือ ติดตั้งโดยใช้ Maven โดยการเพิ่มที่เก็บและการพึ่งพาต่อไปนี้ในไฟล์ pom.xml ของโครงการของคุณ:

Maven Repository:

<repository>
    <id>groupdocs-artifact-repository</id>
    <name>GroupDocs Artifact Repository</name>
    <url>https://repository.groupdocs.cloud/repo</url>
</repository>

Maven Dependency:

<dependency>
    <groupId>com.groupdocs</groupId>
    <artifactId>groupdocs-parser-cloud</artifactId>
    <version>23.3</version>
    <scope>compile</scope>
</dependency>

ถัดไป คุณต้อง sign up สำหรับบัญชีทดลองใช้งานฟรีหรือ purchase a subscription plan บนเว็บไซต์ GroupDocs และ get your API key เมื่อคุณมี Client Id และ Client Secret ให้เพิ่มโค้ดสตSnippet ด้านล่างนี้ลงในแอปพลิเคชันที่ใช้ Java:

# รับ clientid และ clientsecret ของคุณจาก https://dashboard.groupdocs.cloud หลังจากการลงทะเบียน。

String ClientId = "xxxxxxxx-xxxx-xxxx-xxxx-xxxxxxxxxxxx";
String ClientSecret = "xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx";
String MyStorage = "test-internal-storage";
Configuration configuration = new Configuration(ClientId, ClientSecret);

วิธีการดึงรูปภาพทั้งหมดจากไฟล์ PDF ใน Java โดยใช้ REST API

ตอนนี้เรามาเขียนขั้นตอนและตัวอย่างโค้ดเพื่อนำภาพออกจากไฟล์ PDF โดยใช้ GroupDocs.Parser Cloud SDK สำหรับ Java:

ก่อนอื่น ให้นำเข้าชั้นเรียนที่ต้องการไปยังไฟล์ Java ของคุณ。
ประการที่สอง สร้างตัวอย่างของคลาส ParseApi
สาม, สร้างตัวอย่างของคลาส FileInfo .
ถัดไป กำหนดเส้นทางไปยังเอกสาร PDF ที่นำเข้า
แล้ว สร้างอินสแตนซ์ของคลาส ImagesOptions()
ถัดไป กำหนด fileInfo ให้กับตัวเลือกภาพ setFileInfo。
ตอนนี้ สร้างตัวอย่างของคลาส ImagesRequest() และส่งพารามิเตอร์ ImagesOptions.
สุดท้าย ให้เรียกดูผลลัพธ์โดยใช้เมธอด ParseApi.images() และส่งพารามิเตอร์ ImagesRequest.

ตัวอย่างโค้ดต่อไปนี้แสดงวิธีการดึงรูปภาพทั้งหมดจากไฟล์ PDF ออนไลน์ใน Java โดยใช้ REST API:

package com.groupdocsdev.classes;

import com.groupdocs.cloud.parser.api.ParseApi;
import com.groupdocs.cloud.parser.client.ApiException;
import com.groupdocs.cloud.parser.client.Configuration;
import com.groupdocs.cloud.parser.model.FileInfo;
import com.groupdocs.cloud.parser.model.ImagesOptions;
import com.groupdocs.cloud.parser.model.ImagesResult;
import com.groupdocs.cloud.parser.model.requests.ImagesRequest;

// วิธีการดึงรูปภาพจากไฟล์ PDF ใน Java.
public class App {

	public static void main(String[] args) {
		
		// สร้างตัวอย่างของ Parse API
		ParseApi apiInstance = new ParseApi(configuration);

		try {

			// จัดเตรียมการตั้งค่า
			FileInfo fileInfo = new FileInfo();
			fileInfo.setFilePath("java-testing/input-sample-file.pdf");

			ImagesOptions options = new ImagesOptions();
			options.setFileInfo(fileInfo);
			ImagesRequest request = new ImagesRequest(options);
			ImagesResult response = apiInstance.images(request);

			// Get output file path
			System.out.println("Output file path: " + response.getPath());
				
		} catch (ApiException e) {
			System.err.println("Exception while calling FileApi:");
			e.printStackTrace();
		}
		
	}
}

Extract Specific Images from PDF Files in Java using Page Number

ในส่วนนี้ เราจะให้ขั้นตอนและโค้ดส่วนหนึ่งสำหรับการดึงภาพเฉพาะจากไฟล์ PDF อย่างเป็นระเบียบในภาษา Java:

ก่อนอื่น ให้นำเข้าชั้นเรียนที่ต้องการไปยังไฟล์ Java ของคุณ。
ประการที่สอง สร้างอินสแตนซ์ของคลาส ParseApi.
ประการที่สาม สร้างอินสแตนซ์ของคลาส FileInfo
ถัดไป กำหนดเส้นทางไปยังเอกสาร PDF ที่นำเข้า
แล้ว สร้างอินสแตนซ์ของคลาส ImagesOptions()
ถัดไป กำหนด fileInfo ให้กับตัวเลือกภาพ setFileInfo。
จากนั้น ให้กำหนดค่า setStartPageNumber และ setCountPagesToExtract
ตอนนี้ สร้างตัวอย่างของคลาส ImagesRequest() และส่งพารามิเตอร์ ImagesOptions.
สุดท้ายให้รับผลลัพธ์โดยการเรียกใช้ ParseApi.images() วิธีและส่งพารามิเตอร์ ImagesRequest

โปรแกรมตัวอย่างด้านล่างแสดงวิธีการดึงรูปภาพเฉพาะจากไฟล์ PDF ตามช่วงหน้าใน Java โดยใช้ REST API:

package com.groupdocsdev.classes;

import com.groupdocs.cloud.parser.api.ParseApi;
import com.groupdocs.cloud.parser.client.ApiException;
import com.groupdocs.cloud.parser.client.Configuration;
import com.groupdocs.cloud.parser.model.FileInfo;
import com.groupdocs.cloud.parser.model.ImagesOptions;
import com.groupdocs.cloud.parser.model.ImagesResult;
import com.groupdocs.cloud.parser.model.requests.ImagesRequest;

// ดึงภาพจากไฟล์ PDF ออนไลน์ตามช่วงหน้าด้วย Java
public class App {

	public static void main(String[] args) {
		
		// สร้างอินสแตนซ์ของ Parse API
		ParseApi apiInstance = new ParseApi(configuration);

		try {

			// เตรียมการตั้งค่า
			FileInfo fileInfo = new FileInfo();
			fileInfo.setFilePath("java-testing/input-sample-file.pdf");

			ImagesOptions options = new ImagesOptions();
			options.setFileInfo(fileInfo);
			options.setStartPageNumber(1);
			options.setCountPagesToExtract(2);
			ImagesRequest request = new ImagesRequest(options);
			ImagesResult response = apiInstance.images(request);

			// Get output file path
			System.out.println("Output file path: " + response.getPath());
				
		} catch (ApiException e) {
			System.err.println("Exception while calling FileApi:");
			e.printStackTrace();
		}
		
	}
}

ฟรีเครื่องมือออนไลน์สำหรับการดึงภาพ

วิธีที่ดีที่สุดในการแยกภาพจาก PDF ออนไลน์ฟรีคืออะไร? กรุณาลองใช้ online PDF File parser เพื่อแยกภาพจากไฟล์ PDF ซอฟต์แวร์ PDF Parser นี้พัฒนาด้วยภาษา Java ตามที่กล่าวถึงในห้องสมุด parser ข้างต้น.

บทสรุป

สรุปได้ว่า GroupDocs.Parser Cloud SDK สำหรับ Java เป็นโซลูชันที่เชื่อถือได้และมีประสิทธิภาพสำหรับการดึงภาพจากไฟล์ PDF ได้อย่างง่ายดาย สิ่งต่อไปนี้คือสิ่งที่คุณได้เรียนรู้จากบทความนี้:

How to extract all images from PDF files programmatically in Java using REST API;
How to extract specific images from PDF documents in Java using REST API;
เครื่องมือการสกัดภาพออนไลน์เพื่อสกัดภาพจากเอกสาร PDF

นอกจากนี้ คุณสามารถเรียนรู้เพิ่มเติมเกี่ยวกับ GroupDocs.Parser Cloud API ได้โดยใช้ documentation เรายังมีส่วน API Reference ที่ช่วยให้คุณสามารถมองเห็นและมีส่วนร่วมกับ APIs ของเราได้โดยตรงผ่านเบราว์เซอร์ ซอร์สโค้ดทั้งหมดของ Java SDK มีให้ฟรีที่ Github.

สุดท้ายนี้ เราจะยังคงเขียนบทความบล็อกใหม่เกี่ยวกับรูปแบบไฟล์ที่แตกต่างกันและการวิเคราะห์ไฟล์เหล่านั้นโดยใช้ REST API ดังนั้น กรุณาติดต่อเราเพื่อรับข้อมูลอัปเดตล่าสุด

ถามคำถาม

หากคุณมีข้อสงสัยเกี่ยวกับวิธีการวิเคราะห์เอกสาร โปรดติดต่อเราผ่านทาง forum.

FAQs

How do I parse PDF files using Java?

ในการดึงภาพ ข้อความ หรือข้อมูลที่เป็นเมตาดาต้า คุณต้องโหลดและ解析เอกสาร PDF ก่อนโดยใช้ GroupDocs.Parser Cloud SDK กระบวนการนี้เกี่ยวข้องกับการระบุเส้นทางไฟล์และเรียกใช้วิธี Parse เพื่อตีความไฟล์ PDF

GroupDocs.Parser Cloud SDK for Java รองรับรูปแบบไฟล์อื่น ๆ นอกเหนือจาก PDF หรือไม่?

ใช่ นอกจากไฟล์ PDF แล้ว GroupDocs.Parser Cloud SDK for Java ยังรองรับการดึงข้อมูลรูปภาพจากรูปแบบเอกสารต่างๆ รวมถึง Word, Excel, PowerPoint, HTML และอื่นๆ อีกมากมาย

Can I extract all images from a PDF file using GroupDocs.Parser Cloud SDK for Java?

ใช่ คุณสามารถดึงภาพทั้งหมดจากไฟล์ PDF โดยใช้ GroupDocs.Parser Cloud SDK for Java.

ดูเพิ่มเติม

นี่คือบทความที่เกี่ยวข้องบางส่วนที่คุณอาจพบว่ามีประโยชน์:

Java REST API to Separate Images from PDF and SDK Installation#

วิธีการดึงรูปภาพทั้งหมดจากไฟล์ PDF ใน Java โดยใช้ REST API#

Extract Specific Images from PDF Files in Java using Page Number#

ฟรีเครื่องมือออนไลน์สำหรับการดึงภาพ#

บทสรุป#

ถามคำถาม#

FAQs#

ดูเพิ่มเติม#