PDF File Parser – แยกภาพจากไฟล์ PDF ออนไลน์ใน Java

PDF(Portable Document Format) เป็นรูปแบบไฟล์ที่ใช้กันอย่างแพร่หลายสำหรับการแชร์และเก็บรักษาเอกสารออนไลน์ มันมักจะมีเนื้อหาหลายประเภท รวมถึงข้อความ รูปภาพ ตาราง และอื่นๆ การดึงเนื้อหาที่เฉพาะเจาะจงจากไฟล์ PDF เช่น รูปภาพ อาจเป็นงานที่ท้าทายโดยไม่มีเครื่องมือหรือห้องสมุดที่เชื่อถือได้ หนึ่งในเครื่องมือดังกล่าวคือ GroupDocs.Parser Cloud SDK สำหรับ Java ซึ่งให้วิธีที่ราบรื่นและมีประสิทธิภาพในการดึงรูปภาพจากไฟล์ PDF ในบทความนี้เราจะแสดงวิธีการดึงรูปภาพจากไฟล์ PDF ใน Java โดยใช้ REST API

หัวข้อดังต่อไปนี้จะถูกนำเสนอในบทความนี้:

Java REST API to Separate Images from PDF and SDK Installation

GroupDocs.Parser Cloud SDK for Java เป็นไลบรารี Java ที่มีพลังและหลากหลายซึ่งให้วิธีที่ง่ายและมีประสิทธิภาพในการแยกวิเคราะห์และถอดข้อมูลจาก รูปแบบเอกสารต่างๆ รวมถึงไฟล์ PDF มันมีคุณสมบัติต่างๆ สำหรับการแยกวิเคราะห์เอกสาร ช่วยให้นักพัฒนาสามารถดึงภาพ ข้อความ เมทาดาต้า และเนื้อหาอื่นๆ ออกมาได้ GroupDocs.Parser ยังมี C#.NET, Java, PHP, Ruby และ Python SDKs ซึ่งเป็น สมาชิกในครอบครัวตัวแยกวิเคราะห์เอกสาร สำหรับ Cloud APIs.

ในการเริ่มต้น คุณต้องรวม GroupDocs.Parser Cloud SDK เข้าในโครงการ Java ของคุณ คุณสามารถ ดาวน์โหลด ไฟล์ JAR ของ API หรือ ติดตั้งโดยใช้ Maven โดยการเพิ่มที่เก็บและการพึ่งพาต่อไปนี้ในไฟล์ pom.xml ของโครงการของคุณ:

Maven Repository:

<repository>
    <id>groupdocs-artifact-repository</id>
    <name>GroupDocs Artifact Repository</name>
    <url>https://repository.groupdocs.cloud/repo</url>
</repository>

Maven Dependency:

<dependency>
    <groupId>com.groupdocs</groupId>
    <artifactId>groupdocs-parser-cloud</artifactId>
    <version>23.3</version>
    <scope>compile</scope>
</dependency>

ถัดไป คุณต้อง sign up สำหรับบัญชีทดลองใช้งานฟรีหรือ purchase a subscription plan บนเว็บไซต์ GroupDocs และ get your API key เมื่อคุณมี Client Id และ Client Secret ให้เพิ่มโค้ดสตSnippet ด้านล่างนี้ลงในแอปพลิเคชันที่ใช้ Java:

# รับ clientid และ clientsecret ของคุณจาก https://dashboard.groupdocs.cloud หลังจากการลงทะเบียน。

String ClientId = "xxxxxxxx-xxxx-xxxx-xxxx-xxxxxxxxxxxx";
String ClientSecret = "xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx";
String MyStorage = "test-internal-storage";
Configuration configuration = new Configuration(ClientId, ClientSecret);

วิธีการดึงรูปภาพทั้งหมดจากไฟล์ PDF ใน Java โดยใช้ REST API

ตอนนี้เรามาเขียนขั้นตอนและตัวอย่างโค้ดเพื่อนำภาพออกจากไฟล์ PDF โดยใช้ GroupDocs.Parser Cloud SDK สำหรับ Java:

  • ก่อนอื่น ให้นำเข้าชั้นเรียนที่ต้องการไปยังไฟล์ Java ของคุณ。
  • ประการที่สอง สร้างตัวอย่างของคลาส ParseApi
  • สาม, สร้างตัวอย่างของคลาส FileInfo .
  • ถัดไป กำหนดเส้นทางไปยังเอกสาร PDF ที่นำเข้า
  • แล้ว สร้างอินสแตนซ์ของคลาส ImagesOptions()
  • ถัดไป กำหนด fileInfo ให้กับตัวเลือกภาพ setFileInfo。
  • ตอนนี้ สร้างตัวอย่างของคลาส ImagesRequest() และส่งพารามิเตอร์ ImagesOptions.
  • สุดท้าย ให้เรียกดูผลลัพธ์โดยใช้เมธอด ParseApi.images() และส่งพารามิเตอร์ ImagesRequest.

ตัวอย่างโค้ดต่อไปนี้แสดงวิธีการดึงรูปภาพทั้งหมดจากไฟล์ PDF ออนไลน์ใน Java โดยใช้ REST API:

package com.groupdocsdev.classes;

import com.groupdocs.cloud.parser.api.ParseApi;
import com.groupdocs.cloud.parser.client.ApiException;
import com.groupdocs.cloud.parser.client.Configuration;
import com.groupdocs.cloud.parser.model.FileInfo;
import com.groupdocs.cloud.parser.model.ImagesOptions;
import com.groupdocs.cloud.parser.model.ImagesResult;
import com.groupdocs.cloud.parser.model.requests.ImagesRequest;

// วิธีการดึงรูปภาพจากไฟล์ PDF ใน Java.
public class App {

	public static void main(String[] args) {
		
		// สร้างตัวอย่างของ Parse API
		ParseApi apiInstance = new ParseApi(configuration);

		try {

			// จัดเตรียมการตั้งค่า
			FileInfo fileInfo = new FileInfo();
			fileInfo.setFilePath("java-testing/input-sample-file.pdf");

			ImagesOptions options = new ImagesOptions();
			options.setFileInfo(fileInfo);
			ImagesRequest request = new ImagesRequest(options);
			ImagesResult response = apiInstance.images(request);

			// Get output file path
			System.out.println("Output file path: " + response.getPath());
				
		} catch (ApiException e) {
			System.err.println("Exception while calling FileApi:");
			e.printStackTrace();
		}
		
	}
}

Extract Specific Images from PDF Files in Java using Page Number

ในส่วนนี้ เราจะให้ขั้นตอนและโค้ดส่วนหนึ่งสำหรับการดึงภาพเฉพาะจากไฟล์ PDF อย่างเป็นระเบียบในภาษา Java:

  • ก่อนอื่น ให้นำเข้าชั้นเรียนที่ต้องการไปยังไฟล์ Java ของคุณ。
  • ประการที่สอง สร้างอินสแตนซ์ของคลาส ParseApi.
  • ประการที่สาม สร้างอินสแตนซ์ของคลาส FileInfo
  • ถัดไป กำหนดเส้นทางไปยังเอกสาร PDF ที่นำเข้า
  • แล้ว สร้างอินสแตนซ์ของคลาส ImagesOptions()
  • ถัดไป กำหนด fileInfo ให้กับตัวเลือกภาพ setFileInfo。
  • จากนั้น ให้กำหนดค่า setStartPageNumber และ setCountPagesToExtract
  • ตอนนี้ สร้างตัวอย่างของคลาส ImagesRequest() และส่งพารามิเตอร์ ImagesOptions.
  • สุดท้ายให้รับผลลัพธ์โดยการเรียกใช้ ParseApi.images() วิธีและส่งพารามิเตอร์ ImagesRequest

โปรแกรมตัวอย่างด้านล่างแสดงวิธีการดึงรูปภาพเฉพาะจากไฟล์ PDF ตามช่วงหน้าใน Java โดยใช้ REST API:

package com.groupdocsdev.classes;

import com.groupdocs.cloud.parser.api.ParseApi;
import com.groupdocs.cloud.parser.client.ApiException;
import com.groupdocs.cloud.parser.client.Configuration;
import com.groupdocs.cloud.parser.model.FileInfo;
import com.groupdocs.cloud.parser.model.ImagesOptions;
import com.groupdocs.cloud.parser.model.ImagesResult;
import com.groupdocs.cloud.parser.model.requests.ImagesRequest;

// ดึงภาพจากไฟล์ PDF ออนไลน์ตามช่วงหน้าด้วย Java
public class App {

	public static void main(String[] args) {
		
		// สร้างอินสแตนซ์ของ Parse API
		ParseApi apiInstance = new ParseApi(configuration);

		try {

			// เตรียมการตั้งค่า
			FileInfo fileInfo = new FileInfo();
			fileInfo.setFilePath("java-testing/input-sample-file.pdf");

			ImagesOptions options = new ImagesOptions();
			options.setFileInfo(fileInfo);
			options.setStartPageNumber(1);
			options.setCountPagesToExtract(2);
			ImagesRequest request = new ImagesRequest(options);
			ImagesResult response = apiInstance.images(request);

			// Get output file path
			System.out.println("Output file path: " + response.getPath());
				
		} catch (ApiException e) {
			System.err.println("Exception while calling FileApi:");
			e.printStackTrace();
		}
		
	}
}

ฟรีเครื่องมือออนไลน์สำหรับการดึงภาพ

วิธีที่ดีที่สุดในการแยกภาพจาก PDF ออนไลน์ฟรีคืออะไร? กรุณาลองใช้ online PDF File parser เพื่อแยกภาพจากไฟล์ PDF ซอฟต์แวร์ PDF Parser นี้พัฒนาด้วยภาษา Java ตามที่กล่าวถึงในห้องสมุด parser ข้างต้น.

บทสรุป

สรุปได้ว่า GroupDocs.Parser Cloud SDK สำหรับ Java เป็นโซลูชันที่เชื่อถือได้และมีประสิทธิภาพสำหรับการดึงภาพจากไฟล์ PDF ได้อย่างง่ายดาย สิ่งต่อไปนี้คือสิ่งที่คุณได้เรียนรู้จากบทความนี้:

  • How to extract all images from PDF files programmatically in Java using REST API;
  • How to extract specific images from PDF documents in Java using REST API;
  • เครื่องมือการสกัดภาพออนไลน์เพื่อสกัดภาพจากเอกสาร PDF

นอกจากนี้ คุณสามารถเรียนรู้เพิ่มเติมเกี่ยวกับ GroupDocs.Parser Cloud API ได้โดยใช้ documentation เรายังมีส่วน API Reference ที่ช่วยให้คุณสามารถมองเห็นและมีส่วนร่วมกับ APIs ของเราได้โดยตรงผ่านเบราว์เซอร์ ซอร์สโค้ดทั้งหมดของ Java SDK มีให้ฟรีที่ Github.

สุดท้ายนี้ เราจะยังคงเขียนบทความบล็อกใหม่เกี่ยวกับรูปแบบไฟล์ที่แตกต่างกันและการวิเคราะห์ไฟล์เหล่านั้นโดยใช้ REST API ดังนั้น กรุณาติดต่อเราเพื่อรับข้อมูลอัปเดตล่าสุด

ถามคำถาม

หากคุณมีข้อสงสัยเกี่ยวกับวิธีการวิเคราะห์เอกสาร โปรดติดต่อเราผ่านทาง forum.

FAQs

How do I parse PDF files using Java?

ในการดึงภาพ ข้อความ หรือข้อมูลที่เป็นเมตาดาต้า คุณต้องโหลดและ解析เอกสาร PDF ก่อนโดยใช้ GroupDocs.Parser Cloud SDK กระบวนการนี้เกี่ยวข้องกับการระบุเส้นทางไฟล์และเรียกใช้วิธี Parse เพื่อตีความไฟล์ PDF

GroupDocs.Parser Cloud SDK for Java รองรับรูปแบบไฟล์อื่น ๆ นอกเหนือจาก PDF หรือไม่?

ใช่ นอกจากไฟล์ PDF แล้ว GroupDocs.Parser Cloud SDK for Java ยังรองรับการดึงข้อมูลรูปภาพจากรูปแบบเอกสารต่างๆ รวมถึง Word, Excel, PowerPoint, HTML และอื่นๆ อีกมากมาย

Can I extract all images from a PDF file using GroupDocs.Parser Cloud SDK for Java?

ใช่ คุณสามารถดึงภาพทั้งหมดจากไฟล์ PDF โดยใช้ GroupDocs.Parser Cloud SDK for Java.

ดูเพิ่มเติม

นี่คือบทความที่เกี่ยวข้องบางส่วนที่คุณอาจพบว่ามีประโยชน์: