PDF File Parser – แยกรูปภาพจากไฟล์ PDF ออนไลน์ใน Java

PDF(Portable Document Format) คือรูปแบบไฟล์ที่ใช้กันอย่างแพร่หลายสำหรับการแบ่งปันและการเก็บรักษาเอกสารทางออนไลน์ มักมีเนื้อหาหลายประเภท รวมถึงข้อความ รูปภาพ ตาราง และอื่นๆ การแยกเนื้อหาเฉพาะจากไฟล์ PDF เช่น รูปภาพอาจเป็นงานที่ท้าทายหากไม่มีเครื่องมือหรือไลบรารีที่เชื่อถือได้ เครื่องมือหนึ่งดังกล่าวคือ GroupDocs.Parser Cloud SDK สำหรับ Java ซึ่งให้วิธีการที่ราบรื่นและมีประสิทธิภาพในการแยกรูปภาพจากไฟล์ PDF ในบทความนี้ เราจะสาธิตวิธีแยกรูปภาพจากไฟล์ PDF ใน Java โดยใช้ REST API

หัวข้อต่อไปนี้จะครอบคลุมในบทความนี้:

Java REST API เพื่อแยกรูปภาพออกจากการติดตั้ง PDF และ SDK

GroupDocs.Parser Cloud SDK สำหรับ Java เป็นไลบรารี Java ที่ทรงพลังและหลากหลาย ซึ่งมอบวิธีที่ง่ายและมีประสิทธิภาพในการแยกวิเคราะห์และแยกข้อมูลจาก รูปแบบเอกสาร ต่างๆ รวมถึงไฟล์ PDF โดยมีฟีเจอร์มากมายสำหรับการแยกวิเคราะห์เอกสาร ช่วยให้นักพัฒนาสามารถแยกรูปภาพ ข้อความ ข้อมูลเมตา และเนื้อหาอื่นๆ GroupDocs.Parser ยังมี C#.NET, Java, PHP, Ruby และ Python SDK เป็น สมาชิกตระกูลโปรแกรมแยกวิเคราะห์เอกสาร สำหรับ Cloud API

ในการเริ่มต้น คุณต้องรวม GroupDocs.Parser Cloud SDK ไว้ในโปรเจ็กต์ Java ของคุณ คุณสามารถ ดาวน์โหลด ไฟล์ JAR ของ API หรือติดตั้งโดยใช้ Maven โดยเพิ่มที่เก็บและการอ้างอิงต่อไปนี้ในไฟล์ pom.xml ของโปรเจ็กต์:

พื้นที่เก็บข้อมูล Maven:

<repository>
    <id>groupdocs-artifact-repository</id>
    <name>GroupDocs Artifact Repository</name>
    <url>https://repository.groupdocs.cloud/repo</url>
</repository>

การพึ่งพา Maven:

<dependency>
    <groupId>com.groupdocs</groupId>
    <artifactId>groupdocs-parser-cloud</artifactId>
    <version>23.3</version>
    <scope>compile</scope>
</dependency>

ถัดไป คุณต้อง ลงทะเบียน สำหรับบัญชีทดลองใช้ฟรีหรือ ซื้อแผนการสมัครสมาชิก บนเว็บไซต์ GroupDocs และ รับรหัส API ของคุณ เมื่อคุณมี Client Id และ Client Secret แล้ว ให้เพิ่มข้อมูลโค้ดด้านล่างลงในแอปพลิเคชันที่ใช้ Java:

# รับ client_id และ client_secret ของคุณจาก https://dashboard.groupdocs.cloud หลังจากลงทะเบียน

String ClientId = "xxxxxxxx-xxxx-xxxx-xxxx-xxxxxxxxxxxx";
String ClientSecret = "xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx";
String MyStorage = "test-internal-storage";
Configuration configuration = new Configuration(ClientId, ClientSecret);

วิธีแยกรูปภาพทั้งหมดจากไฟล์ PDF ใน Java โดยใช้ REST API

ตอนนี้ เรามาเขียนขั้นตอนและโค้ดตัวอย่างเพื่อแยกรูปภาพจากไฟล์ PDF โดยใช้ GroupDocs.Parser Cloud SDK สำหรับ Java:

  • ขั้นแรก นำเข้าคลาสที่จำเป็นลงในไฟล์ Java ของคุณ
  • ประการที่สอง สร้างอินสแตนซ์ของคลาส ParseApi
  • ประการที่สาม สร้างอินสแตนซ์ของคลาส FileInfo
  • จากนั้นกำหนดเส้นทางไปยังเอกสาร PDF ที่ป้อน
  • จากนั้น สร้างอินสแตนซ์ของคลาส ImagesOptions()
  • ถัดไป กำหนด fileInfo ให้กับตัวเลือกภาพ setFileInfo
  • ตอนนี้ สร้างอินสแตนซ์ของคลาส ImagesRequest() และส่งพารามิเตอร์ ImagesOptions
  • สุดท้าย รับผลลัพธ์โดยเรียกเมธอด ParseApi.images() และส่งพารามิเตอร์ ImagesRequest

ตัวอย่างโค้ดต่อไปนี้แสดงวิธีแยกรูปภาพทั้งหมดจากไฟล์ PDF ทางออนไลน์ใน Java โดยใช้ REST API:

package com.groupdocsdev.classes;

import com.groupdocs.cloud.parser.api.ParseApi;
import com.groupdocs.cloud.parser.client.ApiException;
import com.groupdocs.cloud.parser.client.Configuration;
import com.groupdocs.cloud.parser.model.FileInfo;
import com.groupdocs.cloud.parser.model.ImagesOptions;
import com.groupdocs.cloud.parser.model.ImagesResult;
import com.groupdocs.cloud.parser.model.requests.ImagesRequest;

// วิธีแยกรูปภาพจากไฟล์ PDF ใน Java
public class App {

	public static void main(String[] args) {
		
		// สร้างอินสแตนซ์ของ Parse API
		ParseApi apiInstance = new ParseApi(configuration);

		try {

			// เตรียมการตั้งค่า
			FileInfo fileInfo = new FileInfo();
			fileInfo.setFilePath("java-testing/input-sample-file.pdf");

			ImagesOptions options = new ImagesOptions();
			options.setFileInfo(fileInfo);
			ImagesRequest request = new ImagesRequest(options);
			ImagesResult response = apiInstance.images(request);

			// รับเส้นทางไฟล์เอาต์พุต
			System.out.println("Output file path: " + response.getPath());
				
		} catch (ApiException e) {
			System.err.println("Exception while calling FileApi:");
			e.printStackTrace();
		}
		
	}
}

แยกรูปภาพเฉพาะจากไฟล์ PDF ใน Java โดยใช้หมายเลขหน้า

ในส่วนนี้ เราจะให้ขั้นตอนและข้อมูลโค้ดสำหรับการแยกรูปภาพเฉพาะจากไฟล์ PDF โดยทางโปรแกรมใน Java:

  • ขั้นแรก นำเข้าคลาสที่จำเป็นลงในไฟล์ Java ของคุณ
  • ประการที่สอง สร้างอินสแตนซ์ของคลาส ParseApi
  • ประการที่สาม สร้างอินสแตนซ์ของคลาส FileInfo
  • จากนั้นกำหนดเส้นทางไปยังเอกสาร PDF ที่ป้อน
  • จากนั้น สร้างอินสแตนซ์ของคลาส ImagesOptions()
  • ถัดไป กำหนด fileInfo ให้กับตัวเลือกภาพ setFileInfo
  • จากนั้น ระบุค่า setStartPageNumber และ setCountPagesToExtract
  • ตอนนี้ สร้างอินสแตนซ์ของคลาส ImagesRequest() และส่งพารามิเตอร์ ImagesOptions
  • สุดท้าย รับผลลัพธ์โดยเรียกเมธอด ParseApi.images() และส่งพารามิเตอร์ ImagesRequest

ตัวอย่างโค้ดต่อไปนี้แสดงวิธีแยกรูปภาพเฉพาะจากไฟล์ PDF ตามช่วงหน้าใน Java โดยใช้ REST API:

package com.groupdocsdev.classes;

import com.groupdocs.cloud.parser.api.ParseApi;
import com.groupdocs.cloud.parser.client.ApiException;
import com.groupdocs.cloud.parser.client.Configuration;
import com.groupdocs.cloud.parser.model.FileInfo;
import com.groupdocs.cloud.parser.model.ImagesOptions;
import com.groupdocs.cloud.parser.model.ImagesResult;
import com.groupdocs.cloud.parser.model.requests.ImagesRequest;

// แยกรูปภาพจากไฟล์ PDF ออนไลน์ตามช่วงหน้าใน Java
public class App {

	public static void main(String[] args) {
		
		// สร้างอินสแตนซ์ของ Parse API
		ParseApi apiInstance = new ParseApi(configuration);

		try {

			// เตรียมการตั้งค่า
			FileInfo fileInfo = new FileInfo();
			fileInfo.setFilePath("java-testing/input-sample-file.pdf");

			ImagesOptions options = new ImagesOptions();
			options.setFileInfo(fileInfo);
			options.setStartPageNumber(1);
			options.setCountPagesToExtract(2);
			ImagesRequest request = new ImagesRequest(options);
			ImagesResult response = apiInstance.images(request);

			// รับเส้นทางไฟล์เอาต์พุต
			System.out.println("Output file path: " + response.getPath());
				
		} catch (ApiException e) {
			System.err.println("Exception while calling FileApi:");
			e.printStackTrace();
		}
		
	}
}

โปรแกรมแยกรูปภาพออนไลน์ฟรี

วิธีที่ดีที่สุดในการแยกรูปภาพจาก PDF ออนไลน์ฟรีคืออะไร โปรดลองใช้ ตัวแยกวิเคราะห์ไฟล์ PDF ออนไลน์ เพื่อแยกรูปภาพออกจากไฟล์ PDF ซอฟต์แวร์ตัวแยกวิเคราะห์ PDF นี้ได้รับการพัฒนาโดยใช้ Java ตามที่กล่าวไว้ข้างต้น ไลบรารีตัวแยกวิเคราะห์

บทสรุป

โดยสรุป GroupDocs.Parser Cloud SDK สำหรับ Java มอบโซลูชันที่เชื่อถือได้และมีประสิทธิภาพสำหรับการแยกรูปภาพจากไฟล์ PDF อย่างง่ายดาย ต่อไปนี้คือสิ่งที่คุณได้เรียนรู้จากบทความนี้:

  • วิธีแยกรูปภาพทั้งหมดจากไฟล์ PDF โดยทางโปรแกรมใน Java โดยใช้ REST API
  • วิธีแยกรูปภาพเฉพาะจากเอกสาร PDF ใน Java โดยใช้ REST API
  • และเครื่องมือแยกรูปภาพออนไลน์เพื่อแยกรูปภาพจากเอกสาร PDF

นอกจากนี้ คุณสามารถเรียนรู้เพิ่มเติมเกี่ยวกับ GroupDocs.Parser Cloud API โดยใช้ เอกสารประกอบ นอกจากนี้ เรายังมีส่วน การอ้างอิง API ที่ช่วยให้คุณแสดงภาพและโต้ตอบกับ API ของเราได้โดยตรงผ่านเบราว์เซอร์ ซอร์สโค้ดที่สมบูรณ์ของ Java SDK มีให้ใช้งานฟรีบน Github

สุดท้าย เรายังคงเขียนบทความบล็อกใหม่ๆ ในรูปแบบไฟล์ต่างๆ และแยกวิเคราะห์โดยใช้ REST API ดังนั้น กรุณาติดต่อเพื่อรับการปรับปรุงล่าสุด

ถามคำถาม

ในกรณีที่คุณมีข้อสงสัยเกี่ยวกับวิธีการแยกวิเคราะห์เอกสาร โปรดติดต่อเราผ่านทาง ฟอรัม

คำถามที่พบบ่อย

ฉันจะแยกวิเคราะห์ไฟล์ PDF โดยใช้ Java ได้อย่างไร

หากต้องการแยกรูปภาพ ข้อความ หรือข้อมูลเมตา ก่อนอื่นคุณต้องโหลดและแยกวิเคราะห์เอกสาร PDF โดยใช้ GroupDocs.Parser Cloud SDK กระบวนการนี้เกี่ยวข้องกับการระบุเส้นทางของไฟล์และการเรียกใช้เมธอด Parse เพื่อแยกวิเคราะห์ไฟล์ PDF

GroupDocs.Parser Cloud SDK สำหรับ Java รองรับรูปแบบไฟล์อื่นนอกเหนือจาก PDF หรือไม่

ใช่ นอกจากไฟล์ PDF แล้ว GroupDocs.Parser Cloud SDK for Java ยังรองรับการแยกรูปภาพจากรูปแบบเอกสารต่างๆ รวมถึง Word, Excel, PowerPoint, HTML และอื่นๆ อีกมากมาย

ฉันสามารถแยกรูปภาพทั้งหมดออกจากไฟล์ PDF โดยใช้ GroupDocs.Parser Cloud SDK for Java ได้หรือไม่

ได้ คุณสามารถแยกรูปภาพทั้งหมดออกจากไฟล์ PDF โดยใช้ GroupDocs.Parser Cloud SDK for Java

ดูสิ่งนี้ด้วย

ต่อไปนี้คือบทความที่เกี่ยวข้องบางส่วนที่คุณอาจพบว่ามีประโยชน์: