
PDF(Portable Document Format) เป็นรูปแบบไฟล์ที่ใช้กันอย่างแพร่หลายสำหรับการแชร์และเก็บรักษาเอกสารออนไลน์ มันมักจะมีเนื้อหาหลายประเภท รวมถึงข้อความ รูปภาพ ตาราง และอื่นๆ การดึงเนื้อหาที่เฉพาะเจาะจงจากไฟล์ PDF เช่น รูปภาพ อาจเป็นงานที่ท้าทายโดยไม่มีเครื่องมือหรือห้องสมุดที่เชื่อถือได้ หนึ่งในเครื่องมือดังกล่าวคือ GroupDocs.Parser Cloud SDK สำหรับ Java ซึ่งให้วิธีที่ราบรื่นและมีประสิทธิภาพในการดึงรูปภาพจากไฟล์ PDF ในบทความนี้เราจะแสดงวิธีการดึงรูปภาพจากไฟล์ PDF ใน Java โดยใช้ REST API
หัวข้อดังต่อไปนี้จะถูกนำเสนอในบทความนี้:
- Java REST API เพื่อแยกภาพจาก PDF และการติดตั้ง SDK
- วิธีการดึงภาพทั้งหมดจากไฟล์ PDF ใน Java โดยใช้ REST API
- Extract Specific Images from PDF Files in Java using Page Number
Java REST API to Separate Images from PDF and SDK Installation
GroupDocs.Parser Cloud SDK for Java เป็นไลบรารี Java ที่มีพลังและหลากหลายซึ่งให้วิธีที่ง่ายและมีประสิทธิภาพในการแยกวิเคราะห์และถอดข้อมูลจาก รูปแบบเอกสารต่างๆ รวมถึงไฟล์ PDF มันมีคุณสมบัติต่างๆ สำหรับการแยกวิเคราะห์เอกสาร ช่วยให้นักพัฒนาสามารถดึงภาพ ข้อความ เมทาดาต้า และเนื้อหาอื่นๆ ออกมาได้ GroupDocs.Parser ยังมี C#.NET, Java, PHP, Ruby และ Python SDKs ซึ่งเป็น สมาชิกในครอบครัวตัวแยกวิเคราะห์เอกสาร สำหรับ Cloud APIs.
ในการเริ่มต้น คุณต้องรวม GroupDocs.Parser Cloud SDK เข้าในโครงการ Java ของคุณ คุณสามารถ ดาวน์โหลด ไฟล์ JAR ของ API หรือ ติดตั้งโดยใช้ Maven โดยการเพิ่มที่เก็บและการพึ่งพาต่อไปนี้ในไฟล์ pom.xml ของโครงการของคุณ:
Maven Repository:
<repository>
<id>groupdocs-artifact-repository</id>
<name>GroupDocs Artifact Repository</name>
<url>https://repository.groupdocs.cloud/repo</url>
</repository>
Maven Dependency:
<dependency>
<groupId>com.groupdocs</groupId>
<artifactId>groupdocs-parser-cloud</artifactId>
<version>23.3</version>
<scope>compile</scope>
</dependency>
ถัดไป คุณต้อง sign up สำหรับบัญชีทดลองใช้งานฟรีหรือ purchase a subscription plan บนเว็บไซต์ GroupDocs และ get your API key เมื่อคุณมี Client Id และ Client Secret ให้เพิ่มโค้ดสตSnippet ด้านล่างนี้ลงในแอปพลิเคชันที่ใช้ Java:
# รับ clientid และ clientsecret ของคุณจาก https://dashboard.groupdocs.cloud หลังจากการลงทะเบียน。
String ClientId = "xxxxxxxx-xxxx-xxxx-xxxx-xxxxxxxxxxxx";
String ClientSecret = "xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx";
String MyStorage = "test-internal-storage";
Configuration configuration = new Configuration(ClientId, ClientSecret);
วิธีการดึงรูปภาพทั้งหมดจากไฟล์ PDF ใน Java โดยใช้ REST API
ตอนนี้เรามาเขียนขั้นตอนและตัวอย่างโค้ดเพื่อนำภาพออกจากไฟล์ PDF โดยใช้ GroupDocs.Parser Cloud SDK สำหรับ Java:
- ก่อนอื่น ให้นำเข้าชั้นเรียนที่ต้องการไปยังไฟล์ Java ของคุณ。
- ประการที่สอง สร้างตัวอย่างของคลาส ParseApi
- สาม, สร้างตัวอย่างของคลาส FileInfo .
- ถัดไป กำหนดเส้นทางไปยังเอกสาร PDF ที่นำเข้า
- แล้ว สร้างอินสแตนซ์ของคลาส ImagesOptions()
- ถัดไป กำหนด fileInfo ให้กับตัวเลือกภาพ setFileInfo。
- ตอนนี้ สร้างตัวอย่างของคลาส ImagesRequest() และส่งพารามิเตอร์ ImagesOptions.
- สุดท้าย ให้เรียกดูผลลัพธ์โดยใช้เมธอด ParseApi.images() และส่งพารามิเตอร์ ImagesRequest.
ตัวอย่างโค้ดต่อไปนี้แสดงวิธีการดึงรูปภาพทั้งหมดจากไฟล์ PDF ออนไลน์ใน Java โดยใช้ REST API:
package com.groupdocsdev.classes;
import com.groupdocs.cloud.parser.api.ParseApi;
import com.groupdocs.cloud.parser.client.ApiException;
import com.groupdocs.cloud.parser.client.Configuration;
import com.groupdocs.cloud.parser.model.FileInfo;
import com.groupdocs.cloud.parser.model.ImagesOptions;
import com.groupdocs.cloud.parser.model.ImagesResult;
import com.groupdocs.cloud.parser.model.requests.ImagesRequest;
// วิธีการดึงรูปภาพจากไฟล์ PDF ใน Java.
public class App {
public static void main(String[] args) {
// สร้างตัวอย่างของ Parse API
ParseApi apiInstance = new ParseApi(configuration);
try {
// จัดเตรียมการตั้งค่า
FileInfo fileInfo = new FileInfo();
fileInfo.setFilePath("java-testing/input-sample-file.pdf");
ImagesOptions options = new ImagesOptions();
options.setFileInfo(fileInfo);
ImagesRequest request = new ImagesRequest(options);
ImagesResult response = apiInstance.images(request);
// Get output file path
System.out.println("Output file path: " + response.getPath());
} catch (ApiException e) {
System.err.println("Exception while calling FileApi:");
e.printStackTrace();
}
}
}
Extract Specific Images from PDF Files in Java using Page Number
ในส่วนนี้ เราจะให้ขั้นตอนและโค้ดส่วนหนึ่งสำหรับการดึงภาพเฉพาะจากไฟล์ PDF อย่างเป็นระเบียบในภาษา Java:
- ก่อนอื่น ให้นำเข้าชั้นเรียนที่ต้องการไปยังไฟล์ Java ของคุณ。
- ประการที่สอง สร้างอินสแตนซ์ของคลาส ParseApi.
- ประการที่สาม สร้างอินสแตนซ์ของคลาส FileInfo
- ถัดไป กำหนดเส้นทางไปยังเอกสาร PDF ที่นำเข้า
- แล้ว สร้างอินสแตนซ์ของคลาส ImagesOptions()
- ถัดไป กำหนด fileInfo ให้กับตัวเลือกภาพ setFileInfo。
- จากนั้น ให้กำหนดค่า setStartPageNumber และ setCountPagesToExtract
- ตอนนี้ สร้างตัวอย่างของคลาส ImagesRequest() และส่งพารามิเตอร์ ImagesOptions.
- สุดท้ายให้รับผลลัพธ์โดยการเรียกใช้ ParseApi.images() วิธีและส่งพารามิเตอร์ ImagesRequest
โปรแกรมตัวอย่างด้านล่างแสดงวิธีการดึงรูปภาพเฉพาะจากไฟล์ PDF ตามช่วงหน้าใน Java โดยใช้ REST API:
package com.groupdocsdev.classes;
import com.groupdocs.cloud.parser.api.ParseApi;
import com.groupdocs.cloud.parser.client.ApiException;
import com.groupdocs.cloud.parser.client.Configuration;
import com.groupdocs.cloud.parser.model.FileInfo;
import com.groupdocs.cloud.parser.model.ImagesOptions;
import com.groupdocs.cloud.parser.model.ImagesResult;
import com.groupdocs.cloud.parser.model.requests.ImagesRequest;
// ดึงภาพจากไฟล์ PDF ออนไลน์ตามช่วงหน้าด้วย Java
public class App {
public static void main(String[] args) {
// สร้างอินสแตนซ์ของ Parse API
ParseApi apiInstance = new ParseApi(configuration);
try {
// เตรียมการตั้งค่า
FileInfo fileInfo = new FileInfo();
fileInfo.setFilePath("java-testing/input-sample-file.pdf");
ImagesOptions options = new ImagesOptions();
options.setFileInfo(fileInfo);
options.setStartPageNumber(1);
options.setCountPagesToExtract(2);
ImagesRequest request = new ImagesRequest(options);
ImagesResult response = apiInstance.images(request);
// Get output file path
System.out.println("Output file path: " + response.getPath());
} catch (ApiException e) {
System.err.println("Exception while calling FileApi:");
e.printStackTrace();
}
}
}
ฟรีเครื่องมือออนไลน์สำหรับการดึงภาพ
วิธีที่ดีที่สุดในการแยกภาพจาก PDF ออนไลน์ฟรีคืออะไร? กรุณาลองใช้ online PDF File parser เพื่อแยกภาพจากไฟล์ PDF ซอฟต์แวร์ PDF Parser นี้พัฒนาด้วยภาษา Java ตามที่กล่าวถึงในห้องสมุด parser ข้างต้น.
บทสรุป
สรุปได้ว่า GroupDocs.Parser Cloud SDK สำหรับ Java เป็นโซลูชันที่เชื่อถือได้และมีประสิทธิภาพสำหรับการดึงภาพจากไฟล์ PDF ได้อย่างง่ายดาย สิ่งต่อไปนี้คือสิ่งที่คุณได้เรียนรู้จากบทความนี้:
- How to extract all images from PDF files programmatically in Java using REST API;
- How to extract specific images from PDF documents in Java using REST API;
- เครื่องมือการสกัดภาพออนไลน์เพื่อสกัดภาพจากเอกสาร PDF
นอกจากนี้ คุณสามารถเรียนรู้เพิ่มเติมเกี่ยวกับ GroupDocs.Parser Cloud API ได้โดยใช้ documentation เรายังมีส่วน API Reference ที่ช่วยให้คุณสามารถมองเห็นและมีส่วนร่วมกับ APIs ของเราได้โดยตรงผ่านเบราว์เซอร์ ซอร์สโค้ดทั้งหมดของ Java SDK มีให้ฟรีที่ Github.
สุดท้ายนี้ เราจะยังคงเขียนบทความบล็อกใหม่เกี่ยวกับรูปแบบไฟล์ที่แตกต่างกันและการวิเคราะห์ไฟล์เหล่านั้นโดยใช้ REST API ดังนั้น กรุณาติดต่อเราเพื่อรับข้อมูลอัปเดตล่าสุด
ถามคำถาม
หากคุณมีข้อสงสัยเกี่ยวกับวิธีการวิเคราะห์เอกสาร โปรดติดต่อเราผ่านทาง forum.
FAQs
How do I parse PDF files using Java?
ในการดึงภาพ ข้อความ หรือข้อมูลที่เป็นเมตาดาต้า คุณต้องโหลดและ解析เอกสาร PDF ก่อนโดยใช้ GroupDocs.Parser Cloud SDK กระบวนการนี้เกี่ยวข้องกับการระบุเส้นทางไฟล์และเรียกใช้วิธี Parse เพื่อตีความไฟล์ PDF
GroupDocs.Parser Cloud SDK for Java รองรับรูปแบบไฟล์อื่น ๆ นอกเหนือจาก PDF หรือไม่?
ใช่ นอกจากไฟล์ PDF แล้ว GroupDocs.Parser Cloud SDK for Java ยังรองรับการดึงข้อมูลรูปภาพจากรูปแบบเอกสารต่างๆ รวมถึง Word, Excel, PowerPoint, HTML และอื่นๆ อีกมากมาย
Can I extract all images from a PDF file using GroupDocs.Parser Cloud SDK for Java?
ใช่ คุณสามารถดึงภาพทั้งหมดจากไฟล์ PDF โดยใช้ GroupDocs.Parser Cloud SDK for Java.
ดูเพิ่มเติม
นี่คือบทความที่เกี่ยวข้องบางส่วนที่คุณอาจพบว่ามีประโยชน์: