
คุณอาจต้องแยกรูปภาพออกจากเอกสาร PDF หรือ Word เพื่อนำมาใช้ใหม่ คุณสามารถแยกรูปภาพจากเอกสาร PDF โดยทางโปรแกรมบนคลาวด์ได้อย่างง่ายดาย บทความนี้จะอธิบายวิธีแยกรูปภาพจากเอกสาร PDF โดยใช้ REST API ใน Python
หัวข้อต่อไปนี้จะครอบคลุมในบทความนี้:
- โปรแกรมแยกวิเคราะห์เอกสาร REST API และ Python SDK
- แยกรูปภาพจาก PDF โดยใช้ REST API
- บันทึกภาพตามช่วงหมายเลขหน้าโดยใช้ REST API
- รับรูปภาพจากเอกสารที่แนบมาโดยใช้ REST API
โปรแกรมแยกวิเคราะห์เอกสาร REST API และ Python SDK
สำหรับการดึงภาพจากเอกสาร PDF ฉันจะใช้ API ของ Python SDK of GroupDocs.Parser Cloud ช่วยให้คุณสามารถแยกวิเคราะห์ข้อมูลจากเอกสารยอดนิยมทุกประเภท คุณสามารถแยกข้อความ รูปภาพ และแยกวิเคราะห์ข้อมูลตามเทมเพลตได้โดยใช้ SDK นอกจากนี้ยังมี .NET, Java, PHP, Ruby และ Node.js SDK เป็น สมาชิกตระกูลโปรแกรมแยกวิเคราะห์เอกสาร สำหรับ Cloud API
คุณสามารถติดตั้ง GroupDocs.Parser Cloud ในโครงการ Python ของคุณด้วย pip (ตัวติดตั้งแพ็คเกจสำหรับ python) โดยใช้คำสั่งต่อไปนี้ในคอนโซล:
pip install groupdocs_parser_cloud
โปรดรับรหัสไคลเอ็นต์และรหัสลับไคลเอ็นต์ของคุณจาก แดชบอร์ด ก่อนที่คุณจะเริ่มทำตามขั้นตอนและตัวอย่างโค้ดที่มีอยู่ เมื่อคุณมีรหัสไคลเอ็นต์และรหัสลับแล้ว ให้เพิ่มรหัสตามที่แสดงด้านล่าง:
client_id = "112f0f38-9dae-42d5-b4fc-cc84ae644972"
client_secret = "16ad3fe0bdc39c910f57d2fd48a5d618"
configuration = groupdocs_parser_cloud.Configuration(client_id, client_secret)
configuration.api_base_url = "https://api.groupdocs.cloud"
my_storage = ""
แยกรูปภาพจาก PDF โดยใช้ REST API ใน Python
คุณสามารถแยกรูปภาพออกจากเอกสาร PDF ได้โดยทำตามขั้นตอนง่าย ๆ ที่กล่าวถึงด้านล่าง:
- อัปโหลด ไฟล์ PDF ไปยังคลาวด์
- แยกรูปภาพออกจากเอกสาร PDF โดยใช้ Python
- ดาวน์โหลด the extracted images
อัปโหลดเอกสาร
ก่อนอื่น อัปโหลดเอกสาร PDF ไปยังคลาวด์โดยใช้ตัวอย่างโค้ดที่ระบุด้านล่าง:
# การเริ่มต้น API
file_api = groupdocs_parser_cloud.FileApi.from_config(configuration)
my_storage = ""
request = groupdocs_parser_cloud.UploadFileRequest("sample.pdf", "C:\\Files\\sample.pdf", my_storage)
response = file_api.upload_file(request)
ด้วยเหตุนี้ ไฟล์ PDF ที่อัปโหลด (sample.pdf) จะอยู่ใน ส่วนไฟล์ ของแดชบอร์ดของคุณบนระบบคลาวด์
แยกรูปภาพทั้งหมดออกจากเอกสาร PDF โดยใช้ Python
คุณสามารถแยกรูปภาพทั้งหมดออกจากไฟล์ PDF โดยทางโปรแกรมโดยทำตามขั้นตอนด้านล่าง
- สร้างอินสแตนซ์ของ ParseApi
- กำหนด ImageOptions
- กำหนดเส้นทางไปยังไฟล์ PDF
- สร้างคำขอรูปภาพ
- รับผลลัพธ์โดยเรียกเมธอด ParseApi.images()
ตัวอย่างโค้ดต่อไปนี้แสดงวิธีแยกรูปภาพทั้งหมดจากเอกสาร PDF โดยใช้ REST API
# การเริ่มต้น API
parseApi = groupdocs_parser_cloud.ParseApi.from_config(configuration)
# กำหนดตัวเลือกภาพ
options = groupdocs_parser_cloud.ImagesOptions()
options.file_info = groupdocs_parser_cloud.FileInfo()
options.file_info.file_path = "sample.pdf"
# สร้างคำขอ
request = groupdocs_parser_cloud.ImagesRequest(options)
result = parseApi.images(request)
for image in result.images:
print("Image path in storage: " + image.path + ". Download url: " + image.download_url)
print("Image format: " + image.file_format + ". Page index: " + str(image.page_index))

แยกรูปภาพทั้งหมดออกจากเอกสาร PDF
ดาวน์โหลดภาพที่แยกออกมา
ตัวอย่างโค้ดด้านบนจะบันทึกภาพที่แยกไว้บนคลาวด์ คุณสามารถดาวน์โหลดรูปภาพเหล่านี้ได้โดยใช้ตัวอย่างโค้ดด้านล่าง:
# การเริ่มต้น API
file_api = groupdocs_parser_cloud.FileApi.from_config(configuration)
my_storage = ""
# ดาวน์โหลดภาพ
request = groupdocs_parser_cloud.DownloadFileRequest(image.path, my_storage)
response = file_api.download_file(request)
# ย้ายไฟล์ที่ดาวน์โหลดไปยังไดเร็กทอรีการทำงานของคุณ
shutil.move(response, "C:\\Files\\Images")
บันทึกภาพตามหมายเลขหน้าจากเอกสาร PDF โดยใช้ Python
คุณสามารถแยกรูปภาพจากหน้าเฉพาะของไฟล์ PDF โดยทางโปรแกรมโดยทำตามขั้นตอนด้านล่าง
- สร้างอินสแตนซ์ของ ParseApi
- กำหนด ImageOptions
- ระบุเส้นทางไปยังไฟล์ PDF
- กำหนดหมายเลขหน้าเริ่มต้น
- กำหนดจำนวนหน้าที่ต้องการแยก
- สร้างคำขอรูปภาพ
- รับผลลัพธ์โดยเรียกเมธอด ParseApi.images()
ตัวอย่างโค้ดต่อไปนี้แสดงวิธีแยกรูปภาพตามช่วงหมายเลขหน้าจากเอกสาร PDF โดยใช้ REST API โปรดทำตามขั้นตอนที่กล่าวถึงก่อนหน้านี้เพื่อดาวน์โหลดภาพที่แยกออกมา
# การเริ่มต้น API
parseApi = groupdocs_parser_cloud.ParseApi.from_config(configuration)
# กำหนดตัวเลือกภาพ
options = groupdocs_parser_cloud.ImagesOptions()
options.file_info = groupdocs_parser_cloud.FileInfo()
options.file_info.file_path = "sample.pdf"
# กำหนดช่วงหน้า
options.start_page_number = 1
options.count_pages_to_extract = 1
# สร้างคำขอ
request = groupdocs_parser_cloud.ImagesRequest(options)
result = parseApi.images(request)
for page in result.pages:
print("Images from " + str(page.page_index) + " page.")
for image in page.images:
print("Image path in storage: " + image.path + ". Download url: " + image.download_url)
print("Image format: " + image.file_format + ". Page index: " + str(image.page_index))

แยกรูปภาพตามช่วงหมายเลขหน้าจากเอกสาร PDF
รับรูปภาพจากเอกสารที่แนบมาด้วย PDF โดยใช้ Python
คุณสามารถแยกรูปภาพออกจากเอกสารภายในคอนเทนเนอร์ ซึ่งมีให้ใช้งานเป็นไฟล์แนบในไฟล์ PDF โดยทางโปรแกรมโดยทำตามขั้นตอนด้านล่าง
- สร้างอินสแตนซ์ของ ParseApi
- กำหนด ImageOptions
- กำหนดเส้นทางไปยังไฟล์ PDF
- กำหนด ContainerItemInfo
- ระบุเส้นทางสัมพัทธ์ของเอกสารภายใน
- กำหนดหมายเลขหน้าเริ่มต้น
- กำหนดจำนวนหน้าที่ต้องการแยก
- สร้างคำขอรูปภาพ
- รับผลลัพธ์โดยเรียกเมธอด ParseApi.images()
ตัวอย่างโค้ดต่อไปนี้แสดงวิธีการแยกรูปภาพจากเอกสารภายในเอกสาร PDF โดยใช้ REST API โปรดทำตามขั้นตอนที่กล่าวถึงก่อนหน้านี้เพื่อดาวน์โหลดภาพที่แยกออกมา
# การเริ่มต้น API
parseApi = groupdocs_parser_cloud.ParseApi.from_config(configuration)
# กำหนดตัวเลือกภาพ
options = groupdocs_parser_cloud.ImagesOptions()
options.file_info = groupdocs_parser_cloud.FileInfo()
options.file_info.file_path = "PDF_with_attachements.pdf"
options.file_info.password = "password"
# กำหนดรายการคอนเทนเนอร์
container_info = groupdocs_parser_cloud.ContainerItemInfo()
container_info.relative_path = "template-document.pdf"
options.container_item_info = container_info
# กำหนดช่วงหน้า
options.start_page_number = 2
options.count_pages_to_extract = 1
# สร้างคำขอ
request = groupdocs_parser_cloud.ImagesRequest(options)
result = parseApi.images(request)
for page in result.pages:
print("Images from " + str(page.page_index) + " page.")
for image in page.images:
print("Image path in storage: " + image.path + ". Download url: " + image.download_url)
print("Image format: " + image.file_format + ". Page index: " + str(image.page_index))

แยกรูปภาพจากเอกสารที่แนบมาในเอกสาร PDF
ลองออนไลน์
โปรดลองใช้เครื่องมือแยกวิเคราะห์ PDF ออนไลน์ฟรีต่อไปนี้ ซึ่งพัฒนาโดยใช้ API ข้างต้น https://products.groupdocs.app/parser/pdf
บทสรุป
ในบทความนี้ คุณได้เรียนรู้วิธีแยกรูปภาพจากเอกสาร PDF บนคลาวด์ บทความนี้ยังอธิบายวิธีการอัปโหลดไฟล์ PDF บนระบบคลาวด์โดยทางโปรแกรม คุณยังได้เรียนรู้วิธีดาวน์โหลดภาพที่แยกออกมาโดยใช้ SDK คุณสามารถเรียนรู้เพิ่มเติมเกี่ยวกับ GroupDocs.Parser Cloud API โดยใช้ เอกสารประกอบ เรายังมีส่วน API Reference ที่ช่วยให้คุณแสดงภาพและโต้ตอบกับ API ของเราได้โดยตรงผ่านเบราว์เซอร์ ในกรณีที่มีความคลุมเครือ โปรดติดต่อเราได้ที่ ฟอรัม