แยกรูปภาพจากเอกสาร PDF

คุณอาจต้องแยกรูปภาพออกจากเอกสาร PDF หรือ Word เพื่อนำมาใช้ใหม่ คุณสามารถแยกรูปภาพจากเอกสาร PDF โดยทางโปรแกรมบนคลาวด์ได้อย่างง่ายดาย บทความนี้จะอธิบายวิธีแยกรูปภาพจากเอกสาร PDF โดยใช้ REST API ใน Python

หัวข้อต่อไปนี้จะครอบคลุมในบทความนี้:

โปรแกรมแยกวิเคราะห์เอกสาร REST API และ Python SDK

สำหรับการดึงภาพจากเอกสาร PDF ฉันจะใช้ API ของ Python SDK of GroupDocs.Parser Cloud ช่วยให้คุณสามารถแยกวิเคราะห์ข้อมูลจากเอกสารยอดนิยมทุกประเภท คุณสามารถแยกข้อความ รูปภาพ และแยกวิเคราะห์ข้อมูลตามเทมเพลตได้โดยใช้ SDK นอกจากนี้ยังมี .NET, Java, PHP, Ruby และ Node.js SDK เป็น สมาชิกตระกูลโปรแกรมแยกวิเคราะห์เอกสาร สำหรับ Cloud API

คุณสามารถติดตั้ง GroupDocs.Parser Cloud ในโครงการ Python ของคุณด้วย pip (ตัวติดตั้งแพ็คเกจสำหรับ python) โดยใช้คำสั่งต่อไปนี้ในคอนโซล:

pip install groupdocs_parser_cloud

โปรดรับรหัสไคลเอ็นต์และรหัสลับไคลเอ็นต์ของคุณจาก แดชบอร์ด ก่อนที่คุณจะเริ่มทำตามขั้นตอนและตัวอย่างโค้ดที่มีอยู่ เมื่อคุณมีรหัสไคลเอ็นต์และรหัสลับแล้ว ให้เพิ่มรหัสตามที่แสดงด้านล่าง:

client_id = "112f0f38-9dae-42d5-b4fc-cc84ae644972"
client_secret = "16ad3fe0bdc39c910f57d2fd48a5d618"

configuration = groupdocs_parser_cloud.Configuration(client_id, client_secret)
configuration.api_base_url = "https://api.groupdocs.cloud"
my_storage = ""

แยกรูปภาพจาก PDF โดยใช้ REST API ใน Python

คุณสามารถแยกรูปภาพออกจากเอกสาร PDF ได้โดยทำตามขั้นตอนง่าย ๆ ที่กล่าวถึงด้านล่าง:

อัปโหลดเอกสาร

ก่อนอื่น อัปโหลดเอกสาร PDF ไปยังคลาวด์โดยใช้ตัวอย่างโค้ดที่ระบุด้านล่าง:

# การเริ่มต้น API
file_api = groupdocs_parser_cloud.FileApi.from_config(configuration)
my_storage = ""

request = groupdocs_parser_cloud.UploadFileRequest("sample.pdf", "C:\\Files\\sample.pdf", my_storage)
response = file_api.upload_file(request)

ด้วยเหตุนี้ ไฟล์ PDF ที่อัปโหลด (sample.pdf) จะอยู่ใน ส่วนไฟล์ ของแดชบอร์ดของคุณบนระบบคลาวด์

แยกรูปภาพทั้งหมดออกจากเอกสาร PDF โดยใช้ Python

คุณสามารถแยกรูปภาพทั้งหมดออกจากไฟล์ PDF โดยทางโปรแกรมโดยทำตามขั้นตอนด้านล่าง

  • สร้างอินสแตนซ์ของ ParseApi
  • กำหนด ImageOptions
  • กำหนดเส้นทางไปยังไฟล์ PDF
  • สร้างคำขอรูปภาพ
  • รับผลลัพธ์โดยเรียกเมธอด ParseApi.images()

ตัวอย่างโค้ดต่อไปนี้แสดงวิธีแยกรูปภาพทั้งหมดจากเอกสาร PDF โดยใช้ REST API

# การเริ่มต้น API
parseApi = groupdocs_parser_cloud.ParseApi.from_config(configuration)
# กำหนดตัวเลือกภาพ
options = groupdocs_parser_cloud.ImagesOptions()
options.file_info = groupdocs_parser_cloud.FileInfo()
options.file_info.file_path = "sample.pdf"

# สร้างคำขอ
request = groupdocs_parser_cloud.ImagesRequest(options)
result = parseApi.images(request)

for image in result.images:
    print("Image path in storage: " + image.path + ". Download url: " + image.download_url)
    print("Image format: " + image.file_format + ". Page index: " + str(image.page_index))
แยกรูปภาพทั้งหมดออกจากเอกสาร PDF

แยกรูปภาพทั้งหมดออกจากเอกสาร PDF

ดาวน์โหลดภาพที่แยกออกมา

ตัวอย่างโค้ดด้านบนจะบันทึกภาพที่แยกไว้บนคลาวด์ คุณสามารถดาวน์โหลดรูปภาพเหล่านี้ได้โดยใช้ตัวอย่างโค้ดด้านล่าง:

# การเริ่มต้น API
file_api = groupdocs_parser_cloud.FileApi.from_config(configuration)
my_storage = ""
  
# ดาวน์โหลดภาพ 
request = groupdocs_parser_cloud.DownloadFileRequest(image.path, my_storage)
response = file_api.download_file(request)

# ย้ายไฟล์ที่ดาวน์โหลดไปยังไดเร็กทอรีการทำงานของคุณ
shutil.move(response, "C:\\Files\\Images")

บันทึกภาพตามหมายเลขหน้าจากเอกสาร PDF โดยใช้ Python

คุณสามารถแยกรูปภาพจากหน้าเฉพาะของไฟล์ PDF โดยทางโปรแกรมโดยทำตามขั้นตอนด้านล่าง

  • สร้างอินสแตนซ์ของ ParseApi
  • กำหนด ImageOptions
  • ระบุเส้นทางไปยังไฟล์ PDF
  • กำหนดหมายเลขหน้าเริ่มต้น
  • กำหนดจำนวนหน้าที่ต้องการแยก
  • สร้างคำขอรูปภาพ
  • รับผลลัพธ์โดยเรียกเมธอด ParseApi.images()

ตัวอย่างโค้ดต่อไปนี้แสดงวิธีแยกรูปภาพตามช่วงหมายเลขหน้าจากเอกสาร PDF โดยใช้ REST API โปรดทำตามขั้นตอนที่กล่าวถึงก่อนหน้านี้เพื่อดาวน์โหลดภาพที่แยกออกมา

# การเริ่มต้น API
parseApi = groupdocs_parser_cloud.ParseApi.from_config(configuration)
# กำหนดตัวเลือกภาพ
options = groupdocs_parser_cloud.ImagesOptions()
options.file_info = groupdocs_parser_cloud.FileInfo()
options.file_info.file_path = "sample.pdf"
# กำหนดช่วงหน้า
options.start_page_number = 1
options.count_pages_to_extract = 1

# สร้างคำขอ
request = groupdocs_parser_cloud.ImagesRequest(options)
result = parseApi.images(request)

for page in result.pages:
    print("Images from " + str(page.page_index) + " page.")
   for image in page.images:
        print("Image path in storage: " + image.path + ". Download url: " + image.download_url)
        print("Image format: " + image.file_format + ". Page index: " + str(image.page_index))
แยกรูปภาพตามช่วงหมายเลขหน้าจากเอกสาร PDF

แยกรูปภาพตามช่วงหมายเลขหน้าจากเอกสาร PDF

รับรูปภาพจากเอกสารที่แนบมาด้วย PDF โดยใช้ Python

คุณสามารถแยกรูปภาพออกจากเอกสารภายในคอนเทนเนอร์ ซึ่งมีให้ใช้งานเป็นไฟล์แนบในไฟล์ PDF โดยทางโปรแกรมโดยทำตามขั้นตอนด้านล่าง

  • สร้างอินสแตนซ์ของ ParseApi
  • กำหนด ImageOptions
  • กำหนดเส้นทางไปยังไฟล์ PDF
  • กำหนด ContainerItemInfo
  • ระบุเส้นทางสัมพัทธ์ของเอกสารภายใน
  • กำหนดหมายเลขหน้าเริ่มต้น
  • กำหนดจำนวนหน้าที่ต้องการแยก
  • สร้างคำขอรูปภาพ
  • รับผลลัพธ์โดยเรียกเมธอด ParseApi.images()

ตัวอย่างโค้ดต่อไปนี้แสดงวิธีการแยกรูปภาพจากเอกสารภายในเอกสาร PDF โดยใช้ REST API โปรดทำตามขั้นตอนที่กล่าวถึงก่อนหน้านี้เพื่อดาวน์โหลดภาพที่แยกออกมา

# การเริ่มต้น API
parseApi = groupdocs_parser_cloud.ParseApi.from_config(configuration)

# กำหนดตัวเลือกภาพ
options = groupdocs_parser_cloud.ImagesOptions()
options.file_info = groupdocs_parser_cloud.FileInfo()
options.file_info.file_path = "PDF_with_attachements.pdf"
options.file_info.password = "password"
# กำหนดรายการคอนเทนเนอร์
container_info = groupdocs_parser_cloud.ContainerItemInfo()
container_info.relative_path = "template-document.pdf"
options.container_item_info = container_info
# กำหนดช่วงหน้า
options.start_page_number = 2
options.count_pages_to_extract = 1

# สร้างคำขอ
request = groupdocs_parser_cloud.ImagesRequest(options)
result = parseApi.images(request)

for page in result.pages:
    print("Images from " + str(page.page_index) + " page.")
   for image in page.images:
        print("Image path in storage: " + image.path + ". Download url: " + image.download_url)
        print("Image format: " + image.file_format + ". Page index: " + str(image.page_index))
แยกรูปภาพจากเอกสารที่แนบมาในเอกสาร PDF

แยกรูปภาพจากเอกสารที่แนบมาในเอกสาร PDF

ลองออนไลน์

โปรดลองใช้เครื่องมือแยกวิเคราะห์ PDF ออนไลน์ฟรีต่อไปนี้ ซึ่งพัฒนาโดยใช้ API ข้างต้น https://products.groupdocs.app/parser/pdf

บทสรุป

ในบทความนี้ คุณได้เรียนรู้วิธีแยกรูปภาพจากเอกสาร PDF บนคลาวด์ บทความนี้ยังอธิบายวิธีการอัปโหลดไฟล์ PDF บนระบบคลาวด์โดยทางโปรแกรม คุณยังได้เรียนรู้วิธีดาวน์โหลดภาพที่แยกออกมาโดยใช้ SDK คุณสามารถเรียนรู้เพิ่มเติมเกี่ยวกับ GroupDocs.Parser Cloud API โดยใช้ เอกสารประกอบ เรายังมีส่วน API Reference ที่ช่วยให้คุณแสดงภาพและโต้ตอบกับ API ของเราได้โดยตรงผ่านเบราว์เซอร์ ในกรณีที่มีความคลุมเครือ โปรดติดต่อเราได้ที่ ฟอรัม

ดูสิ่งนี้ด้วย