แยกรูปภาพจากเอกสาร PDF โดยใช้ REST API ใน Python

คุณอาจต้องแยกรูปภาพออกจากเอกสาร PDF หรือ Word เพื่อนำมาใช้ใหม่ คุณสามารถแยกรูปภาพจากเอกสาร PDF โดยทางโปรแกรมบนคลาวด์ได้อย่างง่ายดาย บทความนี้จะอธิบายวิธีแยกรูปภาพจากเอกสาร PDF โดยใช้ REST API ใน Python

หัวข้อต่อไปนี้จะครอบคลุมในบทความนี้:

โปรแกรมแยกวิเคราะห์เอกสาร REST API และ Python SDK
แยกรูปภาพจาก PDF โดยใช้ REST API
บันทึกภาพตามช่วงหมายเลขหน้าโดยใช้ REST API
รับรูปภาพจากเอกสารที่แนบมาโดยใช้ REST API

โปรแกรมแยกวิเคราะห์เอกสาร REST API และ Python SDK

สำหรับการดึงภาพจากเอกสาร PDF ฉันจะใช้ API ของ Python SDK of GroupDocs.Parser Cloud ช่วยให้คุณสามารถแยกวิเคราะห์ข้อมูลจากเอกสารยอดนิยมทุกประเภท คุณสามารถแยกข้อความ รูปภาพ และแยกวิเคราะห์ข้อมูลตามเทมเพลตได้โดยใช้ SDK นอกจากนี้ยังมี .NET, Java, PHP, Ruby และ Node.js SDK เป็น สมาชิกตระกูลโปรแกรมแยกวิเคราะห์เอกสาร สำหรับ Cloud API

คุณสามารถติดตั้ง GroupDocs.Parser Cloud ในโครงการ Python ของคุณด้วย pip (ตัวติดตั้งแพ็คเกจสำหรับ python) โดยใช้คำสั่งต่อไปนี้ในคอนโซล:

pip install groupdocs_parser_cloud

โปรดรับรหัสไคลเอ็นต์และรหัสลับไคลเอ็นต์ของคุณจาก แดชบอร์ด ก่อนที่คุณจะเริ่มทำตามขั้นตอนและตัวอย่างโค้ดที่มีอยู่ เมื่อคุณมีรหัสไคลเอ็นต์และรหัสลับแล้ว ให้เพิ่มรหัสตามที่แสดงด้านล่าง:

client_id = "112f0f38-9dae-42d5-b4fc-cc84ae644972"
client_secret = "16ad3fe0bdc39c910f57d2fd48a5d618"

configuration = groupdocs_parser_cloud.Configuration(client_id, client_secret)
configuration.api_base_url = "https://api.groupdocs.cloud"
my_storage = ""

แยกรูปภาพจาก PDF โดยใช้ REST API ใน Python

คุณสามารถแยกรูปภาพออกจากเอกสาร PDF ได้โดยทำตามขั้นตอนง่าย ๆ ที่กล่าวถึงด้านล่าง:

อัปโหลด ไฟล์ PDF ไปยังคลาวด์
แยกรูปภาพออกจากเอกสาร PDF โดยใช้ Python
ดาวน์โหลด the extracted images

อัปโหลดเอกสาร

ก่อนอื่น อัปโหลดเอกสาร PDF ไปยังคลาวด์โดยใช้ตัวอย่างโค้ดที่ระบุด้านล่าง:

# การเริ่มต้น API
file_api = groupdocs_parser_cloud.FileApi.from_config(configuration)
my_storage = ""

request = groupdocs_parser_cloud.UploadFileRequest("sample.pdf", "C:\\Files\\sample.pdf", my_storage)
response = file_api.upload_file(request)

ด้วยเหตุนี้ ไฟล์ PDF ที่อัปโหลด (sample.pdf) จะอยู่ใน ส่วนไฟล์ ของแดชบอร์ดของคุณบนระบบคลาวด์

แยกรูปภาพทั้งหมดออกจากเอกสาร PDF โดยใช้ Python

คุณสามารถแยกรูปภาพทั้งหมดออกจากไฟล์ PDF โดยทางโปรแกรมโดยทำตามขั้นตอนด้านล่าง

สร้างอินสแตนซ์ของ ParseApi
กำหนด ImageOptions
กำหนดเส้นทางไปยังไฟล์ PDF
สร้างคำขอรูปภาพ
รับผลลัพธ์โดยเรียกเมธอด ParseApi.images()

ตัวอย่างโค้ดต่อไปนี้แสดงวิธีแยกรูปภาพทั้งหมดจากเอกสาร PDF โดยใช้ REST API

# การเริ่มต้น API
parseApi = groupdocs_parser_cloud.ParseApi.from_config(configuration)
# กำหนดตัวเลือกภาพ
options = groupdocs_parser_cloud.ImagesOptions()
options.file_info = groupdocs_parser_cloud.FileInfo()
options.file_info.file_path = "sample.pdf"

# สร้างคำขอ
request = groupdocs_parser_cloud.ImagesRequest(options)
result = parseApi.images(request)

for image in result.images:
    print("Image path in storage: " + image.path + ". Download url: " + image.download_url)
    print("Image format: " + image.file_format + ". Page index: " + str(image.page_index))

ดาวน์โหลดภาพที่แยกออกมา

ตัวอย่างโค้ดด้านบนจะบันทึกภาพที่แยกไว้บนคลาวด์ คุณสามารถดาวน์โหลดรูปภาพเหล่านี้ได้โดยใช้ตัวอย่างโค้ดด้านล่าง:

# การเริ่มต้น API
file_api = groupdocs_parser_cloud.FileApi.from_config(configuration)
my_storage = ""
  
# ดาวน์โหลดภาพ 
request = groupdocs_parser_cloud.DownloadFileRequest(image.path, my_storage)
response = file_api.download_file(request)

# ย้ายไฟล์ที่ดาวน์โหลดไปยังไดเร็กทอรีการทำงานของคุณ
shutil.move(response, "C:\\Files\\Images")

บันทึกภาพตามหมายเลขหน้าจากเอกสาร PDF โดยใช้ Python

คุณสามารถแยกรูปภาพจากหน้าเฉพาะของไฟล์ PDF โดยทางโปรแกรมโดยทำตามขั้นตอนด้านล่าง

สร้างอินสแตนซ์ของ ParseApi
กำหนด ImageOptions
ระบุเส้นทางไปยังไฟล์ PDF
กำหนดหมายเลขหน้าเริ่มต้น
กำหนดจำนวนหน้าที่ต้องการแยก
สร้างคำขอรูปภาพ
รับผลลัพธ์โดยเรียกเมธอด ParseApi.images()

ตัวอย่างโค้ดต่อไปนี้แสดงวิธีแยกรูปภาพตามช่วงหมายเลขหน้าจากเอกสาร PDF โดยใช้ REST API โปรดทำตามขั้นตอนที่กล่าวถึงก่อนหน้านี้เพื่อดาวน์โหลดภาพที่แยกออกมา

# การเริ่มต้น API
parseApi = groupdocs_parser_cloud.ParseApi.from_config(configuration)
# กำหนดตัวเลือกภาพ
options = groupdocs_parser_cloud.ImagesOptions()
options.file_info = groupdocs_parser_cloud.FileInfo()
options.file_info.file_path = "sample.pdf"
# กำหนดช่วงหน้า
options.start_page_number = 1
options.count_pages_to_extract = 1

# สร้างคำขอ
request = groupdocs_parser_cloud.ImagesRequest(options)
result = parseApi.images(request)

for page in result.pages:
    print("Images from " + str(page.page_index) + " page.")
   for image in page.images:
        print("Image path in storage: " + image.path + ". Download url: " + image.download_url)
        print("Image format: " + image.file_format + ". Page index: " + str(image.page_index))

รับรูปภาพจากเอกสารที่แนบมาด้วย PDF โดยใช้ Python

คุณสามารถแยกรูปภาพออกจากเอกสารภายในคอนเทนเนอร์ ซึ่งมีให้ใช้งานเป็นไฟล์แนบในไฟล์ PDF โดยทางโปรแกรมโดยทำตามขั้นตอนด้านล่าง

สร้างอินสแตนซ์ของ ParseApi
กำหนด ImageOptions
กำหนดเส้นทางไปยังไฟล์ PDF
กำหนด ContainerItemInfo
ระบุเส้นทางสัมพัทธ์ของเอกสารภายใน
กำหนดหมายเลขหน้าเริ่มต้น
กำหนดจำนวนหน้าที่ต้องการแยก
สร้างคำขอรูปภาพ
รับผลลัพธ์โดยเรียกเมธอด ParseApi.images()

ตัวอย่างโค้ดต่อไปนี้แสดงวิธีการแยกรูปภาพจากเอกสารภายในเอกสาร PDF โดยใช้ REST API โปรดทำตามขั้นตอนที่กล่าวถึงก่อนหน้านี้เพื่อดาวน์โหลดภาพที่แยกออกมา

# การเริ่มต้น API
parseApi = groupdocs_parser_cloud.ParseApi.from_config(configuration)

# กำหนดตัวเลือกภาพ
options = groupdocs_parser_cloud.ImagesOptions()
options.file_info = groupdocs_parser_cloud.FileInfo()
options.file_info.file_path = "PDF_with_attachements.pdf"
options.file_info.password = "password"
# กำหนดรายการคอนเทนเนอร์
container_info = groupdocs_parser_cloud.ContainerItemInfo()
container_info.relative_path = "template-document.pdf"
options.container_item_info = container_info
# กำหนดช่วงหน้า
options.start_page_number = 2
options.count_pages_to_extract = 1

# สร้างคำขอ
request = groupdocs_parser_cloud.ImagesRequest(options)
result = parseApi.images(request)

for page in result.pages:
    print("Images from " + str(page.page_index) + " page.")
   for image in page.images:
        print("Image path in storage: " + image.path + ". Download url: " + image.download_url)
        print("Image format: " + image.file_format + ". Page index: " + str(image.page_index))

ลองออนไลน์

โปรดลองใช้เครื่องมือแยกวิเคราะห์ PDF ออนไลน์ฟรีต่อไปนี้ ซึ่งพัฒนาโดยใช้ API ข้างต้น https://products.groupdocs.app/parser/pdf

บทสรุป

ในบทความนี้ คุณได้เรียนรู้วิธีแยกรูปภาพจากเอกสาร PDF บนคลาวด์ บทความนี้ยังอธิบายวิธีการอัปโหลดไฟล์ PDF บนระบบคลาวด์โดยทางโปรแกรม คุณยังได้เรียนรู้วิธีดาวน์โหลดภาพที่แยกออกมาโดยใช้ SDK คุณสามารถเรียนรู้เพิ่มเติมเกี่ยวกับ GroupDocs.Parser Cloud API โดยใช้ เอกสารประกอบ เรายังมีส่วน API Reference ที่ช่วยให้คุณแสดงภาพและโต้ตอบกับ API ของเราได้โดยตรงผ่านเบราว์เซอร์ ในกรณีที่มีความคลุมเครือ โปรดติดต่อเราได้ที่ ฟอรัม

แยกรูปภาพจากเอกสาร PDF โดยใช้ Python

โปรแกรมแยกวิเคราะห์เอกสาร REST API และ Python SDK

แยกรูปภาพจาก PDF โดยใช้ REST API ใน Python

อัปโหลดเอกสาร

แยกรูปภาพทั้งหมดออกจากเอกสาร PDF โดยใช้ Python

ดาวน์โหลดภาพที่แยกออกมา

บันทึกภาพตามหมายเลขหน้าจากเอกสาร PDF โดยใช้ Python

รับรูปภาพจากเอกสารที่แนบมาด้วย PDF โดยใช้ Python

ลองออนไลน์

บทสรุป

ดูสิ่งนี้ด้วย

โปรแกรมแยกวิเคราะห์เอกสาร REST API และ Python SDK#

แยกรูปภาพจาก PDF โดยใช้ REST API ใน Python#

อัปโหลดเอกสาร#

แยกรูปภาพทั้งหมดออกจากเอกสาร PDF โดยใช้ Python#

ดาวน์โหลดภาพที่แยกออกมา#

บันทึกภาพตามหมายเลขหน้าจากเอกสาร PDF โดยใช้ Python#

รับรูปภาพจากเอกสารที่แนบมาด้วย PDF โดยใช้ Python#

ลองออนไลน์#

บทสรุป#

ดูสิ่งนี้ด้วย#

โปรแกรมแยกวิเคราะห์เอกสาร REST API และ Python SDK

แยกรูปภาพจาก PDF โดยใช้ REST API ใน Python

อัปโหลดเอกสาร

แยกรูปภาพทั้งหมดออกจากเอกสาร PDF โดยใช้ Python

ดาวน์โหลดภาพที่แยกออกมา

บันทึกภาพตามหมายเลขหน้าจากเอกสาร PDF โดยใช้ Python

รับรูปภาพจากเอกสารที่แนบมาด้วย PDF โดยใช้ Python

ลองออนไลน์

บทสรุป

ดูสิ่งนี้ด้วย