แยกหน้าเฉพาะจาก PDF

คุณอาจต้องแยกหน้าที่ต้องการออกจากเอกสาร PDF หรืออาจต้องแยกเอกสาร PDF ขนาดใหญ่ออกเป็นส่วนย่อยๆ ในฐานะนักพัฒนา Python คุณสามารถแยกหน้าเฉพาะจากเอกสาร PDF ได้อย่างง่ายดายด้วยหมายเลขหน้าหรือตามช่วงของหน้าโดยทางโปรแกรม ในบทความนี้ คุณจะได้เรียนรู้วิธีแยกหน้าเฉพาะจากเอกสาร PDF โดยใช้ REST API ใน Python

หัวข้อต่อไปนี้จะครอบคลุมในบทความนี้:

ตัวแยกเอกสาร REST API และ Python SDK

สำหรับการดึงหน้าออกจากเอกสาร PDF ฉันจะใช้ API ของ Python SDK of GroupDocs.Merger Cloud เป็น Cloud SDK ที่มีคุณลักษณะหลากหลายและมีประสิทธิภาพสูง ซึ่งใช้ในการรวมเอกสารหลายฉบับเป็นเอกสารเดียว นอกจากนี้ยังช่วยให้คุณสามารถแบ่งเอกสารเดียวออกเป็นหลายเอกสารได้ SDK มีฟังก์ชันในการลบ แลกเปลี่ยน หมุน หรือเปลี่ยนการวางแนวหน้าสำหรับหน้าทั้งหมดหรือช่วงที่ต้องการ และดำเนินการจัดการอื่น ๆ ได้อย่างง่ายดายสำหรับรูปแบบไฟล์ที่รองรับ เช่น PDF, Word, Powerpoint และ Excel worksheets ปัจจุบันยังมี .NET, Java, PHP, Ruby, Android และ Node.js SDK เป็น สมาชิกตระกูลการควบรวมเอกสาร สำหรับ Cloud API

คุณสามารถติดตั้ง GroupDocs.Merger-Cloud ในโครงการ Python โดยใช้คำสั่งต่อไปนี้ในคอนโซล:

pip install groupdocs_merger_cloud

โปรดรับรหัสไคลเอ็นต์และรหัสลับไคลเอ็นต์ของคุณจาก แดชบอร์ด ก่อนที่คุณจะเริ่มทำตามขั้นตอนและตัวอย่างโค้ดที่มีอยู่ เมื่อคุณมี ID และรหัสลับของคุณแล้ว ให้เพิ่มรหัสตามที่แสดงด้านล่าง:

client_id = "da0c487d-c1c0-45ae-b7bf-43eaf53c5ad5"
client_secret = "479db2b01dcb93a3d4d20efb16dea971"

configuration = groupdocs_merger_cloud.Configuration(client_id, client_secret)
configuration.api_base_url = "https://api.groupdocs.cloud"
my_storage = ""

แยกหน้าเฉพาะจาก PDF โดยใช้ REST API ใน Python

คุณสามารถแยกหน้าเฉพาะจากเอกสาร PDF โดยทำตามขั้นตอนง่าย ๆ ที่กล่าวถึงด้านล่าง:

  1. อัปโหลด ไฟล์ PDF ไปยังคลาวด์
  2. แยกหน้าเฉพาะตามหมายเลขหน้า จากไฟล์ PDF ที่อัปโหลด
  3. ดาวน์โหลด ไฟล์ที่แยกออกมา

อัปโหลดเอกสาร

ก่อนอื่น ให้อัปโหลดเอกสาร PDF หลายหน้าไปยังคลาวด์โดยใช้ตัวอย่างโค้ดที่ระบุด้านล่าง:

# สร้างอินสแตนซ์ของ API
file_api = groupdocs_merger_cloud.FileApi.from_config(configuration)
my_storage = ""

# อัปโหลดไฟล์ตัวอย่าง
request = groupdocs_merger_cloud.UploadFileRequest("ten-pages.pdf", "C:\\Files\\ten-pages.pdf", my_storage)
response = file_api.upload_file(request)

ด้วยเหตุนี้ ไฟล์ PDF จะถูกอัปโหลดไปยัง Cloud Storage และจะอยู่ใน ส่วนไฟล์ ของแดชบอร์ดของคุณ

แยกหน้าเฉพาะตามหมายเลขหน้าโดยใช้ Python

โปรดทำตามขั้นตอนด้านล่างเพื่อแยกหน้าใดหน้าหนึ่งหรือหลายหน้าจากเอกสาร PDF โดยทางโปรแกรม

  • สร้างอินสแตนซ์ Document API
  • ให้ SplitOptions
  • กำหนดเส้นทางไฟล์อินพุต
  • กำหนดเส้นทางไดเร็กทอรีเอาต์พุต
  • ระบุหมายเลขหน้าที่คั่นด้วยเครื่องหมายจุลภาคเพื่อแยก
  • ตั้งโหมดเป็น Pages
  • สร้าง SplitRequest
  • รับผลลัพธ์โดยเรียกเมธอด DocumentApi.split()

ตัวอย่างโค้ดต่อไปนี้แสดงวิธีแยกหน้าโดยระบุหมายเลขหน้าเฉพาะจากเอกสาร PDF โดยใช้ REST API

# การเริ่มต้น API
documentApi = groupdocs_merger_cloud.DocumentApi.from_config(configuration)

# กำหนดตัวเลือกการแยก
options = groupdocs_merger_cloud.SplitOptions()
options.file_info = groupdocs_merger_cloud.FileInfo("ten-pages.pdf")
options.output_path = "Output"
options.pages = [1, 3]
options.mode = "Pages"

# สร้างคำขอแยก
split_request = groupdocs_merger_cloud.SplitRequest(options)
result = documentApi.split(split_request)        

print("Documents count = " + str(len(result.documents)))
แยกหน้าเฉพาะจาก PDF โดยใช้ Python

แยกหน้าเฉพาะจาก PDF โดยใช้ Python

ดาวน์โหลดไฟล์หน้าที่แยกออกมา

ตัวอย่างโค้ดด้านบนจะบันทึกหน้าที่แยกออกมาในไฟล์ PDF แยกต่างหากบนคลาวด์ คุณสามารถดาวน์โหลดได้โดยใช้ตัวอย่างโค้ดต่อไปนี้:

# การเริ่มต้น API
file_api = groupdocs_merger_cloud.FileApi.from_config(configuration)
my_storage = ""

# ดาวน์โหลดไฟล์คำขอ
request = groupdocs_merger_cloud.DownloadFileRequest("Output\\ten-pages_1.pdf", my_storage)
response = file_api.download_file(request)

# ย้ายไฟล์ที่ดาวน์โหลดไปยังไดเร็กทอรีการทำงานของคุณ
shutil.move(response, "C:\\Files\\")

แยกหน้าตามช่วงหน้าโดยใช้ Python

โปรดทำตามขั้นตอนด้านล่างเพื่อแยกหน้าจากเอกสาร PDF โดยระบุช่วงหน้าโดยทางโปรแกรม

  • สร้างอินสแตนซ์ Document API
  • ให้ SplitOptions
  • กำหนดเส้นทางไฟล์อินพุต
  • กำหนดเส้นทางไดเร็กทอรีเอาต์พุต
  • ระบุช่วงหน้าโดยตั้งค่าหมายเลขหน้าเริ่มต้นและหมายเลขหน้าสิ้นสุดเพื่อแยก
  • ตั้งโหมดเป็น Pages
  • สร้าง SplitRequest
  • รับผลลัพธ์โดยเรียกเมธอด DocumentApi.split()
  • สร้าง DownloadFileRequest
  • ดาวน์โหลดไฟล์โดยเรียกเมธอด FileApi.download\file()

ตัวอย่างโค้ดต่อไปนี้แสดงวิธีแยกหน้าโดยระบุช่วงหน้าจากเอกสาร PDF โดยใช้ REST API โปรดทำตามขั้นตอนที่กล่าวถึงก่อนหน้านี้เพื่ออัปโหลดไฟล์

# การเริ่มต้น API
documentApi = groupdocs_merger_cloud.DocumentApi.from_config(configuration)
file_api = groupdocs_merger_cloud.FileApi.from_config(configuration)
my_storage = ""

# กำหนดตัวเลือกการแยก
options = groupdocs_merger_cloud.SplitOptions()
options.file_info = groupdocs_merger_cloud.FileInfo("ten-pages.pdf")
options.output_path = "Output"
options.start_page_number = 4
options.end_page_number = 7
options.mode = "Pages"

# สร้างคำขอแยก
split_request = groupdocs_merger_cloud.SplitRequest(options)
result = documentApi.split(split_request)   

print("Documents count = " + str(len(result.documents)))

# แสดงผลและดาวน์โหลดไฟล์ทีละไฟล์
for data in result.documents:
    print("Document Url = " + str(data))
    
    # สร้างคำขอดาวน์โหลดไฟล์
    request = groupdocs_merger_cloud.DownloadFileRequest(data.path, my_storage)
    response = file_api.download_file(request)
    
    # ย้ายไฟล์ที่ดาวน์โหลดไปยังไดเร็กทอรีการทำงานของคุณ
    shutil.move(response, "C:\\Files\\")
แยกหน้าตามช่วงหน้าโดยใช้ Python

แยกหน้าตามช่วงหน้าโดยใช้ Python

ลองออนไลน์

โปรดลองใช้เครื่องมือแยก PDF ออนไลน์ฟรีต่อไปนี้ ซึ่งพัฒนาโดยใช้ API ด้านบน https://products.groupdocs.app/splitter/pdf

บทสรุป

ในบทความนี้ คุณได้เรียนรู้วิธีแยกหน้าเฉพาะจากเอกสาร PDF บนคลาวด์โดยใช้ Python คุณยังได้เรียนรู้วิธีอัปโหลดไฟล์ PDF บนคลาวด์โดยทางโปรแกรม จากนั้นดาวน์โหลดไฟล์ที่แยกออกจากคลาวด์ คุณสามารถเรียนรู้เพิ่มเติมเกี่ยวกับ GroupDocs.Merger Cloud API โดยใช้ เอกสารประกอบ เรายังมีส่วน API Reference ที่ช่วยให้คุณแสดงภาพและโต้ตอบกับ API ของเราได้โดยตรงผ่านเบราว์เซอร์ ในกรณีที่มีความคลุมเครือ โปรดติดต่อเราได้ที่ ฟอรัม

ดูสิ่งนี้ด้วย