คุณอาจต้องแยกหน้าที่ต้องการออกจากเอกสาร PDF หรืออาจต้องแยกเอกสาร PDF ขนาดใหญ่ออกเป็นส่วนย่อยๆ ในฐานะนักพัฒนา Python คุณสามารถแยกหน้าเฉพาะจากเอกสาร PDF ได้อย่างง่ายดายด้วยหมายเลขหน้าหรือตามช่วงของหน้าโดยทางโปรแกรม ในบทความนี้ คุณจะได้เรียนรู้วิธีแยกหน้าเฉพาะจากเอกสาร PDF โดยใช้ REST API ใน Python
หัวข้อต่อไปนี้จะครอบคลุมในบทความนี้:
- ตัวแยกเอกสาร REST API และ Python SDK
- แยกหน้าเฉพาะจาก PDF โดยใช้ REST API
- แยกหน้าตามช่วงหน้าโดยใช้ Python
ตัวแยกเอกสาร REST API และ Python SDK
สำหรับการดึงหน้าออกจากเอกสาร PDF ฉันจะใช้ API ของ Python SDK of GroupDocs.Merger Cloud เป็น Cloud SDK ที่มีคุณลักษณะหลากหลายและมีประสิทธิภาพสูง ซึ่งใช้ในการรวมเอกสารหลายฉบับเป็นเอกสารเดียว นอกจากนี้ยังช่วยให้คุณสามารถแบ่งเอกสารเดียวออกเป็นหลายเอกสารได้ SDK มีฟังก์ชันในการลบ แลกเปลี่ยน หมุน หรือเปลี่ยนการวางแนวหน้าสำหรับหน้าทั้งหมดหรือช่วงที่ต้องการ และดำเนินการจัดการอื่น ๆ ได้อย่างง่ายดายสำหรับรูปแบบไฟล์ที่รองรับ เช่น PDF, Word, Powerpoint และ Excel worksheets ปัจจุบันยังมี .NET, Java, PHP, Ruby, Android และ Node.js SDK เป็น สมาชิกตระกูลการควบรวมเอกสาร สำหรับ Cloud API
คุณสามารถติดตั้ง GroupDocs.Merger-Cloud ในโครงการ Python โดยใช้คำสั่งต่อไปนี้ในคอนโซล:
pip install groupdocs_merger_cloud
โปรดรับรหัสไคลเอ็นต์และรหัสลับไคลเอ็นต์ของคุณจาก แดชบอร์ด ก่อนที่คุณจะเริ่มทำตามขั้นตอนและตัวอย่างโค้ดที่มีอยู่ เมื่อคุณมี ID และรหัสลับของคุณแล้ว ให้เพิ่มรหัสตามที่แสดงด้านล่าง:
client_id = "da0c487d-c1c0-45ae-b7bf-43eaf53c5ad5"
client_secret = "479db2b01dcb93a3d4d20efb16dea971"
configuration = groupdocs_merger_cloud.Configuration(client_id, client_secret)
configuration.api_base_url = "https://api.groupdocs.cloud"
my_storage = ""
แยกหน้าเฉพาะจาก PDF โดยใช้ REST API ใน Python
คุณสามารถแยกหน้าเฉพาะจากเอกสาร PDF โดยทำตามขั้นตอนง่าย ๆ ที่กล่าวถึงด้านล่าง:
- อัปโหลด ไฟล์ PDF ไปยังคลาวด์
- แยกหน้าเฉพาะตามหมายเลขหน้า จากไฟล์ PDF ที่อัปโหลด
- ดาวน์โหลด ไฟล์ที่แยกออกมา
อัปโหลดเอกสาร
ก่อนอื่น ให้อัปโหลดเอกสาร PDF หลายหน้าไปยังคลาวด์โดยใช้ตัวอย่างโค้ดที่ระบุด้านล่าง:
# สร้างอินสแตนซ์ของ API
file_api = groupdocs_merger_cloud.FileApi.from_config(configuration)
my_storage = ""
# อัปโหลดไฟล์ตัวอย่าง
request = groupdocs_merger_cloud.UploadFileRequest("ten-pages.pdf", "C:\\Files\\ten-pages.pdf", my_storage)
response = file_api.upload_file(request)
ด้วยเหตุนี้ ไฟล์ PDF จะถูกอัปโหลดไปยัง Cloud Storage และจะอยู่ใน ส่วนไฟล์ ของแดชบอร์ดของคุณ
แยกหน้าเฉพาะตามหมายเลขหน้าโดยใช้ Python
โปรดทำตามขั้นตอนด้านล่างเพื่อแยกหน้าใดหน้าหนึ่งหรือหลายหน้าจากเอกสาร PDF โดยทางโปรแกรม
- สร้างอินสแตนซ์ Document API
- ให้ SplitOptions
- กำหนดเส้นทางไฟล์อินพุต
- กำหนดเส้นทางไดเร็กทอรีเอาต์พุต
- ระบุหมายเลขหน้าที่คั่นด้วยเครื่องหมายจุลภาคเพื่อแยก
- ตั้งโหมดเป็น Pages
- สร้าง SplitRequest
- รับผลลัพธ์โดยเรียกเมธอด DocumentApi.split()
ตัวอย่างโค้ดต่อไปนี้แสดงวิธีแยกหน้าโดยระบุหมายเลขหน้าเฉพาะจากเอกสาร PDF โดยใช้ REST API
# การเริ่มต้น API
documentApi = groupdocs_merger_cloud.DocumentApi.from_config(configuration)
# กำหนดตัวเลือกการแยก
options = groupdocs_merger_cloud.SplitOptions()
options.file_info = groupdocs_merger_cloud.FileInfo("ten-pages.pdf")
options.output_path = "Output"
options.pages = [1, 3]
options.mode = "Pages"
# สร้างคำขอแยก
split_request = groupdocs_merger_cloud.SplitRequest(options)
result = documentApi.split(split_request)
print("Documents count = " + str(len(result.documents)))
ดาวน์โหลดไฟล์หน้าที่แยกออกมา
ตัวอย่างโค้ดด้านบนจะบันทึกหน้าที่แยกออกมาในไฟล์ PDF แยกต่างหากบนคลาวด์ คุณสามารถดาวน์โหลดได้โดยใช้ตัวอย่างโค้ดต่อไปนี้:
# การเริ่มต้น API
file_api = groupdocs_merger_cloud.FileApi.from_config(configuration)
my_storage = ""
# ดาวน์โหลดไฟล์คำขอ
request = groupdocs_merger_cloud.DownloadFileRequest("Output\\ten-pages_1.pdf", my_storage)
response = file_api.download_file(request)
# ย้ายไฟล์ที่ดาวน์โหลดไปยังไดเร็กทอรีการทำงานของคุณ
shutil.move(response, "C:\\Files\\")
แยกหน้าตามช่วงหน้าโดยใช้ Python
โปรดทำตามขั้นตอนด้านล่างเพื่อแยกหน้าจากเอกสาร PDF โดยระบุช่วงหน้าโดยทางโปรแกรม
- สร้างอินสแตนซ์ Document API
- ให้ SplitOptions
- กำหนดเส้นทางไฟล์อินพุต
- กำหนดเส้นทางไดเร็กทอรีเอาต์พุต
- ระบุช่วงหน้าโดยตั้งค่าหมายเลขหน้าเริ่มต้นและหมายเลขหน้าสิ้นสุดเพื่อแยก
- ตั้งโหมดเป็น Pages
- สร้าง SplitRequest
- รับผลลัพธ์โดยเรียกเมธอด DocumentApi.split()
- สร้าง DownloadFileRequest
- ดาวน์โหลดไฟล์โดยเรียกเมธอด FileApi.download\file()
ตัวอย่างโค้ดต่อไปนี้แสดงวิธีแยกหน้าโดยระบุช่วงหน้าจากเอกสาร PDF โดยใช้ REST API โปรดทำตามขั้นตอนที่กล่าวถึงก่อนหน้านี้เพื่ออัปโหลดไฟล์
# การเริ่มต้น API
documentApi = groupdocs_merger_cloud.DocumentApi.from_config(configuration)
file_api = groupdocs_merger_cloud.FileApi.from_config(configuration)
my_storage = ""
# กำหนดตัวเลือกการแยก
options = groupdocs_merger_cloud.SplitOptions()
options.file_info = groupdocs_merger_cloud.FileInfo("ten-pages.pdf")
options.output_path = "Output"
options.start_page_number = 4
options.end_page_number = 7
options.mode = "Pages"
# สร้างคำขอแยก
split_request = groupdocs_merger_cloud.SplitRequest(options)
result = documentApi.split(split_request)
print("Documents count = " + str(len(result.documents)))
# แสดงผลและดาวน์โหลดไฟล์ทีละไฟล์
for data in result.documents:
print("Document Url = " + str(data))
# สร้างคำขอดาวน์โหลดไฟล์
request = groupdocs_merger_cloud.DownloadFileRequest(data.path, my_storage)
response = file_api.download_file(request)
# ย้ายไฟล์ที่ดาวน์โหลดไปยังไดเร็กทอรีการทำงานของคุณ
shutil.move(response, "C:\\Files\\")
ลองออนไลน์
โปรดลองใช้เครื่องมือแยก PDF ออนไลน์ฟรีต่อไปนี้ ซึ่งพัฒนาโดยใช้ API ด้านบน https://products.groupdocs.app/splitter/pdf
บทสรุป
ในบทความนี้ คุณได้เรียนรู้วิธีแยกหน้าเฉพาะจากเอกสาร PDF บนคลาวด์โดยใช้ Python คุณยังได้เรียนรู้วิธีอัปโหลดไฟล์ PDF บนคลาวด์โดยทางโปรแกรม จากนั้นดาวน์โหลดไฟล์ที่แยกออกจากคลาวด์ คุณสามารถเรียนรู้เพิ่มเติมเกี่ยวกับ GroupDocs.Merger Cloud API โดยใช้ เอกสารประกอบ เรายังมีส่วน API Reference ที่ช่วยให้คุณแสดงภาพและโต้ตอบกับ API ของเราได้โดยตรงผ่านเบราว์เซอร์ ในกรณีที่มีความคลุมเครือ โปรดติดต่อเราได้ที่ ฟอรัม