วิธี PDF ไฟล์เป็น PDF หลายไฟล์ใน Python

การแยกเอกสาร Python - แยกไฟล์ PDF เป็นไฟล์ PDF หลายไฟล์โดยใช้ Python

PDF(Portable Document Format) คือรูปแบบไฟล์ที่ใช้กันอย่างแพร่หลายสำหรับเอกสารที่ต้องการแชร์ พิมพ์ หรือเก็บถาวร คุณเบื่อที่จะจัดการกับไฟล์ PDF ขนาดใหญ่ที่มีเอกสารหรือส่วนต่างๆ จำนวนมากหรือไม่? คุณคิดว่ามันยากไหมที่จะแยกหน้าหรือส่วนใดส่วนหนึ่งจากไฟล์ PDF ไฟล์เดียวเป็นเอกสารแยกต่างหาก การแยกไฟล์ PDF ออกเป็นไฟล์ขนาดเล็กหลายๆ ไฟล์จะทำให้งานการจัดการเอกสารของคุณง่ายขึ้นอย่างมาก ในบทความนี้ เราจะสำรวจวิธีแยกไฟล์ PDF เป็นไฟล์ PDF หลายไฟล์ใน Python โดยใช้ GroupDocs.Merger Cloud SDK สำหรับ Python

หัวข้อต่อไปนี้จะครอบคลุมในบทความนี้:

Python REST API เพื่อแยก PDF เป็นหน้าและการติดตั้ง SDK

GroupDocs.Merger Cloud SDK สำหรับ Python เป็นชุดพัฒนาซอฟต์แวร์ที่ทรงพลังและเต็มไปด้วยฟีเจอร์ที่ให้คุณจัดการไฟล์ PDF โดยทางโปรแกรม มีฟังก์ชันการทำงานที่หลากหลาย ได้แก่ การแยก การรวม การหมุน และการจัดเรียงชุดของหน้าใหม่ใน รูปแบบเอกสารที่รองรับ สามารถรวม SDK เข้ากับแอปพลิเคชันที่ใช้ Python เพื่อทำให้กระบวนการพัฒนาของคุณง่ายขึ้นและเพิ่มประสิทธิภาพการทำงาน

คุณสามารถติดตั้ง Merger API ในแอปพลิเคชัน Python ด้วย PIP จาก PyPI โดยเรียกใช้คำสั่งต่อไปนี้ในเทอร์มินัล:

pip install groupdocs-merger-cloud

ต่อไป คุณต้อง ลงทะเบียน สำหรับบัญชีทดลองใช้ฟรีหรือ ซื้อแผนการสมัครสมาชิก บนเว็บไซต์ GroupDocs และ รับรหัส API ของคุณ เมื่อคุณมี Client Id และ Client Secret แล้ว ให้เพิ่มข้อมูลโค้ดด้านล่างลงในแอปพลิเคชันที่ใช้ Python:

# นำเข้า SDK การควบรวม groupdocs
import groupdocs_merger_cloud

# รับ app_sid & app_key จาก https://dashboard.groupdocs.cloud หลังจากลงทะเบียนฟรี
app_sid = "xxxxxxx-xxxx-xxxx-xxxx-xxxxxxxxxxxx"
app_key = "xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx"

# รับการกำหนดค่า File API 
configuration = groupdocs_merger_cloud.Configuration(app_sid, app_key)
configuration.api_base_url = "https://api.groupdocs.cloud"
storage_name = "LocalStorage"

วิธีแบ่งหน้า PDF เป็นไฟล์ PDF แยกใน Python

หากต้องการแยกไฟล์ PDF เป็นไฟล์ PDF หลายไฟล์โดยใช้ GroupDocs.Merger Cloud SDK สำหรับ Python ให้ทำตามขั้นตอนเหล่านี้:

อัปโหลดไฟล์

ประการแรก อัปโหลดไฟล์ PDF ไปยังคลาวด์โดยใช้ตัวอย่างโค้ดที่ระบุด้านล่าง:

# สร้างอินสแตนซ์ของไฟล์ API
file_api = groupdocs_merger_cloud.FileApi.from_config(configuration)

# โทรขออัพโหลดไฟล์
request = groupdocs_merger_cloud.UploadFileRequest("python-testing\input-sample-file.pdf", "H:\\groupdocs-cloud-data\\input-sample-file.pdf", storage_name)

# อัปโหลดไฟล์ไปยังคลาวด์
response = file_api.upload_file(request)
print(response.uploaded)

ด้วยเหตุนี้ ไฟล์ที่อัปโหลดจะอยู่ใน ส่วนไฟล์ ของแดชบอร์ดของคุณบนระบบคลาวด์

แยก PDF เป็นแต่ละหน้าใน Python

ในส่วนนี้ เราจะเขียนขั้นตอนและโค้ดตัวอย่างเพื่อแบ่งหน้า PDF ออกเป็นไฟล์ PDF แยกกันทางโปรแกรมตามที่ระบุด้านล่าง:

  • ขั้นแรก สร้างอินสแตนซ์ของคลาส DocumentApi
  • ประการที่สอง สร้างอินสแตนซ์ของคลาส SplitOptions
  • ประการที่สาม สร้างอินสแตนซ์ของคลาส FileInfo
  • ระบุเส้นทางไฟล์อินพุตเป็นพารามิเตอร์ให้กับ FileInfo
  • ถัดไป ระบุพาธไดเร็กทอรีเอาต์พุต
  • ตั้งค่าหมายเลขหน้าเฉพาะในอาร์เรย์ที่คั่นด้วยเครื่องหมายจุลภาค
  • ตอนนี้ ตั้งค่าโหมดแยก PDF เป็น Pages เพื่อแยกหมายเลขหน้า
  • จากนั้น สร้างอินสแตนซ์ของคลาส SplitRequest และส่งพารามิเตอร์ SplitOptions
  • สุดท้าย เรียกเมธอด DocumentAPI.split() และส่งพารามิเตอร์ SplitRequest เพื่อรับผลลัพธ์

ข้อมูลโค้ดต่อไปนี้แสดงวิธีแยกไฟล์ PDF ใน Python โดยใช้ REST API:

# วิธีแยกไฟล์ PDF เป็นไฟล์ PDF เดี่ยวหลายไฟล์ใน Python
try:
	# สร้างอินสแตนซ์ของ Document API
	documentApi = groupdocs_merger_cloud.DocumentApi.from_keys(app_sid, app_key)
	 
	options = groupdocs_merger_cloud.SplitOptions()
	options.file_info = groupdocs_merger_cloud.FileInfo("python-testing\input-sample-file.pdf")
	options.output_path = "python-testing"
	options.pages = [1, 3]
	options.mode = "Pages"

	result = documentApi.split(groupdocs_merger_cloud.SplitRequest(options))
	print("Successfully split PDF to single page PDF files: " + result[0].path)
except groupdocs_merger_cloud.ApiException as e:
  print("Exception while calling API: {0}".format(e.message))

ดาวน์โหลดไฟล์

ตัวอย่างโค้ดด้านบนจะบันทึกไฟล์ที่แยกไว้บนคลาวด์ คุณสามารถดาวน์โหลดได้โดยใช้ตัวอย่างโค้ดต่อไปนี้:

# การเริ่มต้น API เพื่อดาวน์โหลดไฟล์
import shutil
file_api = groupdocs_merger_cloud.FileApi.from_config(configuration)

# สร้างคำขอดาวน์โหลดไฟล์
request = groupdocs_merger_cloud.DownloadFileRequest("python-testing\input-sample-file.pdf", storage_name)

# ดาวน์โหลดไฟล์
response = file_api.download_file(request)

# ย้ายไฟล์ที่ดาวน์โหลดไปยังไดเร็กทอรีของคุณ
shutil.move(response, "H:\\groupdocs-cloud-data\\")

แค่นั้นแหละ!

แยกเอกสาร PDF เป็นไฟล์แยกกันโดยใช้ตัวกรองช่วง

คุณสามารถแยกไฟล์ PDF ได้โดยระบุโหมดช่วงหน้าและกรองโดยทางโปรแกรมโดยทำตามขั้นตอนด้านล่าง:

  • ขั้นแรก สร้างอินสแตนซ์ของคลาส DocumentApi
  • ประการที่สอง สร้างอินสแตนซ์ของคลาส SplitOptions
  • ประการที่สาม สร้างอินสแตนซ์ของคลาส FileInfo
  • ระบุเส้นทางไฟล์อินพุตเป็นพารามิเตอร์ให้กับ FileInfo
  • ถัดไป ระบุพาธไดเร็กทอรีเอาต์พุตเป็น “python-testing”
  • ตั้งค่าหมายเลขหน้าเริ่มต้นและหมายเลขหน้าสิ้นสุด
  • ถัดไป ตั้งค่า rangemode ของหน้าเป็น OddPages
  • ตอนนี้ ตั้งค่าโหมดแยก PDF เป็น Pages เพื่อแยกหมายเลขหน้า
  • จากนั้น สร้างอินสแตนซ์ของคลาส SplitRequest และส่งพารามิเตอร์ SplitOptions
  • สุดท้าย เรียกเมธอด DocumentAPI.split() และส่งพารามิเตอร์ SplitRequest เพื่อรับผลลัพธ์

ข้อมูลโค้ดต่อไปนี้แสดงวิธีแยกไฟล์ PDF โดยใช้ตัวกรองใน Python โดยใช้ REST API:

# วิธีแยกไฟล์ PDF เป็น PDF เดี่ยวหลายไฟล์โดยใช้ตัวกรอง
try:
	# สร้างอินสแตนซ์ของ Document API
	documentApi = groupdocs_merger_cloud.DocumentApi.from_keys(app_sid, app_key)
	 
	options = groupdocs_merger_cloud.SplitOptions()
	options.file_info = groupdocs_merger_cloud.FileInfo("python-testing\input-sample-file.pdf")
	options.output_path = "python-testing"
	options.start_page_number = 3
	options.end_page_number = 9
	options.range_mode = "OddPages"
	options.mode = "Pages" # mode Intervals

	result = documentApi.split(groupdocs_merger_cloud.SplitRequest(options))
	print("Successfully split PDF file using pages range filter: " + result[0].path)
except groupdocs_merger_cloud.ApiException as e:
  print("Exception while calling API: {0}".format(e.message))

แยกหน้า PDF เป็นหลายไฟล์ใน Python โดยใช้ Array Filter

ในส่วนนี้ เราจะเขียนขั้นตอนและตัวอย่างข้อมูลโค้ดเพื่อแยกไฟล์ PDF เป็นไฟล์ PDF หลายไฟล์โดยทางโปรแกรม:

  • ขั้นแรก สร้างอินสแตนซ์ของคลาส DocumentApi
  • ประการที่สอง สร้างอินสแตนซ์ของคลาส SplitOptions
  • ประการที่สาม สร้างอินสแตนซ์ของคลาส FileInfo
  • ระบุเส้นทางไฟล์อินพุตเป็นพารามิเตอร์ให้กับ FileInfo
  • ถัดไป ระบุพาธไดเร็กทอรีเอาต์พุตเป็น “python-testing”
  • จากนั้น ตั้งค่าคอลเลกชันเพจในรูปแบบอาร์เรย์
  • ตั้งค่าโหมดแยก PDF เป็น Intervals เพื่อแยกไฟล์ PDF
  • จากนั้น สร้างอินสแตนซ์ของคลาส SplitRequest และส่งพารามิเตอร์ SplitOptions
  • สุดท้าย เรียกเมธอด DocumentAPI.split() และส่งพารามิเตอร์ SplitRequest เพื่อรับผลลัพธ์

ข้อมูลโค้ดต่อไปนี้แสดงวิธีแยกไฟล์ PDF เป็นไฟล์ PDF หลายไฟล์ใน Python โดยใช้ REST API:

# วิธีแยกไฟล์ PDF เป็นไฟล์หลายหน้าใน Python
try:
	# สร้างอินสแตนซ์ของ Document API
	documentApi = groupdocs_merger_cloud.DocumentApi.from_keys(app_sid, app_key)
	 
	options = groupdocs_merger_cloud.SplitOptions()
	options.file_info = groupdocs_merger_cloud.FileInfo("python-testing\input-sample-file.pdf")
	options.output_path = "python-testing"
	options.pages = [3, 6, 8]
	options.mode = "Intervals"

	result = documentApi.split(groupdocs_merger_cloud.SplitRequest(options))
	print("Successfully split PDF file to multiple PDF files: " + result[0].path)
except groupdocs_merger_cloud.ApiException as e:
  print("Exception while calling API: {0}".format(e.message))

ตัวแยก PDF ออนไลน์ฟรี

วิธีแยกไฟล์ PDF ออนไลน์ฟรี โปรดลองใช้เครื่องมือ ตัวแยก PDF ออนไลน์ ต่อไปนี้เพื่อแยกเอกสาร PDF ฟรี เครื่องมือออนไลน์ตัวแยกเอกสารนี้ได้รับการพัฒนาโดยใช้ REST API ที่กล่าวถึงข้างต้น

บทสรุป

โดยสรุป การแยกไฟล์ PDF เป็นไฟล์ PDF หลายไฟล์โดยใช้ GroupDocs.Merger Cloud SDK สำหรับ Python เป็นวิธีที่สะดวกในการจัดการและจัดการเอกสาร PDF ของคุณ ต่อไปนี้คือสิ่งที่คุณได้เรียนรู้ในบทความนี้:

  • วิธีแยกไฟล์ PDF หนึ่งไฟล์เป็นหลายไฟล์โดยใช้ Python บนคลาวด์
  • อัปโหลดและดาวน์โหลดไฟล์โดยทางโปรแกรมใน Python บนคลาวด์
  • แยกไฟล์ PDF เป็นหลายไฟล์ใน Python โดยใช้ตัวกรองช่วงหน้า
  • และแยกไฟล์ PDF ได้ฟรีโดยใช้ตัวแยก PDF ออนไลน์

นอกจากนี้ เรายังมี ส่วนอ้างอิง API ที่ช่วยให้คุณแสดงภาพและสื่อสารกับ API ของเราได้โดยตรงผ่านเบราว์เซอร์ ซอร์สโค้ดที่สมบูรณ์ของ Python SDK มีให้ใช้งานฟรีบน GitHub โปรดตรวจสอบ GroupDocs.Merger Cloud SDK สำหรับ Python ตัวอย่างที่นี่

นอกจากนี้ เราขอแนะนำให้คุณปฏิบัติตาม คู่มือการเริ่มต้นใช้งาน สำหรับขั้นตอนโดยละเอียดและการใช้งาน API

สุดท้าย เรายังคงเขียนบล็อกโพสต์ใหม่เกี่ยวกับการทำงานของเอกสารต่างๆ โดยใช้ REST API ดังนั้นโปรดติดต่อเพื่อรับการอัปเดตเป็นประจำ

ถามคำถาม

หากคุณมีคำถามใดๆ เกี่ยวกับ API ตัวแยกเอกสาร PDF โปรดอย่าลังเลที่จะถามเราได้ที่ ฟอรัมสนับสนุนฟรี

คำถามที่พบบ่อย

ฉันสามารถแยกไฟล์ PDF ออกเป็นหลายๆ ไฟล์ตามหน้าที่ระบุได้หรือไม่

ได้ เมื่อใช้ GroupDocs.Merger Cloud SDK สำหรับ Python คุณสามารถกำหนดช่วงของหน้าที่จะแยกและแยก PDF ออกเป็นไฟล์ PDF แยกกัน

GroupDocs.Merger Cloud SDK สำหรับ Python รองรับรูปแบบเอกสารอื่นนอกเหนือจาก PDF หรือไม่

ใช่ GroupDocs.Merger Cloud SDK สำหรับ Python รองรับรูปแบบเอกสารต่างๆ รวมถึง DOCX, XLSX, PPTX และอื่นๆ คุณสามารถดำเนินการที่คล้ายกันกับไฟล์ประเภทเหล่านี้ได้เช่นกัน

เป็นไปได้ไหมที่จะรวมไฟล์ PDF แยกกลับเป็นไฟล์เดียวหากจำเป็น?

ใช่ GroupDocs.Merger Cloud SDK สำหรับ Python ยังรองรับการรวมไฟล์ PDF อีกด้วย คุณสามารถรวมไฟล์ PDF แยกเป็นเอกสารเดียวได้อย่างง่ายดายเมื่อต้องการ

GroupDocs.Merger Cloud SDK สำหรับ Python รักษารูปแบบดั้งเดิมของไฟล์ PDF ในระหว่างกระบวนการแยกหรือไม่

ใช่ SDK จะรักษารูปแบบและเลย์เอาต์ดั้งเดิมของไฟล์ PDF ในขณะที่แยกออกเป็นหลายๆ ไฟล์

ดูสิ่งนี้ด้วย

สำหรับข้อมูลเพิ่มเติมเกี่ยวกับหัวข้อที่เกี่ยวข้อง เราขอแนะนำให้ดูบทความต่อไปนี้: