วิธีแยกหน้าออกจากไฟล์ PDF ออนไลน์ใน Python

แยกหน้าออกจากไฟล์ PDF ออนไลน์ใน Python

ในบางกรณี คุณอาจต้องแยกหน้า PDF ออกจากเอกสาร PDF หรืออาจต้องแยกเอกสาร PDF ขนาดใหญ่ออกเป็นไฟล์ PDF ขนาดเล็ก ในฐานะนักพัฒนา Python คุณสามารถแยกหน้าที่ต้องการจากไฟล์ PDF ทางออนไลน์หรือแยกหน้า PDF ตามช่วงหน้าโดยทางโปรแกรม ในบทความนี้ คุณจะได้เรียนรู้วิธีแยกหน้าจากไฟล์ PDF ออนไลน์ใน Python โดยใช้ REST API

หัวข้อต่อไปนี้จะกล่าวถึงในบทความนี้:

ตัวแยกเอกสาร REST API และ Python SDK

ในการแยกหน้า PDF จากไฟล์ PDF ทางออนไลน์ ฉันจะใช้ Python SDK ของ GroupDocs.Merger Cloud API เป็น Cloud SDK ที่มีคุณลักษณะหลากหลายและมีประสิทธิภาพสูง Python API นี้ช่วยให้คุณสามารถแยกหน้า PDF จากเอกสารเดียวออกเป็นหลายไฟล์ SDK มีฟังก์ชันในการจัดเรียงใหม่ ลบ แลกเปลี่ยน หมุน หรือเปลี่ยนการวางแนวหน้าสำหรับหน้าทั้งหมดหรือช่วงที่ต้องการ นอกจากนี้ยังรองรับการปรับแต่งอื่นๆ สำหรับรูปแบบไฟล์ที่รองรับ เช่น PDF, Word, PowerPoint, Excel worksheets เป็นต้น ขณะนี้รองรับ .NET, Java, PHP, Ruby, Android และ Node.js SDK เป็นเอกสาร การควบรวมกิจการ สมาชิกในครอบครัวสำหรับ Cloud API

คุณสามารถติดตั้ง GroupDocs.Merger-Cloud ในโครงการ Python โดยใช้คำสั่งต่อไปนี้ในคอนโซล:

pip install groupdocs_merger_cloud

โปรดรับรหัสไคลเอ็นต์และรหัสลับไคลเอ็นต์ของคุณจาก แดชบอร์ด ก่อนที่คุณจะเริ่มทำตามขั้นตอนและตัวอย่างโค้ดที่มีอยู่ เมื่อคุณมี ID และรหัสลับของคุณแล้ว ให้เพิ่มรหัสตามที่แสดงด้านล่าง:

# นำเข้า SDK การควบรวม groupdocs
import groupdocs_merger_cloud

# รับ app_sid & app_key จาก https://dashboard.groupdocs.cloud หลังจากลงทะเบียนฟรี
app_sid = "xxxxxxx-xxxx-xxxx-xxxx-xxxxxxxxxxxx"
app_key = "xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx"

# รับการกำหนดค่า File API 
configuration = groupdocs_merger_cloud.Configuration(app_sid, app_key)
configuration.api_base_url = "https://api.groupdocs.cloud"
storage_name = "LocalStorage"

วิธีแยกหน้าเฉพาะจาก PDF ใน Python โดยใช้ REST API

API ตัวแยก PDF ของเราช่วยให้คุณดูตัวอย่างหน้าที่คุณต้องการแยกได้ คุณสามารถเลือกหน้าได้โดยระบุจำนวนหน้าที่คุณต้องการแยก แบ่งไฟล์ PDF ของคุณออกเป็นแต่ละหน้าทันที หรือแยกหน้าที่ต้องการจากเอกสาร PDF ใหม่ แยกหน้า PDF จากไฟล์ PDF ออนไลน์โดยทำตามขั้นตอนง่าย ๆ ที่ระบุไว้ด้านล่าง:

  1. อัปโหลด ไฟล์ PDF ไปยังคลาวด์
  2. แยก PDF Pages by Page Numbers in Python.
  3. ดาวน์โหลด ไฟล์ที่แยกออกมา

อัปโหลดเอกสาร

ก่อนอื่น อัปโหลดเอกสาร PDF หลายหน้าไปยังคลาวด์โดยใช้ข้อมูลโค้ดที่ระบุด้านล่าง:

# อัปโหลดไฟล์ PDF ไปยังที่เก็บข้อมูลบนคลาวด์
# สร้างอินสแตนซ์ของไฟล์ API
file_api = groupdocs_merger_cloud.FileApi.from_config(configuration)

# โทรขออัพโหลดไฟล์
request = groupdocs_merger_cloud.UploadFileRequest("python-testing\sample-file.pdf", "H:\\groupdocs-cloud-data\\sample-file.pdf", storage_name)

# อัปโหลดไฟล์ PDF ไปยังคลาวด์
response = file_api.upload_file(request)
print(response.uploaded)

ด้วยเหตุนี้ ไฟล์ PDF จะถูกอัปโหลดไปยัง Cloud Storage และจะอยู่ใน ส่วนไฟล์ ของแดชบอร์ดของคุณ เราลบไฟล์ทั้งหมดของคุณอย่างถาวรจากระบบคลาวด์ภายใน 24 ชั่วโมงหลังการอัปโหลด

แยกหน้าเฉพาะตามหมายเลขหน้าโดยใช้ Python

หากต้องการแยกหน้าใดหน้าหนึ่งหรือหลายหน้าออกจากเอกสาร PDF โดยทางโปรแกรม ให้ทำตามขั้นตอนด้านล่าง:

  • ประการแรก สร้างอินสแตนซ์ PagesApi
  • ประการที่สอง ให้อินสแตนซ์ของ ExtractOptions
  • ตอนนี้ ตั้งค่าเส้นทางไฟล์อินพุตด้วยอินสแตนซ์ FileInfo
  • ถัดไป ตั้งค่าพาธไดเร็กทอรีเอาต์พุต
  • จากนั้นระบุหมายเลขหน้าที่คั่นด้วยเครื่องหมายจุลภาคเพื่อดึงข้อมูล
  • ถัดไป ตั้งค่าโหมดเป็น Pages
  • จากนั้น สร้างอินสแตนซ์ ExtractRequest
  • สุดท้าย รับผลลัพธ์โดยเรียกคลาส pagesApi.extract()

ตัวอย่างโค้ดต่อไปนี้แสดงวิธีแยกหน้าโดยระบุหมายเลขหน้าเฉพาะจากเอกสาร PDF โดยใช้ REST API:

# วิธีแยกหน้าเฉพาะจาก PDF ใน Python โดยใช้ REST API
try:
    # สร้างอินสแตนซ์ของ Pages API
    pagesApi = groupdocs_merger_cloud.PagesApi.from_keys(app_sid, app_key)
     
    options = groupdocs_merger_cloud.ExtractOptions()
    options.file_info = groupdocs_merger_cloud.FileInfo("python-testing/sample-file.pdf")
    options.output_path = "python-testing"
    options.pages = [2, 4, 7]        
     
    result = pagesApi.extract(groupdocs_merger_cloud.ExtractRequest(options))
    print("Successfully extracted certain pages of PDF document: " + result[0].path)
except groupdocs_merger_cloud.ApiException as e:
  print("Exception while calling API: {0}".format(e.message))

ดาวน์โหลดไฟล์หน้า PDF ที่แยกออกมา

ตัวอย่างโค้ดด้านบนจะบันทึกหน้าที่แยกออกมาในไฟล์ PDF แยกต่างหากบนคลาวด์ คุณสามารถดาวน์โหลดได้โดยใช้ตัวอย่างโค้ดต่อไปนี้:

# การเริ่มต้น API เพื่อดาวน์โหลดไฟล์ที่แปลงแล้ว
import shutil
file_api = groupdocs_merger_cloud.FileApi.from_config(configuration)

# สร้างคำขอดาวน์โหลดไฟล์
request = groupdocs_merger_cloud.DownloadFileRequest("python-testing\sample-file.pdf", storage_name)

# ดาวน์โหลดไฟล์ที่แปลงแล้ว
response = file_api.download_file(request)

# ย้ายไฟล์ที่ดาวน์โหลดไปยังไดเร็กทอรีของคุณ
shutil.move(response, "H:\\groupdocs-cloud-data\\")

แยกหน้าจาก PDF ตามช่วงหน้าใน Python โดยใช้ REST API

โปรดปฏิบัติตามขั้นตอนที่กล่าวถึงด้านล่างเพื่อแยกหน้าจากเอกสาร PDF โดยระบุช่วงของหน้าโดยทางโปรแกรม

  • ประการแรก สร้างอินสแตนซ์ PagesApi
  • ถัดไป ตั้งค่า ExtractOptions
  • กำหนดเส้นทางไฟล์อินพุตด้วยอินสแตนซ์ FileInfo
  • ถัดไป ตั้งค่าพาธไดเร็กทอรีเอาต์พุต
  • ระบุช่วงหน้าโดยตั้งค่าหมายเลขหน้าเริ่มต้นและหมายเลขหน้าสิ้นสุดเพื่อแยก
  • ตอนนี้ ตั้งค่าช่วงเวลาของโหมดเป็น Pages
  • ตั้งค่า rangemode เป็น EvenPages หรือ OddPages
  • จากนั้น สร้างอินสแตนซ์ ExtractRequest
  • สุดท้าย รับผลลัพธ์โดยเรียกเมธอด pagesApi.extract()

ตัวอย่างโค้ดต่อไปนี้แสดงวิธีแยกหน้าโดยระบุช่วงหน้าจากเอกสาร PDF โดยใช้ REST API โปรดทำตามขั้นตอนที่กล่าวถึงก่อนหน้านี้เพื่ออัปโหลดไฟล์

# วิธีแยกหน้าจาก PDF ตามช่วงหน้าใน Python โดยใช้ REST API
try:
    # สร้างอินสแตนซ์ของ Document API
    pagesApi = groupdocs_merger_cloud.PagesApi.from_keys(app_sid, app_key)
     
    options = groupdocs_merger_cloud.ExtractOptions()
    options.file_info = groupdocs_merger_cloud.FileInfo("python-testing\sample-file.pdf")
    options.output_path = "python-testing"
    options.start_page_number = 1
    options.end_page_number = 10
    options.range_mode = "EvenPages" # or set range_mode to "OddPages"
    options.mode = "Pages" # Mode Intervals
     
    result = pagesApi.extract(groupdocs_merger_cloud.ExtractRequest(options))
    print("Successfully extract selected pages from PDF by page range interval: " + result[0].path)
except groupdocs_merger_cloud.ApiException as e:
  print("Exception while calling API: {0}".format(e.message))

ตัวแยกหน้า PDF ออนไลน์ฟรี

จะแยกหน้าออกจาก pdf ฟรีได้อย่างไร โปรดลองใช้ เครื่องมือแยก PDF ออนไลน์ฟรี ซึ่งพัฒนาโดยใช้ API ด้านบน

สรุป

สิ่งนี้นำเราไปสู่บทสรุปของโพสต์บล็อก ฉันหวังว่าคุณจะได้เรียนรู้:

  • วิธีแยกหน้าเฉพาะจากเอกสาร PDF ใน Python
  • อัปโหลดไฟล์ PDF โดยทางโปรแกรมแล้วดาวน์โหลดไฟล์ที่แยกจากคลาวด์
  • วิธีแยกหน้าไฟล์ PDF โดยใช้ช่วงหน้าโดยใช้ Python

คุณสามารถเรียนรู้เพิ่มเติมเกี่ยวกับ GroupDocs.Merger Cloud API โดยใช้ เอกสารประกอบ เรายังมีส่วน API Reference ที่ช่วยให้คุณแสดงภาพและโต้ตอบกับ API ของเราได้โดยตรงผ่านเบราว์เซอร์

ใน หน้าเริ่มต้นใช้งาน คุณอาจค้นพบรายละเอียดเพิ่มเติม

นอกจากนี้ Groupdocs.cloud ยังได้รับการอัปเดตอย่างต่อเนื่องด้วยหัวข้อใหม่ๆ ด้วยเหตุนี้ ข้อมูล APIs ล่าสุดจึงยังคงทันสมัยอยู่เสมอ

ถามคำถาม

คุณสามารถถามคำถามเกี่ยวกับ API ของซอฟต์แวร์แยกหน้า PDF ผ่านการสนับสนุนฟรี ฟอรัม

คำถามที่พบบ่อย

จะแยกหน้าจากไฟล์ PDF ใน Python ได้อย่างไร

โปรดติดตาม ลิงก์นี้ เพื่อเรียนรู้ข้อมูลโค้ด Python เกี่ยวกับวิธีแยกหน้าจากไฟล์ PDF ใน Python

วิธีแยกหน้าจากเอกสาร PDF ออนไลน์โดยใช้ REST API

สร้างอินสแตนซ์ของ PagesApi ตั้งค่าของ ExtractOptions และเรียกใช้เมธอด pagesApi.extract() ด้วย ExtractRequest เพื่อบันทึกหน้าที่เลือกของไฟล์ PDF ทางออนไลน์

จะติดตั้งไลบรารีดาวน์โหลดตัวแยกหน้า PDF ฟรีได้อย่างไร

วิธีง่ายๆ ในการแยกหน้าออกจาก PDF คือการใช้ Python SDK คุณสามารถติดตั้งไลบรารี Python ของตัวแยก PDF เพื่อแยกหลายหน้าออกจากไฟล์ PDF โดยทางโปรแกรม

ฉันจะแยกหน้า PDF ออฟไลน์ใน windows ได้อย่างไร

โปรดไปที่ ลิงก์นี้ เพื่อดาวน์โหลดซอฟต์แวร์แยกไฟล์ PDF สำหรับ windows ซอฟต์แวร์ดาวน์โหลด PDF extractor ฟรีนี้จะแบ่งหน้า PDF ในหน้าต่างอย่างรวดเร็วด้วยการคลิกเพียงครั้งเดียว

ดูสิ่งนี้ด้วย