ลบคำอธิบายประกอบจาก PDF โดยใช้ REST API ใน Python

คำอธิบายประกอบจะให้ข้อมูลเพิ่มเติมในเอกสารในรูปแบบของความคิดเห็น ป๊อปอัป และวัตถุกราฟิกอื่นๆ มากมาย ในบางกรณี เราอาจต้องลบคำอธิบายประกอบออกจากเอกสาร PDF ที่มีคำอธิบายประกอบ ในบทความนี้ เราจะเรียนรู้วิธีลบหรือแยกคำอธิบายประกอบจากเอกสาร PDF โดยใช้ REST API ใน Python

หัวข้อต่อไปนี้จะครอบคลุมในบทความนี้:

REST API และ Python SDK เพื่อลบคำอธิบายประกอบ

สำหรับการแตกหรือลบคำอธิบายประกอบจากเอกสาร PDF เราจะใช้ Python SDK of GroupDocs.Annotation Cloud API อนุญาตให้เพิ่มคำอธิบายประกอบ การซ้อนทับลายน้ำ การแทนที่ข้อความ & มาร์กอัป และบันทึกย่อช่วยเตือนไปยัง รูปแบบเอกสารที่รองรับ โปรดติดตั้งโดยใช้คำสั่งต่อไปนี้ในคอนโซล:

pip install groupdocs_annotation_cloud

โปรด รับรหัสลูกค้าและข้อมูลลับจากแดชบอร์ด ก่อนทำตามขั้นตอนดังกล่าว เมื่อคุณมี ID และรหัสลับของคุณแล้ว ให้เพิ่มรหัสตามที่แสดงด้านล่าง:

# ตัวอย่างโค้ดนี้สาธิตวิธีการเพิ่ม ClientID และ Secret
client_id = "659fe7da-715b-4744-a0f7-cf469a392b73"
client_secret = "b377c36cfa28fa69960ebac6b6e36421"

configuration = groupdocs_annotation_cloud.Configuration(client_id, client_secret)
configuration.api_base_url = "https://api.groupdocs.cloud"
my_storage = ""

ลบคำอธิบายประกอบจากไฟล์ PDF โดยใช้ REST API ใน Python

เราสามารถลบคำอธิบายประกอบทั้งหมดออกจากไฟล์ PDF ได้โดยทำตามขั้นตอนง่าย ๆ ที่กล่าวถึงด้านล่าง:

อัปโหลดเอกสาร

ประการแรก เราจะอัปโหลดไฟล์ PDF ไปยังคลาวด์โดยใช้ตัวอย่างโค้ดที่ระบุด้านล่าง:

# ตัวอย่างโค้ดนี้สาธิตวิธีอัปโหลดไฟล์ PDF ไปยังระบบคลาวด์
# สร้างอินสแตนซ์ของ API
file_api = groupdocs_annotation_cloud.FileApi.from_config(configuration)

# อัปโหลดไฟล์ตัวอย่าง
request = groupdocs_annotation_cloud.UploadFileRequest("sample.pdf", "C:\\Files\\sample.pdf", my_storage)
response = file_api.upload_file(request)

ด้วยเหตุนี้ ไฟล์ที่อัปโหลดจะอยู่ใน ส่วนไฟล์ ของแดชบอร์ดบนระบบคลาวด์

ลบคำอธิบายประกอบจาก PDF ใน Python

ตอนนี้ เราจะลบคำอธิบายประกอบออกจากเอกสาร PDF โดยทางโปรแกรมโดยทำตามขั้นตอนด้านล่าง:

  • ขั้นแรก สร้างอินสแตนซ์ของ AnnotateApi
  • จากนั้น สร้างอินสแตนซ์ของ FileInfo
  • จากนั้นตั้งค่าเส้นทางไฟล์ PDF อินพุต
  • จากนั้น สร้างอินสแตนซ์ของ RemoveOptions
  • จากนั้นกำหนด FileInfo ให้กับ RemoveOptions
  • ถัดไป ระบุรหัสคำอธิบายประกอบในอาร์เรย์ที่คั่นด้วยเครื่องหมายจุลภาคเพื่อลบ
  • จากนั้น ตั้งค่าพาธของไฟล์เอาต์พุต
  • หลังจากนั้น ให้สร้างคำขอโดยเรียกเมธอด RemoveAnnotationsRequest ด้วยอ็อบเจ็กต์ RemoveOptions
  • สุดท้าย รับผลลัพธ์โดยเรียกเมธอด AnnotateApi.remove\annotations() โดยมี RemoveAnnotationsRequest เป็นอาร์กิวเมนต์

ตัวอย่างโค้ดต่อไปนี้แสดงวิธีลบคำอธิบายประกอบออกจากเอกสาร PDF โดยใช้ REST API ใน Python เราเพียงแค่ต้องระบุ ID คำอธิบายประกอบที่จะลบออกจากเอกสาร เราสามารถรับรหัสคำอธิบายประกอบโดยใช้วิธีการแยก () กับ ExtractRequest ตามที่อธิบายไว้ ที่นี่

# ตัวอย่างโค้ดนี้สาธิตวิธีลบคำอธิบายประกอบออกจาก PDF
# ตัวอย่าง API
api = groupdocs_annotation_cloud.AnnotateApi(configuration)

# รายละเอียดไฟล์อินพุต
file_info = groupdocs_annotation_cloud.FileInfo()
file_info.file_path = "sample.pdf"

# ลบตัวเลือก
options = groupdocs_annotation_cloud.RemoveOptions()
options.file_info = file_info
options.annotation_ids = [0,1,2]

# ไฟล์เอาต์พุต
options.output_path = "annotations_removed.pdf"

# ลบคำขอ
request = groupdocs_annotation_cloud.RemoveAnnotationsRequest(options)
result = api.remove_annotations(request)

print("RemoveAnnotations: Annotations removed: " + result['href'])
ลบคำอธิบายประกอบจาก PDF ใน Python

ลบคำอธิบายประกอบจาก PDF ใน Python

ดาวน์โหลดไฟล์เอาต์พุต

ตัวอย่างโค้ดด้านบนจะบันทึกไฟล์เอาต์พุตหลังจากลบคำอธิบายประกอบออกจากไฟล์ PDF บนคลาวด์ สามารถดาวน์โหลดได้โดยใช้ตัวอย่างโค้ดต่อไปนี้:

# ตัวอย่างโค้ดนี้สาธิตวิธีดาวน์โหลดไฟล์ PDF จากระบบคลาวด์
# การเริ่มต้น API
file_api = groupdocs_annotation_cloud.FileApi.from_config(configuration)

# สร้างคำขอดาวน์โหลดไฟล์
request = groupdocs_annotation_cloud.DownloadFileRequest("annotations_removed.pdf", my_storage)

# ดาวน์โหลดไฟล์
response = file_api.download_file(request)

# ย้ายไฟล์ที่ดาวน์โหลดไปยังไดเร็กทอรีการทำงานของคุณ
shutil.move(response, "C:\\Files\\")

แยกคำอธิบายประกอบจากเอกสาร PDF ใน Python

เราสามารถแยกคำอธิบายประกอบจากเอกสาร PDF โดยทางโปรแกรมโดยทำตามขั้นตอนด้านล่าง:

  • ขั้นแรก สร้างอินสแตนซ์ของ AnnotateApi
  • จากนั้น สร้างอินสแตนซ์ของ FileInfo
  • จากนั้นตั้งค่าเส้นทางไฟล์อินพุต
  • หลังจากนั้น สร้างคำขอโดยเรียกใช้เมธอด ExtractRequest ด้วยวัตถุ FileInfo
  • สุดท้าย รับผลลัพธ์โดยเรียกเมธอด AnnotateApi.extract() โดยมี ExtractRequest เป็นอาร์กิวเมนต์

ตัวอย่างโค้ดต่อไปนี้แสดงวิธีแยกคำอธิบายประกอบจากเอกสาร PDF โดยใช้ REST API ใน Python

# ตัวอย่างโค้ดนี้สาธิตวิธีแยกคำอธิบายประกอบจากไฟล์ PDF
# ตัวอย่าง API
api = groupdocs_annotation_cloud.AnnotateApi.from_config(configuration)

# รายละเอียดไฟล์อินพุต
file_info = groupdocs_annotation_cloud.FileInfo()
file_info.file_path = "sample.pdf"

# แยกคำขอคำอธิบายประกอบ
request = groupdocs_annotation_cloud.ExtractRequest(file_info)
result = api.extract(request)        

print("ExtractAnnotations: annotations count: " + str(len(result)))

# แสดงผล
for x in range(len(result)):
  print(result[x]);

ตัวอย่างโค้ดด้านบนจะส่งกลับอาร์เรย์ของคำอธิบายประกอบทั้งหมดในรูปแบบ JSON ดังที่แสดงด้านล่าง:

แยกคำอธิบายประกอบจากเอกสาร PDF ใน Python

แยกคำอธิบายประกอบจากเอกสาร PDF ใน Python

ลองออนไลน์

โปรดลองใช้เครื่องมือคำอธิบายประกอบ PDF ออนไลน์ฟรีต่อไปนี้ ซึ่งพัฒนาโดยใช้ API ข้างต้น https://products.groupdocs.app/annotation/pdf

บทสรุป

ในบทความนี้ เราได้เรียนรู้วิธีลบคำอธิบายประกอบออกจากเอกสาร PDF บนคลาวด์ เราได้เห็นวิธีแยกคำอธิบายประกอบจากเอกสาร PDF โดยใช้ Python บทความนี้ยังอธิบายวิธีอัปโหลดไฟล์ PDF ไปยังระบบคลาวด์โดยทางโปรแกรมและดาวน์โหลดไฟล์จากระบบคลาวด์ นอกจากนี้ คุณสามารถเรียนรู้เพิ่มเติมเกี่ยวกับ GroupDocs.Annotation Cloud API โดยใช้ เอกสารประกอบ เรายังมีส่วน API Reference ที่ช่วยให้คุณแสดงภาพและโต้ตอบกับ API ของเราได้โดยตรงผ่านเบราว์เซอร์ ในกรณีที่มีความคลุมเครือ โปรดติดต่อเราได้ที่ ฟอรัม

ดูสิ่งนี้ด้วย