Xóa chú thích khỏi PDF bằng API REST trong Python.

Chú thích cung cấp thông tin bổ sung trong tài liệu dưới dạng nhận xét, cửa sổ bật lên và nhiều đối tượng đồ họa khác. Trong một số trường hợp, chúng tôi có thể cần xóa chú thích khỏi tài liệu PDF được chú thích. Trong bài viết này, chúng ta sẽ tìm hiểu cách xóa hoặc trích xuất chú thích khỏi tài liệu PDF bằng API REST trong Python.

Các chủ đề sau đây sẽ được đề cập trong bài viết này:

API REST và SDK Python để xóa chú thích

Để trích xuất hoặc xóa chú thích khỏi tài liệu PDF, chúng tôi sẽ sử dụng Python SDK của GroupDocs.Annotation Cloud API. Nó cho phép thêm chú thích, lớp phủ hình mờ, thay thế và đánh dấu văn bản cũng như ghi chú dán vào các định dạng tài liệu được hỗ trợ. Vui lòng cài đặt nó bằng lệnh sau trong bảng điều khiển:

pip install groupdocs_annotation_cloud

Vui lòng lấy Client ID và Secret của bạn từ bảng điều khiển trước khi làm theo các bước được đề cập. Khi bạn có ID và bí mật của mình, hãy thêm mã như hình bên dưới:

# Ví dụ mã này trình bày cách thêm ClientID và Secret
client_id = "659fe7da-715b-4744-a0f7-cf469a392b73"
client_secret = "b377c36cfa28fa69960ebac6b6e36421"

configuration = groupdocs_annotation_cloud.Configuration(client_id, client_secret)
configuration.api_base_url = "https://api.groupdocs.cloud"
my_storage = ""

Xóa chú thích khỏi tệp PDF bằng API REST trong Python

Chúng tôi có thể xóa tất cả các chú thích khỏi tệp PDF bằng cách thực hiện theo các bước đơn giản được đề cập bên dưới:

Tải lên tài liệu

Đầu tiên, chúng tôi sẽ tải tệp PDF lên đám mây bằng mẫu mã được cung cấp bên dưới:

# Ví dụ mã này trình bày cách tải tệp PDF lên đám mây.
# Tạo phiên bản của API
file_api = groupdocs_annotation_cloud.FileApi.from_config(configuration)

# Tải lên các tệp mẫu
request = groupdocs_annotation_cloud.UploadFileRequest("sample.pdf", "C:\\Files\\sample.pdf", my_storage)
response = file_api.upload_file(request)

Do đó, tệp đã tải lên sẽ có sẵn trong phần tệp của trang tổng quan trên đám mây.

Xóa chú thích khỏi PDF bằng Python

Bây giờ, chúng tôi sẽ xóa các chú thích khỏi tài liệu PDF theo chương trình bằng cách thực hiện theo các bước dưới đây:

  • Đầu tiên, tạo một phiên bản của AnnotateApi.
  • Tiếp theo, tạo một phiên bản của FileInfo.
  • Sau đó, đặt đường dẫn tệp PDF đầu vào.
  • Tiếp theo, tạo một phiên bản của RemoveOptions.
  • Sau đó, gán FileInfo cho RemoveOptions.
  • Tiếp theo, cung cấp ID chú thích trong một mảng được phân tách bằng dấu phẩy để xóa.
  • Sau đó, đặt đường dẫn tệp đầu ra.
  • Sau đó, tạo một yêu cầu bằng cách gọi phương thức RemoveAnnotationsRequest với đối tượng RemoveOptions.
  • Cuối cùng, nhận kết quả bằng cách gọi phương thức AnnotateApi.remove\annotations() với đối số RemoveAnnotationsRequest.

Mẫu mã sau đây cho biết cách xóa chú thích khỏi tài liệu PDF bằng API REST trong Python. Chúng tôi chỉ cần đề cập đến ID chú thích sẽ bị xóa khỏi tài liệu. Chúng ta có thể lấy ID chú thích bằng cách sử dụng phương thức extract() với ExtractRequest như được mô tả tại đây.

# Ví dụ mã này trình bày cách xóa chú thích khỏi PDF.
# ví dụ api
api = groupdocs_annotation_cloud.AnnotateApi(configuration)

# Chi tiết tập tin đầu vào
file_info = groupdocs_annotation_cloud.FileInfo()
file_info.file_path = "sample.pdf"

# Xóa tùy chọn
options = groupdocs_annotation_cloud.RemoveOptions()
options.file_info = file_info
options.annotation_ids = [0,1,2]

# tập tin đầu ra
options.output_path = "annotations_removed.pdf"

# Loại bỏ yêu cầu
request = groupdocs_annotation_cloud.RemoveAnnotationsRequest(options)
result = api.remove_annotations(request)

print("RemoveAnnotations: Annotations removed: " + result['href'])
Xóa chú thích khỏi PDF bằng Python.

Xóa chú thích khỏi PDF bằng Python.

Tải xuống tệp đầu ra

Mẫu mã trên sẽ lưu tệp đầu ra sau khi xóa chú thích khỏi tệp PDF trên đám mây. Nó có thể được tải xuống bằng cách sử dụng mẫu mã sau:

# Ví dụ mã này trình bày cách tải xuống tệp PDF từ đám mây.
# khởi tạo API
file_api = groupdocs_annotation_cloud.FileApi.from_config(configuration)

# Tạo yêu cầu tệp tải xuống
request = groupdocs_annotation_cloud.DownloadFileRequest("annotations_removed.pdf", my_storage)

# Tải tập tin
response = file_api.download_file(request)

# Di chuyển tệp đã tải xuống vào thư mục làm việc của bạn
shutil.move(response, "C:\\Files\\")

Trích xuất chú thích từ tài liệu PDF bằng Python

Chúng tôi có thể trích xuất các chú thích từ các tài liệu PDF theo chương trình bằng cách làm theo các bước dưới đây:

  • Đầu tiên, tạo một phiên bản của AnnotateApi.
  • Tiếp theo, tạo một phiên bản của FileInfo.
  • Sau đó, đặt đường dẫn tệp đầu vào.
  • Sau đó, tạo một yêu cầu bằng cách gọi phương thức ExtractRequest với đối tượng FileInfo.
  • Cuối cùng, nhận kết quả bằng cách gọi phương thức AnnotateApi.extract() với đối số là ExtractRequest.

Mẫu mã sau đây cho biết cách trích xuất chú thích từ tài liệu PDF bằng API REST trong Python.

# Ví dụ mã này trình bày cách trích xuất chú thích từ tệp PDF.
# ví dụ api
api = groupdocs_annotation_cloud.AnnotateApi.from_config(configuration)

# Chi tiết tập tin đầu vào
file_info = groupdocs_annotation_cloud.FileInfo()
file_info.file_path = "sample.pdf"

# Trích xuất yêu cầu chú thích
request = groupdocs_annotation_cloud.ExtractRequest(file_info)
result = api.extract(request)        

print("ExtractAnnotations: annotations count: " + str(len(result)))

# Hiển thị kết quả
for x in range(len(result)):
  print(result[x]);

Mẫu mã trên sẽ trả về một mảng gồm tất cả các chú thích ở định dạng JSON, như được hiển thị bên dưới:

Trích xuất chú thích từ tài liệu PDF bằng Python.

Trích xuất chú thích từ tài liệu PDF bằng Python.

Thử trực tuyến

Vui lòng thử công cụ chú thích PDF trực tuyến miễn phí sau đây, được phát triển bằng cách sử dụng API ở trên. https://products.groupdocs.app/annotation/pdf

Phần kết luận

Trong bài viết này, chúng ta đã học cách xóa chú thích khỏi tài liệu PDF trên đám mây. Chúng ta cũng đã biết cách trích xuất chú thích từ tài liệu PDF bằng Python. Bài viết này cũng giải thích cách lập trình tải tệp PDF lên đám mây và tải xuống tệp từ đám mây. Ngoài ra, bạn có thể tìm hiểu thêm về GroupDocs.Annotation Cloud API bằng cách sử dụng tài liệu. Chúng tôi cũng cung cấp phần Tham khảo API cho phép bạn hình dung và tương tác trực tiếp với các API của chúng tôi thông qua trình duyệt. Trong trường hợp có bất kỳ sự mơ hồ nào, vui lòng liên hệ với chúng tôi trên diễn đàn.

Xem thêm