Python trích xuất hoặc xóa chú thích khỏi tệp Word.

Là nhà phát triển Python, bạn có thể chú thích bất kỳ tệp Word (.doc hoặc .docx) nào theo chương trình trên đám mây. Bạn cũng có thể trích xuất hoặc xóa tất cả chú thích khỏi tệp Word bằng Python. Các chú thích bao gồm nhận xét, cửa sổ bật lên và nhiều đối tượng đồ họa khác trong tài liệu cung cấp thông tin bổ sung. Bài viết này sẽ tập trung vào cách trích xuất hoặc xóa chú thích khỏi tệp DOCX bằng API REST trong Python.

Các chủ đề sau đây sẽ được đề cập trong bài viết này:

Chú thích tài liệu API REST và Python SDK

Để trích xuất hoặc xóa chú thích khỏi tệp DOC hoặc DOCX, tôi sẽ sử dụng API Python SDK của GroupDocs.Annotation Cloud. Nó cho phép bạn xây dựng các công cụ chú thích hình ảnh và tài liệu trực tuyến theo chương trình. Những công cụ như vậy có thể được sử dụng để thêm chú thích, lớp phủ hình mờ, thay thế văn bản, biên tập, ghi chú dán và đánh dấu văn bản vào các tài liệu kinh doanh ở tất cả các định dạng phổ biến. Nó cũng cung cấp các SDK .NET, Java, PHP, Ruby và Node.js dưới dạng các thành viên dòng chú thích tài liệu cho Cloud API.

Bạn có thể cài đặt GroupDocs.Annotation Cloud cho dự án Python của mình bằng lệnh sau trong bảng điều khiển:

pip install groupdocs_annotation_cloud

Vui lòng lấy ID khách hàng và Bí mật khách hàng của bạn từ bảng điều khiển trước khi bạn bắt đầu làm theo các bước và ví dụ về mã có sẵn. Khi bạn có ID và bí mật của mình, hãy thêm mã như hình bên dưới:

client_id = "da0c487d-c1c0-45ae-b7bf-43eaf53c5ad5"
client_secret = "479db2b01dcb93a3d4d20efb16dea971"

configuration = groupdocs_annotation_cloud.Configuration(client_id, client_secret)
configuration.api_base_url = "https://api.groupdocs.cloud"

Trích xuất hoặc xóa chú thích khỏi tệp DOCX bằng API REST trong Python

Bạn có thể trích xuất hoặc xóa tất cả chú thích khỏi tệp DOCX bằng cách thực hiện theo các bước đơn giản dưới đây:

Tải lên tài liệu

Đầu tiên, tải tệp DOCX lên Đám mây bằng ví dụ mã được cung cấp bên dưới:

# ví dụ api
file_api = groupdocs_annotation_cloud.FileApi.from_config(configuration)

# cập nhật dử liệu
request = groupdocs_annotation_cloud.UploadFileRequest("input.docx", "C:\\Files\\input.docx", my_storage)
response = file_api.upload_file(request)

Do đó, tệp DOCX đã tải lên (input.docx) sẽ có trong phần tệp trên trang tổng quan của bạn trên đám mây.

Trích xuất chú thích từ tệp DOCX bằng Python

Vui lòng làm theo các bước được đề cập bên dưới để trích xuất chú thích từ tài liệu Word theo chương trình.

  • Tạo một phiên bản của AnnotateApi
  • Tạo một phiên bản FileInfo
  • Đặt đường dẫn tệp
  • Tạo một yêu cầu bằng cách gọi phương thức ExtractRequest
  • Nhận kết quả bằng cách gọi phương thức AnnotateApi.extract()

Đoạn mã sau cho biết cách trích xuất chú thích từ tài liệu Word bằng API REST.

# ví dụ api
api = groupdocs_annotation_cloud.AnnotateApi.from_config(configuration)

# chi tiết tập tin đầu vào
file_info = groupdocs_annotation_cloud.FileInfo()
file_info.file_path = "input.docx"

# trích xuất yêu cầu chú thích
request = groupdocs_annotation_cloud.ExtractRequest(file_info)
result = api.extract(request)        

print("ExtractAnnotations: annotations count: " + str(len(result)))

Đoạn mã mẫu trên sẽ trả về một mảng gồm tất cả các chú thích ở định dạng JSON như hình bên dưới:

Trích xuất chú thích từ tệp DOCX bằng Python

Trích xuất chú thích từ tệp DOCX bằng Python

Xóa chú thích khỏi tệp DOCX bằng Python

Vui lòng làm theo các bước được đề cập bên dưới để xóa chú thích khỏi tài liệu Word theo chương trình.

  • Tạo một phiên bản của AnnotateApi
  • Tạo một phiên bản FileInfo
  • Đặt đường dẫn tệp
  • Xác định RemoveOptions
  • Đặt thông tin tệp thành AnnotateOptions
  • Cung cấp ID chú thích để xóa
  • Đặt đường dẫn tệp đầu ra
  • Tạo một yêu cầu bằng cách gọi phương thức RemoveAnnotationsRequest
  • Nhận kết quả bằng cách gọi phương thức AnnotateApi.remove\annotations()

Đoạn mã sau cho biết cách xóa chú thích khỏi tài liệu Word bằng API REST. Bạn cần đề cập đến các ID chú thích cần xóa khỏi tài liệu.

# ví dụ api
api = groupdocs_annotation_cloud.AnnotateApi.from_keys(client_id, client_secret)

# chi tiết tập tin đầu vào
file_info = groupdocs_annotation_cloud.FileInfo()
file_info.file_path = "input.docx"

# loại bỏ các tùy chọn
options = groupdocs_annotation_cloud.RemoveOptions()
options.file_info = file_info
options.annotation_ids = [0,1,2,3,4,5,6,7,8,9,10,11]

# tập tin đầu ra
options.output_path = "output.docx"

# Loại bỏ yêu cầu
request = groupdocs_annotation_cloud.RemoveAnnotationsRequest(options)
result = api.remove_annotations(request)

print("RemoveAnnotations: Annotations removed: " + result['href'])
Xóa chú thích khỏi tệp DOCX bằng Python

Xóa chú thích khỏi tệp DOCX bằng Python

Tải xuống tệp đầu ra

Mẫu mã trên sẽ lưu tệp DOCX đầu ra (output.docx) sau khi xóa chú thích trên đám mây. Bạn có thể tải xuống bằng mẫu mã sau:

# ví dụ api
file_api = groupdocs_annotation_cloud.FileApi.from_config(configuration)

# tải tập tin yêu cầu
request = groupdocs_annotation_cloud.DownloadFileRequest("output.docx", my_storage)
response = file_api.download_file(request)

# Di chuyển tệp đã tải xuống vào thư mục làm việc của bạn
shutil.move(response, "C:\\Files\\")

Thử trực tuyến

Vui lòng dùng thử công cụ chú thích DOCX trực tuyến miễn phí sau đây, được phát triển bằng cách sử dụng API ở trên. https://products.groupdocs.app/annotation/docx

Phần kết luận

Trong bài viết này, bạn đã học cách trích xuất hoặc xóa chú thích khỏi tài liệu Word trên đám mây bằng Python. Bạn cũng đã học cách lập trình tải lên tệp DOCX trên đám mây và tải xuống tệp từ đám mây. Bạn có thể tìm hiểu thêm về GroupDocs.Annotation Cloud API bằng cách sử dụng tài liệu. Chúng tôi cũng cung cấp phần Tham khảo API cho phép bạn hình dung và tương tác trực tiếp với các API của chúng tôi thông qua trình duyệt. Trong trường hợp có bất kỳ sự mơ hồ nào, vui lòng liên hệ với chúng tôi trên diễn đàn.

Xem thêm