Python에서 REST API를 사용하여 PDF에서 주석을 제거합니다.

주석은 주석, 팝업 및 기타 다양한 그래픽 개체의 형태로 문서에 추가 정보를 제공합니다. 경우에 따라 주석이 달린 PDF 문서에서 주석을 제거해야 할 수도 있습니다. 이 기사에서는 Python에서 REST API를 사용하여 PDF 문서에서 주석을 제거하거나 추출하는 방법을 배웁니다.

이 문서에서는 다음 항목을 다룹니다.

주석을 제거하기 위한 REST API 및 Python SDK

PDF 문서에서 주석을 추출하거나 제거하기 위해 GroupDocs.Annotation Cloud의 Python SDK API를 사용합니다. 지원되는 문서 형식에 주석, 워터마크 오버레이, 텍스트 교체 및 마크업, 스티커 메모를 추가할 수 있습니다. 콘솔에서 다음 명령을 사용하여 설치하십시오.

pip install groupdocs_annotation_cloud

언급된 단계를 따르기 전에 대시보드에서 클라이언트 ID와 암호를 가져오십시오. ID와 시크릿이 있으면 아래와 같이 코드를 추가합니다.

# 이 코드 예제는 ClientID 및 Secret을 추가하는 방법을 보여줍니다.
client_id = "659fe7da-715b-4744-a0f7-cf469a392b73"
client_secret = "b377c36cfa28fa69960ebac6b6e36421"

configuration = groupdocs_annotation_cloud.Configuration(client_id, client_secret)
configuration.api_base_url = "https://api.groupdocs.cloud"
my_storage = ""

Python에서 REST API를 사용하여 PDF 파일에서 주석 제거

아래에 언급된 간단한 단계에 따라 PDF 파일에서 모든 주석을 삭제할 수 있습니다.

문서 업로드

먼저 아래 제공된 코드 샘플을 사용하여 PDF 파일을 클라우드에 업로드합니다.

# 이 코드 예제는 PDF 파일을 클라우드에 업로드하는 방법을 보여줍니다.
# API 인스턴스 생성
file_api = groupdocs_annotation_cloud.FileApi.from_config(configuration)

# 샘플 파일 업로드
request = groupdocs_annotation_cloud.UploadFileRequest("sample.pdf", "C:\\Files\\sample.pdf", my_storage)
response = file_api.upload_file(request)

결과적으로 업로드된 파일은 클라우드 대시보드의 파일 섹션에서 사용할 수 있습니다.

Python의 PDF에서 주석 제거

이제 아래 단계에 따라 프로그래밍 방식으로 PDF 문서에서 주석을 제거합니다.

  • 먼저 AnnotateApi 인스턴스를 만듭니다.
  • 다음으로 FileInfo의 인스턴스를 만듭니다.
  • 그런 다음 입력 PDF 파일 경로를 설정합니다.
  • 그런 다음 RemoveOptions의 인스턴스를 만듭니다.
  • 그런 다음 FileInfo를 RemoveOptions에 할당합니다.
  • 그런 다음 제거할 주석 ID를 쉼표로 구분된 배열로 제공합니다.
  • 그런 다음 출력 파일 경로를 설정합니다.
  • 그런 다음 RemoveOptions 개체와 함께 RemoveAnnotationsRequest 메서드를 호출하여 요청을 만듭니다.
  • 마지막으로 RemoveAnnotationsRequest를 인수로 사용하여 AnnotateApi.remove\annotations() 메서드를 호출하여 결과를 얻습니다.

다음 코드 샘플은 Python에서 REST API를 사용하여 PDF 문서에서 주석을 제거하는 방법을 보여줍니다. 문서에서 제거할 주석 ID만 언급하면 됩니다. 여기에 설명된 대로 ExtractRequest와 함께 extract() 메서드를 사용하여 주석 ID를 얻을 수 있습니다.

# 이 코드 예제는 PDF에서 주석을 제거하는 방법을 보여줍니다.
# API 인스턴스
api = groupdocs_annotation_cloud.AnnotateApi(configuration)

# 입력 파일 세부 정보
file_info = groupdocs_annotation_cloud.FileInfo()
file_info.file_path = "sample.pdf"

# 옵션 제거
options = groupdocs_annotation_cloud.RemoveOptions()
options.file_info = file_info
options.annotation_ids = [0,1,2]

# 결과물 파일
options.output_path = "annotations_removed.pdf"

# 요청 삭제
request = groupdocs_annotation_cloud.RemoveAnnotationsRequest(options)
result = api.remove_annotations(request)

print("RemoveAnnotations: Annotations removed: " + result['href'])
Python의 PDF에서 주석을 제거합니다.

Python의 PDF에서 주석을 제거합니다.

출력 파일 다운로드

위의 코드 샘플은 클라우드의 PDF 파일에서 주석을 제거한 후 출력 파일을 저장합니다. 다음 코드 샘플을 사용하여 다운로드할 수 있습니다.

# 이 코드 예제는 클라우드에서 PDF 파일을 다운로드하는 방법을 보여줍니다.
# API 초기화
file_api = groupdocs_annotation_cloud.FileApi.from_config(configuration)

# 다운로드 파일 요청 생성
request = groupdocs_annotation_cloud.DownloadFileRequest("annotations_removed.pdf", my_storage)

# 파일 다운로드
response = file_api.download_file(request)

# 다운로드한 파일을 작업 디렉토리로 이동
shutil.move(response, "C:\\Files\\")

Python의 PDF 문서에서 주석 추출

아래 단계에 따라 프로그래밍 방식으로 PDF 문서에서 주석을 추출할 수 있습니다.

  • 먼저 AnnotateApi 인스턴스를 만듭니다.
  • 다음으로 FileInfo의 인스턴스를 만듭니다.
  • 그런 다음 입력 파일 경로를 설정합니다.
  • 그런 다음 FileInfo 개체와 함께 ExtractRequest 메서드를 호출하여 요청을 만듭니다.
  • 마지막으로 ExtractRequest를 인수로 사용하여 AnnotateApi.extract() 메서드를 호출하여 결과를 얻습니다.

다음 코드 샘플은 Python에서 REST API를 사용하여 PDF 문서에서 주석을 추출하는 방법을 보여줍니다.

# 이 코드 예제는 PDF 파일에서 주석을 추출하는 방법을 보여줍니다.
# API 인스턴스
api = groupdocs_annotation_cloud.AnnotateApi.from_config(configuration)

# 입력 파일 세부 정보
file_info = groupdocs_annotation_cloud.FileInfo()
file_info.file_path = "sample.pdf"

# 주석 요청 추출
request = groupdocs_annotation_cloud.ExtractRequest(file_info)
result = api.extract(request)        

print("ExtractAnnotations: annotations count: " + str(len(result)))

# 결과 표시
for x in range(len(result)):
  print(result[x]);

위의 코드 샘플은 아래와 같이 JSON 형식의 모든 주석 배열을 반환합니다.

Python의 PDF 문서에서 주석을 추출합니다.

Python의 PDF 문서에서 주석을 추출합니다.

온라인 시도

위의 API를 사용하여 개발된 다음 무료 온라인 PDF 주석 도구를 사용해 보십시오. https://products.groupdocs.app/annotation/pdf

결론

이 기사에서는 클라우드의 PDF 문서에서 주석을 제거하는 방법을 배웠습니다. 또한 Python을 사용하여 PDF 문서에서 주석을 추출하는 방법도 살펴보았습니다. 이 문서에서는 프로그래밍 방식으로 PDF 파일을 클라우드에 업로드하고 클라우드에서 파일을 다운로드하는 방법도 설명했습니다. 또한 문서를 사용하여 GroupDocs.Annotation Cloud API에 대해 자세히 알아볼 수 있습니다. 또한 브라우저를 통해 직접 API를 시각화하고 상호 작용할 수 있는 API 참조 섹션을 제공합니다. 모호한 점이 있으면 언제든지 포럼에 문의해 주십시오.

또한보십시오