Python 개발자는 응용 프로그램에서 PDF를 Word 문서로 변환하는 기능을 제공하기 위해 사용자의 요구 사항을 가질 수 있습니다. Adobe Acrobat 없이 PDF 문서를 편집하는 것은 매우 어렵기 때문입니다. 그리고 사용자는 PDF 문서의 텍스트, 표, 이미지 및 기타 내용을 편집해야 한다는 요구 사항이 있습니다. 요구 사항에 대한 솔루션은 PDF 문서를 편집 가능한 Word 문서로 변환하는 것입니다. 그러나 프로그래밍 방식으로 그렇게 간단하지 않다는 것을 알고 있습니다. 운 좋게도 모듈이 있습니다. Python용 GroupDocs.Conversion Cloud SDK 몇 줄의 Python 코드로 PDF를 편집 가능한 Word 문서로 쉽게 변환할 수 있습니다.

PDF에서 Word로 - 변환 API 및 Python SDK

클라우드용 GroupDocs.Conversion

GroupDocs.Conversion Cloud는 도구나 소프트웨어에 의존하지 않는 플랫폼 독립적인 문서 및 이미지 변환 솔루션입니다. 모든 지원되는 파일 형식의 이미지와 문서를 빠르고 안정적으로 변환할 수 있습니다. 소스 코드 및 작업 예제와 함께 널리 사용되는 모든 프로그래밍 언어에 대한 SDK를 제공합니다. 이를 통해 개발자는 기본 REST API 호출에 대해 걱정할 필요 없이 애플리케이션에서 직접 GroupDocs.Conversion Cloud를 사용할 수 있습니다. 이 기사에서는 PDF를 Word로 변환하기 위해 Python SDK를 사용하고 있습니다.

Python에서 PDF를 편집 가능한 DOCX로 변환하는 방법

저는 Python 3.7.4를 사용할 것입니다. Python 2.7, 3.4 이상을 원하는 버전을 사용할 수 있습니다. 코딩을 시작하기 전에 groupdocs.cloud로 가입하여 APP SID 및 APP 키를 받으세요.

다음 명령을 사용하여 pypi에서 groupdocs-conversion-cloud 패키지를 설치합니다.

\> pip install groupdocs-conversion-cloud

스크립트 파일을 저장하는 폴더에 원본 PDF 문서를 저장합니다.

변환을 위한 샘플 Python 코드

선호하는 편집기를 사용하고 다음 단계에 따라 PDF를 Python에서 편집 가능한 Word 문서로 변환하십시오.

  • GroupDocs.Conversion Cloud Python 패키지 가져오기
# 가져오기 모듈
import groupdocs_conversion_cloud
  • API 초기화
# https://dashboard.groupdocs.cloud에서 app_sid 및 app_key를 가져옵니다(무료 등록 필요).
app_sid = "xxxxx-xxxx-xxxx-xxxx-xxxxxxxxx"
app_key = "xxxxxxxxxxxxxxxxxxxxxxxxxxxxxx"

# API 인스턴스 생성
convert_api = groupdocs_conversion_cloud.ConvertApi.from_keys(app_sid, app_key)
file_api = groupdocs_conversion_cloud.FileApi.from_keys(app_sid, app_key)
  • 소스 PDF 문서를 GroupDocs 기본 저장소에 업로드
try:

        #upload soruce file to storage
        filename = '02_pages.pdf'
        remote_name = '02_pages.pdf'
        output_name= 'sample.docx'
        strformat='docx'

        request_upload = groupdocs_conversion_cloud.UploadFileRequest(remote_name,filename)
        response_upload = file_api.upload_file(request_upload)
  • PDF 문서를 편집 가능한 DOCX로 변환
        #Convert PDF to Word document
        settings = groupdocs_conversion_cloud.ConvertSettings()
        settings.file_path =remote_name
        settings.format = strformat
        settings.output_path = output_name
        
        loadOptions = groupdocs_conversion_cloud.PdfLoadOptions()
        loadOptions.hide_pdf_annotations = True
        loadOptions.remove_embedded_files = False
        loadOptions.flatten_all_fields = True

        settings.load_options = loadOptions

        convertOptions = groupdocs_conversion_cloud.DocxConvertOptions()
        convertOptions.from_page = 1
        convertOptions.pages_count = 1
            
        settings.convert_options = convertOptions
                
        request = groupdocs_conversion_cloud.ConvertDocumentRequest(settings)
        response = convert_api.convert_document(request)

        print("Document converted successfully: " + str(response))
except groupdocs_conversion_cloud.ApiException as e:
        print("Exception when calling get_supported_conversion_types: {0}".format(e.message))
  • 그리고 그게 다야. PDF 문서는 DOCX로 변환되며 API 응답에는 결과 문서의 URL이 포함됩니다.
Document converted successfully: [{'name': 'sample.docx',
 'path': 'sample.docx',
 'size': 4078202,
 'url': 'https://api.groupdocs.cloud/v2.0/conversion/storage/file/sample.docx'}]

질문이나 제안이 있으십니까? 언제든지 아래에 의견을 남기거나 지원 포럼에 질문을 게시하세요. API를 지속적으로 개선하고 개선하는 데 도움이 됩니다.

GroupDocs.Conversion Cloud에 대해 자세히 알아보려면 다음과 같은 GroupDocs.Conversion Cloud의 유용한 리소스를 살펴보십시오.