Как разработчик Python, вы можете потребовать от своих пользователей предоставить в вашем приложении функцию преобразования документов PDF в Word. Потому что очень сложно редактировать документы PDF без Adobe Acrobat. И пользователям необходимо редактировать текст, таблицы, изображения и другое содержимое в документе PDF. Решением этого требования является преобразование документа PDF в редактируемый документ Word. Но, вы знаете, что это не так просто программно. К счастью, есть модуль; GroupDocs.Conversion Cloud SDK для Python, который упрощает преобразование PDF в редактируемый документ Word с помощью нескольких строк кода Python.

PDF в Word — API преобразования и Python SDK

GroupDocs.Conversion для облака

GroupDocs.Conversion Cloud — это независимое от платформы решение для преобразования документов и изображений, не зависящее от какого-либо инструмента или программного обеспечения. Он может быстро и надежно конвертировать изображения и документы любого поддерживаемого формата файла. Он предлагает SDK для всех популярных языков программирования с исходным кодом и рабочими примерами. Это позволяет разработчикам использовать GroupDocs.Conversion Cloud непосредственно в своих приложениях, не беспокоясь о базовых вызовах REST API. В этой статье я использую Python SDK для преобразования PDF в Word.

Как конвертировать PDF в редактируемый DOCX в Python

Я буду использовать Python 3.7.4, вы можете использовать любую версию Python 2.7, 3.4 или выше. Прежде чем мы начнем программировать, зарегистрируйтесь на groupdocs.cloud, чтобы получить идентификатор безопасности приложения и ключ приложения.

Установите пакет groupdocs-conversion-cloud из pypi с помощью следующей команды.

\> pip install groupdocs-conversion-cloud

Сохраните исходный PDF-документ в папке, в которой вы сохраняете файл сценария.

Пример кода Python для преобразования

Используйте свой любимый редактор и выполните следующие шаги, чтобы преобразовать PDF в редактируемый документ Word на Python.

  • Импорт пакета GroupDocs.Conversion Cloud Python
# Модуль импорта
import groupdocs_conversion_cloud
  • Инициализировать API
# Получите свой app_sid и app_key на https://dashboard.groupdocs.cloud (требуется бесплатная регистрация).
app_sid = "xxxxx-xxxx-xxxx-xxxx-xxxxxxxxx"
app_key = "xxxxxxxxxxxxxxxxxxxxxxxxxxxxxx"

# Создать экземпляр API
convert_api = groupdocs_conversion_cloud.ConvertApi.from_keys(app_sid, app_key)
file_api = groupdocs_conversion_cloud.FileApi.from_keys(app_sid, app_key)
  • Загрузить исходный PDF-документ в хранилище GroupDocs по умолчанию
try:

        #upload soruce file to storage
        filename = '02_pages.pdf'
        remote_name = '02_pages.pdf'
        output_name= 'sample.docx'
        strformat='docx'

        request_upload = groupdocs_conversion_cloud.UploadFileRequest(remote_name,filename)
        response_upload = file_api.upload_file(request_upload)
  • Преобразование PDF-документа в редактируемый DOCX
        #Convert PDF to Word document
        settings = groupdocs_conversion_cloud.ConvertSettings()
        settings.file_path =remote_name
        settings.format = strformat
        settings.output_path = output_name
        
        loadOptions = groupdocs_conversion_cloud.PdfLoadOptions()
        loadOptions.hide_pdf_annotations = True
        loadOptions.remove_embedded_files = False
        loadOptions.flatten_all_fields = True

        settings.load_options = loadOptions

        convertOptions = groupdocs_conversion_cloud.DocxConvertOptions()
        convertOptions.from_page = 1
        convertOptions.pages_count = 1
            
        settings.convert_options = convertOptions
                
        request = groupdocs_conversion_cloud.ConvertDocumentRequest(settings)
        response = convert_api.convert_document(request)

        print("Document converted successfully: " + str(response))
except groupdocs_conversion_cloud.ApiException as e:
        print("Exception when calling get_supported_conversion_types: {0}".format(e.message))
  • Вот и все. PDF-документ преобразуется в DOCX, а ответ API включает URL-адрес результирующего документа.
Document converted successfully: [{'name': 'sample.docx',
 'path': 'sample.docx',
 'size': 4078202,
 'url': 'https://api.groupdocs.cloud/v2.0/conversion/storage/file/sample.docx'}]

Есть вопрос или предложение? Пожалуйста, напишите нам комментарий ниже или задайте вопрос на форуме поддержки. Это помогает нам постоянно улучшать и совершенствовать наш API.

Хотите узнать больше о GroupDocs.Conversion Cloud, просмотрите следующие полезные ресурсы GroupDocs.Conversion Cloud.