Como desarrollador de Python, puede tener un requisito de sus usuarios para proporcionar la función de conversión de documentos PDF a Word en su aplicación. Porque es muy difícil editar documentos PDF sin Adobe Acrobat. Y los usuarios tienen el requisito de editar texto, tablas, imágenes y otros contenidos en el documento PDF. Una solución para el requisito es convertir el documento PDF en un documento de Word editable. Pero, sabes que no es tan simple programáticamente. Afortunadamente, hay un módulo; GroupDocs.Conversion Cloud SDK for Python que le facilita la conversión de PDF a un documento de Word editable con unas pocas líneas de código python.

PDF a Word: API de conversión y SDK de Python

GroupDocs.Conversión para la nube

GroupDocs.Conversion Cloud es una solución de conversión de documentos e imágenes independiente de la plataforma sin depender de ninguna herramienta o software. Puede convertir de forma rápida y fiable imágenes y documentos de cualquier formato de archivo compatible. Ofrece los SDK para todos los lenguajes de programación populares con código fuente y ejemplos prácticos. Eso permite a los desarrolladores usar GroupDocs.Conversion Cloud directamente en sus aplicaciones sin preocuparse por las llamadas API REST subyacentes. En este artículo, estoy usando el SDK de Python para la conversión de PDF a Word.

Cómo convertir PDF a DOCX editable en Python

Usaré Python 3.7.4, puedes usar cualquier versión que te guste Python 2.7, 3.4 o superior. Antes de comenzar con la codificación, regístrese con groupdocs.cloud para obtener su APP SID y APP Key.

Instale el paquete groupdocs-conversion-cloud desde pypi con el siguiente comando.

\> pip install groupdocs-conversion-cloud

Guarde su documento PDF de origen en la carpeta donde está guardando su archivo de secuencia de comandos.

Ejemplo de código de Python para conversión

Use su editor favorito y siga los siguientes pasos para convertir el PDF a un documento de Word editable en Python.

  • Importe el paquete GroupDocs.Conversion Cloud Python
# Módulo de importación
import groupdocs_conversion_cloud
  • Inicializar la API
# Obtenga su app_sid y app_key en https://dashboard.groupdocs.cloud (se requiere registro gratuito).
app_sid = "xxxxx-xxxx-xxxx-xxxx-xxxxxxxxx"
app_key = "xxxxxxxxxxxxxxxxxxxxxxxxxxxxxx"

# Crear instancia de la API
convert_api = groupdocs_conversion_cloud.ConvertApi.from_keys(app_sid, app_key)
file_api = groupdocs_conversion_cloud.FileApi.from_keys(app_sid, app_key)
  • Cargue el documento PDF de origen en el almacenamiento predeterminado de GroupDocs
try:

        #upload soruce file to storage
        filename = '02_pages.pdf'
        remote_name = '02_pages.pdf'
        output_name= 'sample.docx'
        strformat='docx'

        request_upload = groupdocs_conversion_cloud.UploadFileRequest(remote_name,filename)
        response_upload = file_api.upload_file(request_upload)
  • Convierta el documento PDF a DOCX editable
        #Convert PDF to Word document
        settings = groupdocs_conversion_cloud.ConvertSettings()
        settings.file_path =remote_name
        settings.format = strformat
        settings.output_path = output_name
        
        loadOptions = groupdocs_conversion_cloud.PdfLoadOptions()
        loadOptions.hide_pdf_annotations = True
        loadOptions.remove_embedded_files = False
        loadOptions.flatten_all_fields = True

        settings.load_options = loadOptions

        convertOptions = groupdocs_conversion_cloud.DocxConvertOptions()
        convertOptions.from_page = 1
        convertOptions.pages_count = 1
            
        settings.convert_options = convertOptions
                
        request = groupdocs_conversion_cloud.ConvertDocumentRequest(settings)
        response = convert_api.convert_document(request)

        print("Document converted successfully: " + str(response))
except groupdocs_conversion_cloud.ApiException as e:
        print("Exception when calling get_supported_conversion_types: {0}".format(e.message))
  • Y eso es. El documento PDF se convierte a DOCX y la respuesta de la API incluye la URL del documento resultante.
Document converted successfully: [{'name': 'sample.docx',
 'path': 'sample.docx',
 'size': 4078202,
 'url': 'https://api.groupdocs.cloud/v2.0/conversion/storage/file/sample.docx'}]

¿Tienes alguna pregunta o sugerencia? No dude en enviarnos un comentario a continuación o publicar una pregunta en el foro de soporte. Nos ayuda a mejorar y refinar continuamente nuestra API.

Si desea explorar más sobre GroupDocs.Conversion Cloud, consulte los siguientes recursos útiles de GroupDocs.Conversion Cloud.