Como um desenvolvedor Python, você pode ter um requisito de seus usuários para fornecer o recurso de conversão de documento PDF para Word em seu aplicativo. Porque é muito difícil editar documentos PDF sem o Adobe Acrobat. E os usuários precisam editar texto, tabela, imagens e outros conteúdos no documento PDF. Uma solução para o requisito é converter o documento PDF em um documento editável do Word. Mas, você sabe que não é tão simples programaticamente. Felizmente, existe um módulo; GroupDocs.Conversion Cloud SDK for Python que facilita a conversão de PDF em documento editável do Word com algumas linhas de código python.

PDF para Word - API de conversão e SDK do Python

GroupDocs.Conversion for Cloud

GroupDocs.Conversion Cloud é uma solução de conversão de imagens e documentos independente de plataforma, sem depender de nenhuma ferramenta ou software. Ele pode converter de forma rápida e confiável imagens e documentos de qualquer formato de arquivo suportado. Ele oferece os SDKs para todas as linguagens de programação populares com código-fonte e exemplos de trabalho. Isso permite que os desenvolvedores usem o GroupDocs.Conversion Cloud diretamente em seus aplicativos sem se preocupar com chamadas de API REST subjacentes. Neste artigo, estou usando o Python SDK para conversão de PDF para Word.

Como converter PDF para DOCX editável em Python

Estarei usando o Python 3.7.4, você pode usar qualquer versão que desejar, Python 2.7, 3.4 ou superior. Antes de começarmos a codificar, inscreva-se com groupdocs.cloud para obter o SID e a chave do APP.

Instale o pacote groupdocs-conversion-cloud de pypi com o seguinte comando.

\> pip install groupdocs-conversion-cloud

Armazene seu documento PDF de origem na pasta onde você está salvando seu arquivo de script.

Exemplo de código Python para conversão

Use seu editor favorito e siga as etapas a seguir para converter o PDF em um documento editável do Word em Python.

  • Importe o pacote GroupDocs.Conversion Cloud Python
# módulo de importação
import groupdocs_conversion_cloud
  • Inicializar a API
# Obtenha seu app_sid e app_key em https://dashboard.groupdocs.cloud (registro gratuito é necessário).
app_sid = "xxxxx-xxxx-xxxx-xxxx-xxxxxxxxx"
app_key = "xxxxxxxxxxxxxxxxxxxxxxxxxxxxxx"

# Criar instância da API
convert_api = groupdocs_conversion_cloud.ConvertApi.from_keys(app_sid, app_key)
file_api = groupdocs_conversion_cloud.FileApi.from_keys(app_sid, app_key)
  • Carregue o documento PDF de origem para o armazenamento padrão do GroupDocs
try:

        #upload soruce file to storage
        filename = '02_pages.pdf'
        remote_name = '02_pages.pdf'
        output_name= 'sample.docx'
        strformat='docx'

        request_upload = groupdocs_conversion_cloud.UploadFileRequest(remote_name,filename)
        response_upload = file_api.upload_file(request_upload)
  • Converta o documento PDF em DOCX editável
        #Convert PDF to Word document
        settings = groupdocs_conversion_cloud.ConvertSettings()
        settings.file_path =remote_name
        settings.format = strformat
        settings.output_path = output_name
        
        loadOptions = groupdocs_conversion_cloud.PdfLoadOptions()
        loadOptions.hide_pdf_annotations = True
        loadOptions.remove_embedded_files = False
        loadOptions.flatten_all_fields = True

        settings.load_options = loadOptions

        convertOptions = groupdocs_conversion_cloud.DocxConvertOptions()
        convertOptions.from_page = 1
        convertOptions.pages_count = 1
            
        settings.convert_options = convertOptions
                
        request = groupdocs_conversion_cloud.ConvertDocumentRequest(settings)
        response = convert_api.convert_document(request)

        print("Document converted successfully: " + str(response))
except groupdocs_conversion_cloud.ApiException as e:
        print("Exception when calling get_supported_conversion_types: {0}".format(e.message))
  • E é isso. O documento PDF é convertido em DOCX e a resposta da API inclui o URL do documento resultante.
Document converted successfully: [{'name': 'sample.docx',
 'path': 'sample.docx',
 'size': 4078202,
 'url': 'https://api.groupdocs.cloud/v2.0/conversion/storage/file/sample.docx'}]

Tem uma pergunta ou sugestão? Sinta-se à vontade para nos enviar um comentário abaixo ou postar uma pergunta no fórum de suporte. Isso nos ajuda a melhorar e refinar continuamente nossa API.

Quer explorar mais sobre o GroupDocs.Conversion Cloud, consulte os seguintes recursos úteis do GroupDocs.Conversion Cloud.