Jako programista Python możesz wymagać od swoich użytkowników udostępnienia funkcji konwersji dokumentów PDF na Word w swojej aplikacji. Ponieważ bardzo trudno jest edytować dokumenty PDF bez Adobe Acrobat. Użytkownicy mają obowiązek edytowania tekstu, tabeli, obrazów i innych treści w dokumencie PDF. Rozwiązaniem tego wymagania jest przekonwertowanie dokumentu PDF na edytowalny dokument programu Word. Ale wiesz, że programowo nie jest to takie proste. Na szczęście istnieje moduł; GroupDocs.Conversion Cloud SDK for Python, który ułatwia konwersję plików PDF do edytowalnych dokumentów Word za pomocą kilku wierszy kodu Python.

PDF do Worda — interfejs API konwersji i pakiet SDK języka Python

GroupDocs.Conversion dla chmury

GroupDocs.Conversion Cloud to niezależne od platformy rozwiązanie do konwersji dokumentów i obrazów, które nie wymaga żadnego narzędzia ani oprogramowania. Może szybko i niezawodnie konwertować obrazy i dokumenty dowolnego obsługiwanego formatu pliku. Oferuje SDK dla wszystkich popularnych języków programowania wraz z kodem źródłowym i działającymi przykładami. Dzięki temu programiści mogą korzystać z GroupDocs.Conversion Cloud bezpośrednio w swoich aplikacjach, nie martwiąc się o bazowe wywołania API REST. W tym artykule używam Python SDK do konwersji plików PDF na Word.

Jak przekonwertować PDF na edytowalny DOCX w Python

Będę używać Python 3.7.4, możesz użyć dowolnej wersji Python 2.7, 3.4 lub nowszej. Zanim zaczniemy kodować, zarejestruj się na groupdocs.cloud, aby uzyskać identyfikator SID i klucz aplikacji.

Zainstaluj pakiet groupdocs-conversion-cloud z pypi za pomocą następującego polecenia.

\> pip install groupdocs-conversion-cloud

Zapisz źródłowy dokument PDF w folderze, w którym zapisujesz plik skryptu.

Przykładowy kod Python do konwersji

Użyj swojego ulubionego edytora i wykonaj następujące kroki, aby przekonwertować plik PDF na edytowalny dokument Word w Python.

  • Zaimportuj pakiet GroupDocs.Conversion Cloud Python
# Moduł importu
import groupdocs_conversion_cloud
  • Zainicjuj interfejs API
# Pobierz app_sid i app_key na https://dashboard.groupdocs.cloud (wymagana jest bezpłatna rejestracja).
app_sid = "xxxxx-xxxx-xxxx-xxxx-xxxxxxxxx"
app_key = "xxxxxxxxxxxxxxxxxxxxxxxxxxxxxx"

# Utwórz instancję interfejsu API
convert_api = groupdocs_conversion_cloud.ConvertApi.from_keys(app_sid, app_key)
file_api = groupdocs_conversion_cloud.FileApi.from_keys(app_sid, app_key)
  • Prześlij źródłowy dokument PDF do domyślnej pamięci GroupDocs
try:

        #upload soruce file to storage
        filename = '02_pages.pdf'
        remote_name = '02_pages.pdf'
        output_name= 'sample.docx'
        strformat='docx'

        request_upload = groupdocs_conversion_cloud.UploadFileRequest(remote_name,filename)
        response_upload = file_api.upload_file(request_upload)
  • Konwertuj dokument PDF na edytowalny DOCX
        #Convert PDF to Word document
        settings = groupdocs_conversion_cloud.ConvertSettings()
        settings.file_path =remote_name
        settings.format = strformat
        settings.output_path = output_name
        
        loadOptions = groupdocs_conversion_cloud.PdfLoadOptions()
        loadOptions.hide_pdf_annotations = True
        loadOptions.remove_embedded_files = False
        loadOptions.flatten_all_fields = True

        settings.load_options = loadOptions

        convertOptions = groupdocs_conversion_cloud.DocxConvertOptions()
        convertOptions.from_page = 1
        convertOptions.pages_count = 1
            
        settings.convert_options = convertOptions
                
        request = groupdocs_conversion_cloud.ConvertDocumentRequest(settings)
        response = convert_api.convert_document(request)

        print("Document converted successfully: " + str(response))
except groupdocs_conversion_cloud.ApiException as e:
        print("Exception when calling get_supported_conversion_types: {0}".format(e.message))
  • I to wszystko. Dokument PDF jest konwertowany do formatu DOCX, a odpowiedź API zawiera adres URL dokumentu wynikowego.
Document converted successfully: [{'name': 'sample.docx',
 'path': 'sample.docx',
 'size': 4078202,
 'url': 'https://api.groupdocs.cloud/v2.0/conversion/storage/file/sample.docx'}]

Masz pytanie lub sugestię? Zachęcamy do pozostawienia nam komentarza poniżej lub zadania pytania na forum wsparcia. Pomaga nam to w ciągłym ulepszaniu i udoskonalaniu naszego interfejsu API.

Chcesz dowiedzieć się więcej o GroupDocs.Conversion Cloud, przejrzyj następujące przydatne zasoby GroupDocs.Conversion Cloud.