Python 開発者は、アプリケーションに PDF から Word へのドキュメント変換機能を提供するようユーザーから要求されることがあります。 Adobe Acrobat なしで PDF ドキュメントを編集するのは非常に難しいためです。また、ユーザーは PDF ドキュメント内のテキスト、表、画像、その他のコンテンツを編集する必要があります。この要件に対する解決策は、PDF ドキュメントを編集可能な Word ドキュメントに変換することです。ただし、プログラム的にはそれほど単純ではないことはご存知でしょう。幸いなことに、モジュールがあります。 GroupDocs.Conversion Cloud SDK for Python を使用すると、数行の Python コードで PDF を編集可能な Word ドキュメントに簡単に変換できます。

PDF から Word - 変換 API と Python SDK

GroupDocs.Conversion for Cloud

GroupDocs.Conversion Cloud は、ツールやソフトウェアに依存しない、プラットフォームに依存しないドキュメントと画像の変換ソリューションです。あらゆるサポートされているファイル形式の画像とドキュメントを迅速かつ確実に変換できます。すべての一般的なプログラミング言語の SDK をソース コードと実際のサンプルとともに提供します。これにより、開発者は基盤となる REST API 呼び出しを気にせずに、GroupDocs.Conversion Cloud をアプリケーション内で直接使用できるようになります。この記事では、PDF から Word への変換に Python SDK を使用します。

Python で PDF を編集可能な DOCX に変換する方法

ここでは Python 3.7.4 を使用しますが、Python 2.7、3.4、またはそれ以降の任意のバージョンを使用できます。コーディングを始める前に、groupdocs.cloud にサインアップして APP SID と APP Key を取得してください。

次のコマンドを使用して、pypi から groupdocs-conversion-cloud パッケージをインストールします。

\> pip install groupdocs-conversion-cloud

スクリプト ファイルを保存しているフォルダーにソース PDF ドキュメントを保存します。

変換用のサンプル Python コード

お気に入りのエディターを使用し、次の手順に従って PDF を Python で編集可能な Word ドキュメントに変換します。

  • GroupDocs.Conversion Cloud Python パッケージをインポートする
# インポートモジュール
import groupdocs_conversion_cloud
  • APIを初期化する
# https://dashboard.groupdocs.cloud で app_sid と app_key を取得します (無料の登録が必要です)。
app_sid = "xxxxx-xxxx-xxxx-xxxx-xxxxxxxxx"
app_key = "xxxxxxxxxxxxxxxxxxxxxxxxxxxxxx"

# APIのインスタンスを作成する
convert_api = groupdocs_conversion_cloud.ConvertApi.from_keys(app_sid, app_key)
file_api = groupdocs_conversion_cloud.FileApi.from_keys(app_sid, app_key)
  • ソース PDF ドキュメントを GroupDocs のデフォルト ストレージにアップロードする
try:

        #upload soruce file to storage
        filename = '02_pages.pdf'
        remote_name = '02_pages.pdf'
        output_name= 'sample.docx'
        strformat='docx'

        request_upload = groupdocs_conversion_cloud.UploadFileRequest(remote_name,filename)
        response_upload = file_api.upload_file(request_upload)
  • PDF ドキュメントを編集可能な DOCX に変換します
        #Convert PDF to Word document
        settings = groupdocs_conversion_cloud.ConvertSettings()
        settings.file_path =remote_name
        settings.format = strformat
        settings.output_path = output_name
        
        loadOptions = groupdocs_conversion_cloud.PdfLoadOptions()
        loadOptions.hide_pdf_annotations = True
        loadOptions.remove_embedded_files = False
        loadOptions.flatten_all_fields = True

        settings.load_options = loadOptions

        convertOptions = groupdocs_conversion_cloud.DocxConvertOptions()
        convertOptions.from_page = 1
        convertOptions.pages_count = 1
            
        settings.convert_options = convertOptions
                
        request = groupdocs_conversion_cloud.ConvertDocumentRequest(settings)
        response = convert_api.convert_document(request)

        print("Document converted successfully: " + str(response))
except groupdocs_conversion_cloud.ApiException as e:
        print("Exception when calling get_supported_conversion_types: {0}".format(e.message))
  • 以上です。 PDF ドキュメントは DOCX に変換され、API 応答には結果のドキュメントの URL が含まれます。
Document converted successfully: [{'name': 'sample.docx',
 'path': 'sample.docx',
 'size': 4078202,
 'url': 'https://api.groupdocs.cloud/v2.0/conversion/storage/file/sample.docx'}]

ご質問またはご提案がありますか?お気軽に以下にコメントを残すか、サポート フォーラムに質問を投稿してください。これは、API を継続的に改善および改良するのに役立ちます。

GroupDocs.Conversion Cloud についてさらに詳しく知りたい場合は、GroupDocs.Conversion Cloud の次の便利なリソースを参照してください。