Python 開発者は、アプリケーションに PDF から Word へのドキュメント変換機能を提供するようユーザーから要求されることがあります。 Adobe Acrobat なしで PDF ドキュメントを編集するのは非常に難しいためです。また、ユーザーは PDF ドキュメント内のテキスト、表、画像、その他のコンテンツを編集する必要があります。この要件に対する解決策は、PDF ドキュメントを編集可能な Word ドキュメントに変換することです。ただし、プログラム的にはそれほど単純ではないことはご存知でしょう。幸いなことに、モジュールがあります。 GroupDocs.Conversion Cloud SDK for Python を使用すると、数行の Python コードで PDF を編集可能な Word ドキュメントに簡単に変換できます。
PDF から Word - 変換 API と Python SDK
GroupDocs.Conversion Cloud は、ツールやソフトウェアに依存しない、プラットフォームに依存しないドキュメントと画像の変換ソリューションです。あらゆるサポートされているファイル形式の画像とドキュメントを迅速かつ確実に変換できます。すべての一般的なプログラミング言語の SDK をソース コードと実際のサンプルとともに提供します。これにより、開発者は基盤となる REST API 呼び出しを気にせずに、GroupDocs.Conversion Cloud をアプリケーション内で直接使用できるようになります。この記事では、PDF から Word への変換に Python SDK を使用します。
Python で PDF を編集可能な DOCX に変換する方法
ここでは Python 3.7.4 を使用しますが、Python 2.7、3.4、またはそれ以降の任意のバージョンを使用できます。コーディングを始める前に、groupdocs.cloud にサインアップして APP SID と APP Key を取得してください。
次のコマンドを使用して、pypi から groupdocs-conversion-cloud パッケージをインストールします。
\> pip install groupdocs-conversion-cloud
スクリプト ファイルを保存しているフォルダーにソース PDF ドキュメントを保存します。
変換用のサンプル Python コード
お気に入りのエディターを使用し、次の手順に従って PDF を Python で編集可能な Word ドキュメントに変換します。
- GroupDocs.Conversion Cloud Python パッケージをインポートする
# インポートモジュール
import groupdocs_conversion_cloud
- APIを初期化する
# https://dashboard.groupdocs.cloud で app_sid と app_key を取得します (無料の登録が必要です)。
app_sid = "xxxxx-xxxx-xxxx-xxxx-xxxxxxxxx"
app_key = "xxxxxxxxxxxxxxxxxxxxxxxxxxxxxx"
# APIのインスタンスを作成する
convert_api = groupdocs_conversion_cloud.ConvertApi.from_keys(app_sid, app_key)
file_api = groupdocs_conversion_cloud.FileApi.from_keys(app_sid, app_key)
- ソース PDF ドキュメントを GroupDocs のデフォルト ストレージにアップロードする
try:
#upload soruce file to storage
filename = '02_pages.pdf'
remote_name = '02_pages.pdf'
output_name= 'sample.docx'
strformat='docx'
request_upload = groupdocs_conversion_cloud.UploadFileRequest(remote_name,filename)
response_upload = file_api.upload_file(request_upload)
- PDF ドキュメントを編集可能な DOCX に変換します
#Convert PDF to Word document
settings = groupdocs_conversion_cloud.ConvertSettings()
settings.file_path =remote_name
settings.format = strformat
settings.output_path = output_name
loadOptions = groupdocs_conversion_cloud.PdfLoadOptions()
loadOptions.hide_pdf_annotations = True
loadOptions.remove_embedded_files = False
loadOptions.flatten_all_fields = True
settings.load_options = loadOptions
convertOptions = groupdocs_conversion_cloud.DocxConvertOptions()
convertOptions.from_page = 1
convertOptions.pages_count = 1
settings.convert_options = convertOptions
request = groupdocs_conversion_cloud.ConvertDocumentRequest(settings)
response = convert_api.convert_document(request)
print("Document converted successfully: " + str(response))
except groupdocs_conversion_cloud.ApiException as e:
print("Exception when calling get_supported_conversion_types: {0}".format(e.message))
- 以上です。 PDF ドキュメントは DOCX に変換され、API 応答には結果のドキュメントの URL が含まれます。
Document converted successfully: [{'name': 'sample.docx',
'path': 'sample.docx',
'size': 4078202,
'url': 'https://api.groupdocs.cloud/v2.0/conversion/storage/file/sample.docx'}]
ご質問またはご提案がありますか?お気軽に以下にコメントを残すか、サポート フォーラムに質問を投稿してください。これは、API を継続的に改善および改良するのに役立ちます。
GroupDocs.Conversion Cloud についてさらに詳しく知りたい場合は、GroupDocs.Conversion Cloud の次の便利なリソースを参照してください。
- Web API Explorer → API のライブサンプル
- 開発者向けドキュメント → オンラインドキュメント
- 例と SDK → Github のコードサンプル
- サポート フォーラム → オンライン ヘルプ