Python 開発者は、クラウド上でプログラムによって Word ドキュメントを HTML ファイルに簡単に変換できます。 Word ファイルは主に公式データと個人データの共有に使用されます。ただし、ドキュメントを Web ブラウザーで表示または表示したい場合は、Python で Word をオンラインで HTML に変換するのが賢明な解決策です。 Word から HTML への変換は、HTML ファイルをインターネットに簡単にアップロードできるようにするのに役立ちます。この記事では、Python で Word をオンラインで HTML に変換する方法を学習します。
この記事では次のトピックについて説明します。
- Word から HTML への変換 REST API および Python SDK
- Python の REST API を使用して Word を HTML に変換する
- Cloud Storage を使用しない Word から HTML への変換
- WordをHTMLに変換して直接ダウンロードする方法
Word から HTML への変換 REST API および Python SDK
Word を HTML ファイルに変換するには、GroupDocs.Conversion Cloud の Python SDK API を使用します。この API を使用すると、サポートされているファイル形式 のドキュメントと画像を必要な形式に変換できます。 Word、PowerPoint, Excel、PDF、HTML、CAD、ラスター画像など、50種類以上の文書や画像を簡単に変換できます。
コンソールで次のコマンドを使用して、GroupDocs.Conversion Cloud を Python プロジェクトにインストールできます。
pip install groupdocs_conversion_cloud
手順と利用可能なコード例を開始する前に、ダッシュボード からクライアント ID とクライアント シークレットを取得してください。 ID とシークレットを取得したら、以下に示すコードを追加してください。
# http://api.groupdocs.cloud から Python SDK を Python アプリケーションにインポートします
import groupdocs_conversion_cloud
# 無料登録後、https://dashboard.groupdocs.cloud から client_id と client_secret を取得します。
client_id = "xxxxxxx-xxxx-xxxx-xxxx-xxxxxxxxxxxx"
client_secret = "xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx"
# ファイル API 構成を取得する
configuration = groupdocs_conversion_cloud.Configuration(client_id, client_secret)
configuration.api_base_url = "https://api.groupdocs.cloud"
storage_name = "LocalStorage"
Python の REST API を使用して Word を HTML に変換する
以下の簡単な手順に従って、Word を HTML ファイルに変換できます。
ドキュメントをアップロードする
まず、以下のコード例を使用して、Word ファイルをクラウドにアップロードします。
# Wordファイルをクラウドストレージにアップロードする
# ファイルAPIのインスタンスを作成する
file_api = groupdocs_conversion_cloud.FileApi.from_config(configuration)
# ファイルアップロードリクエストを呼び出す
request = groupdocs_conversion_cloud.UploadFileRequest("python-testing\sample-word.docx", "H:\\groupdocs-cloud-data\\word-file.docx", storage_name)
# docx ファイルをクラウドにアップロードする
response = file_api.upload_file(request)
print(response.uploaded)
その結果、アップロードされた Word ファイルは、クラウド上のダッシュボードの ファイル セクション で利用できるようになります。
Python で Word を HTML に変換する
以下の手順に従って、プログラムで Word を HTML に簡単に変換できます。
- ConvertApi のインスタンスを作成する
- ConvertSettings のインスタンスを作成する
- Wordファイルのパスを設定する
- フォーマットに「html」を割り当てます
- 出力ファイルのパスを指定します
- 必要に応じて HtmlConvertOptions を定義します
- from\page や pages\count などのさまざまなプロパティを設定します。
- ConvertSettings を使用して ConvertDocumentRequest を作成する
- ConvertDocumentRequest で convert\document() メソッドを呼び出して結果を取得します
次のコード例は、REST API を使用して書式を失わずに Word を HTML に変換する方法を示しています。
# Python で Word を HTML に変換する方法
# 必要なAPIインスタンスを作成する
convert_api = groupdocs_conversion_cloud.ConvertApi.from_keys(client_id, client_secret)
# 変換設定を準備する
settings = groupdocs_conversion_cloud.ConvertSettings()
settings.file_path = "python-testing/sample-word.docx"
settings.format = "html"
settings.output_path = "python-testing"
# HTML変換オプション
convertOptions = groupdocs_conversion_cloud.HtmlConvertOptions()
convertOptions.from_page = 1
convertOptions.pages_count = 1
settings.convert_options = convertOptions
# 変換ドキュメントリクエストの作成
request = groupdocs_conversion_cloud.ConvertDocumentRequest(settings)
# Word のページを HTML ファイルに変換する
result = convert_api.convert_document(request)
print("Converted range of pages from Word to HTML web page: " + result[0].path)
変換されたファイルをダウンロードする
上記のコードサンプルは、変換された HTML ファイルをクラウド上に保存します。次のコードサンプルを使用してダウンロードできます。
# 変換されたファイルをダウンロードするための API の初期化
import shutil
file_api = groupdocs_conversion_cloud.FileApi.from_config(configuration)
# ダウンロードファイルリクエストの作成
request = groupdocs_conversion_cloud.DownloadFileRequest("python-testing\\sample-word.html", storage_name)
# 変換されたファイルをダウンロードする
response = file_api.download_file(request)
# ダウンロードしたファイルをディレクトリに移動します
shutil.move(response, "H:\\groupdocs-cloud-data\\")
Cloud Storage を使用しない Word から HTML への変換
以下の手順に従って、クラウド ストレージを使用せずに Word を HTML ドキュメントに変換できます。
- ConvertApi のインスタンスを作成する
- ConvertDocumentDirectRequest を作成し、要求されたドキュメント形式と入力ファイルのパスを渡します
- ConvertDocumentDirectRequest で convert\document\direct() メソッドを呼び出して結果を取得します
- 必要に応じて、shutil.move() メソッドを使用して出力ファイルをローカル パスに保存します。
次のコード例は、クラウド ストレージを使用せずに Word を HTML に変換する方法を示しています。
# クラウドストレージを使用せずにWordからHTMLへ変換
# 必要なAPIインスタンスを作成する
import shutil
convert_api = groupdocs_conversion_cloud.ConvertApi.from_keys(client_id, client_secret)
# 変換リクエストを準備する
request = groupdocs_conversion_cloud.ConvertDocumentDirectRequest("html", "H:\\groupdocs-cloud-data\\word-file.docx")
# クラウドストレージを使用せずにWordをHTMLに変換
response = convert_api.convert_document_direct(request)
# ダウンロードしたファイルを作業ディレクトリに移動します
shutil.move(response, "H:\\groupdocs-cloud-data\\")
リクエスト本文で入力ファイルを渡し、API レスポンスで出力ファイルを受け取ります。
Word を HTML に変換して直接ダウンロードする方法
以下の手順に従って、プログラムを使用して Word を HTML ファイルに簡単に変換できます。
- ConvertApi のインスタンスを作成する
- ConvertSettings のインスタンスを作成する
- Wordファイルのパスを設定する
- フォーマットに「html」を割り当てます
- 出力パスを「なし」に設定します
- ConvertSettings を使用して ConvertDocumentRequest を作成する
- convert\document\download() メソッドを呼び出して結果を取得します
- 必要に応じて、shutil.move() メソッドを使用して出力ファイルをローカル パスに保存します。
次のコード例は、Python の REST API を使用して Word を HTML に変換し、直接ダウンロードする方法を示しています。
# Word を HTML に変換して直接ダウンロードする方法
# 必要なAPIインスタンスを作成する
import shutil
convert_api = groupdocs_conversion_cloud.ConvertApi.from_keys(client_id, client_secret)
# 変換設定を準備する
settings = groupdocs_conversion_cloud.ConvertSettings()
settings.file_path = "python-testing/sample-word.docx"
settings.format = "html"
# ドキュメントIOStreamとして出力
settings.output_path = None
# 変換リクエストを準備する
request = groupdocs_conversion_cloud.ConvertDocumentRequest(settings)
# WordをHTMLファイルに直接変換
response = convert_api.convert_document_download(request)
# ダウンロードしたファイルを作業ディレクトリに移動します
shutil.move(response, "H:\\groupdocs-cloud-data\\")
API は、応答として変換された HTML ファイルを返します。前述の手順に従ってファイルをアップロードしてください。
オンラインWordからHTMLへのコンバーター
上記APIを利用して開発された以下のオンラインWordからHTMLへの無料変換ツールをお試しください。
結論
この記事では、次のことを学びました。
- クラウド上で Python を使用して Word ドキュメントを HTML ファイルに変換する方法。
- HTML ファイルをクラウドにアップロードし、変換された HTML ファイルをクラウドからダウンロードします。
- プログラムでクラウド ストレージを使用せずに Word を HTML ファイルに変換する方法。
- WordをHTMLファイルに変換して直接ダウンロードする方法;
GroupDocs.Conversion Cloud API の詳細については、ドキュメント を使用して学習できます。また、ブラウザーを通じて API を直接視覚化し操作できるようにする API リファレンス セクションも提供しています。
質問する
Word から HTML へのコンバーターについてご質問がある場合は、無料サポート フォーラム でお気軽にお問い合わせください。
関連項目
以下の記事を参照して学習することをお勧めします。