Python でオンラインで Word を HTML に変換する方法

Python でオンラインで Word を HTML に変換する

Python 開発者は、クラウド上でプログラムによって Word ドキュメントを HTML ファイルに簡単に変換できます。 Word ファイルは主に公式データと個人データの共有に使用されます。ただし、ドキュメントを Web ブラウザーで表示または表示したい場合は、Python で Word をオンラインで HTML に変換するのが賢明な解決策です。 Word から HTML への変換は、HTML ファイルをインターネットに簡単にアップロードできるようにするのに役立ちます。この記事では、Python で Word をオンラインで HTML に変換する方法を学習します。

この記事では次のトピックについて説明します。

Word から HTML への変換 REST API および Python SDK

Word を HTML ファイルに変換するには、GroupDocs.Conversion Cloud の Python SDK API を使用します。この API を使用すると、サポートされているファイル形式 のドキュメントと画像を必要な形式に変換できます。 Word、PowerPoint, Excel、PDF、HTML、CAD、ラスター画像など、50種類以上の文書や画像を簡単に変換できます。

コンソールで次のコマンドを使用して、GroupDocs.Conversion Cloud を Python プロジェクトにインストールできます。

pip install groupdocs_conversion_cloud

手順と利用可能なコード例を開始する前に、ダッシュボード からクライアント ID とクライアント シークレットを取得してください。 ID とシークレットを取得したら、以下に示すコードを追加してください。

# http://api.groupdocs.cloud から Python SDK を Python アプリケーションにインポートします
import groupdocs_conversion_cloud

# 無料登録後、https://dashboard.groupdocs.cloud から client_id と client_secret を取得します。
client_id = "xxxxxxx-xxxx-xxxx-xxxx-xxxxxxxxxxxx"
client_secret = "xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx"

# ファイル API 構成を取得する 
configuration = groupdocs_conversion_cloud.Configuration(client_id, client_secret)
configuration.api_base_url = "https://api.groupdocs.cloud"
storage_name = "LocalStorage"

Python の REST API を使用して Word を HTML に変換する

以下の簡単な手順に従って、Word を HTML ファイルに変換できます。

ドキュメントをアップロードする

まず、以下のコード例を使用して、Word ファイルをクラウドにアップロードします。

# Wordファイルをクラウドストレージにアップロードする
# ファイルAPIのインスタンスを作成する
file_api = groupdocs_conversion_cloud.FileApi.from_config(configuration)

# ファイルアップロードリクエストを呼び出す
request = groupdocs_conversion_cloud.UploadFileRequest("python-testing\sample-word.docx", "H:\\groupdocs-cloud-data\\word-file.docx", storage_name)

# docx ファイルをクラウドにアップロードする
response = file_api.upload_file(request)
print(response.uploaded)

その結果、アップロードされた Word ファイルは、クラウド上のダッシュボードの ファイル セクション で利用できるようになります。

Python で Word を HTML に変換する

以下の手順に従って、プログラムで Word を HTML に簡単に変換できます。

  • ConvertApi のインスタンスを作成する
  • ConvertSettings のインスタンスを作成する
  • Wordファイルのパスを設定する
  • フォーマットに「html」を割り当てます
  • 出力ファイルのパスを指定します
  • 必要に応じて HtmlConvertOptions を定義します
  • from\page や pages\count などのさまざまなプロパティを設定します。
  • ConvertSettings を使用して ConvertDocumentRequest を作成する
  • ConvertDocumentRequest で convert\document() メソッドを呼び出して結果を取得します

次のコード例は、REST API を使用して書式を失わずに Word を HTML に変換する方法を示しています。

# Python で Word を HTML に変換する方法
# 必要なAPIインスタンスを作成する
convert_api = groupdocs_conversion_cloud.ConvertApi.from_keys(client_id, client_secret)

# 変換設定を準備する
settings = groupdocs_conversion_cloud.ConvertSettings()
settings.file_path = "python-testing/sample-word.docx"
settings.format = "html"
settings.output_path = "python-testing"

# HTML変換オプション
convertOptions = groupdocs_conversion_cloud.HtmlConvertOptions()
convertOptions.from_page = 1 
convertOptions.pages_count = 1

settings.convert_options = convertOptions

# 変換ドキュメントリクエストの作成
request = groupdocs_conversion_cloud.ConvertDocumentRequest(settings)

# Word のページを HTML ファイルに変換する
result = convert_api.convert_document(request)
print("Converted range of pages from Word to HTML web page: " + result[0].path)

変換されたファイルをダウンロードする

上記のコードサンプルは、変換された HTML ファイルをクラウド上に保存します。次のコードサンプルを使用してダウンロードできます。

# 変換されたファイルをダウンロードするための API の初期化
import shutil
file_api = groupdocs_conversion_cloud.FileApi.from_config(configuration)

# ダウンロードファイルリクエストの作成
request = groupdocs_conversion_cloud.DownloadFileRequest("python-testing\\sample-word.html", storage_name)

# 変換されたファイルをダウンロードする
response = file_api.download_file(request)

# ダウンロードしたファイルをディレクトリに移動します
shutil.move(response, "H:\\groupdocs-cloud-data\\")

Cloud Storage を使用しない Word から HTML への変換

以下の手順に従って、クラウド ストレージを使用せずに Word を HTML ドキュメントに変換できます。

  • ConvertApi のインスタンスを作成する
  • ConvertDocumentDirectRequest を作成し、要求されたドキュメント形式と入力ファイルのパスを渡します
  • ConvertDocumentDirectRequest で convert\document\direct() メソッドを呼び出して結果を取得します
  • 必要に応じて、shutil.move() メソッドを使用して出力ファイルをローカル パスに保存します。

次のコード例は、クラウド ストレージを使用せずに Word を HTML に変換する方法を示しています。

# クラウドストレージを使用せずにWordからHTMLへ変換
# 必要なAPIインスタンスを作成する
import shutil
convert_api = groupdocs_conversion_cloud.ConvertApi.from_keys(client_id, client_secret)

# 変換リクエストを準備する
request = groupdocs_conversion_cloud.ConvertDocumentDirectRequest("html", "H:\\groupdocs-cloud-data\\word-file.docx")

# クラウドストレージを使用せずにWordをHTMLに変換
response = convert_api.convert_document_direct(request)

# ダウンロードしたファイルを作業ディレクトリに移動します
shutil.move(response, "H:\\groupdocs-cloud-data\\")

リクエスト本文で入力ファイルを渡し、API レスポンスで出力ファイルを受け取ります。

Word を HTML に変換して直接ダウンロードする方法

以下の手順に従って、プログラムを使用して Word を HTML ファイルに簡単に変換できます。

  • ConvertApi のインスタンスを作成する
  • ConvertSettings のインスタンスを作成する
  • Wordファイルのパスを設定する
  • フォーマットに「html」を割り当てます
  • 出力パスを「なし」に設定します
  • ConvertSettings を使用して ConvertDocumentRequest を作成する
  • convert\document\download() メソッドを呼び出して結果を取得します
  • 必要に応じて、shutil.move() メソッドを使用して出力ファイルをローカル パスに保存します。

次のコード例は、Python の REST API を使用して Word を HTML に変換し、直接ダウンロードする方法を示しています。

# Word を HTML に変換して直接ダウンロードする方法
# 必要なAPIインスタンスを作成する
import shutil
convert_api = groupdocs_conversion_cloud.ConvertApi.from_keys(client_id, client_secret)

# 変換設定を準備する
settings = groupdocs_conversion_cloud.ConvertSettings()
settings.file_path = "python-testing/sample-word.docx"
settings.format = "html"

# ドキュメントIOStreamとして出力
settings.output_path = None    

# 変換リクエストを準備する
request = groupdocs_conversion_cloud.ConvertDocumentRequest(settings)

# WordをHTMLファイルに直接変換
response = convert_api.convert_document_download(request)

# ダウンロードしたファイルを作業ディレクトリに移動します
shutil.move(response, "H:\\groupdocs-cloud-data\\")

API は、応答として変換された HTML ファイルを返します。前述の手順に従ってファイルをアップロードしてください。

オンラインWordからHTMLへのコンバーター

上記APIを利用して開発された以下のオンラインWordからHTMLへの無料変換ツールをお試しください。

結論

この記事では、次のことを学びました。

  • クラウド上で Python を使用して Word ドキュメントを HTML ファイルに変換する方法。
  • HTML ファイルをクラウドにアップロードし、変換された HTML ファイルをクラウドからダウンロードします。
  • プログラムでクラウド ストレージを使用せずに Word を HTML ファイルに変換する方法。
  • WordをHTMLファイルに変換して直接ダウンロードする方法;

GroupDocs.Conversion Cloud API の詳細については、ドキュメント を使用して学習できます。また、ブラウザーを通じて API を直接視覚化し操作できるようにする API リファレンス セクションも提供しています。

質問する

Word から HTML へのコンバーターについてご質問がある場合は、無料サポート フォーラム でお気軽にお問い合わせください。

関連項目

以下の記事を参照して学習することをお勧めします。