Python で Word 文書からページを抽出する方法

Python で Word 文書からページを抽出する方法

プログラム的に Word 文書をページごとに複数の文書に分割する必要がある場合があります。 Word 文書を分割すると、Word 文書から簡単にページを抽出し、特定の情報やデータを関係者と共有できます。 Python 開発者は、クラウド上で Word ドキュメントをオンラインの個別のファイルに分割できます。この記事では、Python で Word 文書からページを抽出する方法を学習します。

この Word ページ分割記事では、次のトピックについて説明します。

Word ドキュメント スプリッター REST API - Python SDK

Word ファイルを複数のファイルに分割するには、GroupDocs.Merger Cloud API の Python SDK を使用します。 サポートされている文書形式WordExcelVisio 図面PDFHTML。 Python ソース コード リポジトリ は GitHub で無料で入手できます。

Word ファイル スプリッターを無料でダウンロードできます。ターミナルで次のコマンドを使用すると、PyPI から PIP を使用して Python アプリケーションに Word doc Splitter をインストールできます。

pip install groupdocs-merger-cloud

以下の手順に従う前に、ダッシュボードから クライアント ID とシークレットを取得してください。 ID とシークレットを取得したら、以下のコードをアプリケーションに追加して、以下に示すように Word ドキュメントを個別のファイルに分割します。

# groupdocs Merger SDK をインポートする
import groupdocs_merger_cloud

# 無料登録後、https://dashboard.groupdocs.cloud から app_sid と app_key を取得します。
app_sid = "xxxxxxx-xxxx-xxxx-xxxx-xxxxxxxxxxxx"
app_key = "xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx"

# ファイル API 構成を取得する 
configuration = groupdocs_merger_cloud.Configuration(app_sid, app_key)
configuration.api_base_url = "https://api.groupdocs.cloud"
storage_name = "LocalStorage"

Python で Word ドキュメントを単一のドキュメントに分割する方法

以下の手順に従って、クラウド上で docx をプログラム的に分割できます。

Word文書をアップロードする

まず、以下のコード例を使用して、Word ファイルをクラウドにアップロードし、Word オンラインからページを抽出します。

# Wordファイルをクラウドストレージにアップロード
# ファイルAPIのインスタンスを作成する
file_api = groupdocs_merger_cloud.FileApi.from_config(configuration)

# ファイルアップロードリクエストを呼び出す
request = groupdocs_merger_cloud.UploadFileRequest("python-testing\word-file.docx", "H:\\groupdocs-cloud-data\\word-file.docx", storage_name)

# Wordファイルをクラウドにアップロードする
response = file_api.upload_file(request)
print(response.uploaded)

その結果、アップロードされたファイルは、クラウド上のダッシュボードの ファイル セクション で利用できるようになります。

Python で Word ドキュメントのページを分割する

以下の手順に従って、プログラムで Word ページを個別のファイルに分割できます。

  • まず、DocumentApiのインスタンスを作成します。
  • 次に、SplitOptions のインスタンスを作成します。
  • 次に、FileInfo のインスタンスを作成します。
  • 入力ファイルのパスを引数として FileInfo に渡します
  • 次に、出力ファイルのパスを指定します
  • 特定のページ番号をカンマ区切りの配列で設定します。
  • ここで、docx 分割モードを Pages に設定します。カンマ区切りの配列でページ番号を分割できます。
  • SplitOptions を使用して SplitRequest を作成する
  • 最後に、SplitRequest を引数として DocumentAPI.split() メソッドを呼び出し、結果を取得します。

次のコード スニペットは、Python の REST API を使用して Word ファイルを個別のページに分割する方法を示しています。

# Python で Word ドキュメントを単一のドキュメントに分割する方法
try:
    # Document API のインスタンスを作成する
    documentApi = groupdocs_merger_cloud.DocumentApi.from_keys(app_sid, app_key)
     
    options = groupdocs_merger_cloud.SplitOptions()
    options.file_info = groupdocs_merger_cloud.FileInfo("python-testing\word-file.docx")
    options.output_path = "python-testing"
    options.pages = [1, 3]
    options.mode = "Pages"

    result = documentApi.split(groupdocs_merger_cloud.SplitRequest(options))
    print("Successfully split word docx to single page document: " + result[0].path)
except groupdocs_merger_cloud.ApiException as e:
  print("Exception while calling API: {0}".format(e.message))
Python で Word ファイルを別々のページに分割する方法

Python で Word ファイルを個別のページに分割する方法

単一ファイルをダウンロードする

最後に、上記のコードサンプルは、Pythonを使用して分離したファイルをクラウド上に保存します。次のコードサンプルを使用してダウンロードできます。

# 分割ファイルをダウンロードするためのAPI初期化
import shutil
file_api = groupdocs_merger_cloud.FileApi.from_config(configuration)

# ダウンロードファイルリクエストの作成
request = groupdocs_merger_cloud.DownloadFileRequest("python-testing\word-file.docx", storage_name)

# 分割ファイルをダウンロード
response = file_api.download_file(request)

# ダウンロードしたファイルをディレクトリに移動します
shutil.move(response, "H:\\groupdocs-cloud-data\\")

Python で Word 文書をページ範囲ごとに単一の文書に分割する

以下の手順を使用して、オンラインで Word 文書をページごとに複数の文書に分割できます。

  • DocumentApi のインスタンスを作成します。
  • 次に、SplitOptions のインスタンスを作成します。
  • 次に、FileInfo のインスタンスを作成します。
  • 入力ファイルのパスを引数として FileInfo に渡します
  • 次に、出力ファイルのパスを指定します as “python-testing”
  • start\page\number と end\page\number の値を設定します
  • 単語を分割するには、docx 分割モードをページに設定します
  • SplitOptions を使用して SplitRequest を作成する
  • 最後に、SplitRequest を引数として DocumentAPI.split() メソッドを呼び出します。

次のコード スニペットは、REST API を使用して Python で Word ドキュメントからページを抽出する方法を示しています。

# Python で Word 文書をページ範囲ごとに単一の文書に分割する方法
try:
    # Document API のインスタンスを作成する
    documentApi = groupdocs_merger_cloud.DocumentApi.from_keys(app_sid, app_key)
     
    options = groupdocs_merger_cloud.SplitOptions()
    options.file_info = groupdocs_merger_cloud.FileInfo("python-testing\word-file.docx")
    options.output_path = "python-testing"
    options.start_page_number = 3
    options.end_page_number = 7
    options.mode = "Pages"

    result = documentApi.split(groupdocs_merger_cloud.SplitRequest(options))
    print("Successfully split Word to single files by page range: " + result[0].path)
except groupdocs_merger_cloud.ApiException as e:
  print("Exception while calling API: {0}".format(e.message))

フィルターを適用して Word 文書を個別のファイルに分割する

以下に示すように、範囲モードを使用してオンラインで Word 文書をページごとに複数の文書に分割し、プログラムでフィルターすることができます。

  • DocumentApi のインスタンスを作成する
  • 次に、SplitOptions のインスタンスを作成します。
  • 次に、FileInfo のインスタンスを作成します。
  • 入力ファイルのパスを引数として FileInfo に渡します
  • 次に、出力ファイルのパスを指定します as “python-testing”
  • start\page\number と end\page\number の値を設定します
  • 次に、range\mode を「OddPages」に設定します。
  • 単語を分割するには、docx 分割モードをページに設定します
  • SplitOptions を使用して SplitRequest を作成する
  • 最後に、SplitRequest を引数として DocumentAPI.split() メソッドを呼び出します。

次のコード スニペットは、Python で REST API を使用してフィルターを適用して Word ドキュメント ページを抽出する方法を示しています。

# フィルターを適用して Word 文書を個別のファイルに分割する方法
try:
    # Document API のインスタンスを作成する
    documentApi = groupdocs_merger_cloud.DocumentApi.from_keys(app_sid, app_key)
     
    options = groupdocs_merger_cloud.SplitOptions()
    options.file_info = groupdocs_merger_cloud.FileInfo("python-testing\word-file.docx")
    options.output_path = "python-testing"
    options.start_page_number = 3
    options.end_page_number = 7
    options.range_mode = "OddPages"
    options.mode = "Pages" # mode Intervals

    result = documentApi.split(groupdocs_merger_cloud.SplitRequest(options))
    print("Successfully split Word by range of pages and using filter: " + result[0].path)
except groupdocs_merger_cloud.ApiException as e:
  print("Exception while calling API: {0}".format(e.message))

Python を使用して Word ドキュメントを複数のファイルに分割する方法

以下の手順に従って、プログラムで Word ファイルを複数のドキュメントに分割できます。

  • DocumentApi のインスタンスを作成する
  • 次に、SplitOptions のインスタンスを作成します。
  • 次に、FileInfo のインスタンスを作成します。
  • 入力ファイルのパスを引数として FileInfo に渡します
  • 次に、出力ファイルのパスを指定します as “python-testing”
  • 次に、ページコレクションを配列形式で設定します
  • docx 分割モードを間隔に設定して単語を分割します
  • SplitOptions を使用して SplitRequest を作成する
  • 最後に、SplitRequest を引数として DocumentAPI.split() メソッドを呼び出します。

次のコード スニペットは、Python の REST API を使用して docx を複数のファイルに分割する方法を示しています。

# Python を使用して Docx ファイルを複数のファイルに分割する方法
try:
    # Document API のインスタンスを作成する
    documentApi = groupdocs_merger_cloud.DocumentApi.from_keys(app_sid, app_key)
     
    options = groupdocs_merger_cloud.SplitOptions()
    options.file_info = groupdocs_merger_cloud.FileInfo("python-testing\word-file.docx")
    options.output_path = "python-testing"
    options.pages = [3, 6, 8]
    options.mode = "Intervals"

    result = documentApi.split(groupdocs_merger_cloud.SplitRequest(options))
    print("Successfully split Word file to multiple files: " + result[0].path)
except groupdocs_merger_cloud.ApiException as e:
  print("Exception while calling API: {0}".format(e.message))

オンライン分割 Word ファイル

Word文書をオンラインで無料で複数のファイルに分割する方法? Word ドキュメントをオンラインで固定ページ数またはさまざまなページ範囲で複数のファイルに無料で分割する Word ドキュメント スプリッター オンライン を試すことができます。複数ページの Word 文書は、元の文書の形式を維持したまま複数の Word ファイルに分割されます。

結論

このチュートリアルでは、次のことを学びました。

  • クラウド上のPythonでWordファイルを2つに分割する方法;
  • Python で docx ファイルを別のファイルに分割する方法;
  • Python でプログラム的に Word 文書をページごとに分割する方法。
  • Python でプログラム的に Word ドキュメントをオンラインで複数のドキュメントに分割する方法。
  • オンラインワードページスプリッターを使用してワードファイルをオンラインで無料で分割する方法;

さらに、ドキュメント を使用して、GroupDocs.Merger Cloud API について詳しく学ぶことができます。また、ブラウザーを通じて直接 API を視覚化し、通信できるようにする API リファレンス セクションも提供しています。さらに、GroupDocs.Merger Cloud SDK for Python ここに例があります を参照してください。

質問する

オンラインで Word 文書からページを抽出する方法についてご質問がある場合は、フォーラム でお気軽にお問い合わせください。

よくある質問

docx スプリッター API を使用してオンラインで Word 文書からページを抽出するにはどうすればよいですか?

オンラインで Word ページを抽出するには、ドキュメント スプリッターの無料ダウンロード Python ライブラリ をインストールします。 API の詳細については、ドキュメント を参照してください。

Word文書をオンラインで無料で分割する最速の方法は何ですか?

オンライン Word ページ抽出ツール は非常に高速に動作し、オンラインで docx を数秒で分割できます。

無料でオンラインでWordからページを抽出するにはどうすればよいですか?

  • オンラインワードページ抽出ツールを開きます。
  • ファイル ドロップ領域内をクリックして Word docx ファイルをアップロードするか、Word ファイルをドラッグ アンド ドロップします。
  • 「変換」ボタンをクリックします。ドキュメントがアップロードされ、DOC 形式に変換されます。
  • 出力ファイルのダウンロード リンクは、分割後すぐに利用できるようになります。

無料のオンライン ドキュメント スプリッターを使用しても安全ですか?

はい、ドキュメント スプリッター Word は安全であり、アップロードされたファイルには誰もアクセスできません。アップロードされたファイルは 24 時間後に削除されます。

関連項目