Jak extrahovat stránky z dokumentů aplikace Word v Pythonu

Jak extrahovat stránky z dokumentů aplikace Word v Pythonu

Možná budete muset programově rozdělit dokument aplikace Word na více dokumentů podle stránky. Rozdělením dokumentů aplikace Word můžete snadno extrahovat stránku z dokumentu aplikace Word a sdílet konkrétní informace nebo data se zúčastněnými stranami. Jako vývojář Pythonu můžete dokument Word rozdělit do samostatných souborů online v cloudu. V tomto článku se dozvíte, jak extrahovat stránky z wordových dokumentů v Pythonu.

Tento článek o rozdělování stránek slov by měl obsahovat následující témata:

Word Documents Splitter REST API - Python SDK

K rozdělení wordového souboru do více souborů budu používat Python SDK of GroupDocs.Merger Cloud API. Umožňuje otáčet, rozdělovat, spojovat, odstraňovat a přeskupovat jednu stránku nebo kolekci stránek z podporovaných formátů dokumentů z Word, Excel, kresby Visio, PDF a HTML. Python úložiště zdrojového kódu je volně dostupný na GitHubu.

Word file splitter je zdarma ke stažení. Word doc splitter můžete nainstalovat do vaší Python aplikace pomocí PIP z PyPI pomocí následujícího příkazu v terminálu:

pip install groupdocs-merger-cloud

Před provedením níže uvedených kroků získejte své ID klienta a tajný klíč z řídicího panelu. Jakmile budete mít své ID a tajemství, přidejte do své aplikace níže uvedený kód a rozdělte dokument aplikace Word do samostatných souborů, jak je uvedeno níže:

# Importujte sadu SDK pro sloučení skupinových dokumentů
import groupdocs_merger_cloud

# Získejte app_sid & app_key z https://dashboard.groupdocs.cloud po bezplatné registraci.
app_sid = "xxxxxxx-xxxx-xxxx-xxxx-xxxxxxxxxxxx"
app_key = "xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx"

# Získejte konfigurace API souboru 
configuration = groupdocs_merger_cloud.Configuration(app_sid, app_key)
configuration.api_base_url = "https://api.groupdocs.cloud"
storage_name = "LocalStorage"

Jak rozdělit dokument Word na jeden dokument v Pythonu

Dokument docx můžete programově rozdělit v cloudu podle níže uvedených kroků.

Nahrajte dokument aplikace Word

Nejprve nahrajeme soubory aplikace Word do cloudu, abychom extrahovali stránky z aplikace Word online pomocí příkladu kódu uvedeného níže:

# Nahrajte soubor Word do cloudového úložiště
# Vytvořte instanci souborového API
file_api = groupdocs_merger_cloud.FileApi.from_config(configuration)

# Zavolejte žádost o nahrání souboru
request = groupdocs_merger_cloud.UploadFileRequest("python-testing\word-file.docx", "H:\\groupdocs-cloud-data\\word-file.docx", storage_name)

# Nahrajte soubor word do cloudu
response = file_api.upload_file(request)
print(response.uploaded)

V důsledku toho budou nahrané soubory dostupné v sekce souborů vašeho řídicího panelu v cloudu.

Rozdělte stránky dokumentu Word v Pythonu

Stránky aplikace Word můžete programově rozdělit do samostatných souborů podle následujících kroků:

  • Nejprve vytvořte instanci DocumentApi.
  • Poté vytvořte instanci SplitOptions
  • Nyní vytvořte instanci souboru FileInfo
  • Předejte cestu vstupního souboru jako argument FileInfo
  • Dále zadejte cestu k výstupnímu souboru
  • Nastavte konkrétní čísla stránek v poli odděleném čárkami
  • Nyní nastavte režim rozdělení docx na Pages. Umožňuje rozdělit čísla stránek do pole odděleného čárkami
  • Vytvořte SplitRequest pomocí SplitOptions
  • Nakonec zavolejte metodu DocumentAPI.split() s argumentem SplitRequest a získejte výsledky

Následující fragment kódu ukazuje, jak rozdělit soubor Word na samostatné stránky pomocí REST API v Pythonu:

# Jak rozdělit dokument Word na jeden dokument v Pythonu
try:
    # Vytvořte instanci rozhraní Document API
    documentApi = groupdocs_merger_cloud.DocumentApi.from_keys(app_sid, app_key)
     
    options = groupdocs_merger_cloud.SplitOptions()
    options.file_info = groupdocs_merger_cloud.FileInfo("python-testing\word-file.docx")
    options.output_path = "python-testing"
    options.pages = [1, 3]
    options.mode = "Pages"

    result = documentApi.split(groupdocs_merger_cloud.SplitRequest(options))
    print("Successfully split word docx to single page document: " + result[0].path)
except groupdocs_merger_cloud.ApiException as e:
  print("Exception while calling API: {0}".format(e.message))
Jak rozdělit soubor Word na samostatné stránky v Pythonu

Jak rozdělit soubor Word na samostatné stránky v Pythonu

Stáhněte si jednotný soubor

Nakonec výše uvedená ukázka kódu uloží oddělený soubor do cloudu pomocí pythonu. Lze jej stáhnout pomocí následující ukázky kódu:

# Inicializace API pro stažení samostatného souboru
import shutil
file_api = groupdocs_merger_cloud.FileApi.from_config(configuration)

# Vytvořit požadavek na stažení souboru
request = groupdocs_merger_cloud.DownloadFileRequest("python-testing\word-file.docx", storage_name)

# Stáhnout oddělený soubor
response = file_api.download_file(request)

# Přesuňte stažený soubor do svého adresáře
shutil.move(response, "H:\\groupdocs-cloud-data\\")

Rozdělte dokument Word na jednotlivé podle rozsahu stránek v Pythonu

Word dokument můžete rozdělit do více dokumentů podle stránek online pomocí následujících kroků uvedených níže:

  • Vytvořte instanci DocumentApi
  • Poté vytvořte instanci SplitOptions
  • Nyní vytvořte instanci souboru FileInfo
  • Předejte cestu vstupního souboru jako argument FileInfo
  • Dále zadejte cestu k výstupnímu souboru as “python-testing”
  • Nastavte hodnoty start\page\number a end\page\number
  • Chcete-li rozdělit slovo, nastavte režim rozdělení docx na Stránky
  • Vytvořte SplitRequest pomocí SplitOptions
  • Nakonec zavolejte metodu DocumentAPI.split() s argumentem SplitRequest

Následující fragment kódu ukazuje, jak extrahovat stránky z wordového dokumentu v Pythonu pomocí REST API:

# Jak rozdělit dokument Word na jednotlivé podle rozsahu stránek v Pythonu
try:
    # Vytvořte instanci rozhraní Document API
    documentApi = groupdocs_merger_cloud.DocumentApi.from_keys(app_sid, app_key)
     
    options = groupdocs_merger_cloud.SplitOptions()
    options.file_info = groupdocs_merger_cloud.FileInfo("python-testing\word-file.docx")
    options.output_path = "python-testing"
    options.start_page_number = 3
    options.end_page_number = 7
    options.mode = "Pages"

    result = documentApi.split(groupdocs_merger_cloud.SplitRequest(options))
    print("Successfully split Word to single files by page range: " + result[0].path)
except groupdocs_merger_cloud.ApiException as e:
  print("Exception while calling API: {0}".format(e.message))

Rozdělte dokumenty aplikace Word do samostatných souborů použitím filtru

Word dokument můžete rozdělit do více dokumentů podle stránky online pomocí režimu rozsahu a programově filtrovat, jak je uvedeno níže:

  • Vytvořte instanci DocumentApi
  • Poté vytvořte instanci SplitOptions
  • Nyní vytvořte instanci souboru FileInfo
  • Předejte cestu vstupního souboru jako argument FileInfo
  • Dále zadejte cestu k výstupnímu souboru as “python-testing”
  • Nastavte hodnoty start\page\number a end\page\number
  • Dále nastavte rozsah\režim na „OddPages“
  • Chcete-li rozdělit slovo, nastavte režim rozdělení docx na Stránky
  • Vytvořte SplitRequest pomocí SplitOptions
  • Nakonec zavolejte metodu DocumentAPI.split() s argumentem SplitRequest

Následující fragment kódu ukazuje, jak extrahovat stránky dokumentu Word použitím filtru pomocí REST API v Pythonu:

# Jak rozdělit dokumenty aplikace Word do samostatných souborů pomocí filtru
try:
    # Vytvořte instanci rozhraní Document API
    documentApi = groupdocs_merger_cloud.DocumentApi.from_keys(app_sid, app_key)
     
    options = groupdocs_merger_cloud.SplitOptions()
    options.file_info = groupdocs_merger_cloud.FileInfo("python-testing\word-file.docx")
    options.output_path = "python-testing"
    options.start_page_number = 3
    options.end_page_number = 7
    options.range_mode = "OddPages"
    options.mode = "Pages" # mode Intervals

    result = documentApi.split(groupdocs_merger_cloud.SplitRequest(options))
    print("Successfully split Word by range of pages and using filter: " + result[0].path)
except groupdocs_merger_cloud.ApiException as e:
  print("Exception while calling API: {0}".format(e.message))

Jak rozdělit dokument Word do více souborů pomocí Pythonu

Soubor aplikace Word můžete programově rozdělit na více dokumentů podle následujících kroků:

  • Vytvořte instanci DocumentApi
  • Poté vytvořte instanci SplitOptions
  • Nyní vytvořte instanci souboru FileInfo
  • Předejte cestu vstupního souboru jako argument FileInfo
  • Dále zadejte cestu k výstupnímu souboru as “python-testing”
  • Poté nastavte kolekci stránek ve formátu pole
  • Pro rozdělení slova nastavte režim rozdělení docx na Intervaly
  • Vytvořte SplitRequest pomocí SplitOptions
  • Nakonec zavolejte metodu DocumentAPI.split() s argumentem SplitRequest

Následující fragment kódu ukazuje, jak rozdělit docx do více souborů pomocí REST API v Pythonu:

# Jak rozdělit soubory Docx na více souborů pomocí Pythonu
try:
    # Vytvořte instanci rozhraní Document API
    documentApi = groupdocs_merger_cloud.DocumentApi.from_keys(app_sid, app_key)
     
    options = groupdocs_merger_cloud.SplitOptions()
    options.file_info = groupdocs_merger_cloud.FileInfo("python-testing\word-file.docx")
    options.output_path = "python-testing"
    options.pages = [3, 6, 8]
    options.mode = "Intervals"

    result = documentApi.split(groupdocs_merger_cloud.SplitRequest(options))
    print("Successfully split Word file to multiple files: " + result[0].path)
except groupdocs_merger_cloud.ApiException as e:
  print("Exception while calling API: {0}".format(e.message))

Online rozdělený soubor Word

Jak rozdělit dokument aplikace Word do více souborů online zdarma? Můžete vyzkoušet náš word document splitter online pro rozdělení wordového dokumentu do více souborů online zdarma podle pevného počtu stránek nebo v různých rozsazích stránek. Vícestránkové wordové dokumenty jsou rozděleny do více wordových souborů při zachování formátu původního dokumentu.

Závěr

V tomto tutoriálu jsme se naučili:

  • jak rozdělit soubor word na dva v Pythonu v cloudu;
  • jak rozdělit soubor docx na samostatné soubory v Pythonu;
  • Jak programově rozdělit dokument Word podle stránek v Pythonu;
  • jak programově rozdělit wordový dokument do více dokumentů online v Pythonu;
  • jak rozdělit textový soubor online zdarma pomocí online rozdělovače slovních stránek;

Kromě toho se můžete dozvědět více o GroupDocs.Merger Cloud API pomocí dokumentace. Poskytujeme také sekci API Reference, která vám umožní vizualizovat a komunikovat s našimi API přímo prostřednictvím prohlížeče. Kromě toho se podívejte na sadu GroupDocs.Merger Cloud SDK pro Python Příklady zde.

Položit otázku

Pokud máte nějaké dotazy ohledně toho, jak extrahovat stránky z dokumentu Word online, neváhejte se nás zeptat na fóru

Nejčastější dotazy

Jak extrahovat stránky z dokumentu Word online pomocí docx splitter API?

Nainstalujte si rozdělovač dokumentů ke stažení zdarma Knihovna Python a extrahujte stránky aplikace Word online. Úplné podrobnosti o rozhraní API naleznete v dokumentaci.

Jaký je nejrychlejší způsob, jak rozdělit wordový dokument zdarma online?

Word page extractor online funguje velmi rychle a docx můžete rozdělit online během několika sekund.

Jak extrahovat stránku z wordu online zdarma?

  • Otevřete online extraktor stránek slov.
  • Kliknutím do oblasti přetažení souboru nahrajete soubor word docx nebo přetáhnete soubor word.
  • Klikněte na tlačítko Převést. Váš dokument bude nahrán a převeden do formátu DOC.
  • Odkaz na stažení výstupních souborů bude k dispozici okamžitě po rozdělení.

Je bezpečné používat bezplatný online rozdělovač dokumentů?

Ano, document splitter word je bezpečný a nikdo nemá přístup k vašim nahraným souborům. Nahrané soubory mažeme po 24 hodinách.

Viz také