Extrahujte text z XML v Pythonu pomocí REST API.

XML(eXtensible Markup Language) je oblíbený datový formát pro ukládání a výměnu strukturovaných informací. Je široce používán v různých oblastech, včetně vývoje webu, ukládání dat a přenosu dat. Extrahování textu ze souborů XML je klíčové z mnoha důvodů. Umožňuje nám přistupovat a manipulovat se skutečnými daty obsaženými v dokumentech XML. Extrakcí textu můžeme provádět různé operace, jako je analýza dat, transformace dat a integrace dat. V tomto článku prozkoumáme, jak extrahovat text z XML v Pythonu pomocí REST API.

Tento článek bude obsahovat následující témata:

Python REST API pro analýzu dokumentu XML a instalace SDK

GroupDocs.Parser Cloud SDK pro Python je výkonný nástroj, který zjednodušuje extrakci textu z XML a dalších formátů souborů. Poskytuje širokou škálu funkcí, včetně analýzy dokumentů, extrakce textu, extrakce metadat a mnoha dalších. Díky intuitivnímu rozhraní API mohou vývojáři snadno integrovat možnosti extrakce textu do svých aplikací Python. Podporuje také C# .NET, Java, PHP, Ruby a Node.js SDK jako členové rodiny analyzátorů dokumentů pro Cloud API. SDK lze integrovat do aplikace založené na Pythonu, aby se zjednodušil váš vývojový proces a zvýšila produktivita.

Nainstalujte GroupDocs.Parser Cloud do svého projektu Python pomocí pip (instalátor balíčku pro Python) pomocí následujícího příkazu v konzole k extrahování informací z XML:

pip install groupdocs_parser_cloud

Nyní prosím získejte své ID klienta a tajný klíč klienta z dashboard a přidejte kód, jak je uvedeno níže:

# Importujte sadu SDK analyzátoru groupdocs
import groupdocs_parser_cloud

# Získejte app_sid & app_key z https://dashboard.groupdocs.cloud po bezplatné registraci.
app_sid = "xxxxxxx-xxxx-xxxx-xxxx-xxxxxxxxxxxx"
app_key = "xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx"

# Získejte konfigurace API souboru.
configuration = groupdocs_parser_cloud.Configuration(app_sid, app_key)
configuration.api_base_url = "https://api.groupdocs.cloud"
storage_name = "LocalStorage"

Extrahujte veškerý text ze souboru XML v Pythonu pomocí REST API

Chcete-li extrahovat text z dokumentů XML v Pythonu pomocí GroupDocs.Parser Cloud SDK pro Python, postupujte takto:

Nahrajte soubor

Nejprve nahrajte dokument XML do cloudu pomocí příkladu kódu uvedeného níže:

# Vytvořte instanci souborového API
file_api = groupdocs_parser_cloud.FileApi.from_config(configuration)

# Zavolejte žádost o nahrání souboru
request = groupdocs_parser_cloud.UploadFileRequest("python-testing\input-sample-file.pdf", "H:\\groupdocs-cloud-data\\input-sample-file.pdf", storage_name)

# Nahrajte soubor do cloudu
response = file_api.upload_file(request)
print(response.uploaded)

V důsledku toho bude nahraný soubor XML dostupný v sekce souborů vašeho řídicího panelu v cloudu.

Extrahujte veškerý text z dat XML pomocí Pythonu

V této části napíšeme kroky a ukázkový úryvek kódu, který ukazuje, jak extrahovat text z dokumentu XML v Pythonu pomocí GroupDocs.Parser Cloud SDK pro Python:

  • Nejprve vytvořte instanci třídy ParseApi.
  • Za druhé vytvořte instanci třídy TextOptions().
  • Zatřetí vytvořte instanci třídy FileInfo.
  • A přiřaďte jej k metodě textových voleb fileInfo.
  • Dále nastavte cestu k souboru XML jako vstup.
  • Nyní vytvořte instanci třídy TextRequest() a předejte parametr TextOptions.
  • Nakonec získejte výsledky voláním metody ParseApi.text() a předáním parametru TextRequest.

Následující ukázka kódu ukazuje, jak extrahovat text z dokumentu XML v Pythonu pomocí REST API:

# Jak extrahovat text z XML v Pythonu pomocí REST API
try:
  # inicializace api
  parseApi = groupdocs_parser_cloud.ParseApi.from_config(configuration)

  # definovat možnosti textu
  options = groupdocs_parser_cloud.TextOptions()
  options.file_info = groupdocs_parser_cloud.FileInfo()
  options.file_info.file_path = "python-testing/input-sample-file.xml"

  request = groupdocs_parser_cloud.TextRequest(options)
  result = parseApi.text(request)

  print("Successfully extracted text: " + result.text)
except groupdocs_parser_cloud.ApiException as e:
  print("Exception while calling API: {0}".format(e.message))

Výstup můžete vidět na obrázku níže:

Python Extrahujte text ze souboru XML

Extrahujte veškerý text z dat XML pomocí Pythonu.

Zdarma online analyzátor dokumentů

Jak extrahovat text z XML online zdarma? Vyzkoušejte prosím online XML parser software k extrahování dat ze souborů XML. Tento nástroj XML Parser je vyvíjen pomocí výše uvedené knihovny parseru Python.

Závěr

Závěrem lze říci, že extrahování textu ze souborů XML je základním úkolem při práci s daty XML. Python ve spojení s GroupDocs.Parser Cloud SDK poskytuje spolehlivé a efektivní řešení pro extrakci textu ze souborů XML. Z tohoto článku jste se dozvěděli následující:

  • jak extrahovat veškerý text z dokumentů XML v Pythonu pomocí REST API;
  • programově nahrát soubor XML do cloudu pomocí Pythonu;
  • a online software pro extrakci dat XML pro analýzu dokumentů XML.

Kromě toho se můžete dozvědět více o GroupDocs.Parser Cloud API pomocí dokumentace. Poskytujeme také sekci API Reference, která vám umožní vizualizovat a pracovat s našimi API přímo prostřednictvím prohlížeče. Úplný zdrojový kód Python SDK je volně dostupný na Github.

Konečně píšeme nové články na blogu o různých formátech souborů a analýze pomocí REST API. Proto nás prosím kontaktujte pro nejnovější aktualizace.

Položit otázku

V případě, že byste měli nějaké dotazy nebo nejasnosti ohledně analyzátoru dokumentů XML, neváhejte nás kontaktovat prostřednictvím našeho fóra.

Nejčastější dotazy

Proč potřebujeme extrahovat text ze souborů XML?

Extrahování textu ze souborů XML nám umožňuje přistupovat a manipulovat se skutečnými daty obsaženými v dokumentech XML.

Jak mohu extrahovat text ze souborů XML pomocí Pythonu?

Text můžete extrahovat ze souborů XML pomocí GroupDocs.Parser Cloud SDK pro Python, který poskytuje výkonné možnosti extrakce textu.

Je možné extrahovat metadata ze souborů XML pomocí GroupDocs.Parser Cloud SDK pro Python?

Ano, GroupDocs.Parser Cloud SDK pro Python podporuje extrahování metadat ze souborů XML. Můžete získat informace o metadatech, jako je autor, datum vytvoření, datum úpravy a další.

Mohu extrahovat obrázky vložené do souborů XML pomocí GroupDocs.Parser Cloud SDK pro Python?

Ano, GroupDocs.Parser Cloud SDK pro Python umožňuje extrahovat obrázky vložené do souborů XML a převádět je do různých formátů.

Viz také

Zde je několik souvisejících článků, které vám mohou pomoci: