Estrai testo da XML in Python utilizzando l'API REST.

XML(eXtensible Markup Language) è un formato di dati diffuso per l’archiviazione e lo scambio di informazioni strutturate. È ampiamente utilizzato in vari domini, tra cui lo sviluppo web, l’archiviazione dei dati e il trasferimento dei dati. L’estrazione di testo da file XML è fondamentale per molte ragioni. Ci consente di accedere e manipolare i dati effettivi contenuti nei documenti XML. Estraendo il testo, possiamo eseguire varie operazioni, come l’analisi dei dati, la trasformazione dei dati e l’integrazione dei dati. In questo articolo, esploreremo come estrarre il testo da XML in Python utilizzando l’API REST.

In questo articolo saranno trattati i seguenti argomenti:

API REST Python per analizzare documenti XML e installazione SDK

GroupDocs.Parser Cloud SDK for Python è un potente strumento che semplifica l’estrazione di testo da XML e altri formati di file. Fornisce una vasta gamma di funzionalità, tra cui l’analisi dei documenti, l’estrazione del testo, l’estrazione dei metadati e molto altro. Con la sua API intuitiva, gli sviluppatori possono integrare facilmente le funzionalità di estrazione del testo nelle loro applicazioni Python. Supporta anche C# .NET, Java, PHP, Ruby e Node.js SDK come document parser family members per l’API Cloud. L’SDK può essere integrato in un’applicazione basata su Python per semplificare il processo di sviluppo e migliorare la produttività.

Installa GroupDocs.Parser Cloud nel tuo progetto Python con pip (package installer for Python) utilizzando il seguente comando nella console per estrarre informazioni da XML:

pip install groupdocs_parser_cloud

Ora, ottieni il tuo ID cliente e segreto cliente dalla dashboard e aggiungi il codice come mostrato di seguito:

# Importa l'SDK del parser di groupdocs
import groupdocs_parser_cloud

# Ottieni app_sid e app_key da https://dashboard.groupdocs.cloud dopo la registrazione gratuita.
app_sid = "xxxxxxx-xxxx-xxxx-xxxx-xxxxxxxxxxxx"
app_key = "xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx"

# Ottieni le configurazioni dell'API File.
configuration = groupdocs_parser_cloud.Configuration(app_sid, app_key)
configuration.api_base_url = "https://api.groupdocs.cloud"
storage_name = "LocalStorage"

Estrai tutto il testo dal file XML in Python utilizzando l’API REST

Per estrarre testo da documenti XML in Python utilizzando GroupDocs.Parser Cloud SDK for Python, procedi nel seguente modo:

  • Carica il file XML nel cloud
  • Estrai tutto il testo da XML usando Python

Carica il file

Innanzitutto, carica il documento XML nel cloud utilizzando l’esempio di codice fornito di seguito:

# Crea un'istanza dell'API file
file_api = groupdocs_parser_cloud.FileApi.from_config(configuration)

# Chiama la richiesta di caricamento del file
request = groupdocs_parser_cloud.UploadFileRequest("python-testing\input-sample-file.pdf", "H:\\groupdocs-cloud-data\\input-sample-file.pdf", storage_name)

# Carica il file nel cloud
response = file_api.upload_file(request)
print(response.uploaded)

Di conseguenza, il file XML caricato sarà disponibile nella sezione file della dashboard sul cloud.

Estrai tutto il testo dai dati XML usando Python

In questa sezione, scriveremo i passaggi e uno snippet di codice di esempio che dimostra come estrarre il testo da un documento XML in Python utilizzando GroupDocs.Parser Cloud SDK per Python:

  • Innanzitutto, crea un’istanza della classe ParseApi.
  • In secondo luogo, creare un’istanza della classe TextOptions().
  • In terzo luogo, crea un’istanza della classe FileInfo.
  • E assegnalo al metodo fileInfo delle opzioni di testo.
  • Successivamente, imposta il percorso del file XML come input.
  • Creare ora un’istanza della classe TextRequest() e passare il parametro TextOptions.
  • Infine, ottieni i risultati chiamando il metodo ParseApi.text() e passando il parametro TextRequest.

Il seguente esempio di codice mostra come estrarre il testo da un documento XML in Python utilizzando l’API REST:

# Come estrarre testo da XML in Python utilizzando l'API REST
try:
  # inizializzazione dell'API
  parseApi = groupdocs_parser_cloud.ParseApi.from_config(configuration)

  # definire le opzioni di testo
  options = groupdocs_parser_cloud.TextOptions()
  options.file_info = groupdocs_parser_cloud.FileInfo()
  options.file_info.file_path = "python-testing/input-sample-file.xml"

  request = groupdocs_parser_cloud.TextRequest(options)
  result = parseApi.text(request)

  print("Successfully extracted text: " + result.text)
except groupdocs_parser_cloud.ApiException as e:
  print("Exception while calling API: {0}".format(e.message))

Puoi vedere l’output nell’immagine qui sotto:

Python Estrai testo da file XML

Estrai tutto il testo dai dati XML usando Python.

Analizzatore di documenti online gratuito

Come estrarre testo da XML online gratuitamente? Prova un software di parser XML online per estrarre i dati dai file XML. Questo strumento XML Parser è sviluppato utilizzando la suddetta libreria di parser Python.

Conclusione

In conclusione, l’estrazione di testo da file XML è un compito fondamentale quando si lavora con dati XML. Python, abbinato a GroupDocs.Parser Cloud SDK, fornisce una soluzione affidabile ed efficiente per l’estrazione di testo da file XML. Quanto segue è ciò che hai imparato da questo articolo:

  • come estrarre tutto il testo dai documenti XML in Python utilizzando l’API REST;
  • caricare in modo programmatico un file XML nel cloud utilizzando Python;
  • e software di estrazione dati XML online per analizzare documenti XML.

Inoltre, puoi saperne di più su GroupDocs.Parser Cloud API utilizzando la documentazione. Forniamo anche una sezione Riferimento API che ti consente di visualizzare e interagire con le nostre API direttamente attraverso il browser. Il codice sorgente completo di Python SDK è disponibile gratuitamente su GitHub.

Infine, continuiamo a scrivere nuovi articoli di blog su diversi formati di file e l’analisi utilizzando l’API REST. Quindi, ti preghiamo di contattarci per gli ultimi aggiornamenti.

Fai una domanda

In caso di domande o dubbi sul parser di documenti XML, non esitate a contattarci tramite il nostro forum.

Domande frequenti

Perché abbiamo bisogno di estrarre il testo dai file XML?

L’estrazione di testo da file XML ci consente di accedere e manipolare i dati effettivi contenuti nei documenti XML.

Come posso estrarre il testo dai file XML usando Python?

Puoi estrarre il testo dai file XML utilizzando GroupDocs.Parser Cloud SDK for Python, che offre potenti funzionalità di estrazione del testo.

È possibile estrarre metadati da file XML utilizzando GroupDocs.Parser Cloud SDK per Python?

Sì, GroupDocs.Parser Cloud SDK for Python supporta l’estrazione di metadati da file XML. È possibile recuperare informazioni sui metadati come autore, data di creazione, data di modifica e altro.

Posso estrarre immagini incorporate in file XML utilizzando GroupDocs.Parser Cloud SDK per Python?

Sì, GroupDocs.Parser Cloud SDK for Python consente di estrarre immagini incorporate in file XML e convertirle in diversi formati.

Guarda anche

Ecco alcuni articoli correlati che potresti trovare utili: