Analizza i documenti per estrarre testo, immagini e informazioni sui documenti

GroupDocs sta uscendo per condividere la prima versione di GroupDocs.Parser Cloud. È una soluzione API REST indipendente dalla piattaforma pronta all’uso per analizzare ed estrarre dati da tutti i formati di file aziendali comuni senza dipendere da strumenti o plug-in di terze parti. Gli sviluppatori possono integrarlo con la loro applicazione Web, desktop, mobile o cloud senza alcuna curva di apprendimento importante perché può essere utilizzato su qualsiasi piattaforma o linguaggio che supporti REST.

Cos’è GroupDocs.Parser Cloud?

Supponiamo che tu stia sviluppando un sistema di gestione dei documenti e necessiti di una funzione per la ricerca o l’analisi del testo, non sarebbe fantastico se il tuo sistema fosse in grado di leggere o analizzare un’ampia gamma di tipi di documenti senza installare il relativo lettore di documenti?

GroupDocs.Parser Cloud raggiunge lo scopo sopra menzionato. È un’API REST per l’estrazione dei dati dei documenti che supporta oltre 50 tipi di documenti. Una delle funzionalità più preziose di GroupDocs.Parser Cloud è l’analisi dei documenti con modelli predefiniti. È facile definire un modello ed estrarre dati da documenti aziendali, ad esempio fatture, ricevute, preventivi, lettere, ecc. Non si limita all’estrazione del testo, ma è anche possibile estrarre immagini dai tipi di documenti supportati. L’API può essere utilizzata non solo con documenti regolari, ma anche con contenitori come archivi ZIP, file di dati di posta OST/PST e portfolio PDF. Risparmia un po’ di tempo e visita note di rilascio di una prima versione pubblica per un elenco completo delle sue funzionalità.

Come funziona?

Puoi utilizzare le funzionalità di GroupDocs.Parser Cloud nella tua applicazione in due modi. Usalo tramite un client REST o usa il nostro SDK direttamente nel tuo linguaggio di programmazione preferito. È possibile trovare un elenco completo di SDK dal repository Github di GroupDocs.Parser.

Qui dimostrerò la funzionalità di GroupDocs.Parser Cloud analizzando un documento word con un modello predefinito. Sto usando un client REST; cURL uno strumento da riga di comando.

Per prima cosa, prima di procedere, registrati con groupdocs.cloud e ottieni il SID dell’app e la chiave dell’app per autenticare le tue chiamate API rest.

Crea modello

Come condiviso sopra, GroupDocs.Parser Cloud consente agli utenti di analizzare il documento con modelli predefiniti per estrarre i dati dal documento. Creeremo un modello per il seguente documento Word e lo salveremo nella memoria predefinita.

Eccoci, segui questi passaggi per creare un modello semplice:

esempio di URL:

· Ottieni token di accesso

· Crea modello

// Per prima cosa ottieni il token di accesso
// Ottieni la chiave dell'app e il SID dell'app da https://dashboard.groupdocs.cloud/
curl -X POST "https://api.groupdocs.cloud/connect/token" 
-d "grant_type=client_credentials&client_id=[App_SID]&client_secret=[App_Key]" 
-H "Content-Type: application/x-www-form-urlencoded" 
-H "Accept: application/json"

// Crea un modello per l'analisi e salvalo nell'archivio predefinito di GroupDocs
curl -X PUT "https://api.groupdocs.cloud/v1.0/parser/template" 
-H "accept: application/json" 
-H "authorization: Bearer [Access_TOken]" 
-H "Content-Type: application/json" 
-d "{
  "Template": {
    "Fields": [
      {
        "FieldName": "Address",
        "FieldPosition": {
          "FieldPositionType": "Regex",
          "Regex": "Company address:",
          "MatchCase": false,
          "IsLeftLinked": false,
          "IsRightLinked": false,
          "IsTopLinked": false,
          "IsBottomLinked": false,
          "AutoScale": false
        }
      },
      {
        "FieldName": "CompanyAddress",
        "FieldPosition": {
          "FieldPositionType": "Linked",
          "MatchCase": false,
          "LinkedFieldName": "ADDRESS",
          "IsLeftLinked": false,
          "IsRightLinked": true,
          "IsTopLinked": false,
          "IsBottomLinked": false,
          "SearchArea": {
            "Height": 10.0,
            "Width": 100.0
          },
          "AutoScale": true
        }
      },
      {
        "FieldName": "Company",
        "FieldPosition": {
          "FieldPositionType": "Regex",
          "Regex": "Company name:",
          "MatchCase": false,
          "IsLeftLinked": false,
          "IsRightLinked": false,
          "IsTopLinked": false,
          "IsBottomLinked": false,
          "AutoScale": false
        }
      },
      {
        "FieldName": "CompanyName",
        "FieldPosition": {
          "FieldPositionType": "Linked",
          "MatchCase": false,
          "LinkedFieldName": "Company",
          "IsLeftLinked": false,
          "IsRightLinked": true,
          "IsTopLinked": false,
          "IsBottomLinked": false,
          "SearchArea": {
            "Height": 10.0,
            "Width": 100.0
          },
          "AutoScale": true
        }
      }
    ],
    "Tables": [
      {
        "TableName": "Companies",
        "DetectorParameters": {
          "Rectangle": {
            "Position": {
              "X": 77.0,
              "Y": 279.0
            },
            "Size": {
              "Height": 60.0,
              "Width": 480.0
            }
          }
        }
      }
    ]
  },
  "TemplatePath": "Temp/companies.json"
}"

Analizza documento

Ora analizzeremo il documento di Word utilizzando il modello predefinito dall’archivio, generato sopra. Il modello può essere fornito come oggetto o percorso di archiviazione, controlla il documento analisi per modello per maggiori dettagli.

esempio di URL:

// Per prima cosa ottieni il token di accesso
// Ottieni la chiave dell'app e il SID dell'app da https://dashboard.groupdocs.cloud/
curl -X POST "https://api.groupdocs.cloud/connect/token" 
-d "grant_type=client_credentials&client_id=[App_SID]&client_secret=[App_Key]" 
-H "Content-Type: application/x-www-form-urlencoded" 
-H "Accept: application/json"

// Carica il documento di origine nell'archivio predefinito di GrupDocs
curl -X PUT "https://api.groupdocs.cloud/v1.0/parser/storage/file/Temp/companies.docx" 
-H "accept: application/json" 
-H "authorization: Bearer [Access_Token]" 
-H "Content-Type: multipart/form-data" 
-F "File=@C:/Temp/companies.docx"

// Analizza per modello archiviato nell'archivio predefinito di GroupDocs
curl -X POST "https://api.groupdocs.cloud/v1.0/parser/parse" 
-H "accept: application/json" 
-H "authorization: Bearer [Access_Token]" 
-H "Content-Type: application/json" 
-d "{ "FileInfo": { "FilePath": "Temp/companies.docx", }, "TemplatePath": "Temp/companies.json"}"

Qual è il prossimo?

Inizia oggi stesso una prova gratuita di GroupDocs.Parser Cloud: tutto ciò di cui hai bisogno è iscriverti al servizio GroupDocs Cloud. Dopo esserti registrato, sei pronto per provare le potenti funzionalità di elaborazione dei file offerte da GroupDocs.Parser Cloud utilizzando le seguenti risorse.

Se hai domande o suggerimenti, non esitare a scriverci su GroupDocs.Parser Cloud Forum.