Fusionner, extraire du texte, des images et des métadonnées

Nous sommes heureux de partager un aperçu de la prochaine API GroupDocs.Parser Cloud, un nouvel ajout à la liste de produits groupdocs.cloud. GroupDocs.Parser Cloud est une solution d’analyse de documents. En tant que développeur, vous pourrez ajouter une fonctionnalité d’analyse de documents dans vos applications sur n’importe quelle plate-forme sans dépendre d’un plug-in ou d’un outil tiers. La principale caractéristique de cette API REST sera d’analyser des documents sur des modèles définis par l’utilisateur pour extraire des données de vos factures, devis ou autres types de documents commerciaux.

Certaines des fonctionnalités prises en charge dans l’API à venir sont les suivantes. L’API REST ne se limitera pas aux fonctionnalités suivantes, mais nous continuerons d’ajouter de nouvelles fonctionnalités utiles.

Caractéristiques

  • Analyser le document par modèle

  • Extraire le texte

    • Extraire uniquement le texte

    • Extraire le texte formaté à l’aide de l’option de mode d’extraction ; Texte brut, HTML et Réduction

    • Extraire le texte de pages spécifiques en définissant la plage de pages

  • Extraire des images

  • Extraction d’informations sur les documents

  • Gestion des modèles

Formats pris en charge

Dans la première version de l’API Cloud GroupDocs.Parser, nous prendrons en charge les formats de fichiers suivants :

DOC

Document Microsoft Word

POINT

Modèle de document Microsoft Word

DOCX

Document Office XML ouvert

DOCM

Document compatible avec les macros Office Open XML

DOTX

Modèle de document Office Open XML

DOTM

Modèle de document Office Open XML prenant en charge les macros

TXT

Texte brut

ODT

Ouvrir le texte du document

OTT

Modèle de texte de document ouvert

RTF

Format de texte enrichi

PDF

Fichier de format de document portable

HTML

Fichier de langage de balisage hypertexte

XHTML

Extensible Fichier de langage de balisage hypertexte

MHTML

Fichier HTML MIME

MD

Réduction

XML

Fichier XML

CHM

Fichier d’aide HTML compilé

EPUB

Format de fichier de livre électronique numérique

FB2

Fichier FictionBook 2.0

XLS

Feuille de calcul Microsoft Excel

XLT

Modèle Microsoft Excel

XLSX

Feuille de calcul Office Open XML

XLSM

Feuille de calcul Office Open XML prenant en charge les macros

XLSB

Feuille de calcul binaire Office Open XML

XLTX

Modèle de feuille de calcul Office Open XML

XLTM

Modèle de feuille de calcul Office Open XML prenant en charge les macros

ODS

Ouvrir la feuille de calcul du document

OTS

Modèle de feuille de calcul de document ouvert

CSV

Valeurs séparées par des virgules

XLA

Fichier de complément Excel

XLAM

Complément Excel Open XML prenant en charge les macros

NOMBRES

Numéros Apple iWork

PPT

Présentation Powerpoint

PPS

Diaporama PowerPoint

POT

Modèle PowerPoint

PPTX

Présentation Office Open XML

PPTM

Présentation Office Open XML prenant en charge les macros

POTX

Modèle de présentation Office Open XML

POTM

Modèle de présentation compatible avec les macros Office Open XML

PPSX

Diaporama de présentation Office Open XML

PPSM

Diaporama de présentation Office Open XML prenant en charge les macros

ODP

Présentation du document ouvert

OTP

Modèle de présentation de document ouvert

PST

Fichier de banque d’informations personnelles Outlook

OST

Fichier de données hors ligne Outlook

EML

Message électronique

EMLX

Messagerie Apple

MSG

Message électronique Outlook

ONE

Document OneNote

ZIP

Fichier compressé

Sécurité et authentification

L’API REST GroupDocs.Parser Cloud est sécurisée et nécessite une authentification. Vous aurez besoin de AppSID et AppKey pour l’authentification, qui peut être créée sur le tableau de bord.

Explorateur d’API

Nous fournirons un explorateur de référence d’API basé sur le Web pour GroupDocs.Parser Cloud. Vous pourrez donc essayer les API REST tout de suite dans votre navigateur. Et vous pouvez également obtenir des informations sur toutes les ressources de l’API.

SDK

GroupDocs.Parser Cloud viendra avec des SDK pour tous les langages de programmation populaires hébergés sur notre référentiel GitHub ainsi que des exemples de travail, qui vous permettront de l’intégrer dans des systèmes existants. Les SDK seront intégrés à l’API REST. Le SDK s’occupera des détails de bas niveau de la formulation des demandes et de la gestion des réponses, ce qui vous permettra de vous concentrer sur l’écriture de code spécifique à votre projet particulier.

Notre première version

Nous finalisons actuellement la documentation et les exemples pour GroupDocs.Parser Cloud. Nous avons prévu de publier prochainement la première version du nouveau produit avec les fonctionnalités partagées ci-dessus. Si vous avez des questions ou des suggestions, n’hésitez pas à nous écrire sur groupdocs.cloud Forum.

Veuillez rester à l’écoute du blog groupdocs.cloud pour d’autres mises à jour.