Extraire des images de PDF, de feuilles de calcul, de présentations et de documents Word à l'aide de Python
Si vous êtes un développeur Python et que vous souhaitez extraire des données de documents, cet article vous guidera pour extraire des images de documents Word, de feuilles de calcul, de présentations et de documents PDF à l’aide d’exemples Python simples.
Nous utiliserons le SDK Python de GroupDocs.Parser Cloud API. Cependant, actuellement, il fournit également les SDK .NET, Java, PHP, Ruby et Node.js en tant que membres de la famille d’analyse de documents.
L’API prend également en charge l’extraction de texte et de métadonnées ainsi que l’extraction d’images à partir de divers types de documents tels que des documents de traitement de texte, des feuilles de calcul, des présentations, des e-mails, des archives, du balisage et des documents PDF.
Convertir des feuilles de calcul Excel en PDF à l'aide de Python
Cet article vous guidera pour convertir des feuilles de calcul Excel (XLS, XLSX) au format PDF en Python. Les feuilles de calcul Excel sont largement utilisées pour gérer les factures, les grands livres, l’inventaire, les comptes et d’autres rapports. D’autre part, le PDF est également l’un des formats les plus couramment utilisés et réputé pour sa portabilité. La conversion entre ces deux formats est également largement requise par les utilisateurs et les programmeurs.
Traduire des documents Word ou Excel avec l'API REST
Aujourd’hui, nous nous penchons sur l’API REST de traduction qui peut traduire des documents Word et Excel dans d’autres langues. Avec GroupDocs.Translation Cloud, n’importe quel document peut être traduit de l’anglais vers le chinois, le français, l’allemand, l’italien, le russe ou l’espagnol et vice versa. Voici donc les paires de langues dans lesquelles la traduction peut se faire.
Anglais vers chinois et chinois vers anglais Anglais vers français et français vers anglais Anglais vers allemand et allemand vers anglais Anglais vers italien et italien vers anglais Anglais vers russe et russe vers anglais Anglais vers espagnol et espagnol vers anglais Lors de la traduction, l’API s’occupe des paragraphes, des tableaux, des en-têtes.
Ajouter, supprimer, mettre à jour et extraire des métadonnées à l'aide de Java et .NET
Encore une nouvelle pour les Développeurs Cloud ! GroupDocs a lancé l’API Document Metadata Manipulation Cloud. Cela enrichit la solution de gestion des métadonnées de documents de GroupDocs. La solution sert déjà les développeurs .NET et Java en tant qu’API sur site pour les développeurs et en tant qu’application gratuite d’éditeur de métadonnées de documents en ligne pour tout type d’utilisateur pour afficher et modifier les métadonnées des documents.
API Cloud de manipulation des métadonnées GroupDocs.
Modifier des documents Word, Excel, PPT et Web par programme
Encore une bonne nouvelle pour les Développeurs Cloud ! GroupDocs a lancé l’API Document Editing Cloud. Cela améliore la solution d’édition de documents de GroupDocs. La solution existe déjà pour les développeurs .NET et Java en tant qu’API sur site et en tant qu’applications en ligne multiplateformes permettant à tout type d’utilisateur de modifier un document en ligne gratuitement. L’API GroupDocs.Editor Cloud ainsi que les SDK permettent aux développeurs de modifier la plupart des formats de documents populaires à l’aide d’éditeurs WYSIWYG frontaux sans aucune application supplémentaire.
Watermark Cloud API et SDK pour sécuriser les documents
Bonne nouvelle pour les développeurs cloud ! GroupDocs a lancé l’API Watermark Cloud. Cela améliore les GroupDocs solution de filigrane. Il existe déjà en tant qu’API sur site pour les développeurs .NET et Java et en tant qu’applications en ligne multiplateformes pour tout type d’utilisateur. L’API Watermark Cloud ainsi que les SDK permettent aux développeurs de sécuriser des documents importants avec des filigranes, difficiles à supprimer automatiquement par des outils tiers.
Mise à jour des tarifs de GroupDocs Cloud de décembre
Simplifier la tarification pour les nouveaux clients Nous avons mis à jour la structure tarifaire de GroupDocs Cloud afin de la simplifier pour les nouveaux clients. Auparavant, certains appels d’API étaient “payants”, tandis que d’autres ne l’étaient pas. Si un appel d’API créait un document ou un résultat significatif, il était payant. Si un appel d’API n’a pas créé de document ou de résultat, il n’était pas facturable. Cependant, il y avait des «zones grises» avec certains produits GroupDocs Cloud où les clients ne savaient pas s’ils devaient être facturés pour certains appels.
GroupDocs.Storage Cloud a été abandonné
GroupDocs est heureux de partager avec vous que les fonctionnalités de l’API GroupDocs.Storage Cloud sont désormais plus simplifiées. Le stockage des fichiers et des dossiers et leur manipulation ne dépendent plus de l’API GroupDocs.Storage Cloud distincte, cependant, ces fonctionnalités sont disponibles en tant que micro-service dans chaque API GroupDocs Cloud être très précis, “GroupDocs.Storage Cloud a été discontinued en tant que produit distinct”.
Que peuvent faire les utilisateurs existants ? L’API GroupDocs.
Une solution API REST pour analyser des documents et extraire des données
GroupDocs sort pour partager la première version de GroupDocs.Parser Cloud. Il s’agit d’une solution d’API REST indépendante de la plate-forme prête à l’emploi pour analyser et extraire les données de tous les formats de fichiers commerciaux courants sans dépendre d’un outil ou d’un plug-in tiers. Les développeurs peuvent l’intégrer à leur application Web, de bureau, mobile ou cloud sans aucune courbe d’apprentissage majeure, car il peut être utilisé sur n’importe quelle plate-forme ou langage prenant en charge REST.
Présentation de la solution API REST de l'analyseur de documents - GroupDocs.Parser Cloud
Nous sommes heureux de partager un aperçu de la prochaine API GroupDocs.Parser Cloud, un nouvel ajout à la liste de produits groupdocs.cloud. GroupDocs.Parser Cloud est une solution d’analyse de documents. En tant que développeur, vous pourrez ajouter une fonctionnalité d’analyse de documents dans vos applications sur n’importe quelle plate-forme sans dépendre d’un plug-in ou d’un outil tiers. La principale caractéristique de cette API REST sera d’analyser des documents sur des modèles définis par l’utilisateur pour extraire des données de vos factures, devis ou autres types de documents commerciaux.