استخراج الصور من المستندات باستخدام Python

إذا كنت مطور Python وترغب في استخراج البيانات من المستندات ، فستوجهك هذه المقالة لاستخراج الصور من مستندات معالجة النصوص وجداول البيانات والعروض التقديمية ومستندات PDF باستخدام أمثلة بسيطة من Python.

سيتم تغطية الموضوعات التالية اليوم:

استخراج الصور API REST و Python SDK

مستند تحليل Python SDK

هذه المرة ، سنستخدم Python SDK من GroupDocs.Parser Cloud API لاستخراج الصور من أنواع مختلفة من المستندات. ومع ذلك ، فإنه يوفر حاليًا أيضًا .NET و Java و PHP و Ruby و Node.js SDKs باعتبارها أعضاء عائلة تحليل المستندات لواجهة برمجة التطبيقات السحابية.

تدعم واجهة برمجة التطبيقات أيضًا استخراج النصوص والبيانات الوصفية جنبًا إلى جنب مع استخراج الصور من أنواع مختلفة من المستندات مثل مستندات معالجة الكلمات وجداول البيانات والعروض التقديمية ورسائل البريد الإلكتروني والمحفوظات والترميز ومستندات PDF.

عند الوصول إلى الهدف ، أولاً ، احصل على APP KEY و APP SID من لوحة القيادة قبل البدء في اتباع الخطوات وأمثلة الكود المتاحة.

استخراج الصور من ملف PDF باستخدام Python

مستند PDF لاستخراج الصور أو الحصول على صور من ملف pdf أو استخراج صورة من ملف pdf

على سبيل المثال ، سأقوم أولاً باستخراج الصور من مستند PDF. باتباع الخطوات البسيطة فقط ، يمكن استخراج جميع الصور بسهولة.

  • قم بتحميل مستند PDF على السحابة.
  • استخرج الصور من الوثيقة المرفوعة.
  • تنزيل الصور المستخرجة.

قم بتحميل مستند PDF

أولاً ، قم بتحميل مستند PDF على السحابة باستخدام أي من الطرق التالية:

نتيجة لذلك ، سيتم تحميل ملف PDF على Cloud Storage

تم تحميل ملف PDF في لوحة القيادة

تم تحميل ملف PDF في dashboard.groupdocs.cloud/#/files

استخراج الصور من مستند PDF الذي تم تحميله

لقد انتهيت الآن من الجزء الصعب لاستخراج جميع الصور من ملف pdf. سيتيح لك رمز Python التالي استخراج جميع الصور بسرعة من مستند PDF الذي تم تحميله.

# كيفية استخراج الصور من مستندات Word أو جداول بيانات Excel أو العروض التقديمية أو مستند PDF في Python.
import groupdocs_parser_cloud
class ExtractImagesFromPDF:
    @classmethod  
    def Run(cls):
        # احصل على APP SID و APP Key من https://dashboard.groupdocs.cloud/
        configuration = groupdocs_parser_cloud.Configuration("xxxx-APP-SID-xxx", "xxxx APP KEY xxx")
        configuration.api_base_url = "https://api.groupdocs.cloud"
        parseApi = groupdocs_parser_cloud.ParseApi.from_config(configuration)
        
        options = groupdocs_parser_cloud.ImagesOptions()
        options.file_info = groupdocs_parser_cloud.FileInfo()
        options.file_info.file_path = "documents/doc-with-images.pdf"

        request = groupdocs_parser_cloud.ImagesRequest(options)
        result = parseApi.images(request)
        # عرض خصائص الصور المستخرجة
       for image in result.images:
            print("Path: " + image.path)
            print("Download url: " + image.download_url)
            print("Image format: " + image.file_format)
            print("Page index: " + str(image.page_index))

تنزيل الصور المستخرجة

بمجرد استخراج الصور ، يمكنك تنزيل الصور من السحابة إما من لوحة القيادة أو برمجيًا. الصور المعروضة هنا مستخرجة من وثيقة PDF الموضحة أعلاه.

صور مستخرجة من ملف PDF

الصور المستخرجة من وثيقة PDF

الصور المستخرجة من المستند باستخدام Python

استخراج صورة عالية الجودة من ملف pdf أو xlsx أو pptx أو docx

استخراج الصور من Excel أو PPT أو Word Docs باستخدام Python

وبالمثل ، يمكنك استخراج جميع الصور من مستندات Word وجداول البيانات والعروض التقديمية باستخدام كود الثعبان المذكور أعلاه بالضبط لمستند PDF. عليك فقط تغيير مسار الملف باستخدام اسم المستند الصحيح بالملحق.

# استخرج الصور من مستندات Word وجداول بيانات Excel والعروض التقديمية في Python.
options.file_info.file_path = "documents/doc-with-images.docx"
# ما عليك سوى تغيير مسار المستند وفقًا للمتطلبات (doc / docx ، xls / xlsx ، ppt / pptx ، ...)
request = groupdocs_parser_cloud.ImagesRequest(options)
result = parseApi.images(request)

استخراج الصور من المستند عبر الإنترنت

كيفية استخراج الصور من ملف أو doucment عبر الإنترنت مجانًا؟ يوفر Groupdocs.Parser أداة مجانية على الإنترنت لاستخراج الصور من Word عبر الإنترنت ، واستخراج جميع الصور من ملف pdf ، وحفظ جميع الصور في PowerPoint أو استخراج الصور من xlsx python. ما عليك سوى تحديد المستند الذي تريد استخراج صور jpg أو png أو jpeg أو gif.

استخراج الصور من pdf على الإنترنت مجانًا ، استخراج الصور من Excel عبر الإنترنت ، استخراج الصورة من Word عبر الإنترنت و استخراج الصور من pptx عبر الإنترنت تم تطوير الأدوات باستخدام Groupdocs.Parser Python API.

خاتمة

لقد تعلمنا في هذه المقالة ، كيفية استخراج الصور برمجيًا من Word و Excel و PowerPoint و PDF والمستندات الأخرى باستخدام Python. لا فرق في الكود ، علينا فقط تغيير مسار المستند المصدر ونوعه.

لمزيد من الميزات ومعرفة المزيد حول تحليل المستندات API ، قم بزيارة التوثيق للمقالات التي تحتوي أيضًا على الأمثلة. أفضل طريقة لاختبار الميزات المميزة هي تجربة أمثلة تشغيل مفتوحة المصدر من GitHub. في حالة حدوث أي ارتباك ، يشعر فريق دعم GroupDocs بالسعادة لتقديم المساعدة لك. شكرًا

طرح سؤال

إذا كان لديك أي استفسارات بخصوص كيفية استخراج الصور من PDF أو XLSX أو PPTX أو Word DOCX باستخدام Python ، فلا تتردد في سؤالنا على منتدى الدعم المجاني

أنظر أيضا