إذا كنت مطور Python وترغب في استخراج البيانات من المستندات ، فستوجهك هذه المقالة لاستخراج الصور من مستندات معالجة النصوص وجداول البيانات والعروض التقديمية ومستندات PDF باستخدام أمثلة بسيطة من Python.
سيتم تغطية الموضوعات التالية اليوم:
- استخراج الصور API REST و Python SDK
- استخراج الصور من مستند PDF باستخدام Python
- استخراج الصور من Excel أو PPT أو Word Docs باستخدام Python
استخراج الصور API REST و Python SDK
هذه المرة ، سنستخدم Python SDK من GroupDocs.Parser Cloud API لاستخراج الصور من أنواع مختلفة من المستندات. ومع ذلك ، فإنه يوفر حاليًا أيضًا .NET و Java و PHP و Ruby و Node.js SDKs باعتبارها أعضاء عائلة تحليل المستندات لواجهة برمجة التطبيقات السحابية.
تدعم واجهة برمجة التطبيقات أيضًا استخراج النصوص والبيانات الوصفية جنبًا إلى جنب مع استخراج الصور من أنواع مختلفة من المستندات مثل مستندات معالجة الكلمات وجداول البيانات والعروض التقديمية ورسائل البريد الإلكتروني والمحفوظات والترميز ومستندات PDF.
عند الوصول إلى الهدف ، أولاً ، احصل على APP KEY و APP SID من لوحة القيادة قبل البدء في اتباع الخطوات وأمثلة الكود المتاحة.
استخراج الصور من ملف PDF باستخدام Python
على سبيل المثال ، سأقوم أولاً باستخراج الصور من مستند PDF. باتباع الخطوات البسيطة فقط ، يمكن استخراج جميع الصور بسهولة.
- قم بتحميل مستند PDF على السحابة.
- استخرج الصور من الوثيقة المرفوعة.
- تنزيل الصور المستخرجة.
قم بتحميل مستند PDF
أولاً ، قم بتحميل مستند PDF على السحابة باستخدام أي من الطرق التالية:
- باستخدام لوحة القيادة.
- استخدام تحميل ملف API من المتصفح.
- برمجيًا كما هو مذكور في التوثيق.
نتيجة لذلك ، سيتم تحميل ملف PDF على Cloud Storage
استخراج الصور من مستند PDF الذي تم تحميله
لقد انتهيت الآن من الجزء الصعب لاستخراج جميع الصور من ملف pdf. سيتيح لك رمز Python التالي استخراج جميع الصور بسرعة من مستند PDF الذي تم تحميله.
# كيفية استخراج الصور من مستندات Word أو جداول بيانات Excel أو العروض التقديمية أو مستند PDF في Python.
import groupdocs_parser_cloud
class ExtractImagesFromPDF:
@classmethod
def Run(cls):
# احصل على APP SID و APP Key من https://dashboard.groupdocs.cloud/
configuration = groupdocs_parser_cloud.Configuration("xxxx-APP-SID-xxx", "xxxx APP KEY xxx")
configuration.api_base_url = "https://api.groupdocs.cloud"
parseApi = groupdocs_parser_cloud.ParseApi.from_config(configuration)
options = groupdocs_parser_cloud.ImagesOptions()
options.file_info = groupdocs_parser_cloud.FileInfo()
options.file_info.file_path = "documents/doc-with-images.pdf"
request = groupdocs_parser_cloud.ImagesRequest(options)
result = parseApi.images(request)
# عرض خصائص الصور المستخرجة
for image in result.images:
print("Path: " + image.path)
print("Download url: " + image.download_url)
print("Image format: " + image.file_format)
print("Page index: " + str(image.page_index))
تنزيل الصور المستخرجة
بمجرد استخراج الصور ، يمكنك تنزيل الصور من السحابة إما من لوحة القيادة أو برمجيًا. الصور المعروضة هنا مستخرجة من وثيقة PDF الموضحة أعلاه.
استخراج الصور من Excel أو PPT أو Word Docs باستخدام Python
وبالمثل ، يمكنك استخراج جميع الصور من مستندات Word وجداول البيانات والعروض التقديمية باستخدام كود الثعبان المذكور أعلاه بالضبط لمستند PDF. عليك فقط تغيير مسار الملف باستخدام اسم المستند الصحيح بالملحق.
# استخرج الصور من مستندات Word وجداول بيانات Excel والعروض التقديمية في Python.
options.file_info.file_path = "documents/doc-with-images.docx"
# ما عليك سوى تغيير مسار المستند وفقًا للمتطلبات (doc / docx ، xls / xlsx ، ppt / pptx ، ...)
request = groupdocs_parser_cloud.ImagesRequest(options)
result = parseApi.images(request)
استخراج الصور من المستند عبر الإنترنت
كيفية استخراج الصور من ملف أو doucment عبر الإنترنت مجانًا؟ يوفر Groupdocs.Parser أداة مجانية على الإنترنت لاستخراج الصور من Word عبر الإنترنت ، واستخراج جميع الصور من ملف pdf ، وحفظ جميع الصور في PowerPoint أو استخراج الصور من xlsx python. ما عليك سوى تحديد المستند الذي تريد استخراج صور jpg أو png أو jpeg أو gif.
استخراج الصور من pdf على الإنترنت مجانًا ، استخراج الصور من Excel عبر الإنترنت ، استخراج الصورة من Word عبر الإنترنت و استخراج الصور من pptx عبر الإنترنت تم تطوير الأدوات باستخدام Groupdocs.Parser Python API.
خاتمة
لقد تعلمنا في هذه المقالة ، كيفية استخراج الصور برمجيًا من Word و Excel و PowerPoint و PDF والمستندات الأخرى باستخدام Python. لا فرق في الكود ، علينا فقط تغيير مسار المستند المصدر ونوعه.
لمزيد من الميزات ومعرفة المزيد حول تحليل المستندات API ، قم بزيارة التوثيق للمقالات التي تحتوي أيضًا على الأمثلة. أفضل طريقة لاختبار الميزات المميزة هي تجربة أمثلة تشغيل مفتوحة المصدر من GitHub. في حالة حدوث أي ارتباك ، يشعر فريق دعم GroupDocs بالسعادة لتقديم المساعدة لك. شكرًا
طرح سؤال
إذا كان لديك أي استفسارات بخصوص كيفية استخراج الصور من PDF أو XLSX أو PPTX أو Word DOCX باستخدام Python ، فلا تتردد في سؤالنا على منتدى الدعم المجاني
أنظر أيضا
- استخرج جميع الصور من PDF واستخرج الصور من PDF عبر الإنترنت باستخدام Node.js
- الاستخراج الآلي للبيانات من PDF واستخراج البيانات من PDF Python عبر الإنترنت
- استخراج الصور من ملف PDF python واستخراج الصور من ملف PDF باستخدام Python
- كيفية استخراج بيانات محددة من مستند Word باستخدام REST API في Node.js
- استخراج البيانات من PDF javascript وأفضل لغة برمجة لاستخراج البيانات من PDF
- استخراج الجداول من مستند Word python باستخدام REST API في Python