استخراج النص من XML في Python باستخدام REST API.

XML(لغة الترميز الموسعة) هي تنسيق بيانات شائع لتخزين وتبادل المعلومات المهيكلة. يستخدم على نطاق واسع في مجالات مختلفة ، بما في ذلك تطوير الويب وتخزين البيانات ونقل البيانات. يعد استخراج النص من ملفات XML أمرًا بالغ الأهمية لأسباب عديدة. يسمح لنا بالوصول إلى البيانات الفعلية الموجودة في مستندات XML ومعالجتها. من خلال استخراج النص ، يمكننا إجراء عمليات مختلفة ، مثل تحليل البيانات وتحويل البيانات وتكامل البيانات. في هذه المقالة ، سوف نستكشف كيفية استخراج نص من XML في Python باستخدام REST API.

سيتم تناول الموضوعات التالية في هذه المقالة:

Python REST API لتحليل مستند XML وتثبيت SDK

GroupDocs.Parser Cloud SDK for Python هي أداة قوية تبسط استخراج النص من XML وتنسيقات الملفات الأخرى. يوفر نطاقًا واسعًا من الميزات ، بما في ذلك تحليل المستندات واستخراج النص واستخراج البيانات الوصفية وغير ذلك الكثير. من خلال واجهة برمجة التطبيقات سهلة الاستخدام ، يمكن للمطورين دمج إمكانات استخراج النص بسهولة في تطبيقات Python الخاصة بهم. كما أنها تدعم حزم SDK لـ C# .NET و Java و PHP و Ruby و Node.js باعتبارها أعضاء عائلة محلل المستندات لواجهة برمجة التطبيقات السحابية. يمكن دمج SDK في تطبيق قائم على Python لتبسيط عملية التطوير لديك وتعزيز الإنتاجية.

قم بتثبيت GroupDocs.Parser Cloud إلى مشروع Python الخاص بك باستخدام pip (أداة تثبيت الحزمة لـ Python) باستخدام الأمر التالي في وحدة التحكم لاستخراج المعلومات من XML:

pip install groupdocs_parser_cloud

الآن ، يرجى الحصول على معرّف العميل وسر العميل من لوحة القيادة وإضافة الرمز كما هو موضح أدناه:

# استيراد SDK محلل groupdocs
import groupdocs_parser_cloud

# احصل على app_sid & app_key من https://dashboard.groupdocs.cloud بعد التسجيل المجاني.
app_sid = "xxxxxxx-xxxx-xxxx-xxxx-xxxxxxxxxxxx"
app_key = "xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx"

# الحصول على تكوينات ملف API.
configuration = groupdocs_parser_cloud.Configuration(app_sid, app_key)
configuration.api_base_url = "https://api.groupdocs.cloud"
storage_name = "LocalStorage"

استخراج كل النص من ملف XML في Python باستخدام واجهة برمجة تطبيقات REST

لاستخراج نص من مستندات XML في Python باستخدام GroupDocs.Parser Cloud SDK for Python ، اتبع الخطوات التالية:

تحميل الملف

أولاً ، قم بتحميل مستند XML إلى السحابة باستخدام مثال الرمز الموضح أدناه:

# إنشاء مثيل لملف API
file_api = groupdocs_parser_cloud.FileApi.from_config(configuration)

# طلب ملف تحميل المكالمة
request = groupdocs_parser_cloud.UploadFileRequest("python-testing\input-sample-file.pdf", "H:\\groupdocs-cloud-data\\input-sample-file.pdf", storage_name)

# تحميل الملف إلى السحابة
response = file_api.upload_file(request)
print(response.uploaded)

نتيجة لذلك ، سيكون ملف XML الذي تم تحميله متاحًا في قسم الملفات من لوحة المعلومات الخاصة بك على السحابة.

استخراج كل النص من بيانات XML باستخدام Python

في هذا القسم ، سنكتب الخطوات ومثالًا لمقتطف الشفرة الذي يوضح كيفية استخراج نص من مستند XML في Python باستخدام GroupDocs.Parser Cloud SDK for Python:

  • أولاً ، قم بإنشاء مثيل للفئة ParseApi.
  • ثانيًا ، قم بإنشاء مثيل لفئة TextOptions().
  • ثالثًا ، قم بإنشاء مثيل للفئة FileInfo.
  • وقم بتعيينه إلى طريقة FileInfo الخاصة بخيارات النص.
  • بعد ذلك ، قم بتعيين المسار إلى ملف XML كمدخل.
  • الآن ، قم بإنشاء مثيل لفئة TextRequest() وقم بتمرير معلمة TextOptions.
  • أخيرًا ، احصل على النتائج عن طريق استدعاء طريقة ParseApi.text() وتمرير معلمة TextRequest.

يوضح نموذج التعليمات البرمجية التالي كيفية استخراج نص من مستند XML في Python باستخدام REST API:

# كيفية استخراج نص من XML في Python باستخدام REST API
try:
  # تهيئة API
  parseApi = groupdocs_parser_cloud.ParseApi.from_config(configuration)

  # تحديد خيارات النص
  options = groupdocs_parser_cloud.TextOptions()
  options.file_info = groupdocs_parser_cloud.FileInfo()
  options.file_info.file_path = "python-testing/input-sample-file.xml"

  request = groupdocs_parser_cloud.TextRequest(options)
  result = parseApi.text(request)

  print("Successfully extracted text: " + result.text)
except groupdocs_parser_cloud.ApiException as e:
  print("Exception while calling API: {0}".format(e.message))

يمكنك أن ترى الإخراج في الصورة أدناه:

بيثون استخراج النص من ملف XML

استخراج كل النص من بيانات XML باستخدام Python.

محلل مجاني للوثائق عبر الإنترنت

كيفية استخراج نص من XML عبر الإنترنت مجانًا؟ الرجاء محاولة برنامج محلل XML عبر الإنترنت لاستخراج البيانات من ملفات XML. تم تطوير أداة محلل XML باستخدام مكتبة محلل Python المذكورة أعلاه.

خاتمة

في الختام ، يعد استخراج النص من ملفات XML مهمة أساسية عند العمل مع بيانات XML. يوفر Python ، إلى جانب GroupDocs.Parser Cloud SDK ، حلاً موثوقًا وفعالًا لاستخراج النص من ملفات XML. فيما يلي ما تعلمته من هذه المقالة:

  • كيفية استخراج كل النصوص من مستندات XML في Python باستخدام REST API ؛
  • تحميل ملف XML برمجيًا إلى السحابة باستخدام Python ؛
  • وبرنامج استخراج بيانات XML عبر الإنترنت لتحليل مستندات XML.

بالإضافة إلى ذلك ، يمكنك معرفة المزيد حول GroupDocs.Parser Cloud API باستخدام التوثيق. نوفر أيضًا قسم مرجع واجهة برمجة التطبيقات الذي يتيح لك تصور واجهات برمجة التطبيقات الخاصة بنا والتفاعل معها مباشرةً من خلال المتصفح. شفرة المصدر الكاملة لـ Python SDK متاحة مجانًا على Github.

أخيرًا ، نواصل كتابة مقالات مدونة جديدة حول تنسيقات ملفات مختلفة والتحليل باستخدام REST API. لذا ، يرجى التواصل معنا للحصول على آخر التحديثات.

طرح سؤال

في حال كان لديك أي استفسارات أو ارتباك حول محلل مستندات XML ، فلا تتردد في الاتصال بنا عبر المنتدى.

أسئلة وأجوبة

لماذا نحتاج إلى استخراج نص من ملفات XML؟

يتيح لنا استخراج النص من ملفات XML الوصول إلى البيانات الفعلية الموجودة في مستندات XML ومعالجتها.

كيف يمكنني استخراج نص من ملفات XML باستخدام Python؟

يمكنك استخراج نص من ملفات XML باستخدام GroupDocs.Parser Cloud SDK for Python ، والذي يوفر إمكانات قوية لاستخراج النص.

هل من الممكن استخراج البيانات الوصفية من ملفات XML باستخدام GroupDocs.Parser Cloud SDK for Python؟

نعم ، GroupDocs.Parser Cloud SDK for Python تدعم استخراج البيانات الوصفية من ملفات XML. يمكنك استرداد معلومات البيانات الوصفية مثل المؤلف وتاريخ الإنشاء وتاريخ التعديل والمزيد.

هل يمكنني استخراج الصور المضمنة في ملفات XML باستخدام GroupDocs.Parser Cloud SDK for Python؟

نعم ، GroupDocs.Parser Cloud SDK for Python يسمح لك باستخراج الصور المضمنة في ملفات XML وتحويلها إلى تنسيقات مختلفة.

أنظر أيضا

فيما يلي بعض المقالات ذات الصلة التي قد تجدها مفيدة: