
XML(eXtensible Markup Language) هو تنسيق بيانات شائع لتخزين وتبادل المعلومات المهيكلة. يتم استخدامه على نطاق واسع في مجالات متعددة، بما في ذلك تطوير الويب، وتخزين البيانات، ونقل البيانات. يعد استخراج النصوص من ملفات XML أمرًا مهمًا لعدة أسباب. فهو يتيح لنا الوصول إلى البيانات الفعلية الموجودة في وثائق XML والتلاعب بها. من خلال استخراج النص، يمكننا إجراء عمليات مختلفة، مثل تحليل البيانات، وتحويل البيانات، ودمج البيانات. في هذه المقالة، سوف نستكشف كيفية استخراج النص من XML في Python باستخدام REST API.
ستتناول المقالة المواضيع التالية:
- Python REST API لتحليل وثيقة XML وتثبيت SDK
- استخراج جميع النصوص من ملف XML في بايثون باستخدام واجهة برمجة التطبيقات REST
Python REST API to Parse XML Document and SDK Installation
GroupDocs.Parser Cloud SDK for Python هو أداة قوية تُبسط استخراج النص من XML وغيرها من تنسيقات الملفات. إنها توفر مجموعة واسعة من الميزات، بما في ذلك تحليل الوثائق، واستخراج النص، واستخراج البيانات الوصفية، والعديد من الميزات الأخرى. مع واجهتها البرمجية البسيطة، يمكن للمطورين دمج قدرات استخراج النص بسهولة في تطبيقاتهم البرمجية بلغة بايثون. كما أنها تدعم C# .NET وJava وPHP وRuby وNode.js SDKs كأعضاء في document parser family members لواجهة Cloud API. يمكن دمج SDK في تطبيق قائم على بايثون لتبسيط عملية التطوير الخاصة بك وتعزيز الإنتاجية.
قم بتثبيت GroupDocs.Parser Cloud في مشروع Python الخاص بك باستخدام pip (package installer for Python) عن طريق تنفيذ الأمر التالي في وحدة التحكم لاستخراج المعلومات من XML:
pip install groupdocs_parser_cloud
الآن، يرجى الحصول على معرف العميل وسر العميل الخاص بك من dashboard وإضافة الكود كما هو موضح أدناه:
# استيراد مجموعة SDK الخاصة بـ GroupDocs Parser
import groupdocs_parser_cloud
# احصل على appsid و appkey من https://dashboard.groupdocs.cloud بعد التسجيل المجاني.
app_sid = "xxxxxxx-xxxx-xxxx-xxxx-xxxxxxxxxxxx"
app_key = "xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx"
# احصل على تكوينات واجهة برمجة التطبيقات للملف.
configuration = groupdocs_parser_cloud.Configuration(app_sid, app_key)
configuration.api_base_url = "https://api.groupdocs.cloud"
storage_name = "LocalStorage"
استخراج كل النص من ملف XML في بايثون باستخدام واجهة برمجة التطبيقات REST
لاستخراج النص من مستندات XML في بايثون باستخدام GroupDocs.Parser Cloud SDK لبايثون، اتبع الخطوات التالية:
رفع الملف
أولاً، قم بتحميل مستند XML إلى السحابة باستخدام مثال الشيفرة المقدم أدناه:
# إنشاء مثيل من واجهة برمجة تطبيقات الملفات
file_api = groupdocs_parser_cloud.FileApi.from_config(configuration)
# استدعاء طلب تحميل الملف
request = groupdocs_parser_cloud.UploadFileRequest("python-testing\input-sample-file.pdf", "H:\\groupdocs-cloud-data\\input-sample-file.pdf", storage_name)
# رفع الملف إلى السحابة
response = file_api.upload_file(request)
print(response.uploaded)
نتيجة لذلك، سيصبح ملف XML المرفوع متاحًا في [files section][https://dashboard.groupdocs.cloud/files] في لوحة التحكم الخاصة بك على السحابة.
استخراج كل النص من بيانات XML باستخدام Python
في هذا القسم، سنكتب الخطوات ومثال على مقتطف الشيفرة الذي يوضح كيفية استخراج النص من مستند XML في بايثون باستخدام مجموعة GroupDocs.Parser Cloud SDK لبايثون:
- أولاً، قم بإنشاء экземпляر من فئة ParseApi.
- ثانياً، قم بإنشاء مثيل من فئة TextOptions().
- ثالثاً، أنشئ مثيل من فئة FileInfo.
- And, assign it to the text options fileInfo method.
- بعد ذلك، اضبط المسار إلى ملف XML كمدخل.
- الآن، قم بإنشاء مثيل من فئة TextRequest() ومرر معلمة TextOptions.
- أخيرًا، احصل على النتائج عن طريق استدعاء ParseApi.text() وتمرير معلمة TextRequest.
يوضح نموذج التعليمات البرمجية التالي كيفية استخراج النص من مستند XML في بايثون باستخدام واجهة برمجة التطبيقات REST:
# كيف تستخرج النص من XML في بايثون باستخدام REST API
try:
# تهيئة واجهة برمجة التطبيقات
parseApi = groupdocs_parser_cloud.ParseApi.from_config(configuration)
# حدد خيارات النص
options = groupdocs_parser_cloud.TextOptions()
options.file_info = groupdocs_parser_cloud.FileInfo()
options.file_info.file_path = "python-testing/input-sample-file.xml"
request = groupdocs_parser_cloud.TextRequest(options)
result = parseApi.text(request)
print("Successfully extracted text: " + result.text)
except groupdocs_parser_cloud.ApiException as e:
print("Exception while calling API: {0}".format(e.message))
يمكنك رؤية النتائج في الصورة أدناه:

Extract all Text from XML data using Python.
مُعالج المستندات المجاني عبر الإنترنت
كيف تستخرج النص من XML عبر الإنترنت مجانًا؟ يرجى تجربة online XML parser software لاستخراج البيانات من ملفات XML. تم تطوير هذه الأداة XML Parser باستخدام مكتبة المحلل بيثون المذكورة أعلاه.
استنتاج
في الختام، استخراج النص من ملفات XML هو مهمة أساسية عند العمل مع بيانات XML. توفر Python، جنبًا إلى جنب مع مجموعة GroupDocs.Parser Cloud SDK، حلاً موثوقًا وفعالًا لاستخراج النص من ملفات XML. فيما يلي ما تعلمته من هذه المقالة:
- كيفية استخراج كل النص من مستندات XML في Python باستخدام واجهة برمجة تطبيقات REST.
- Programmatically upload an XML file to the cloud using Python.
- برنامج استخراج بيانات XML عبر الإنترنت لتحليل مستندات XML.
بالإضافة إلى ذلك، يمكنك معرفة المزيد عن GroupDocs.Parser Cloud API من خلال documentation. كما نقدم قسم API Reference الذي يتيح لك تصور والتفاعل مع واجهات برمجة التطبيقات الخاصة بنا مباشرة من خلال المتصفح. الكود المصدري الكامل لـ Python SDK متاح مجانًا على Github.
أخيرًا، نستمر في كتابة مقالات مدونة جديدة حول تنسيقات الملفات المختلفة والتحليل باستخدام REST API. لذا، يرجى التواصل للحصول على أحدث التحديثات.
اسأل سؤالاً
في حال كان لديك أي استفسارات أو ارتباك بشأن محلل وثيقة XML، يرجى عدم الت hesitate في الاتصال بنا عبر forum.
الأسئلة الشائعة
Why do we need to extract text from XML files?
استخراج النص من ملفات XML يتيح لنا الوصول إلى البيانات الفعلية الموجودة داخل مستندات XML والتعامل معها.
How can I extract text from XML files using Python?
يمكنك استخراج النص من ملفات XML باستخدام GroupDocs.Parser Cloud SDK for Python، الذي يوفر إمكانيات قوية لاستخراج النص.
هل من الممكن استخراج البيانات الوصفية من ملفات XML باستخدام GroupDocs.Parser Cloud SDK لـ Python؟
نعم، GroupDocs.Parser Cloud SDK for Python يدعم استخراج البيانات الوصفية من ملفات XML. يمكنك استرجاع معلومات البيانات الوصفية مثل المؤلف، تاريخ الإنشاء، تاريخ التعديل، والمزيد.
Can I extract images embedded in XML files using GroupDocs.Parser Cloud SDK for Python?
نعم، GroupDocs.Parser Cloud SDK for Python يتيح لك استخراج الصور المضمنة في ملفات XML وتحويلها إلى تنسيقات مختلفة.
انظر أيضا
إليك بعض المقالات المتعلقة التي قد تجدها مفيدة:
- تحليل الوثائق - استخراج النص من ملف PDF في Java
- استخراج البيانات من PDF باستخدام واجهة برمجة التطبيقات REST في Node.js
- تحليل مستندات Word باستخدام واجهة برمجة التطبيقات (REST API) في بايثون
- استخراج الصور من مستندات PDF باستخدام بايثون
- كيفية استخراج النص من ملف PDF باستخدام بايثون
- استخراج بيانات محددة من PDF باستخدام بايثون
- جارٍ استخراج النصوص من مستندات XML باستخدام Java DOM Parser