تحليل المستندات لاستخراج النص والصور ومعلومات المستند

GroupDocs بصدد الخروج لمشاركة الإصدار الأول من GroupDocs.Parser Cloud. إنه عبارة عن حل REST API مستقل خارج الصندوق يقوم بتحليل البيانات واستخراجها من جميع تنسيقات ملفات الأعمال الشائعة دون الاعتماد على أي أداة أو مكون إضافي تابع لجهة خارجية. يمكن للمطورين دمجها مع تطبيقات الويب أو سطح المكتب أو الهاتف المحمول أو السحابة الخاصة بهم دون أي منحنى تعليمي رئيسي لأنه يمكن استخدامها على أي نظام أساسي أو لغة تدعم REST.

ما هو GroupDocs.Parser Cloud؟

لنفترض أنك تقوم بتطوير نظام إدارة مستندات وتحتاج إلى ميزة للبحث عن النص أو تحليل النص ، ألن يكون من الرائع أن يتمكن نظامك من قراءة أو تحليل مجموعة كبيرة من أنواع المستندات دون تثبيت قارئ المستندات ذي الصلة؟

GroupDocs.Parser Cloud يحقق الغرض المذكور أعلاه. إنها واجهة برمجة تطبيقات REST لاستخراج بيانات المستندات تدعم أكثر من 50 نوعًا من المستندات. إحدى أهم ميزات GroupDocs.Parser Cloud هي تحليل المستندات باستخدام قوالب محددة مسبقًا. من السهل تحديد قالب واستخراج البيانات من مستندات الأعمال ، على سبيل المثال الفواتير والإيصالات والاقتباس والخطابات وما إلى ذلك. لا يقتصر الأمر على استخراج النص ولكن يمكنك أيضًا استخراج الصور من أنواع المستندات المدعومة. يمكن استخدام API ليس فقط مع المستندات العادية ولكن أيضًا مع حاويات مثل أرشيفات ZIP وملفات بيانات بريد OST / PST وحافظات PDF. وفر بعض الوقت وقم بزيارة ملاحظات الإصدار لأول إصدار عام للحصول على قائمة كاملة بميزاته.

كيف تعمل؟

يمكنك استخدام ميزات GroupDocs.Parser Cloud في تطبيقك بطريقتين. إما أن تستخدمه عبر بعض عملاء REST أو استخدم SDK الخاص بنا مباشرة بلغة البرمجة المفضلة لديك. يمكنك العثور على قائمة كاملة SDKs من مستودع GroupDocs.Parser Github.

سأوضح هنا وظائف GroupDocs.Parser Cloud عن طريق تحليل مستند Word باستخدام قالب محدد مسبقًا. أنا أستخدم عميل REST ؛ cURL أداة سطر أوامر.

أول شيء أولاً ، قبل المتابعة ، من فضلك اشترك مع groupdocs.cloud واحصل على App SID و App Key لمصادقة مكالمات API المتبقية.

قم بإنشاء نموذج

كما تمت مشاركته أعلاه ، يتيح GroupDocs.Parser Cloud للمستخدمين تحليل المستند باستخدام قوالب محددة مسبقًا لاستخراج البيانات من المستند. سننشئ نموذجًا لمتابعة مستند Word وحفظه في التخزين الافتراضي.

هنا نبدأ ، اتبع هذه الخطوات لإنشاء قالب بسيط:

مثال على cURL:

· الحصول على رمز وصول

· إنشاء نموذج

// احصل أولاً على رمز الوصول
// احصل على App Key و App SID من https://dashboard.groupdocs.cloud/
curl -X POST "https://api.groupdocs.cloud/connect/token" 
-d "grant_type=client_credentials&client_id=[App_SID]&client_secret=[App_Key]" 
-H "Content-Type: application/x-www-form-urlencoded" 
-H "Accept: application/json"

// قم بإنشاء نموذج للتحليل وحفظه في التخزين الافتراضي لـ GroupDocs
curl -X PUT "https://api.groupdocs.cloud/v1.0/parser/template" 
-H "accept: application/json" 
-H "authorization: Bearer [Access_TOken]" 
-H "Content-Type: application/json" 
-d "{
  "Template": {
    "Fields": [
      {
        "FieldName": "Address",
        "FieldPosition": {
          "FieldPositionType": "Regex",
          "Regex": "Company address:",
          "MatchCase": false,
          "IsLeftLinked": false,
          "IsRightLinked": false,
          "IsTopLinked": false,
          "IsBottomLinked": false,
          "AutoScale": false
        }
      },
      {
        "FieldName": "CompanyAddress",
        "FieldPosition": {
          "FieldPositionType": "Linked",
          "MatchCase": false,
          "LinkedFieldName": "ADDRESS",
          "IsLeftLinked": false,
          "IsRightLinked": true,
          "IsTopLinked": false,
          "IsBottomLinked": false,
          "SearchArea": {
            "Height": 10.0,
            "Width": 100.0
          },
          "AutoScale": true
        }
      },
      {
        "FieldName": "Company",
        "FieldPosition": {
          "FieldPositionType": "Regex",
          "Regex": "Company name:",
          "MatchCase": false,
          "IsLeftLinked": false,
          "IsRightLinked": false,
          "IsTopLinked": false,
          "IsBottomLinked": false,
          "AutoScale": false
        }
      },
      {
        "FieldName": "CompanyName",
        "FieldPosition": {
          "FieldPositionType": "Linked",
          "MatchCase": false,
          "LinkedFieldName": "Company",
          "IsLeftLinked": false,
          "IsRightLinked": true,
          "IsTopLinked": false,
          "IsBottomLinked": false,
          "SearchArea": {
            "Height": 10.0,
            "Width": 100.0
          },
          "AutoScale": true
        }
      }
    ],
    "Tables": [
      {
        "TableName": "Companies",
        "DetectorParameters": {
          "Rectangle": {
            "Position": {
              "X": 77.0,
              "Y": 279.0
            },
            "Size": {
              "Height": 60.0,
              "Width": 480.0
            }
          }
        }
      }
    ]
  },
  "TemplatePath": "Temp/companies.json"
}"

مستند التحليل

سنقوم الآن بتحليل مستند Word باستخدام قالب محدد مسبقًا من التخزين ، الذي تم إنشاؤه أعلاه. يمكن تقديم النموذج ككائن أو مسار تخزين ، يرجى مراجعة مستند التحليل حسب القالب لمزيد من التفاصيل.

مثال على cURL:

// احصل أولاً على رمز الوصول
// احصل على App Key و App SID من https://dashboard.groupdocs.cloud/
curl -X POST "https://api.groupdocs.cloud/connect/token" 
-d "grant_type=client_credentials&client_id=[App_SID]&client_secret=[App_Key]" 
-H "Content-Type: application/x-www-form-urlencoded" 
-H "Accept: application/json"

// تحميل ملف soruce إلى تخزين GrupDocs الافتراضي
curl -X PUT "https://api.groupdocs.cloud/v1.0/parser/storage/file/Temp/companies.docx" 
-H "accept: application/json" 
-H "authorization: Bearer [Access_Token]" 
-H "Content-Type: multipart/form-data" 
-F "File=@C:/Temp/companies.docx"

// التحليل حسب النموذج المخزن في تخزين GroupDocs الافتراضي
curl -X POST "https://api.groupdocs.cloud/v1.0/parser/parse" 
-H "accept: application/json" 
-H "authorization: Bearer [Access_Token]" 
-H "Content-Type: application/json" 
-d "{ "FileInfo": { "FilePath": "Temp/companies.docx", }, "TemplatePath": "Temp/companies.json"}"

ماذا بعد؟

ابدأ إصدارًا تجريبيًا مجانيًا من GroupDocs.Parser Cloud اليوم - كل ما تحتاجه هو التسجيل في خدمة GroupDocs Cloud. بمجرد التسجيل ، ستكون جاهزًا لتجربة ميزات معالجة الملفات القوية التي تقدمها GroupDocs.Parser Cloud باستخدام الموارد التالية.

إذا كان لديك أي أسئلة أو اقتراحات ، فلا تتردد في مراسلتنا على GroupDocs.Parser Cloud Forum.