पाठ, चित्र और दस्तावेज़ जानकारी निकालने के लिए दस्तावेज़ों को पार्स करें

GroupDocs GroupDocs.Parser Cloud का पहला संस्करण साझा करने के लिए बाहर निकल रहा है। यह किसी तीसरे पक्ष के टूल या प्लगइन पर निर्भर हुए बिना सभी सामान्य व्यावसायिक फ़ाइल स्वरूपों से डेटा को पार्स करने और निकालने के लिए एक आउट-ऑफ़-बॉक्स प्लेटफ़ॉर्म स्वतंत्र REST API समाधान है। डेवलपर्स इसे अपने वेब, डेस्कटॉप, मोबाइल या क्लाउड एप्लिकेशन के साथ बिना किसी बड़े सीखने के चरण के साथ एकीकृत कर सकते हैं क्योंकि इसका उपयोग किसी भी प्लेटफ़ॉर्म या भाषा पर किया जा सकता है जो REST का समर्थन करता है।

GroupDocs.Parser क्लाउड क्या है?

मान लीजिए कि आप एक दस्तावेज़ प्रबंधन प्रणाली विकसित कर रहे हैं और आपको पाठ खोज या पाठ विश्लेषण के लिए एक सुविधा की आवश्यकता है, तो क्या यह बहुत अच्छा नहीं होगा यदि आपका सिस्टम संबंधित दस्तावेज़ रीडर स्थापित किए बिना दस्तावेज़ प्रकारों की एक विस्तृत श्रृंखला को पढ़ या विश्लेषण कर सके?

GroupDocs.Parser Cloud उपर्युक्त उद्देश्य को पूरा करता है। यह एक दस्तावेज़ डेटा निष्कर्षण REST API है जो 50 से अधिक दस्तावेज़ प्रकारों का समर्थन करता है। GroupDocs.Parser क्लाउड की सबसे मूल्यवान विशेषताओं में से एक पूर्वनिर्धारित टेम्पलेट्स के साथ दस्तावेज़ों को पार्स करना है। टेम्पलेट को परिभाषित करना और व्यावसायिक दस्तावेज़ों से डेटा निकालना आसान है, उदाहरण के लिए चालान, रसीदें, उद्धरण, पत्र इत्यादि। यह केवल पाठ निष्कर्षण तक ही सीमित नहीं है बल्कि आप समर्थित दस्तावेज़ प्रकारों से छवियां भी निकाल सकते हैं। एपीआई का उपयोग न केवल नियमित दस्तावेजों के साथ बल्कि ज़िप अभिलेखागार, ओएसटी/पीएसटी मेल डेटा फ़ाइलों और पीडीएफ पोर्टफोलियो जैसे कंटेनरों के साथ भी किया जा सकता है। कुछ समय निकालें और इसकी विशेषताओं की पूरी सूची के लिए पहली सार्वजनिक रिलीज़ के रिलीज़ नोट्स पर जाएँ।

यह काम किस प्रकार करता है?

आप अपने एप्लिकेशन में GroupDocs.Parser क्लाउड सुविधाओं का उपयोग दो तरीकों से कर सकते हैं। या तो इसे किसी REST क्लाइंट के माध्यम से उपयोग करें या सीधे अपनी पसंदीदा प्रोग्रामिंग भाषा में हमारे SDK का उपयोग करें। आप [GroupDocs.Parser Github रिपॉजिटरी से SDK] की पूरी सूची पा सकते हैं 4

यहां मैं एक पूर्वनिर्धारित टेम्पलेट के साथ एक शब्द दस्तावेज़ को पार्स करके GroupDocs.Parser क्लाउड की कार्यक्षमता प्रदर्शित करूंगा। मैं एक REST क्लाइंट का उपयोग कर रहा हूँ; एक कमांड लाइन टूल को कर्ल करें।

सबसे पहली बात, आगे बढ़ने से पहले, कृपया groupdocs.cloud के साथ साइन अप करें और अपने बाकी एपीआई कॉल को प्रमाणित करने के लिए ऐप एसआईडी और ऐप कुंजी प्राप्त करें।

टेम्पलेट बनाएँ

जैसा कि ऊपर साझा किया गया है, GroupDocs.Parser क्लाउड उपयोगकर्ताओं को दस्तावेज़ से डेटा निकालने के लिए पूर्वनिर्धारित टेम्पलेट्स के साथ दस्तावेज़ को पार्स करने की अनुमति देता है। हम निम्नलिखित वर्ड दस्तावेज़ के लिए एक टेम्पलेट बनाएंगे और डिफ़ॉल्ट स्टोरेज में सहेजेंगे।

यहाँ हम चलते हैं, एक सरल टेम्पलेट बनाने के लिए इन चरणों का पालन करें:

कर्ल उदाहरण:

· एक्सेस टोकन प्राप्त करें

· टेम्पलेट बनाएं

// सबसे पहले एक्सेस टोकन प्राप्त करें
// https://dashboard.groupdocs.cloud/ से ऐप कुंजी और ऐप एसआईडी प्राप्त करें
curl -X POST "https://api.groupdocs.cloud/connect/token" 
-d "grant_type=client_credentials&client_id=[App_SID]&client_secret=[App_Key]" 
-H "Content-Type: application/x-www-form-urlencoded" 
-H "Accept: application/json"

// पार्सिंग के लिए टेम्प्लेट बनाएं और GroupDocs डिफ़ॉल्ट स्टोरेज में सेव करें
curl -X PUT "https://api.groupdocs.cloud/v1.0/parser/template" 
-H "accept: application/json" 
-H "authorization: Bearer [Access_TOken]" 
-H "Content-Type: application/json" 
-d "{
  "Template": {
    "Fields": [
      {
        "FieldName": "Address",
        "FieldPosition": {
          "FieldPositionType": "Regex",
          "Regex": "Company address:",
          "MatchCase": false,
          "IsLeftLinked": false,
          "IsRightLinked": false,
          "IsTopLinked": false,
          "IsBottomLinked": false,
          "AutoScale": false
        }
      },
      {
        "FieldName": "CompanyAddress",
        "FieldPosition": {
          "FieldPositionType": "Linked",
          "MatchCase": false,
          "LinkedFieldName": "ADDRESS",
          "IsLeftLinked": false,
          "IsRightLinked": true,
          "IsTopLinked": false,
          "IsBottomLinked": false,
          "SearchArea": {
            "Height": 10.0,
            "Width": 100.0
          },
          "AutoScale": true
        }
      },
      {
        "FieldName": "Company",
        "FieldPosition": {
          "FieldPositionType": "Regex",
          "Regex": "Company name:",
          "MatchCase": false,
          "IsLeftLinked": false,
          "IsRightLinked": false,
          "IsTopLinked": false,
          "IsBottomLinked": false,
          "AutoScale": false
        }
      },
      {
        "FieldName": "CompanyName",
        "FieldPosition": {
          "FieldPositionType": "Linked",
          "MatchCase": false,
          "LinkedFieldName": "Company",
          "IsLeftLinked": false,
          "IsRightLinked": true,
          "IsTopLinked": false,
          "IsBottomLinked": false,
          "SearchArea": {
            "Height": 10.0,
            "Width": 100.0
          },
          "AutoScale": true
        }
      }
    ],
    "Tables": [
      {
        "TableName": "Companies",
        "DetectorParameters": {
          "Rectangle": {
            "Position": {
              "X": 77.0,
              "Y": 279.0
            },
            "Size": {
              "Height": 60.0,
              "Width": 480.0
            }
          }
        }
      }
    ]
  },
  "TemplatePath": "Temp/companies.json"
}"

पार्स दस्तावेज़

अब हम ऊपर उत्पन्न स्टोरेज से पूर्वनिर्धारित टेम्पलेट का उपयोग करके वर्ड दस्तावेज़ को पार्स करेंगे। टेम्पलेट को ऑब्जेक्ट या स्टोरेज पथ के रूप में प्रदान किया जा सकता है, कृपया अधिक विवरण के लिए टेम्पलेट द्वारा पार्स दस्तावेज़ की जांच करें।

कर्ल उदाहरण:

// सबसे पहले एक्सेस टोकन प्राप्त करें
// https://dashboard.groupdocs.cloud/ से ऐप कुंजी और ऐप एसआईडी प्राप्त करें
curl -X POST "https://api.groupdocs.cloud/connect/token" 
-d "grant_type=client_credentials&client_id=[App_SID]&client_secret=[App_Key]" 
-H "Content-Type: application/x-www-form-urlencoded" 
-H "Accept: application/json"

// ग्रुपडॉक्स डिफॉल्ट स्टोरेज पर स्रोत दस्तावेज़ अपलोड करें
curl -X PUT "https://api.groupdocs.cloud/v1.0/parser/storage/file/Temp/companies.docx" 
-H "accept: application/json" 
-H "authorization: Bearer [Access_Token]" 
-H "Content-Type: multipart/form-data" 
-F "File=@C:/Temp/companies.docx"

// GroupDocs डिफ़ॉल्ट संग्रहण में संग्रहीत टेम्पलेट द्वारा पार्स
curl -X POST "https://api.groupdocs.cloud/v1.0/parser/parse" 
-H "accept: application/json" 
-H "authorization: Bearer [Access_Token]" 
-H "Content-Type: application/json" 
-d "{ "FileInfo": { "FilePath": "Temp/companies.docx", }, "TemplatePath": "Temp/companies.json"}"

आगे क्या होगा?

आज ही GroupDocs.Parser Cloud का निःशुल्क परीक्षण प्रारंभ करें - आपको बस GroupDocs Cloud सेवा के साथ साइन अप करना करना है। एक बार साइन अप करने के बाद, आप निम्नलिखित संसाधनों का उपयोग करके GroupDocs.Parser Cloud द्वारा दी जाने वाली शक्तिशाली फ़ाइल प्रोसेसिंग सुविधाओं को आज़माने के लिए तैयार हैं।

यदि आपके कोई प्रश्न या सुझाव हैं, तो कृपया बेझिझक हमें GroupDocs.Parser Cloud फोरम पर लिखें।