แยกวิเคราะห์เอกสารเพื่อแยกข้อความ รูปภาพ และข้อมูลเอกสาร

GroupDocs กำลังออกจากการแชร์เวอร์ชันแรกของ GroupDocs.Parser Cloud เป็นโซลูชัน REST API อิสระนอกกรอบของแพลตฟอร์มเพื่อแยกวิเคราะห์และแยกข้อมูลจากรูปแบบไฟล์ธุรกิจทั่วไปทั้งหมดโดยไม่ต้องพึ่งพาเครื่องมือหรือปลั๊กอินของบุคคลที่สาม นักพัฒนาสามารถผสานรวมเข้ากับเว็บ เดสก์ท็อป มือถือ หรือแอปพลิเคชันบนคลาวด์โดยไม่ต้องมีช่วงการเรียนรู้ที่สำคัญใด ๆ เพราะสามารถใช้บนแพลตฟอร์มหรือภาษาใด ๆ ที่รองรับ REST

GroupDocs.Parser Cloud คืออะไร

สมมติว่าคุณกำลังพัฒนาระบบการจัดการเอกสารและต้องการคุณลักษณะสำหรับการค้นหาข้อความหรือการวิเคราะห์ข้อความ จะดีกว่าไหมหากระบบของคุณสามารถอ่านหรือวิเคราะห์เอกสารประเภทต่างๆ ได้อย่างหลากหลายโดยไม่ต้องติดตั้งโปรแกรมอ่านเอกสารที่เกี่ยวข้อง

GroupDocs.Parser Cloud บรรลุวัตถุประสงค์ดังกล่าวข้างต้น เป็น REST API การแยกข้อมูลเอกสารที่รองรับเอกสารมากกว่า 50 ประเภท หนึ่งในคุณสมบัติที่มีค่าที่สุดของ GroupDocs.Parser Cloud คือการแยกวิเคราะห์เอกสารด้วยเทมเพลตที่กำหนดไว้ล่วงหน้า กำหนดเทมเพลตและแยกข้อมูลจากเอกสารทางธุรกิจได้ง่าย เช่น ใบแจ้งหนี้ ใบเสร็จรับเงิน ใบเสนอราคา จดหมาย ฯลฯ ไม่จำกัดเฉพาะการแยกข้อความ แต่คุณยังสามารถแยกรูปภาพจากประเภทเอกสารที่รองรับได้อีกด้วย สามารถใช้ API ได้ไม่เฉพาะกับเอกสารทั่วไปเท่านั้น แต่ยังใช้กับคอนเทนเนอร์ เช่น ไฟล์ ZIP ไฟล์ข้อมูลเมล OST/PST และพอร์ตโฟลิโอ PDF สละเวลาและไปที่ บันทึกประจำรุ่นของการเปิดตัวสู่สาธารณะครั้งแรก เพื่อดูรายการคุณสมบัติทั้งหมด

มันทำงานอย่างไร?

คุณสามารถใช้ฟีเจอร์ GroupDocs.Parser Cloud ในแอปพลิเคชันของคุณได้สองวิธี ใช้ผ่านไคลเอนต์ REST หรือใช้ SDK ของเราโดยตรงในภาษาการเขียนโปรแกรมที่คุณชื่นชอบ คุณสามารถดูรายการทั้งหมดของ SDK จาก GroupDocs.Parser Github repository

ที่นี่ ฉันจะสาธิตการทำงานของ GroupDocs.Parser Cloud โดยแยกวิเคราะห์เอกสารคำด้วยเทมเพลตที่กำหนดไว้ล่วงหน้า ฉันใช้ไคลเอนต์ REST ขดเครื่องมือบรรทัดคำสั่ง

สิ่งแรก ก่อนที่คุณจะดำเนินการต่อ โปรด ลงทะเบียนกับ groupdocs.cloud และรับ App SID และ App Key เพื่อตรวจสอบสิทธิ์การเรียก API ที่เหลือของคุณ

สร้างเทมเพลต

GroupDocs.Parser Cloud ช่วยให้ผู้ใช้สามารถแยกวิเคราะห์เอกสารด้วย เทมเพลตที่กำหนดไว้ล่วงหน้า เพื่อดึงข้อมูลจากเอกสาร เราจะสร้างเทมเพลตสำหรับเอกสาร Word ต่อไปนี้และบันทึกลงในพื้นที่จัดเก็บเริ่มต้น

ไปเลย ทำตามขั้นตอนเหล่านี้เพื่อสร้างเทมเพลตอย่างง่าย:

ตัวอย่างขด:

· รับโทเค็นการเข้าถึง

· สร้างเทมเพลต

// รับโทเค็นการเข้าถึงก่อน
// รับ App Key และ App SID จาก https://dashboard.groupdocs.cloud/
curl -X POST "https://api.groupdocs.cloud/connect/token" 
-d "grant_type=client_credentials&client_id=[App_SID]&client_secret=[App_Key]" 
-H "Content-Type: application/x-www-form-urlencoded" 
-H "Accept: application/json"

// สร้างเทมเพลตสำหรับการแยกวิเคราะห์และบันทึกลงในที่เก็บข้อมูลเริ่มต้นของ GroupDocs
curl -X PUT "https://api.groupdocs.cloud/v1.0/parser/template" 
-H "accept: application/json" 
-H "authorization: Bearer [Access_TOken]" 
-H "Content-Type: application/json" 
-d "{
  "Template": {
    "Fields": [
      {
        "FieldName": "Address",
        "FieldPosition": {
          "FieldPositionType": "Regex",
          "Regex": "Company address:",
          "MatchCase": false,
          "IsLeftLinked": false,
          "IsRightLinked": false,
          "IsTopLinked": false,
          "IsBottomLinked": false,
          "AutoScale": false
        }
      },
      {
        "FieldName": "CompanyAddress",
        "FieldPosition": {
          "FieldPositionType": "Linked",
          "MatchCase": false,
          "LinkedFieldName": "ADDRESS",
          "IsLeftLinked": false,
          "IsRightLinked": true,
          "IsTopLinked": false,
          "IsBottomLinked": false,
          "SearchArea": {
            "Height": 10.0,
            "Width": 100.0
          },
          "AutoScale": true
        }
      },
      {
        "FieldName": "Company",
        "FieldPosition": {
          "FieldPositionType": "Regex",
          "Regex": "Company name:",
          "MatchCase": false,
          "IsLeftLinked": false,
          "IsRightLinked": false,
          "IsTopLinked": false,
          "IsBottomLinked": false,
          "AutoScale": false
        }
      },
      {
        "FieldName": "CompanyName",
        "FieldPosition": {
          "FieldPositionType": "Linked",
          "MatchCase": false,
          "LinkedFieldName": "Company",
          "IsLeftLinked": false,
          "IsRightLinked": true,
          "IsTopLinked": false,
          "IsBottomLinked": false,
          "SearchArea": {
            "Height": 10.0,
            "Width": 100.0
          },
          "AutoScale": true
        }
      }
    ],
    "Tables": [
      {
        "TableName": "Companies",
        "DetectorParameters": {
          "Rectangle": {
            "Position": {
              "X": 77.0,
              "Y": 279.0
            },
            "Size": {
              "Height": 60.0,
              "Width": 480.0
            }
          }
        }
      }
    ]
  },
  "TemplatePath": "Temp/companies.json"
}"

แยกวิเคราะห์เอกสาร

ตอนนี้เราจะแยกวิเคราะห์เอกสาร Word โดยใช้เทมเพลตที่กำหนดไว้ล่วงหน้าจากที่เก็บข้อมูลซึ่งสร้างขึ้นด้านบน เทมเพลตสามารถระบุเป็นวัตถุหรือเส้นทางการจัดเก็บ โปรดตรวจสอบเอกสาร แยกวิเคราะห์ตามเทมเพลต เพื่อดูรายละเอียดเพิ่มเติม

ตัวอย่างขด:

// รับโทเค็นการเข้าถึงก่อน
// รับ App Key และ App SID จาก https://dashboard.groupdocs.cloud/
curl -X POST "https://api.groupdocs.cloud/connect/token" 
-d "grant_type=client_credentials&client_id=[App_SID]&client_secret=[App_Key]" 
-H "Content-Type: application/x-www-form-urlencoded" 
-H "Accept: application/json"

// อัปโหลดเอกสารต้นฉบับไปยังที่เก็บข้อมูลเริ่มต้นของ GrupDocs
curl -X PUT "https://api.groupdocs.cloud/v1.0/parser/storage/file/Temp/companies.docx" 
-H "accept: application/json" 
-H "authorization: Bearer [Access_Token]" 
-H "Content-Type: multipart/form-data" 
-F "File=@C:/Temp/companies.docx"

// แยกวิเคราะห์ตามเทมเพลตที่จัดเก็บไว้ในที่เก็บข้อมูลเริ่มต้นของ GroupDocs
curl -X POST "https://api.groupdocs.cloud/v1.0/parser/parse" 
-H "accept: application/json" 
-H "authorization: Bearer [Access_Token]" 
-H "Content-Type: application/json" 
-d "{ "FileInfo": { "FilePath": "Temp/companies.docx", }, "TemplatePath": "Temp/companies.json"}"

อะไรต่อไป?

เริ่มทดลองใช้ GroupDocs.Parser Cloud ฟรีวันนี้ เพียงคุณ ลงทะเบียนกับบริการ GroupDocs Cloud เมื่อคุณลงทะเบียนแล้ว คุณก็พร้อมที่จะลองใช้คุณสมบัติการประมวลผลไฟล์อันทรงพลังที่มีให้โดย GroupDocs.Parser Cloud โดยใช้แหล่งข้อมูลต่อไปนี้

หากคุณมีคำถามหรือข้อเสนอแนะ โปรดอย่าลังเลที่จะเขียนถึงเราที่ GroupDocs.Parser Cloud Forum