ขอแนะนำ Document Parser REST API Solution - GroupDocs.Parser Cloud
เรายินดีที่จะแบ่งปันข้อมูลเชิงลึกเกี่ยวกับ GroupDocs.Parser Cloud API ที่กำลังจะมาถึง ซึ่งเป็นส่วนเสริมใหม่ในรายการผลิตภัณฑ์ groupdocs.cloud GroupDocs.Parser Cloud เป็นโซลูชันการแยกวิเคราะห์เอกสาร ในฐานะนักพัฒนา คุณจะสามารถเพิ่มคุณลักษณะการแยกวิเคราะห์เอกสารในแอปพลิเคชันของคุณบนแพลตฟอร์มใดก็ได้โดยไม่ต้องพึ่งพาปลั๊กอินหรือเครื่องมือของบุคคลที่สาม คุณลักษณะหลักของ REST API นี้คือการแยกวิเคราะห์เอกสารบนเทมเพลตที่ผู้ใช้กำหนด เพื่อดึงข้อมูลจากใบแจ้งหนี้ ใบเสนอราคา หรือเอกสารทางธุรกิจประเภทอื่นๆ ของคุณ
คุณสมบัติบางอย่างที่รองรับใน API ที่กำลังจะมาถึงมีดังต่อไปนี้ REST API จะไม่จำกัดเฉพาะฟีเจอร์ต่อไปนี้ แต่เราจะเพิ่มฟีเจอร์ใหม่ๆ ที่เป็นประโยชน์เรื่อยๆ
คุณสมบัติ
แยกวิเคราะห์เอกสารตามเทมเพลต
แยกข้อความ
แยกข้อความเท่านั้น
แยกข้อความที่จัดรูปแบบโดยใช้ตัวเลือกโหมดการแยก ข้อความธรรมดา HTML และ มาร์คดาวน์
แยกข้อความจากหน้าที่ต้องการโดยตั้งค่าช่วงหน้า
แยกรูปภาพ
การสกัดข้อมูลเอกสาร
การจัดการแม่แบบ
รูปแบบที่รองรับ ในรุ่นแรกของ GroupDocs.Parser Cloud API เราจะรองรับรูปแบบไฟล์ต่อไปนี้:
DOC
เอกสาร Microsoft Word
DOT
เทมเพลตเอกสาร Microsoft Word
DOCX
เอกสาร Office Open XML
DOCM
เอกสารที่เปิดใช้งานมาโคร Office Open XML
DOTX
เทมเพลตเอกสาร Office Open XML
โซลูชัน REST API เพื่อผสานและแยกเอกสาร - GroupDocs.Merger Cloud
เพื่อให้แน่ใจว่า GroupDocs REST APIs เป็นผู้นำของ Document Manipulation API เรากำลังทำงานอย่างเต็มที่เพื่อแนะนำคุณสมบัติและ API ใหม่สำหรับกรณีการใช้งานประจำวันของคุณ ดังที่เราได้ประกาศไปก่อนหน้านี้ เรากำลังอยู่ในขั้นตอนเพื่อเพิ่ม REST API ใหม่ในคอลเลกชั่น REST API ของ GroupDocs เรายินดีที่จะเปิดตัวเวอร์ชันแรกของ GroupDocs.Merger Cloud เป็นโซลูชัน REST API ที่เป็นสากลเพื่อรวมและแยกรูปแบบเอกสารที่หลากหลายบนแพลตฟอร์มใดๆ โดยไม่ต้องติดตั้งปลั๊กอินหรือซอฟต์แวร์ใดๆ
GroupDocs.Merger Cloud คืออะไร ในขณะที่ทำงานกับเอกสาร บางครั้งการรวมเอกสารเป็นไฟล์เดียวเป็นข้อกำหนดทั่วไป คุณสามารถคัดลอกและวางเนื้อหาได้โดยตรงเมื่อข้อมูลมีปริมาณไม่มาก แต่ถ้าไม่ใช่กรณีนั้นล่ะ? คุณต้องการโซลูชันอัตโนมัติที่สามารถรวมเอกสารได้อย่างน่าเชื่อถือและแม่นยำ GroupDocs.Merger Cloud เป็น REST API ที่ไม่เพียงแต่อนุญาตให้คุณรวมเอกสารหลายฉบับ แต่ยังจัดการโครงสร้างเอกสารเดียวในประเภทเอกสารที่รองรับที่หลากหลาย ในฐานะนักพัฒนา คุณสามารถใช้มันในแอปพลิเคชันของคุณสำหรับโซลูชันการผสานเอกสาร รองรับ [รูปแบบไฟล์ทั่วไป] ทั้งหมด 3 ประเภทไฟล์ที่รองรับ ได้แก่ PDF, เอกสาร Microsoft Word, สเปรดชีต Excel, งานนำเสนอ PowerPoint, ข้อความธรรมดาและจัดรูปแบบ และรายการรูปแบบเอกสารที่รองรับจำนวนมาก
ต่อไปนี้เป็นรายการคุณสมบัติที่รองรับของ GroupDocs.Merger Cloud เวอร์ชันแรก:
งานเอกสาร
เข้าร่วมเอกสาร
แยกเอกสาร
ดูตัวอย่างเอกสาร
แปลง PDF เป็นเอกสาร Word ที่แก้ไขได้ด้วย Python SDK
ในฐานะนักพัฒนา Python คุณสามารถขอคุณสมบัติการแปลงเอกสาร PDF เป็น Word จากผู้ใช้ของคุณในแอปพลิเคชันของคุณ เนื่องจากเป็นเรื่องยากมากที่จะแก้ไขเอกสาร PDF โดยไม่ใช้ Adobe Acrobat และผู้ใช้มีความต้องการแก้ไขข้อความ ตาราง รูปภาพ และเนื้อหาอื่นๆ ในเอกสาร PDF วิธีแก้ปัญหาสำหรับความต้องการคือการแปลงเอกสาร PDF เป็นเอกสาร Word ที่แก้ไขได้ แต่คุณรู้ว่ามันไม่ง่ายอย่างนั้นโดยทางโปรแกรม โชคดีที่มีโมดูล GroupDocs.Conversion Cloud SDK for Python ที่ช่วยให้คุณแปลง PDF เป็นเอกสาร Word ที่แก้ไขได้ง่ายด้วยโค้ด Python ไม่กี่บรรทัด
PDF เป็น Word - API การแปลงและ Python SDK GroupDocs.Conversion Cloud เป็นโซลูชันการแปลงเอกสารและรูปภาพที่ไม่ขึ้นกับแพลตฟอร์มโดยไม่ต้องพึ่งเครื่องมือหรือซอฟต์แวร์ใดๆ สามารถแปลงรูปภาพและเอกสารของ รูปแบบไฟล์ที่รองรับ ได้อย่างรวดเร็วและเชื่อถือได้ มี SDKs สำหรับภาษาโปรแกรมยอดนิยมทั้งหมดพร้อมซอร์สโค้ดและตัวอย่างการทำงาน ซึ่งช่วยให้นักพัฒนาสามารถใช้ GroupDocs.Conversion Cloud ได้โดยตรงในแอปพลิเคชันของตนโดยไม่ต้องกังวลเกี่ยวกับการเรียก REST API พื้นฐาน ในบทความนี้ ฉันใช้ Python SDK สำหรับการแปลง PDF เป็น Word
วิธีแปลง PDF เป็น DOCX ที่แก้ไขได้ใน Python ฉันจะใช้ Python 3.
GroupDocs.Merger Cloud กำลังจะเปิดตัวเร็วๆ นี้!
คุณกำลังทำงานกับแอปพลิเคชันการจัดการเอกสารและกำลังมองหา API เพื่อรวมเอกสารในแอปพลิเคชันของคุณหรือไม่ การค้นหาตัวเลือกของคุณควรจะจบลง GroupDocs กำลังจะเปิดตัว Cloud API ใหม่ GroupDocs.Merger Cloud ซึ่งจะช่วยให้นักพัฒนาสามารถผสานรวมเอกสารรูปแบบเดียวกันหลายชุดด้วยความแม่นยำและเที่ยงตรงสูงบนทุกแพลตฟอร์มและไม่ต้องพึ่งพาปลั๊กอินของบุคคลที่สาม หรือแอพพลิเคชั่น. คุณสมบัติที่โดดเด่นบางประการที่ API ใหม่จะนำเสนอ ได้แก่ การรวมเอกสาร การแยกเอกสาร การย้ายหน้าเอกสาร การหมุนหน้าเอกสาร การแยกหน้าเอกสาร และอื่นๆ อีกมากมาย
เราจะแบ่งปันภาพรวมของ GroupDocs.Merger Cloud API ที่กำลังจะมีขึ้นด้านล่างนี้ โดยจะไม่จำกัดเฉพาะฟีเจอร์ต่อไปนี้ แต่เราจะเพิ่มฟีเจอร์ที่มีประโยชน์ใหม่ๆ และการสนับสนุนรูปแบบไฟล์ใหม่ใน API ต่อไป
คุณสมบัติ การดำเนินการด้านเอกสาร
เข้าร่วมเอกสาร
แยกเอกสาร
ดูตัวอย่างเอกสาร
การดำเนินการหน้าเอกสาร
ย้ายหน้า
ลบเพจ
หมุนหน้า
สลับหน้า
แยกหน้า
เปลี่ยนการวางแนวหน้า
การดำเนินการรักษาความปลอดภัยเอกสาร
การสกัดข้อมูลเอกสาร
รูปแบบที่รองรับ GroupDocs.Merger Cloud REST API รองรับรูปแบบไฟล์ต่อไปนี้:
รูปแบบ
คำอธิบาย
DOC
เอกสาร Microsoft Word
DOCX
Microsoft Word เปิดเอกสาร XML
DOCM
เอกสารที่เปิดใช้งานมาโคร Word Open XML
แยกข้อความจากเอกสาร PDF ด้วย Python โดยใช้ GroupDocs.Conversion Cloud
PDF (Portable Document Format) เป็นหนึ่งในรูปแบบไฟล์ที่สำคัญและใช้กันอย่างแพร่หลายซึ่งใช้ในการนำเสนอและแลกเปลี่ยนเอกสาร ในฐานะผู้พัฒนา Python มีหลายสถานการณ์ที่คุณต้องการแยกข้อความจากเอกสาร PDF และส่งออกในรูปแบบอื่นโดยใช้ Python สำหรับการวิเคราะห์ข้อความ ในโพสต์นี้ เราจะแสดงวิธีแยกข้อความจากเอกสาร PDF อย่างถูกต้องโดยใช้ GroupDocs.Conversion Cloud SDK for Python
GroupDocs.Conversion Cloud เป็นโซลูชัน REST API ที่ไม่ขึ้นกับแพลตฟอร์มสำหรับการแปลงเอกสารและรูปภาพโดยไม่ต้องพึ่งพาแอปพลิเคชันของบุคคลที่สาม มันแปลงเอกสารมากกว่า 50 ประเภทจากรูปแบบหนึ่งเป็นอีกรูปแบบหนึ่ง มี SDK สำหรับภาษาโปรแกรมยอดนิยมทั้งหมดรวมถึง Python ดังนั้นนักพัฒนาจึงสามารถใช้ API ได้โดยตรงในแอปพลิเคชันของตนโดยไม่ต้องกังวลเกี่ยวกับการเรียกใช้ REST API พื้นฐาน
ให้เราเริ่มรหัส:
ติดตั้ง GroupDocs.Conversion Cloud Package สิ่งแรก ติดตั้ง groupdocs-conversion-cloud package จาก pypi ด้วยคำสั่งต่อไปนี้
>pip ติดตั้ง groupdocs-conversion-cloud
ตัวอย่างการสกัดข้อความ Python PDF เราจะทำตามขั้นตอนเหล่านี้เพื่อแยกข้อความจากเอกสาร PDF:
ลงทะเบียนฟรีกับ groupdocs.cloud to get your AppSID and AppKey สร้างโมดูลPythonและคัดลอกวางโค้ดต่อไปนี้ในนั้น เราได้ใช้ตัวเลือกเริ่มต้นเพื่อแยกข้อความของเอกสาร PDF คุณสามารถแยกข้อความของบางหน้าได้โดยใช้ ตัวเลือกการแปลง ของรูปแบบข้อความ # นำเข้าโมดูล import groupdocs_conversion_cloud # รับ app_sid และ app_key ของคุณที่ https://dashboard.
โซลูชัน RESTful API ที่เชื่อถือได้เพื่อเพิ่มประสิทธิภาพเอกสาร PDF
GroupDocs.Conversion Cloud เป็นโซลูชันการแปลงเอกสารและรูปภาพ ช่วยให้นักพัฒนาสามารถเพิ่มคุณสมบัติการแปลงเอกสารในแอปพลิเคชันของตนบนแพลตฟอร์มใดก็ได้ด้วยการควบคุมที่สมบูรณ์โดยใช้ REST API Calls มาตรฐาน ในโพสต์นี้ เราจะพูดถึงวิธีเพิ่มประสิทธิภาพเอกสาร PDF คุณสามารถไปที่ GroupDocs.Convesion Cloud เพื่อดูรายการคุณลักษณะทั้งหมด
บางครั้งเอกสาร PDF อาจมีข้อมูลเพิ่มเติม การลดขนาดไฟล์ PDF จะช่วยให้คุณเพิ่มประสิทธิภาพการถ่ายโอนและการจัดเก็บเครือข่าย สิ่งนี้มีประโยชน์อย่างยิ่งสำหรับการเผยแพร่บนหน้าเว็บ การแชร์บนโซเชียลเน็ตเวิร์ก ส่งทางอีเมล หรือการเก็บถาวรในที่เก็บข้อมูล ให้ฉันแสดงให้คุณเห็นว่าคุณสามารถใช้ GroupDocs.Conversion Cloud เพื่อเพิ่มประสิทธิภาพเอกสาร PDF สำหรับเว็บหรือปรับขนาดไฟล์ PDF ได้ง่ายเพียงใด ฉันจะใช้ cURL ในตัวอย่างต่อไปนี้ คุณสามารถใช้ SDK ของภาษาโปรแกรมที่คุณชอบโดยไม่ต้องกังวลเกี่ยวกับการเรียกใช้ REST API
เพิ่มประสิทธิภาพเอกสาร PDF สำหรับเว็บ การปรับให้เหมาะสมหรือการทำให้เป็นเส้นตรงสำหรับเว็บ หมายถึงกระบวนการสร้างไฟล์ PDF ที่เหมาะสำหรับการเรียกดูออนไลน์โดยใช้เว็บเบราว์เซอร์ ไฟล์ PDF เชิงเส้นจะโหลดได้เร็วกว่าทางอินเทอร์เน็ต เนื่องจากไฟล์ PDF ที่ทำให้เป็นเส้นตรงมีข้อมูลที่ช่วยให้เซิร์ฟเวอร์การสตรีมแบบไบต์สามารถดาวน์โหลดไฟล์ PDF ทีละหน้าได้ หากการสตรีมแบบไบต์ถูกปิดใช้งานบนเซิร์ฟเวอร์หรือหากไฟล์ PDF ไม่ได้ทำให้เป็นเส้นตรง จะต้องดาวน์โหลดไฟล์ PDF ทั้งหมดก่อนที่จะสามารถดูได้ ตรวจสอบคำสั่ง cURL API เพื่อเพิ่มประสิทธิภาพไฟล์ PDF สำหรับการแสดงเว็บ:
ปรับ PDF ให้เหมาะสมสำหรับเว็บ
จัดประเภทข้อความดิบใน MS Office, PDF และเอกสารอื่นๆ อีกมากมายโดยใช้ cURL