Java DOM Parser - แยกข้อความจากเอกสาร XML โดยใช้ Java

ในยุคดิจิทัลปัจจุบัน การดึงข้อมูลจากเอกสาร XML(eXtensible Markup Language) มีบทบาทสำคัญในอุตสาหกรรมและแอปพลิเคชันต่างๆ XML เป็นภาษามาร์กอัปยอดนิยมที่ใช้สำหรับจัดเก็บและจัดระเบียบข้อมูลที่มีโครงสร้างในรูปแบบลำดับชั้น การแยกข้อมูลจากเอกสาร XML เป็นสิ่งจำเป็นสำหรับธุรกิจในการดำเนินการวิเคราะห์ข้อมูลและการดำเนินการดึงข้อมูลบนข้อมูล ในบทความนี้ เราจะสำรวจวิธีแยกข้อความจากเอกสาร XML ใน Java โดยใช้ GroupDocs.Parser Cloud SDK สำหรับ Java

หัวข้อต่อไปนี้จะครอบคลุมในบทความนี้:

Java REST API เพื่อแยกไฟล์ XML และการติดตั้ง SDK

GroupDocs.Parser Cloud SDK for Java เป็นโซลูชันที่มีประสิทธิภาพ ใช้งานง่าย และครอบคลุมสำหรับการแยกข้อความจากรูปแบบเอกสารต่างๆ ได้อย่างง่ายดาย รวมถึง XML ด้วย API ที่ครอบคลุม คุณสามารถดึงข้อความ ข้อมูลเมตา รูปภาพ และข้อมูลอื่นๆ จาก รูปแบบเอกสาร กว่า 50 แบบได้อย่างง่ายดาย สามารถรวม SDK เข้ากับแอปพลิเคชันที่ใช้ Java เพื่อทำให้กระบวนการพัฒนาของคุณง่ายขึ้นและเพิ่มประสิทธิภาพการทำงาน

คุณสามารถ ดาวน์โหลด ไฟล์ JAR ของ API หรือติดตั้งโดยใช้ Maven โดยเพิ่มที่เก็บและการอ้างอิงต่อไปนี้ในไฟล์ pom.xml ของโปรเจ็กต์:

พื้นที่เก็บข้อมูล Maven:

<repository>
    <id>groupdocs-artifact-repository</id>
    <name>GroupDocs Artifact Repository</name>
    <url>https://repository.groupdocs.cloud/repo</url>
</repository>

การพึ่งพา Maven:

<dependency>
    <groupId>com.groupdocs</groupId>
    <artifactId>groupdocs-parser-cloud</artifactId>
    <version>23.3</version>
    <scope>compile</scope>
</dependency>

ตอนนี้ คุณต้อง ลงทะเบียน สำหรับบัญชีทดลองใช้ฟรีหรือ ซื้อแผนการสมัครสมาชิก บนเว็บไซต์ GroupDocs และ รับรหัส API ของคุณ เมื่อคุณมี Client Id และ Client Secret แล้ว ให้เพิ่มข้อมูลโค้ดด้านล่างลงในแอปพลิเคชันที่ใช้ Java:

# รับ client_id และ client_secret ของคุณจาก https://dashboard.groupdocs.cloud หลังจากลงทะเบียน

String ClientId = "xxxxxxxx-xxxx-xxxx-xxxx-xxxxxxxxxxxx";
String ClientSecret = "xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx";
String MyStorage = "test-internal-storage";
Configuration configuration = new Configuration(ClientId, ClientSecret);

วิธีแยกข้อความทั้งหมดจากไฟล์ XML ใน Java โดยใช้ REST API

สำหรับการแตกข้อความจากเอกสาร XML ใน Java โดยใช้ GroupDocs.Parser Cloud SDK for Java ให้ทำตามขั้นตอนเหล่านี้:

อัปโหลดไฟล์

ขั้นแรก อัปโหลดเอกสาร XML ไปยังคลาวด์โดยใช้ตัวอย่างโค้ดที่ระบุด้านล่าง:

package com.groupdocsdev.classes;

import java.io.File;

import com.groupdocs.cloud.parser.api.FileApi;
import com.groupdocs.cloud.parser.client.ApiException;
import com.groupdocs.cloud.parser.client.Configuration;
import com.groupdocs.cloud.parser.model.*;
import com.groupdocs.cloud.parser.model.requests.UploadFileRequest;

// อัปโหลดไฟล์ไปยัง Cloud Storage โดยใช้ Java
public class App {

	public static void main(String[] args) {

		FileApi apiInstance = new FileApi(configuration);
		try {
			File fileStream = new File("H:\\groupdocs-cloud-data\\input-sample-file.xml");
			UploadFileRequest request = new UploadFileRequest("java-testing\\input-sample-file.xml", fileStream, MyStorage);
			FilesUploadResult response = apiInstance.uploadFile(request);
			System.out.println("Expected response type is FilesUploadResult: " + response.getUploaded().size());
		} catch (ApiException e) {
			System.err.println("Exception while calling FileApi:");
			e.printStackTrace();
		}
	}
}

ด้วยเหตุนี้ ไฟล์ XML ที่อัปโหลดจะอยู่ใน ส่วนไฟล์ ของแดชบอร์ดของคุณบนระบบคลาวด์

แยกไฟล์ XML โดยใช้ Java

ต่อไปนี้คือขั้นตอนและตัวอย่างข้อมูลโค้ดที่สาธิตวิธีแยกข้อความจากเอกสาร XML ใน Java โดยใช้ GroupDocs.Parser Cloud SDK สำหรับ Java:

  • ขั้นแรก นำเข้าคลาสที่จำเป็นลงในไฟล์ Java ของคุณ
  • ประการที่สอง สร้างอินสแตนซ์ของคลาส ParseApi
  • ประการที่สาม สร้างอินสแตนซ์ของคลาส FileInfo
  • ถัดไป กำหนดเส้นทางไปยังไฟล์ XML เป็นอินพุต
  • จากนั้น สร้างอินสแตนซ์ของคลาส TextOptions()
  • ถัดไป กำหนด fileInfo ให้กับเมธอด setFileInfo
  • ตอนนี้ สร้างอินสแตนซ์ของคลาส TextRequest() และส่งผ่านพารามิเตอร์ TextOptions
  • สุดท้าย รับผลลัพธ์โดยเรียกเมธอด ParseApi.text() และส่งพารามิเตอร์ TextRequest

ตัวอย่างโค้ดต่อไปนี้แสดงวิธีการแยกข้อความและแยกวิเคราะห์เอกสาร XML ใน Java โดยใช้ REST API:

package com.groupdocsdev.classes;

import com.groupdocs.cloud.parser.api.ParseApi;
import com.groupdocs.cloud.parser.client.ApiException;
import com.groupdocs.cloud.parser.client.Configuration;
import com.groupdocs.cloud.parser.model.FileInfo;
import com.groupdocs.cloud.parser.model.*;
import com.groupdocs.cloud.parser.model.requests.TextRequest;

// วิธีแยกข้อความจากไฟล์ XML ใน Java
public class App {

	public static void main(String[] args) {
		
		// สร้างอินสแตนซ์ของ Parse API
		ParseApi apiInstance = new ParseApi(configuration);

		try {

			// เตรียมการตั้งค่า
			FileInfo fileInfo = new FileInfo();
			fileInfo.setFilePath("java-testing/input-sample-file.xml");
			TextOptions options = new TextOptions();
			options.setFileInfo(fileInfo);

			TextRequest request = new TextRequest(options);
			TextResult response = apiInstance.text(request);

			// รับเส้นทางไฟล์เอาต์พุต
			System.out.println("Output file path: " + response.getPath());
				
		} catch (ApiException e) {
			System.err.println("Exception while calling FileApi:");
			e.printStackTrace();
		}
		
	}
}

คุณสามารถดูผลลัพธ์ในภาพด้านล่าง:

Java แยกข้อความจากเอกสาร XML

แยกข้อความจากเอกสาร XML ใน Java

โปรแกรมแยกวิเคราะห์ XML ออนไลน์ฟรี

วิธีที่ดีที่สุดในการแยกข้อความจาก XML ออนไลน์ฟรีคืออะไร โปรดลองใช้ ซอฟต์แวร์ตัวแยกวิเคราะห์ XML ออนไลน์ เพื่อขูดไฟล์ XML เครื่องมือตัวแยกวิเคราะห์ XML นี้ได้รับการพัฒนาโดยใช้ไลบรารีตัวแยกวิเคราะห์ Java ที่กล่าวถึงข้างต้น

บทสรุป

โดยสรุป นักพัฒนาสามารถลดความซับซ้อนของกระบวนการดึงข้อมูลและเข้าถึงข้อมูลภายในเอกสาร XML ได้อย่างมีประสิทธิภาพด้วย GroupDocs.Parser Cloud SDK สำหรับ Java ต่อไปนี้คือสิ่งที่คุณได้เรียนรู้จากบทความนี้:

  • วิธีแยกข้อความทั้งหมดจากเอกสาร XML ใน Java โดยใช้ REST API
  • อัปโหลดไฟล์ XML โดยทางโปรแกรมไปยังคลาวด์โดยใช้ Java
  • และเครื่องมือแยก XML ออนไลน์เพื่อแยกวิเคราะห์เอกสาร XML

นอกจากนี้ คุณสามารถเรียนรู้เพิ่มเติมเกี่ยวกับ GroupDocs.Parser Cloud API โดยใช้ เอกสารประกอบ นอกจากนี้ เรายังมีส่วน การอ้างอิง API ที่ช่วยให้คุณแสดงภาพและโต้ตอบกับ API ของเราได้โดยตรงผ่านเบราว์เซอร์ ซอร์สโค้ดที่สมบูรณ์ของ Java SDK มีให้ใช้งานฟรีบน Github

สุดท้าย เรายังคงเขียนบทความบล็อกใหม่ๆ ในรูปแบบไฟล์ต่างๆ และแยกวิเคราะห์โดยใช้ REST API ดังนั้น กรุณาติดต่อเพื่อรับการปรับปรุงล่าสุด

ถามคำถาม

ในกรณีที่คุณมีข้อสงสัยหรือสับสนเกี่ยวกับตัวแยกวิเคราะห์ข้อมูล XML โปรดติดต่อเราผ่านทาง ฟอรัม

คำถามที่พบบ่อย

ฉันจะแยกข้อความทั้งหมดจากไฟล์ XML โดยใช้ Java ได้อย่างไร

ก่อนอื่นคุณเริ่มต้นคลาส ParserApi และตั้งค่าข้อมูลรับรอง API ของเราโดยใช้ GroupDocs.Parser Cloud SDK for Java จากนั้น สร้างวัตถุ ExtractOptions และระบุไฟล์เอกสาร XML โดยใช้ FileInfo สุดท้าย เรียกใช้เมธอดการแตกไฟล์ ส่งผ่านตัวเลือก และดึงข้อความที่แยกออกมาโดยใช้เมธอด getText

ฉันจะแยกวิเคราะห์เอกสาร XML โดยใช้ Java ได้อย่างไร

คุณสามารถแยกวิเคราะห์ไฟล์ XML โดยใช้ GroupDocs.Parser Cloud SDK for Java ในแอปพลิเคชัน Java ของคุณ SDK อันทรงพลังนี้มอบวิธีที่มีประสิทธิภาพและตรงไปตรงมาในการดึงข้อมูลจากไฟล์ XML ใน Java

ดูสิ่งนี้ด้วย

ต่อไปนี้คือบทความที่เกี่ยวข้องบางส่วนที่คุณอาจพบว่ามีประโยชน์: