html to json

Chuyển đổi HTML trực tuyến sang JSON với Node.js.

Chuyển đổi HTML file sang JSON giúp các nhà phát triển phân tích nội dung web thành dữ liệu có cấu trúc có thể được sử dụng lại trong các ứng dụng, API hoặc bảng điều khiển. Với GroupDocs.Conversion Cloud SDK cho Node.js, bạn có thể chuyển đổi bất kỳ tệp HTML tĩnh nào thành JSON sạch, có cấu trúc bằng cách sử dụng một API REST đơn giản, làm cho nó trở nên lý tưởng cho tự động hóa backend hoặc di chuyển dữ liệu.

Node.js SDK cho Chuyển đổi HTML sang JSON

GroupDocs.Conversion Cloud SDK for Node.js cho phép bạn chuyển đổi HTML sang JSON một cách chính xác trong khi vẫn giữ nguyên cấu trúc và bố cục của tài liệu HTML gốc.

💡 Các tính năng chính::

  • Chuyển đổi tài liệu HTML đầy đủ thành JSON có cấu trúc.
  • Đơn giản hóa việc phân tích HTML cho việc tiêu thụ API.
  • Không cần phần mềm hoặc plugin bổ sung - giải pháp gốc trên đám mây.

Cài đặt SDK

npm install groupdocs-conversion-cloud --save

Tạo Client ID và Client Secret của bạn từ GroupDocs Cloud dashboard.

Chuyển đổi HTML sang JSON sử dụng Node.js

Phần này giải thích chi tiết về cách chúng ta có thể nhanh chóng và dễ dàng chuyển đổi HTML sang định dạng JSON bằng cách sử dụng Node.js:

Bước 1: Nhập SDK và cấu hình API:

const { Configuration, ConvertApi, FileApi, UploadFileRequest, ConvertSettings, ConvertDocumentRequest } = require("groupdocs-conversion-cloud");
const config = new Configuration("YOUR_CLIENT_ID", "YOUR_CLIENT_SECRET");
const convertApi = new ConvertApi(config);
const fileApi = new FileApi(config);

Bước 2: Tải lên tệp HTML đến lưu trữ đám mây:

const fs = require("fs");
const uploadRequest = new UploadFileRequest("source.json", fs.createReadStream("source.html"));
await fileApi.uploadFile(uploadRequest);

Bước 3: Đặt tùy chọn chuyển đổi (HTML → JSON)

const settings = new ConvertSettings();
settings.filePath = "input.html";
settings.format = "json";
settings.outputPath = "converted/resultant.json";

const request = new ConvertDocumentRequest(settings);
await convertApi.convertDocument(request);
console.log("The HTML to JSON conversion completed successfully.");
// More examples over https://github.com/groupdocs-conversion-cloud/groupdocs-conversion-cloud-dotnet
// Lấy thông tin xác thực API của bạn 
string clientId = "XXXXXX-XXXXXXXXX-4088-9ca0-55c38f4b7f22";
string clientSecret1 = "XXXXXXXXXXXXXXXXXXXX";

// Tạo một thể hiện của lớp Configuration và khởi tạo nó với Client ID & Client Secret
Configuration configuration = new Configuration(clientId, clientSecret);
// Định nghĩa URL cơ sở API để thực hiện chuyển đổi PDF sang HTML trực tuyến
configuration.setApiBaseUrl("https://api.groupdocs.cloud");

// Khởi tạo một phiên bản của ConvertApi với đối tượng Configuration
ConvertApi convertApi = new ConvertApi(configuration);

ConvertSettings settings = new ConvertSettings();
settings.setStorageName("internal");
settings.setFilePath("input.html");
settings.setFormat("JSON");
settings.setOutputPath("resultant.json");
    
// Sử dụng phương thức ConvertDocument để chuyển đổi một tài liệu HTML sang định dạng JSON
ConvertDocumentRequest request = new ConvertDocumentRequest(settings);
List<StoredConvertedResult> response = convertApi.convertDocument(request);
    
// Kiểm tra phản hồi và in ra thông báo thành công
if (response != null && response.equals("OK")) {
    System.out.println("The HTML to JSON conversion completed successfuly! The resultant JSON file is saved at: " + response.getFilePath());
}

HTML to JSON qua lệnh cURL

Sử dụng công cụ dòng lệnh cURL để chuyển đổi HTML sang JSON là một lựa chọn tuyệt vời cho người dùng thích tích hợp nhẹ, không cần mã hoặc tự động. Nó rất thích hợp cho scripting phía máy chủ, quy trình làm việc tích hợp liên tục, hoặc các hệ thống yêu cầu gọi API lập trình mà không cần viết một triển khai đầy đủ dựa trên SDK.

Lợi ích của việc sử dụng cURL cho chuyển đổi:

  • Thân thiện với kịch bản: Dễ dàng tích hợp vào các kịch bản shell hoặc cron jobs.
  • Không cần SDK: Truy cập trực tiếp vào REST API.
  • Lý tưởng cho DevOps: Tích hợp liền mạch vào các pipeline CI/CD.
  • Linh hoạt: Hoạt động trên bất kỳ hệ thống nào có cURL được cài đặt.

Bây giờ, hãy tạo mã truy cập Java Web cá nhân của bạn và thực hiện lệnh sau để chuyển đổi HTML sang JSON.

curl -v "https://api.groupdocs.cloud/v2.0/conversion" \
-X POST \
-H "accept: application/json" \
-H "authorization: Bearer {JWT_TOKEN}" \
-H "Content-Type: application/json" \
-d "{  \"StorageName\": \"internal\",  \"FilePath\": \"{inputFile}\",  \"Format\": \"html\",  \"resultantPath\": \"{myResultant}\"}"

Vui lòng thay thế inputFile bằng tên của tệp JSON đầu vào, resultantPath bằng tên của tệp HTML kết quả và JWTTOKEN bằng một mã thông báo truy cập JWT cá nhân hóa.

  • Nếu yêu cầu của bạn là lưu JSON kết quả vào ổ đĩa cục bộ, vui lòng thử sử dụng lệnh cURL sau:
curl -v "https://api.groupdocs.cloud/v2.0/conversion" \
-X POST \
-H "accept: application/json" \
-H "authorization: Bearer {accessToken}" \
-H "Content-Type: application/json" \
-d "{  \"StorageName\": \"internal\",  \"FilePath\": \"input.json\",  \"Format\": \"html\"}"

Trình chuyển đổi HTML sang JSON miễn phí

Nếu bạn không thích lập trình cho việc chuyển đổi HTML sang JSON, thì bạn có thể xem xét việc sử dụng Free HTML to JSON Converter để chuyển đổi ngay lập tức. Nó được phát triển trên nền tảng của GroupDocs.Conversion Cloud APIs.

bộ chuyển đổi html sang json

Liên kết hữu ích

Kết luận

Trong bài viết này, chúng ta đã học rằng bằng cách sử dụng GroupDocs.Conversion Cloud SDK cho Node.js, chúng ta có thể dễ dàng chuyển đổi HTML thành JSON một cách nhanh chóng, chính xác và có thể mở rộng. Nó rất lý tưởng cho các nhà phát triển làm việc với đường ống dữ liệu, backend bảng điều khiển, hoặc bất kỳ quy trình làm việc nào yêu cầu trích xuất nội dung có cấu trúc từ các nguồn HTML.

Bài viết được đề xuất

Chúng tôi xin khuyến nghị bạn nên truy cập các bài viết sau đây để tìm hiểu thêm về: