XML(eXtensible Markup Language)은 구조화된 정보를 저장하고 교환하는 데 널리 사용되는 데이터 형식입니다. 웹 개발, 데이터 저장, 데이터 전송 등 다양한 영역에서 널리 사용되고 있습니다. XML 파일에서 텍스트를 추출하는 것은 여러 가지 이유로 중요합니다. XML 문서에 포함된 실제 데이터에 액세스하고 조작할 수 있습니다. 텍스트를 추출하여 데이터 분석, 데이터 변환, 데이터 통합 등의 다양한 작업을 수행할 수 있습니다. 이 기사에서는 REST API를 사용하여 Python의 XML에서 텍스트를 추출하는 방법을 살펴봅니다.
이 문서에서는 다음 항목을 다룹니다.
XML 문서 및 SDK 설치를 구문 분석하기 위한 Python REST API
Python용 GroupDocs.Parser Cloud SDK는 XML 및 기타 파일 형식에서 텍스트 추출을 간소화하는 강력한 도구입니다. 문서 구문 분석, 텍스트 추출, 메타데이터 추출 등 다양한 기능을 제공합니다. 직관적인 API를 통해 개발자는 텍스트 추출 기능을 Python 애플리케이션에 쉽게 통합할 수 있습니다. 또한 Cloud API용 문서 파서 계열 구성원으로 C# .NET, Java, PHP, Ruby 및 Node.js SDK를 지원합니다. SDK는 Python 기반 애플리케이션에 통합되어 개발 프로세스를 단순화하고 생산성을 향상시킬 수 있습니다.
XML에서 정보를 추출하려면 콘솔에서 다음 명령을 사용하여 pip(Python용 패키지 설치 프로그램)로 GroupDocs.Parser Cloud를 Python 프로젝트에 설치합니다.
pip install groupdocs_parser_cloud
이제 대시보드에서 클라이언트 ID와 클라이언트 암호를 가져와 아래와 같이 코드를 추가하십시오.
# groupdocs 파서 SDK 가져오기
import groupdocs_parser_cloud
# 무료 등록 후 https://dashboard.groupdocs.cloud에서 app_sid 및 app_key를 받으세요.
app_sid = "xxxxxxx-xxxx-xxxx-xxxx-xxxxxxxxxxxx"
app_key = "xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx"
# 파일 API 구성을 가져옵니다.
configuration = groupdocs_parser_cloud.Configuration(app_sid, app_key)
configuration.api_base_url = "https://api.groupdocs.cloud"
storage_name = "LocalStorage"
REST API를 사용하여 Python의 XML 파일에서 모든 텍스트 추출
Python용 GroupDocs.Parser Cloud SDK를 사용하여 Python의 XML 문서에서 텍스트를 추출하려면 다음 단계를 따르세요.
파일 업로드
먼저 아래 제공된 코드 예제를 사용하여 XML 문서를 클라우드에 업로드합니다.
# 파일 API의 인스턴스 만들기
file_api = groupdocs_parser_cloud.FileApi.from_config(configuration)
# 전화 업로드 파일 요청
request = groupdocs_parser_cloud.UploadFileRequest("python-testing\input-sample-file.pdf", "H:\\groupdocs-cloud-data\\input-sample-file.pdf", storage_name)
# 클라우드에 파일 업로드
response = file_api.upload_file(request)
print(response.uploaded)
결과적으로 업로드된 XML 파일은 클라우드 대시보드의 파일 섹션에서 사용할 수 있습니다.
Python을 사용하여 XML 데이터에서 모든 텍스트 추출
이 섹션에서는 Python용 GroupDocs.Parser Cloud SDK를 사용하여 Python의 XML 문서에서 텍스트를 추출하는 방법을 보여 주는 단계와 예제 코드 스니펫을 작성합니다.
- 먼저 ParseApi 클래스의 인스턴스를 만듭니다.
- 둘째, TextOptions() 클래스의 인스턴스를 만듭니다.
- 셋째, FileInfo 클래스의 인스턴스를 생성합니다.
- 그리고 텍스트 옵션 fileInfo 메서드에 할당합니다.
- 그런 다음 XML 파일의 경로를 입력으로 설정합니다.
- 이제 TextRequest() 클래스의 인스턴스를 만들고 TextOptions 매개 변수를 전달합니다.
- 마지막으로 ParseApi.text() 메서드를 호출하고 TextRequest 매개 변수를 전달하여 결과를 얻습니다.
다음 코드 샘플은 REST API를 사용하여 Python의 XML 문서에서 텍스트를 추출하는 방법을 보여줍니다.
# REST API를 사용하여 Python의 XML에서 텍스트를 추출하는 방법
try:
# API 초기화
parseApi = groupdocs_parser_cloud.ParseApi.from_config(configuration)
# 텍스트 옵션 정의
options = groupdocs_parser_cloud.TextOptions()
options.file_info = groupdocs_parser_cloud.FileInfo()
options.file_info.file_path = "python-testing/input-sample-file.xml"
request = groupdocs_parser_cloud.TextRequest(options)
result = parseApi.text(request)
print("Successfully extracted text: " + result.text)
except groupdocs_parser_cloud.ApiException as e:
print("Exception while calling API: {0}".format(e.message))
아래 이미지에서 출력을 볼 수 있습니다.
무료 온라인 문서 파서
온라인에서 무료로 XML에서 텍스트를 추출하는 방법은 무엇입니까? XML 파일에서 데이터를 추출하려면 온라인 XML 파서 소프트웨어를 사용해 보십시오. 이 XML 파서 도구는 위에서 언급한 Python 파서 라이브러리를 사용하여 개발되었습니다.
결론
결론적으로 XML 파일에서 텍스트를 추출하는 것은 XML 데이터로 작업할 때 기본적인 작업입니다. GroupDocs.Parser Cloud SDK와 결합된 Python은 XML 파일에서 텍스트를 추출하기 위한 안정적이고 효율적인 솔루션을 제공합니다. 이 기사에서 배운 내용은 다음과 같습니다.
- REST API를 사용하여 Python의 XML 문서에서 모든 텍스트를 추출하는 방법
- 프로그래밍 방식으로 Python을 사용하여 XML 파일을 클라우드에 업로드합니다.
- XML 문서를 구문 분석하기 위한 온라인 XML 데이터 추출 소프트웨어.
그 외에도 문서를 사용하여 GroupDocs.Parser Cloud API에 대해 자세히 알아볼 수 있습니다. 또한 브라우저를 통해 직접 API를 시각화하고 상호 작용할 수 있는 API 참조 섹션을 제공합니다. Python SDK의 전체 소스 코드는 Github에서 무료로 사용할 수 있습니다.
마지막으로 우리는 계속해서 다른 파일 형식으로 새 블로그 기사를 작성하고 REST API를 사용하여 구문 분석합니다. 따라서 최신 업데이트에 대해 문의하십시오.
질문하기
XML 문서 파서에 대한 질문이나 혼동이 있는 경우 포럼을 통해 언제든지 문의하십시오.
FAQ
XML 파일에서 텍스트를 추출해야 하는 이유는 무엇입니까?
XML 파일에서 텍스트를 추출하면 XML 문서에 포함된 실제 데이터에 액세스하고 조작할 수 있습니다.
Python을 사용하여 XML 파일에서 텍스트를 추출하려면 어떻게 해야 합니까?
강력한 텍스트 추출 기능을 제공하는 Python용 GroupDocs.Parser Cloud SDK를 사용하여 XML 파일에서 텍스트를 추출할 수 있습니다.
Python용 GroupDocs.Parser Cloud SDK를 사용하여 XML 파일에서 메타데이터를 추출할 수 있습니까?
예, Python용 GroupDocs.Parser Cloud SDK는 XML 파일에서 메타데이터 추출을 지원합니다. 작성자, 생성 날짜, 수정 날짜 등과 같은 메타데이터 정보를 검색할 수 있습니다.
Python용 GroupDocs.Parser Cloud SDK를 사용하여 XML 파일에 포함된 이미지를 추출할 수 있습니까?
예, Python용 GroupDocs.Parser Cloud SDK를 사용하면 XML 파일에 포함된 이미지를 추출하여 다른 형식으로 변환할 수 있습니다.
또한보십시오
다음은 도움이 될 수 있는 몇 가지 관련 문서입니다.