Word 문서(DOC, DOCX)를 텍스트 형식으로 변환하는 것은 데이터 추출, 인덱싱 또는 자동화 워크플로우에서 일반적인 요구사항입니다. .NET Cloud SDK의 도움으로 Microsoft Word에 의존하지 않고 자연어 처리, 콘텐츠 분석 또는 대용량 텍스트 데이터를 저장하기 위해 Word 문서에서 쉽게 텍스트를 추출할 수 있습니다.
- Word to Text Conversion API
- [DOCX를 TXT로 변환하는 방법은 C#을 사용하여 다음과 같이 할 수 있습니다.
using System;
using System.IO;
using DocumentFormat.OpenXml.Packaging;
using DocumentFormat.OpenXml.Wordprocessing;
class Program
{
static void Main(string[] args)
{
string docxFilePath = "yourfile.docx"; // 변환할 DOCX 파일 경로
string txtFilePath = "yourfile.txt"; // 저장할 TXT 파일 경로
using (WordprocessingDocument wordDoc = WordprocessingDocument.Open(docxFilePath, false))
{
Body body = wordDoc.MainDocumentPart.Document.Body;
string text = body.InnerText;
File.WriteAllText(txtFilePath, text);
}
Console.WriteLine("변환 완료!");
}
}
위 코드를 사용하여 DOCX 파일을 TXT 파일로 변환할 수 있습니다. DocumentFormat.OpenXml 라이브러리를 사용해야 하므로, NuGet 패키지 관리자를 통해 설치해 주세요.](#docx-txt-csharp)
Word to Text Conversion API
GroupDocs.Parser Cloud SDK for .NET는 Word 문서를 텍스트 형식으로 파싱, 추출 및 변환할 수 있는 강력한 도구를 제공합니다. DOC, DOCX 및 기타 인기 있는 문서 형식을 지원하며, 개발자에게 .NET 애플리케이션에서 문서-텍스트 또는 docx-txt 변환기를 빠르게 구축할 수 있는 방법을 제공합니다.
필수 조건
- GroupDocs Cloud Dashboard에서 가입하세요.
- 클라이언트 ID와 클라이언트 시크릿을 가져오세요. 더 자세한 정보는 이 기사를 방문해 주세요.
- .NET 6.0 이상 및 Visual Studio를 설치하세요.
- NuGet 패키지에서 SDK를 설치합니다:
NuGet\Install-Package GroupDocs.Parser-Cloud -Version 25.7.0
DOCX를 TXT로 변환 C#{#docx-txt-csharp} 사용하기
여기 GroupDocs.Parser Cloud SDK for .NET을 사용하여 DOCX를 TXT로 변환하거나 Word 문서에서 텍스트를 추출하는 방법을 보여주는 간단한 예가 있습니다.
1.: API 구성을 초기화합니다.
var config = new Configuration
{
ClientId = "YOUR_CLIENT_ID",
ClientSecret = "YOUR_CLIENT_SECRET"
};
var parserApi = new ParserApi(config);
2.: Parse 메서드를 호출하여 문서의 텍스트 내용을 추출합니다. ImagesRequest 객체를 초기화하여 ImagesOptions 클래스의 인스턴스를 인수로 전달합니다.
var response = parserApi.Parse(new ParseRequest("sample.docx"));
3.: 추출된 텍스트를 .txt 파일로 로컬에 저장하여 추가 처리를 위해 사용합니다.
File.WriteAllText("output.txt", response.Text);
- 💡 특정 페이지나 문단에서 텍스트를 추출하려면 ParseOptions 매개변수에서 필터를 설정할 수 있습니다.
// 더 많은 예시를 보려면 https://github.com/groupdocs-parser-cloud/groupdocs-parser-cloud-dotnet 를 방문해 주세요.
var configuration = new Configuration("XXXXXXX-XXXXXXX-XXXXXX-55c38f4b7f22", "XXXXXXXXXXXX");
var parseApi = new ParseApi(configuration);
var fileApi = new FileApi(configuration);
// Load input Word document
using (var fileStream = OpenRead("input.docx"))
{
// upload the input Word document to cloud storage
var uploadRequest = new Requests.UploadFileRequest("sample.docx", fileStream);
fileApi.UploadFile(uploadRequest);
}
var options = new TextOptions
{
FileInfo = new FileInfo { FilePath = "sample.docx" }
};
var request = new TextRequest(options);
// extract text from input Word document
var response = parseApi.Text(request);
Console.WriteLine("Extracted Text:\n");
Console.WriteLine(response.Text);
Word에서 cURL을 사용하여 텍스트 추출하기
명령줄 작업을 선호하는 경우 cURL을 통해 REST API를 직접 사용하여 DOC 또는 DOCX를 온라인에서 텍스트로 변환할 수 있습니다.
Step 1: Access Token 얻기:
curl -X POST "https://api.groupdocs.cloud/connect/token" \
-d "grant_type=client_credentials&client_id=YOUR_CLIENT_ID&client_secret=YOUR_CLIENT_SECRET" \
-H "Content-Type: application/x-www-form-urlencoded"
2단계: DOCX를 TXT로 변환:
curl -X POST "https://api.groupdocs.cloud/v1.0/parser/{inputFile}/text" \
-H "accept: application/json" \
-H "authorization: Bearer {ACCESS_TOKEN}" \
-o "{outputFile}.txt"
{inputFile}를 Word 파일 이름으로 바꾸고 {outputFile}를 로컬에 저장할 원하는 TXT 파일 이름으로 바꾸십시오.
무료 DOCX를 TXT로 변환기 온라인
빠르게 Word to text conversion online을 시도하고 싶다면 Free DOCX to TXT Converter를 확인하세요. 이 도구는 브라우저에서 직접 Word 파일을 텍스트 형식으로 업로드하고 즉시 변환할 수 있도록 해줍니다 — 설치나 코딩이 필요 없습니다.

요약
우리는 우리의 .NET Cloud SDK가 Word 문서에서 텍스트를 추출하고 이를 TXT 형식으로 변환하는 신뢰할 수 있는 클라우드 기반 솔루션을 제공한다는 것을 탐구했습니다. 이는 데이터 추출, 콘텐츠 분석 및 통합을 간소화합니다. 엔터프라이즈 문서 처리 시스템.
GroupDocs.Parser Cloud를 사용해야 하는 이유는 무엇인가요?
- DOC 및 DOCX 형식을 지원합니다.
- .NET 애플리케이션과의 쉬운 통합.
- 100% 클라우드 기반 — Microsoft Word 불필요.
- 데이터 처리 또는 저장을 위해 깨끗한 TXT 출력 생성.
자주 묻는 질문 (FAQs)
- DOCX 파일을 TXT로 C#을 사용하여 변환할 수 있습니까?
- 네. SDK는 Word 문서에서 텍스트를 직접 TXT 형식으로 추출하고 저장할 수 있게 해줍니다.
- DOC와 DOCX 파일을 모두 지원하나요?
- 네. 두 파일 형식 모두 변환 및 텍스트 추출을 위해 완전히 지원됩니다.
- 이 변환에 Microsoft Word가 필요합니까?
- 아니요. 변환은 전적으로 GroupDocs Cloud 플랫폼에서 수행됩니다.
- 특정 섹션이나 페이지를 추출하도록 선택할 수 있습니까?
- 네. 부분 텍스트 추출을 위해 페이지 범위 또는 영역을 정의할 수 있습니다.
유용한 링크
관련 기사
- PDF에서 이미지 추출하기 C# .NET
- PDF에서 텍스트 추출하기 C# .NET 사용하여
- [PDF를 JPG로 변환하기 위해 C#에서 사용할 수 있는 방법은 여러 가지가 있습니다. 아래는 PDF 파일을 JPG 이미지로 변환하는 간단한 예제입니다. 이 예제에서는 iText7 및 ImageSharp 라이브러리를 사용합니다.
NuGet 패키지 관리자에서 iText7 및 ImageSharp 패키지를 설치합니다.
Install-Package itext7 Install-Package SixLabors.ImageSharp다음 코드를 사용하여 PDF를 JPG로 변환합니다.
using System;
using System.IO;
using Itext.Kernel.Pdf;
using Itext.Layout.Renderer;
using SixLabors.ImageSharp;
using SixLabors.ImageSharp.PixelFormats;
public class PdfToJpgConverter
{
public static void ConvertPdfToJpg(string pdfPath, string jpgPath)
{
using (PdfReader pdfReader = new PdfReader(pdfPath))
using (PdfDocument pdfDocument = new PdfDocument(pdfReader))
{
for (int i = 1; i <= pdfDocument.GetNumberOfPages(); i++)
{
using (var image = pdfDocument.GetPage(i).GetBitmap())
{
var outputFilePath = Path.Combine(jpgPath, $"page-{i}.jpg");
image.Save(outputFilePath);
}
}
}
}
}
// 사용 예:
string pdfFilePath = "input.pdf";
string outputDirectory = "output_jpgs";
PdfToJpgConverter.ConvertPdfToJpg(pdfFilePath, outputDirectory);
이 코드는 지정된 PDF 파일의 각 페이지를 JPG 형식의 이미지로 변환하여 지정된 출력 디렉토리에 저장합니다. PDF 파일 경로와 출력 디렉토리를 원하는 경로로 수정하면 됩니다.]21
