Konwersja dokumentów Word (DOC, DOCX) na format tekstowy jest powszechnym wymaganiem w ekstrakcji danych, indeksowaniu lub automatyzacji procesów. Dzięki .NET Cloud SDK można łatwo wydobywać tekst z dokumentów Word do przetwarzania języka naturalnego, analizy treści lub przechowywania dużych danych tekstowych bez polegania na programie Microsoft Word.

Word to Text Conversion API

SDK GroupDocs.Parser Cloud SDK for .NET oferuje potężne narzędzia do przetwarzania, ekstrakcji i konwersji dokumentów Word do formatu tekstowego. Obsługuje formaty DOC, DOCX oraz inne popularne formaty dokumentów, zapewniając programistom szybki sposób na stworzenie konwerterów dokumentów na tekst lub docx na txt w aplikacjach .NET.

Wymagania wstępne

  • Zarejestruj się na GroupDocs Cloud Dashboard.
  • Uzyskaj swój identyfikator klienta i tajny klucz klienta. Po więcej informacji, proszę odwiedzić ten artykuł.
  • Zainstaluj .NET 6.0 lub nowszy oraz Visual Studio.
  • Zainstaluj SDK z pakietów NuGet:
NuGet\Install-Package GroupDocs.Parser-Cloud -Version 25.7.0

Convert DOCX to TXT Using C#

Oto prosty przykład demonstrujący, jak konwertować DOCX na TXT lub wydobywać tekst z dokumentów Word przy użyciu GroupDocs.Parser Cloud SDK dla .NET.

1.: Zainicjalizuj konfigurację API

var config = new Configuration
{
    ClientId = "YOUR_CLIENT_ID",
    ClientSecret = "YOUR_CLIENT_SECRET"
};
var parserApi = new ParserApi(config);

2.: Wywołaj metodę Parse, aby wyodrębnić tekstową zawartość dokumentu. Zainicjalizuj obiekt obiektu ImagesRequest, w którym przekazujemy instancję klasy ImagesOptions jako argument.

var response = parserApi.Parse(new ParseRequest("sample.docx"));

3.: Zapisz wyodrębniony tekst jako plik .txt lokalnie do dalszego przetwarzania.

File.WriteAllText("output.txt", response.Text);
  • 💡 Możesz również wyodrębnić tekst z konkretnych stron lub akapitów, ustawiając filtry w parametrze ParseOptions.
// Dla dalszych przykładów, proszę odwiedzić https://github.com/groupdocs-parser-cloud/groupdocs-parser-cloud-dotnet

var configuration = new Configuration("XXXXXXX-XXXXXXX-XXXXXX-55c38f4b7f22", "XXXXXXXXXXXX");
var parseApi = new ParseApi(configuration);
var fileApi = new FileApi(configuration);

// Load input Word document
using (var fileStream = OpenRead("input.docx"))
{
    // upload the input Word document to cloud storage
    var uploadRequest = new Requests.UploadFileRequest("sample.docx", fileStream);
    fileApi.UploadFile(uploadRequest);
}

var options = new TextOptions
{
    FileInfo = new FileInfo { FilePath = "sample.docx" }
};

var request = new TextRequest(options);
// extract text from input Word document
var response = parseApi.Text(request);

Console.WriteLine("Extracted Text:\n");
Console.WriteLine(response.Text);    

Extract Text from Word via cURL

Jeśli wolisz operacje w wierszu poleceń, możesz użyć interfejsu API REST bezpośrednio przez cURL, aby konwertować pliki DOC lub DOCX na tekst online.

Krok 1: Uzyskaj token dostępu:

curl -X POST "https://api.groupdocs.cloud/connect/token" \
-d "grant_type=client_credentials&client_id=YOUR_CLIENT_ID&client_secret=YOUR_CLIENT_SECRET" \
-H "Content-Type: application/x-www-form-urlencoded"

Krok 2: Konwertuj DOCX na TXT:

curl -X POST "https://api.groupdocs.cloud/v1.0/parser/{inputFile}/text" \
  -H "accept: application/json" \
  -H "authorization: Bearer {ACCESS_TOKEN}" \
  -o "{outputFile}.txt"

Zamień {inputFile} na nazwę swojego pliku Word i {outputFile} na pożądaną nazwę pliku TXT, aby zapisać lokalnie.

Free DOCX to TXT Converter Online

Jeśli chcesz szybko wypróbować Word to text conversion online, sprawdź darmowy konwerter DOCX na TXT. Umożliwia on przesłanie i natychmiastowe przekonwertowanie każdego pliku Word na format tekstowy bezpośrednio w przeglądarce — bez instalacji ani kodowania.

Darmowy ekstraktor obrazów

Streszczenie

Zbadaliśmy, że nasze .NET Cloud SDK oferuje niezawodne, oparte na chmurze rozwiązanie do ekstrakcji tekstu z dokumentów Word i konwersji ich na format TXT. Ułatwia to ekstrakcję danych, analizę treści i integrację z systemy przetwarzania dokumentów dla przedsiębiorstw.

Dlaczego warto używać GroupDocs.Parser Cloud?

  • Obsługuje formaty DOC i DOCX.
  • Łatwa integracja z aplikacjami .NET.
  • 100% w chmurze — nie potrzebny Microsoft Word.
  • Generate clean TXT output ready for data processing or storage.

Najczęściej zadawane pytania (FAQ)

  1. Can I convert DOCX to TXT using C#?
  • Tak. SDK pozwala na ekstrakcję i zapisywanie tekstu z dokumentów Word bezpośrednio w formacie TXT.
  1. Czy obsługuje pliki DOC oraz DOCX?
  • Tak. Oba formaty plików są w pełni obsługiwane w zakresie konwersji i ekstrakcji tekstu.
  1. Czy Microsoft Word jest wymagany do tej konwersji?
  • Nie. Konwersja jest wykonywana w całości na platformie GroupDocs Cloud.
  1. Czy mogę wybrać konkretne sekcje lub strony do ekstrakcji?
  • Tak. Możesz zdefiniować zakresy stron lub obszary do częściowego wyodrębniania tekstu.

Przydatne linki

Powiązane artykuły