การแปลงเอกสาร Word (DOC, DOCX) เป็นรูปแบบข้อความเป็นความต้องการทั่วไปในกระบวนการดึงข้อมูล การจัดทำดัชนี หรือการทำงานอัตโนมัติ ด้วยความช่วยเหลือจาก .NET Cloud SDK คุณสามารถดึงข้อความจากเอกสาร Word ได้อย่างง่ายดายสำหรับการประมวลผลภาษาธรรมชาติ การวิเคราะห์เนื้อหา หรือการจัดเก็บข้อมูลข้อความขนาดใหญ่โดยไม่ต้องพึ่งพา Microsoft Word

API แปลงคำเป็นข้อความ

GroupDocs.Parser Cloud SDK for .NET นำเสนอเครื่องมือที่มีประสิทธิภาพในการแปลง เรียกดู และแปลงเอกสาร Word เป็นรูปแบบข้อความ รองรับ DOC, DOCX และรูปแบบเอกสารยอดนิยมอื่นๆ โดยให้ผู้พัฒนามีวิธีที่รวดเร็วในการสร้างตัวแปลงเอกสารเป็นข้อความหรือตัวแปลง docx เป็น txt ในแอปพลิเคชัน .NET

ข้อกำหนดเบื้องต้น

  • ลงทะเบียนที่ GroupDocs Cloud Dashboard.
  • รับตัวระบุลูกค้าและความลับของลูกค้า สำหรับข้อมูลเพิ่มเติม โปรดเยี่ยมชม this article.
  • ติดตั้ง .NET 6.0 หรือเวอร์ชันที่ใหม่กว่าและ Visual Studio.
  • ติดตั้ง SDK จาก NuGet Packages:
NuGet\Install-Package GroupDocs.Parser-Cloud -Version 25.7.0

แปลง DOCX เป็น TXT โดยใช้ C#

นี่คือตัวอย่างง่าย ๆ ที่แสดงวิธีการแปลง DOCX เป็น TXT หรือดึงข้อความจากเอกสาร Word โดยใช้ GroupDocs.Parser Cloud SDK สำหรับ .NET.

1.: เริ่มการตั้งค่า API

var config = new Configuration
{
    ClientId = "YOUR_CLIENT_ID",
    ClientSecret = "YOUR_CLIENT_SECRET"
};
var parserApi = new ParserApi(config);

2.: เรียกใช้วิธีการ Parse เพื่อดึงเนื้อหาข้อความของเอกสารออกมา。 สร้างออบเจ็กต์ของออบเจ็กต์ ImagesRequest โดยเราผ่านอินสแตนซ์ของคลาส ImagesOptions เป็นอาร์กิวเมนต์

var response = parserApi.Parse(new ParseRequest("sample.docx"));

3.: บันทึกข้อความที่ถูกคัดลอกมาเป็นไฟล์ .txt ในเครื่องเพื่อการประมวลผลต่อไป

File.WriteAllText("output.txt", response.Text);
  • 💡 คุณยังสามารถดึงข้อความจากหน้าหรือย่อหน้าที่เฉพาะเจาะจงได้โดยการตั้งค่าตัวกรองในพารามิเตอร์ ParseOptions
// สำหรับตัวอย่างเพิ่มเติม กรุณาเยี่ยมชม https://github.com/groupdocs-parser-cloud/groupdocs-parser-cloud-dotnet

var configuration = new Configuration("XXXXXXX-XXXXXXX-XXXXXX-55c38f4b7f22", "XXXXXXXXXXXX");
var parseApi = new ParseApi(configuration);
var fileApi = new FileApi(configuration);

// โหลดเอกสาร Word ที่ป้อนเข้า
using (var fileStream = OpenRead("input.docx"))
{
    // อัปโหลดเอกสาร Word ที่เป็นข้อมูลเข้าสู่คลาวด์สโตเรจ
    var uploadRequest = new Requests.UploadFileRequest("sample.docx", fileStream);
    fileApi.UploadFile(uploadRequest);
}

var options = new TextOptions
{
    FileInfo = new FileInfo { FilePath = "sample.docx" }
};

var request = new TextRequest(options);
// extract text from input Word document
var response = parseApi.Text(request);

Console.WriteLine("Extracted Text:\n");
Console.WriteLine(response.Text);    

Extract Text from Word via cURL

หากคุณชอบการทำงานผ่านบรรทัดคำสั่ง คุณสามารถใช้ REST API โดยตรงผ่าน cURL เพื่อแปลงไฟล์ DOC หรือ DOCX เป็นข้อความออนไลน์ได้

ขั้นตอนที่ 1: รับโทเค็นการเข้าถึง:

curl -X POST "https://api.groupdocs.cloud/connect/token" \
-d "grant_type=client_credentials&client_id=YOUR_CLIENT_ID&client_secret=YOUR_CLIENT_SECRET" \
-H "Content-Type: application/x-www-form-urlencoded"

ขั้นตอนที่ 2: แปลง DOCX เป็น TXT:

curl -X POST "https://api.groupdocs.cloud/v1.0/parser/{inputFile}/text" \
  -H "accept: application/json" \
  -H "authorization: Bearer {ACCESS_TOKEN}" \
  -o "{outputFile}.txt"

แทนที่ {inputFile} ด้วยชื่อไฟล์ Word ของคุณและ {outputFile} ด้วยชื่อไฟล์ TXT ที่ต้องการบันทึกในเครื่อง.

ฟรี DOCX เป็น TXT ตัวแปลงออนไลน์

หากคุณต้องการลองใช้ Word to text conversion online อย่างรวดเร็ว ให้ตรวจสอบโปรแกรมแปลง DOCX เป็น TXT ฟรี มันช่วยให้คุณอัปโหลดและแปลงไฟล์ Word เป็นรูปแบบข้อความได้ทันทีในเบราว์เซอร์ของคุณ — ไม่ต้องติดตั้งหรือเขียนโค้ด

เครื่องมือดึงรูปภาพฟรี

สรุป

เราได้สำรวจว่า .NET Cloud SDK ของเรามีโซลูชันที่เชื่อถือได้ซึ่งตั้งอยู่บนคลาวด์สำหรับการดึงข้อความจากเอกสาร Word และแปลงเป็นรูปแบบ TXT โดยช่วยให้การดึงข้อมูล การวิเคราะห์เนื้อหา และการรวมเข้ากับ ระบบการประมวลผลเอกสารในระดับองค์กร.

ทำไมถึงเลือกใช้ GroupDocs.Parser Cloud?

  • รองรับรูปแบบ DOC และ DOCX.
  • การเชื่อมต่อที่ง่ายกับแอปพลิเคชัน .NET
  • 100% บนคลาวด์ — ไม่มี Microsoft Word ที่ต้องการ.
  • สร้างเอาต์พุต TXT ที่สะอาดซึ่งพร้อมสำหรับการประมวลผลข้อมูลหรือการจัดเก็บ

คำถามที่พบบ่อย (FAQs)

  1. Can I convert DOCX to TXT using C#?
  • ใช่แล้ว SDK ช่วยให้คุณสามารถดึงและบันทึกข้อความจากเอกสาร Word โดยตรงในรูปแบบ TXT ได้
  1. มันรองรับไฟล์ DOC และไฟล์ DOCX ด้วยหรือไม่?
  • ใช่ รูปแบบไฟล์ทั้งสองแบบได้รับการสนับสนุนอย่างเต็มที่สำหรับการแปลงและการดึงข้อความ
  1. Is Microsoft Word required for this conversion?
  • ไม่ การแปลงจะดำเนินการทั้งหมดบนแพลตฟอร์ม GroupDocs Cloud.
  1. ฉันสามารถเลือกส่วนหรือหน้าที่เฉพาะสำหรับการดึงข้อมูลได้หรือไม่?
  • ใช่ คุณสามารถกำหนดช่วงหน้าหรือพื้นที่สำหรับการดึงข้อมูลข้อความบางส่วนได้

ลิงก์ที่มีประโยชน์

บทความที่เกี่ยวข้อง