PDF เป็นหนึ่งในรูปแบบไฟล์ที่ใช้บ่อยที่สุดในปัจจุบันซึ่งรองรับข้ามแพลตฟอร์ม แต่การลิงก์ไปยังหน้าใดหน้าหนึ่งในเอกสาร PDF นั้นทำได้ยาก และไฟล์ PDF ไม่สามารถแชร์บนโซเชียลเน็ตเวิร์กได้ง่ายๆ คุณสามารถคงรูปลักษณ์ของเอกสาร PDF ไว้ในรูปแบบ HTML ที่สามารถจัดการได้อย่างรวดเร็ว ในบทความนี้ เราจะมาเรียนรู้วิธีการแปลงไฟล์ PDF เป็น HTML ใน Python

หัวข้อต่อไปนี้จะครอบคลุมในบทความนี้:

Python PDF เป็น HTML Converter API – การติดตั้ง

ในการแปลงไฟล์ PDF เป็นเว็บเพจ HTML เราจะใช้ Python SDK of GroupDocs.Conversion Cloud API เป็นเอกสารอิสระแพลตฟอร์มและไลบรารี Python การแปลงรูปภาพที่มีคุณลักษณะหลากหลาย ให้การแปลงรูปภาพและเอกสารอย่างรวดเร็วของ รูปแบบไฟล์ที่รองรับ เป็นรูปแบบคุณภาพสูง

คุณสามารถติดตั้งและรวมไลบรารี Python การแปลง PDF เป็น HTML เข้ากับแอปพลิเคชัน Python ของคุณโดยใช้คำสั่งต่อไปนี้ในคอนโซล:

pip install groupdocs_conversion_cloud

โปรด รับรหัสลูกค้าและข้อมูลลับจากแดชบอร์ด ก่อนทำตามขั้นตอนดังกล่าว เมื่อคุณมี ID และรหัสลับของคุณแล้ว ให้เพิ่มรหัสในแอปพลิเคชันPythonของคุณ:

# โหลดไลบรารี Python สำหรับการแปลง PDF เป็น HTML ในแอปพลิเคชัน Python
import groupdocs_conversion_cloud

# รับ client_id และ client_secret จาก https://dashboard.groupdocs.cloud หลังจากลงทะเบียนฟรี
client_id = "xxxxxxx-xxxx-xxxx-xxxx-xxxxxxxxxxxx"
client_secret = "xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx"

# รับการกำหนดค่าต่างๆ
configuration = groupdocs_conversion_cloud.Configuration(client_id, client_secret)
configuration.api_base_url = "https://api.groupdocs.cloud"
your_storage = "groupdocs-storage-name"

ตอนนี้ เรามาสาธิตวิธีการแปลงรูปแบบ pdf เป็น html ทีละขั้นตอนโดยใช้ REST API ใน Python

วิธีแปลง PDF เป็น HTML ออนไลน์ใน Python โดยใช้ REST API

เราสามารถแปลงไฟล์ pdf เป็นรูปแบบ html โดยทางโปรแกรมโดยทำตามขั้นตอนง่าย ๆ ด้านล่าง:

  • ประการแรก สร้างอินสแตนซ์ของ ConvertApi
  • จากนั้น สร้างตัวอย่างการตั้งค่าการแปลงโดยใช้ ConvertSettings
  • ถัดไป ระบุชื่อที่เก็บไฟล์
  • ตั้งค่าเส้นทางไฟล์ PDF อินพุตและรูปแบบเอาต์พุตเป็น “html”
  • จากนั้น สร้างอินสแตนซ์ของ PdfLoadOptions
  • ระบุรหัสผ่านไฟล์ PDF
  • จากนั้นตั้งค่า output\path และ load\options
  • หลังจากนั้น สร้าง ConvertDocumentRequest โดยมี ConvertSettings เป็นอาร์กิวเมนต์
  • สุดท้าย แปลง pdf เป็น html โดยเรียก convert\document() ด้วย ConvertDocumentRequest

ตัวอย่างโค้ดต่อไปนี้แสดงวิธีเปลี่ยนรูปแบบ pdf เป็น html ใน Python:

# วิธี Python แปลง PDF เป็น HTML ออนไลน์
try:
  # สร้างอินสแตนซ์ของ API
  convert_api = groupdocs_conversion_cloud.ConvertApi.from_keys(client_id, client_secret)

  # กำหนดการตั้งค่าการแปลง
  settings = groupdocs_conversion_cloud.ConvertSettings()
  settings.storage_name = your_storage
  settings.file_path = "python-testing/sample-pdf-file.pdf"
  settings.format = "html"

  loadOptions = groupdocs_conversion_cloud.PdfLoadOptions()
  loadOptions.password = "password"

  settings.load_options = loadOptions
  settings.output_path = "python-testing"

  # สร้างคำขอแปลงเอกสาร
  request = groupdocs_conversion_cloud.ConvertDocumentRequest(settings)

  # แปลงไฟล์ .pdf เป็นเว็บเพจ HTML
  result = convert_api.convert_document(request)
  print("pdf File converted to html successfully: " + result[0].path)

except groupdocs_conversion_cloud.ApiException as e:
  print("Exception when calling convert_document: {0}".format(e.message))

สุดท้าย ตัวอย่างโค้ดด้านบนจะบันทึกไฟล์ HTML ไว้บนคลาวด์ นี่เป็นวิธีที่ดีที่สุดในการแปลงเอกสาร pdf เป็น html

วิธีแปลงไฟล์ PDF เป็น HTML ใน Python

วิธีแปลงไฟล์ PDF เป็น HTML ใน Python

แปลงช่วงของหน้าจากไฟล์ PDF เป็นไฟล์ HTML ใน Python

เราสามารถแปลงช่วงของหน้าเอกสาร PDF เป็น HTML โดยทำตามขั้นตอนด้านล่าง:

  • ขั้นแรก สร้างอินสแตนซ์ของ ConvertApi
  • จากนั้น สร้างตัวอย่างการตั้งค่าการแปลงโดยใช้ ConvertSettings
  • ถัดไป ระบุชื่อที่เก็บข้อมูลบนคลาวด์ของคุณ
  • กำหนดเส้นทางไฟล์ PDF อินพุตและรูปแบบเอาต์พุตเป็น “html”
  • จากนั้น สร้างอินสแตนซ์ของ HtmlConvertOptions
  • ตั้งค่าตัวเลือกจาก\หน้าและหน้า\นับ
  • จากนั้นตั้งค่าเส้นทางเอาต์พุตและ converterOptions
  • ตอนนี้ สร้าง ConvertDocumentRequest ด้วย ConvertSettings เป็นอาร์กิวเมนต์
  • สุดท้าย แปลง pdf เป็นโค้ด html ออนไลน์โดยเรียกเมธอด convert\document() ด้วย ConvertDocumentRequest

ตัวอย่างโค้ดต่อไปนี้แสดงวิธีการแปลงช่วงของหน้าจากเอกสาร PDF เป็นไฟล์ HTML โดยใช้ Python:

# วิธีแปลงช่วงของหน้าจาก PDF เป็น HTML ใน Python
# สร้างอินสแตนซ์ของ API
convert_api = groupdocs_conversion_cloud.ConvertApi.from_keys(client_id, client_secret)

# เตรียมการตั้งค่าการแปลง html
settings = groupdocs_conversion_cloud.ConvertSettings()
settings.storage_name = your_storage
settings.file_path = "python-testing/sample-pdf-file.pdf"
settings.format = "html"

# ตัวเลือกการแปลง PDF: หมายเลขหน้าเริ่มต้นและหน้าทั้งหมดที่จะแปลง
convertOptions = groupdocs_conversion_cloud.HtmlConvertOptions()
convertOptions.from_page = 1 
convertOptions.pages_count = 1

settings.convert_options = convertOptions
settings.output_path = "python-testing"

# สร้างคำขอแปลงเอกสาร
request = groupdocs_conversion_cloud.ConvertDocumentRequest(settings)

# แปลงหน้าของ PDF เป็นไฟล์ HTML
result = convert_api.convert_document(request)
print("Converted range of pages from PDF to HTML web page: " + result[0].path)

สุดท้าย ตัวอย่างโค้ดด้านบนจะบันทึกเอกสารหลังจากแปลงจาก pdf เป็น html ออนไลน์บนคลาวด์

แปลงหน้าเฉพาะจาก PDF เป็นรูปแบบ HTML ใน Python

เราสามารถแปลงหน้าเฉพาะของเอกสาร PDF เป็น HTML โดยใช้ตัวแปลง pdf เป็น html ออนไลน์ที่ดีที่สุดพร้อมรูปภาพโดยทำตามขั้นตอนด้านล่าง:

  • ขั้นแรก สร้างอินสแตนซ์ของ ConvertApi
  • จากนั้น สร้างตัวอย่างการตั้งค่าการแปลงโดยใช้ ConvertSettings
  • ถัดไป ระบุชื่อที่เก็บข้อมูลบนคลาวด์ของคุณ
  • กำหนดเส้นทางไฟล์ PDF อินพุตและรูปแบบเอาต์พุตเป็น “html”
  • จากนั้น สร้างอินสแตนซ์ของ HtmlConvertOptions
  • เพิ่มหมายเลขหน้าเพื่อแปลงในรูปแบบอาร์เรย์
  • จากนั้นตั้งค่าเส้นทางเอาต์พุตและ converterOptions
  • ตอนนี้ สร้าง ConvertDocumentRequest ด้วย ConvertSettings เป็นอาร์กิวเมนต์
  • สุดท้าย แปลง pdf เป็นโค้ด html ออนไลน์โดยเรียกเมธอด convert\document() ด้วย ConvertDocumentRequest

ตัวอย่างโค้ดต่อไปนี้แสดงวิธีการส่งออกบางหน้าของเอกสาร PDF เป็นไฟล์ HTML โดยใช้ Python:

# วิธีแปลงหน้าเฉพาะของไฟล์ PDF เป็นรูปแบบเว็บเพจ HTML ใน Python
# สร้างอินสแตนซ์ของ API
convert_api = groupdocs_conversion_cloud.ConvertApi.from_keys(client_id, client_secret)

# กำหนดการตั้งค่าการแปลง
settings = groupdocs_conversion_cloud.ConvertSettings()
settings.storage_name = your_storage
settings.file_path = "python-testing/sample-pdf-file.pdf"
settings.format = "html"

# ตัวเลือกการแปลง PDF: หมายเลขหน้าที่จะแปลง
convertOptions = groupdocs_conversion_cloud.HtmlConvertOptions()
convertOptions.pages = [1, 3, 5]

settings.convert_options = convertOptions
settings.output_path = "python-testing"

# สร้างคำขอแปลงเอกสาร
request = groupdocs_conversion_cloud.ConvertDocumentRequest(settings)

# แปลงไฟล์ PDF เป็นไฟล์ HTML
result = convert_api.convert_document(request)
print("Successfully converted PDF file to HTML document: " + result[0].path)

สุดท้าย ตัวอย่างโค้ดด้านบนจะแปลง pdf เป็น html พร้อมรูปภาพบนคลาวด์ มีตัวแปลงรหัส pdf เป็น html ออนไลน์ตามที่อธิบายไว้ด้านล่าง

ตัวแปลง PDF เป็น HTML ออนไลน์ฟรี

ตัวแปลง PDF เป็น HTML ที่ดีที่สุดคืออะไร Groupdocs.Conversion มี ตัวแปลง pdf เป็น html ออนไลน์ที่ดีที่สุดฟรี ให้คุณแปลง PDF เป็นรูปแบบ HTML ได้รับการพัฒนาโดยใช้ Groupdocs.Conversion ออนไลน์ pdf เป็น html API

บทสรุป

ในบทความนี้ คุณได้เรียนรู้:

  • วิธีแปลง pdf เป็น html โดยไม่สูญเสียการจัดรูปแบบใน Python
  • วิธีแปลงไฟล์ pdf เป็น html ตามช่วงโดยใช้ Python
  • การแปลงหน้า PDF เฉพาะเป็นรูปแบบ HTML ใน Python
  • โปรแกรมแปลง pdf เป็น html ออนไลน์ฟรี;

นอกจากนี้ คุณสามารถเรียนรู้เพิ่มเติมเกี่ยวกับ API การแปลงรูปแบบไฟล์ GroupDocs.Conversion โดยใช้ เอกสารประกอบ

ถามคำถาม

คุณสามารถถามคำถามเกี่ยวกับวิธีแปลงไฟล์ pdf เป็นรูปแบบ html ผ่านทางฟอรัมสนับสนุนฟรี

ดูสิ่งนี้ด้วย