PDF یکی از رایج‌ترین فرمت‌های فایلی است که امروزه مورد استفاده قرار می‌گیرد که پشتیبانی از پلتفرم متقابل را فراهم می‌کند. اما پیوند دادن به یک صفحه خاص در یک سند PDF دشوار است و فایل های PDF به راحتی در شبکه های اجتماعی به اشتراک گذاشته نمی شوند. شما می توانید ظاهر و احساس سند PDF را در قالب HTML نگه دارید که می تواند به سرعت دستکاری شود. در این مقاله با نحوه تبدیل فایل های PDF به HTML در پایتون آشنا می شویم.

موضوعات زیر در این مقاله پوشش داده خواهد شد:

Python PDF to HTML Converter API – Installation

برای تبدیل فایل PDF به صفحات وب HTML، از Python SDK of GroupDocs.Conversion Cloud API استفاده خواهیم کرد. این یک کتابخانه پایتون برای تبدیل اسناد و تصاویر مستقل از ویژگی های غنی است. این امکان تبدیل سریع تصاویر و اسناد از هر فرمت فایل پشتیبانی شده را به هر فرمتی با کیفیت بالا فراهم می کند.

شما می توانید با استفاده از دستور زیر در کنسول، کتابخانه Python تبدیل PDF به HTML را در برنامه های پایتون خود نصب و ادغام کنید:

pip install groupdocs_conversion_cloud

لطفاً قبل از انجام مراحل ذکر شده [شناسه مشتری و راز خود را از داشبورد 6 دریافت کنید. هنگامی که شناسه و راز خود را دریافت کردید، کد را به برنامه پایتون خود اضافه کنید:

# بارگذاری کتابخانه پایتون برای تبدیل PDF به HTML در برنامه پایتون
import groupdocs_conversion_cloud

# پس از ثبت نام رایگان، client_id و client_secret را از https://dashboard.groupdocs.cloud دریافت کنید.
client_id = "xxxxxxx-xxxx-xxxx-xxxx-xxxxxxxxxxxx"
client_secret = "xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx"

# پیکربندی های مختلف را دریافت کنید
configuration = groupdocs_conversion_cloud.Configuration(client_id, client_secret)
configuration.api_base_url = "https://api.groupdocs.cloud"
your_storage = "groupdocs-storage-name"

اکنون، بیایید نحوه تبدیل pdf به فرمت html را مرحله به مرحله با استفاده از REST API در پایتون نشان دهیم.

نحوه تبدیل PDF به HTML آنلاین در پایتون با استفاده از REST API

با انجام مراحل ساده زیر می توانیم فایل pdf را به صورت برنامه نویسی به فرمت html تبدیل کنیم:

  • ابتدا یک نمونه از ConvertApi ایجاد کنید.
  • سپس، نمونه تنظیمات تبدیل را با استفاده از ConvertSettings ایجاد کنید
  • در مرحله بعد، نام ذخیره سازی فایل ها را وارد کنید
  • مسیر فایل PDF ورودی و فرمت خروجی را به عنوان “html” تنظیم کنید
  • بعد، یک نمونه از PdfLoadOptions ایجاد کنید.
  • رمز فایل PDF را وارد کنید
  • سپس، output\path و load\options را تنظیم کنید
  • پس از آن، ConvertDocumentRequest را با ConvertSettings به عنوان آرگومان ایجاد کنید
  • در نهایت، با فراخوانی convert\document() با ConvertDocumentRequest، pdf را به html تبدیل کنید.

نمونه کد زیر نحوه تغییر فرمت pdf به html در پایتون را نشان می دهد:

# نحوه تبدیل PDF به HTML آنلاین توسط پایتون
try:
  # یک نمونه از API ایجاد کنید
  convert_api = groupdocs_conversion_cloud.ConvertApi.from_keys(client_id, client_secret)

  # تنظیمات تبدیل را تعریف کنید
  settings = groupdocs_conversion_cloud.ConvertSettings()
  settings.storage_name = your_storage
  settings.file_path = "python-testing/sample-pdf-file.pdf"
  settings.format = "html"

  loadOptions = groupdocs_conversion_cloud.PdfLoadOptions()
  loadOptions.password = "password"

  settings.load_options = loadOptions
  settings.output_path = "python-testing"

  # ایجاد درخواست تبدیل سند
  request = groupdocs_conversion_cloud.ConvertDocumentRequest(settings)

  # تبدیل فایل pdf به صفحه وب HTML
  result = convert_api.convert_document(request)
  print("pdf File converted to html successfully: " + result[0].path)

except groupdocs_conversion_cloud.ApiException as e:
  print("Exception when calling convert_document: {0}".format(e.message))

در نهایت، نمونه کد بالا فایل HTML را در فضای ابری ذخیره می کند. این بهترین راه برای تبدیل pdf به سند html است.

نحوه تبدیل فایل های PDF به HTML در پایتون

نحوه تبدیل فایل های PDF به HTML در پایتون

تبدیل محدوده صفحات از فایل PDF به فایل HTML در پایتون

با دنبال کردن مراحل زیر می توانیم محدوده صفحات یک سند PDF را به HTML تبدیل کنیم:

  • ابتدا یک نمونه از ConvertApi ایجاد کنید.
  • سپس، نمونه تنظیمات تبدیل را با استفاده از ConvertSettings ایجاد کنید
  • در مرحله بعد، نام فضای ذخیره سازی ابری خود را وارد کنید
  • مسیر فایل PDF ورودی و فرمت خروجی را به عنوان “html” تنظیم کنید
  • بعد، یک نمونه از HtmlConvertOptions ایجاد کنید
  • گزینه های from\page و pages\count را تنظیم کنید
  • سپس مسیر خروجی و convertOptions را تنظیم کنید
  • اکنون ConvertDocumentRequest را با ConvertSettings به عنوان آرگومان ایجاد کنید
  • در نهایت، با فراخوانی متد convert\document() با ConvertDocumentRequest، pdf را به کد html به صورت آنلاین تبدیل کنید.

نمونه کد زیر نحوه تبدیل طیف وسیعی از صفحات از سند PDF به فایل HTML را با استفاده از پایتون نشان می دهد:

# نحوه تبدیل محدوده صفحات از PDF به HTML در پایتون
# یک نمونه از API ایجاد کنید
convert_api = groupdocs_conversion_cloud.ConvertApi.from_keys(client_id, client_secret)

# تنظیمات تبدیل html را آماده کنید
settings = groupdocs_conversion_cloud.ConvertSettings()
settings.storage_name = your_storage
settings.file_path = "python-testing/sample-pdf-file.pdf"
settings.format = "html"

# گزینه های تبدیل PDF: شماره صفحه شروع و کل صفحات برای تبدیل
convertOptions = groupdocs_conversion_cloud.HtmlConvertOptions()
convertOptions.from_page = 1 
convertOptions.pages_count = 1

settings.convert_options = convertOptions
settings.output_path = "python-testing"

# ایجاد درخواست تبدیل سند
request = groupdocs_conversion_cloud.ConvertDocumentRequest(settings)

# صفحات PDF را به فایل HTML تبدیل کنید
result = convert_api.convert_document(request)
print("Converted range of pages from PDF to HTML web page: " + result[0].path)

در نهایت، نمونه کد بالا، سند را پس از تبدیل از pdf به html به صورت آنلاین در فضای ابری ذخیره می کند.

تبدیل صفحات خاص از PDF به فرمت HTML در پایتون

ما می‌توانیم با دنبال کردن مراحل زیر، صفحات خاصی از یک سند PDF را با استفاده از بهترین مبدل pdf به html به صورت آنلاین با تصاویر به HTML تبدیل کنیم:

  • ابتدا یک نمونه از ConvertApi ایجاد کنید.
  • سپس، نمونه تنظیمات تبدیل را با استفاده از ConvertSettings ایجاد کنید
  • در مرحله بعد، نام فضای ذخیره سازی ابری خود را وارد کنید
  • مسیر فایل PDF ورودی و فرمت خروجی را به عنوان “html” تنظیم کنید
  • بعد، یک نمونه از HtmlConvertOptions ایجاد کنید
  • شماره صفحه را برای تبدیل در قالب آرایه اضافه کنید
  • سپس مسیر خروجی و convertOptions را تنظیم کنید
  • اکنون ConvertDocumentRequest را با ConvertSettings به عنوان آرگومان ایجاد کنید
  • در نهایت، با فراخوانی متد convert\document() با ConvertDocumentRequest، pdf را به کد html به صورت آنلاین تبدیل کنید.

نمونه کد زیر نشان می دهد که چگونه می توان صفحات خاصی از یک سند PDF را با استفاده از پایتون به فایل HTML صادر کرد:

# نحوه تبدیل صفحات خاص فایل PDF به فرمت صفحه وب HTML در پایتون
# یک نمونه از API ایجاد کنید
convert_api = groupdocs_conversion_cloud.ConvertApi.from_keys(client_id, client_secret)

# تنظیمات تبدیل را تعریف کنید
settings = groupdocs_conversion_cloud.ConvertSettings()
settings.storage_name = your_storage
settings.file_path = "python-testing/sample-pdf-file.pdf"
settings.format = "html"

# گزینه های تبدیل PDF: شماره صفحه برای تبدیل
convertOptions = groupdocs_conversion_cloud.HtmlConvertOptions()
convertOptions.pages = [1, 3, 5]

settings.convert_options = convertOptions
settings.output_path = "python-testing"

# ایجاد درخواست تبدیل سند
request = groupdocs_conversion_cloud.ConvertDocumentRequest(settings)

# تبدیل فایل PDF به فایل HTML
result = convert_api.convert_document(request)
print("Successfully converted PDF file to HTML document: " + result[0].path)

در نهایت، نمونه کد بالا pdf را با تصاویر در فضای ابری به html تبدیل می کند. همانطور که در زیر توضیح داده شده است، یک مبدل کد آنلاین pdf به html وجود دارد.

تبدیل آنلاین PDF به HTML به صورت رایگان

بهترین مبدل پی دی اف به HTML چیست؟ Groupdocs.Conversion بهترین مبدل pdf به html آنلاین رایگان را برای تبدیل PDF به فرمت HTML برای شما فراهم می کند. با استفاده از Groupdocs.Conversion آنلاین pdf به html API توسعه یافته است.

نتیجه

در این مقاله یاد گرفتید:

  • نحوه تبدیل pdf به html بدون از دست دادن قالب بندی در پایتون.
  • نحوه تبدیل pdf به فایل html با استفاده از پایتون.
  • تبدیل صفحات PDF خاص به فرمت HTML در پایتون.
  • مبدل آنلاین رایگان pdf به html.

علاوه بر این، می‌توانید درباره API تبدیل فرمت فایل GroupDocs.Conversion با استفاده از documentation اطلاعات بیشتری کسب کنید.

سوال بپرس

می توانید سوالات خود را در مورد نحوه تبدیل فایل pdf به فرمت html از طریق [تالار گفتمان پشتیبانی رایگان] ما بپرسید (https://forum.groupdocs.cloud/c/conversion/11)

همچنین ببینید