PDF به HTM

توسعه تبدیل PDF به HTML با C#.NET.

توانایی تبدیل اسناد PDF به فرمت HTML برای اهداف مختلف، مانند توسعه وب یا مدیریت محتوا، ضروری است. چه توسعه‌دهنده‌ای باشید که به دنبال افزایش دسترسی به وب‌سایت هستید یا یک تولیدکننده محتوا که به‌دنبال استفاده مجدد از محتوای PDF برای مصرف آنلاین است، تسلط بر فرآیند تبدیل PDF به HTML با استفاده از C#.NET می‌تواند گردش کار شما را به طور قابل توجهی ساده کند و کارایی را بهبود بخشد. در این مقاله، ما تمام جزئیات تبدیل PDF به HTML را با استفاده از NET REST API بررسی خواهیم کرد، که همه چیز را از مفاهیم ضروری گرفته تا تکنیک های پیشرفته را پوشش می دهد.

این مقاله موضوعات زیر را پوشش می دهد:

REST API برای تبدیل PDF به HTML

GroupDocs.Conversion Cloud SDK for .NET یک راه حل قوی و همه کاره برای تبدیل یکپارچه اسناد PDF به فرمت HTML ارائه می دهد. SDK همچنین گزینه های سفارشی سازی پیشرفته ای را ارائه می دهد که به شما امکان می دهد تنظیمات تبدیل مانند محدوده صفحه، کیفیت تصویر و ساختار فایل خروجی را با توجه به نیازهای خاص خود مشخص کنید. برای استفاده از SDK، اولین قدم نصب آن است. بنابراین، GroupDocs.Conversion-Cloud را در NuGet Package Manager جستجو کنید و روی دکمه Install کلیک کنید. گزینه دیگر این است که دستور زیر را در کنسول مدیریت بسته اجرا کنید.

NuGet\Install-Package GroupDocs.Conversion-Cloud -Version 24.2.0

هنگامی که REST API با موفقیت نصب شد، مطمئن شوید که اعتبار API (یعنی شناسه مشتری و Client Secret) را دارید. می توانید از این [آموزش] کوتاه 8 دیدن کنید تا نحوه دریافت اعتبارنامه API را ببینید.

تبدیل PDF به HTML با استفاده از C#.NET

بخش زیر جزئیاتی را توضیح می‌دهد که چگونه می‌توانیم از قابلیت‌های قدرتمند Cloud SDK استفاده کنیم و با استفاده از C#.NET، وظیفه تبدیل PDF به HTML را به صورت برنامه‌نویسی خودکار کنیم.

  1. نمونه ای از کلاس «پیکربندی» ایجاد کنید که در آن اعتبار مشتری را به عنوان آرگومان ارسال می کنیم.
var configurations = new Configuration(clientId, clientSecret1);
  1. «ConvertApi» را که در آن شیء پیکربندی را به عنوان آرگومان ورودی ارسال می کنیم، مقداردهی اولیه کنید.
var apiInstance = new ConvertApi(configurations);
  1. فایل پی‌دی‌اف ورودی را در فضای ذخیره‌سازی ابری بارگذاری کنید و نام سند پی‌دی‌اف ورودی را ارسال کنید.
fileUpload.UploadFile(new UploadFileRequest("input.pdf", stream));
  1. یک نمونه «ConvertSettings» ایجاد کنید که در آن نام PDF ورودی، فرمت خروجی به عنوان «html» و نام فایل HTML حاصل را مشخص می کنیم.
var settings = new ConvertSettings{...}
  1. برای تبدیل PDF به فرمت HTML با ConvertDocumentRequest API تماس بگیرید. پس از تبدیل موفقیت آمیز، HTML حاصل در فضای ذخیره سازی ابری ذخیره می شود.
var response = apiInstance.ConvertDocument(new ConvertDocumentRequest(settings));
// نمونه های بیشتر در https://github.com/groupdocs-conversion-cloud/groupdocs-conversion-cloud-dotnet
// اعتبار API خود را دریافت کنید 
string clientId = "4bdefca3-f08c-4088-9ca0-55c38f4b7f22";
string clientSecret1 = "a43c8b4365246a062688a259abe5b469";

// یک نمونه از کلاس Configuration ایجاد کنید و آن را با Client ID & Client Secret مقداردهی کنید. 
var configurations = new GroupDocs.Conversion.Cloud.Sdk.Client.Configuration(clientId, clientSecret1);
// مقدار ApiBaseUrl را برای تنظیم url پایه API مبدل html به PDF تعریف کنید.
configuration.ApiBaseUrl = "https://api.groupdocs.cloud";

// یک نمونه از کلاس ConvertApi را با شیء کلاس Configuration راه اندازی کنید.
var apiInstance = new GroupDocs.Conversion.Cloud.Sdk.Api.ConvertApi(configurations);
             
// فایل HTML را از درایو محلی بارگیری کنید             
using (var stream = System.IO.File.OpenRead("input.pdf"))
{
    // یک نمونه از FileApi ایجاد کنید
    var fileUpload = new FileApi(configurations);
    // فایل PDF ورودی را در فضای ذخیره سازی ابری آپلود کنید
    fileUpload.UploadFile(new UploadFileRequest("input.pdf", stream));

    // ConvertSettings را ایجاد کنید که در آن PDF ورودی و نام HTML حاصل را تعریف می کنیم
    var settings = new ConvertSettings
    {
        StorageName = "internal",
        FilePath = "input.pdf",
        Format = "html",
        OutputPath = "resultant.html"
    };
    
    // متد ConvertDocument را برای تبدیل PDF به HTML به صورت برنامه نویسی فراخوانی کنید.
    var response = apiInstance.ConvertDocument(new GroupDocs.Conversion.Cloud.Sdk.Model.Requests.ConvertDocumentRequest(settings));
    if (response != null && response.Equals("OK"))
    {
        // چاپ پیام موفقیت آمیز
        Console.WriteLine("The PDF file successfully converted to HTML !");
    }
}
PDF به HTML.

تصویر: - پیش نمایش تبدیل PDF به HTML.

نمونه فایل PDF مورد استفاده در مثال بالا را می توانید از input.pdf دانلود کنید.

تبدیل PDF به صفحه وب با استفاده از دستورات cURL

تبدیل PDF به HTML با استفاده از GroupDocs.Conversion Cloud و دستورات cURL یک راه حل راحت و قابل نوشتن برای خودکار کردن وظایف تبدیل سند ارائه می دهد. یکی از مزایای کلیدی این رویکرد، سادگی و سهولت ادغام آن در جریان کار و خطوط لوله اتوماسیون موجود است. تنها با چند دستور ساده می توانید فرآیند تبدیل را بدون نیاز به کدهای پیچیده یا کتابخانه های اضافی آغاز و مدیریت کنید.

اولین گام در این رویکرد، به دست آوردن اعتبار شخصی (App Key و App SID) و تولید رمز دسترسی JWT است. هنگامی که توکن JWT داشتیم، لطفاً دستور cURL زیر را اجرا کنید تا PDF به فرمت HTML تبدیل شود. دستور زیر رشته نمونه را به عنوان واترمارک اضافه می کند اما اختیاری است.

curl -v "https://api.groupdocs.cloud/v2.0/conversion" \
-X POST \
-H "accept: application/json" \
-H "authorization: Bearer {accessToken}" \
-H "Content-Type: application/json" \
-d "{  \"FilePath\": \"{sourceFile}\",  \"Format\": \"html\",  \"LoadOptions\": {    \"Format\": \"pdf\"  },  \"ConvertOptions\": {    \"FromPage\": 1,    \"PagesCount\": 3,    \"Pages\": [      1,2,3    ],    \"WatermarkOptions\": {      \"Text\": \"Hello World !\",      \"FontName\": \"Arial\",      \"FontSize\": 10,      \"Bold\": true,      \"Italic\": true,      \"Color\": \"Yellow\",      \"Width\": 0,      \"Height\": 0,      \"Top\": 0,      \"Left\": 0,      \"RotationAngle\": 20,      \"Transparency\": .5,      \"Background\": true,      \"AutoAlign\": true    }  },  \"OutputPath\": \"{resultantFile}\"}" -v

لطفاً «sourceFile» را با نام فایل PDF ورودی موجود در فضای ذخیره‌سازی ابری، «resultantFile» را با نام قالب HTML خروجی که باید تولید شود و «accessToken» را با توکن JWT که در بالا ایجاد شده است جایگزین کنید. پس از تبدیل موفقیت آمیز، فایل حاصل در فضای ذخیره سازی ابری ذخیره می شود.

در صورتی که می خواهید HTML حاصل را در درایو محلی ذخیره کنید، لطفاً از دستور زیر استفاده کنید.

curl -v "https://api.groupdocs.cloud/v2.0/conversion" \
-X POST \
-H "accept: application/json" \
-H "authorization: Bearer {accessToken}" \
-H "Content-Type: application/json" \
-d "{  \"FilePath\": \"{sourceFile}\",  \"Format\": \"html\",  \"LoadOptions\": {    \"Format\": \"pdf\"  },  \"ConvertOptions\": {    \"FromPage\": 1,    \"PagesCount\": 3,    \"Pages\": [      1,2,3    ],    \"WatermarkOptions\": {      \"Text\": \"Hello World !\",      \"FontName\": \"Arial\",      \"FontSize\": 10,      \"Bold\": true,      \"Italic\": true,      \"Color\": \"Yellow\",      \"Width\": 0,      \"Height\": 0,      \"Top\": 0,      \"Left\": 0,      \"RotationAngle\": 20,      \"Transparency\": .5,      \"Background\": true,      \"AutoAlign\": true  }  } }" \
-o "resultant.html"

برنامه تبدیل PDF به HTML رایگان

می توانید از تبدیل کننده PDF به HTML رایگان، سبک و فوق کارآمد ما که در بالای API GroupDocs.Conversion توسعه یافته است استفاده کنید.

برنامه رایگان pdf به html

لینک های مفید

نتیجه

در پایان، چه بخواهید از GroupDocs.Conversion Cloud SDK برای .NET استفاده کنید یا از GroupDocs.Conversion Cloud با دستورات cURL استفاده کنید، تبدیل PDF به HTML به یک فرآیند یکپارچه و کارآمد تبدیل می شود. هر دو رویکرد راه‌حل‌های همه‌کاره‌ای را برای خودکار کردن وظایف تبدیل سند ارائه می‌دهند و به شما این امکان را می‌دهند که شکاف بین فرمت‌های PDF و HTML را بدون زحمت پر کنید. به طور کلی، چه راحتی یک SDK یا انعطاف‌پذیری دستورات cURL را ترجیح دهید، هر دو روش به شما این امکان را می‌دهند که PDF را به طور مؤثر به HTML تبدیل کنید و گردش‌های کاری پردازش اسناد خود را با اطمینان بهینه کنید.

مقالات مرتبط

توصیه می کنیم برای کسب اطلاعات بیشتر به لینک های زیر مراجعه کنید: