Витягування зображень з PDF документів є поширеною вимогою при роботі з звітами, відсканованими документами або презентаційними файлами, які містять вбудовані візуальні елементи. Замість того, щоб вручну зберігати кожне зображення, ви можете автоматизувати процес витягування за допомогою GroupDocs.Parser Cloud SDK для .NET.

У цьому посібнику ви дізнаєтеся, як витягувати зображення з PDF-файлів, використовуючи C# .NET та API GroupDocs.Parser Cloud REST, разом з простими кодовими фрагментами для швидкої інтеграції.

Чому вилучати зображення з PDF-файлів?

Існує багато практичних випадків використання для автоматизації витягання зображень з PDF:

  • Отримайте логотипи, діаграми та інфографіку з маркетингових або фінансових звітів.
  • Витягнути фотографії та сканування з багатосторінкових PDF-документів.
  • Створіть автоматизовані конвеєри витягування контенту для аналізу документів.
  • Обробляйте великі партії PDF-файлів без ручних зусиль або настільних інструментів.

API для парсингу PDF

GroupDocs.Parser Cloud SDK for .NET є легким і простим у інтеграції API-обгорткою, яка дозволяє вам витягувати структурований контент — такий як текст, зображення та інші компоненти PDF, а також інших форматів файлів, включаючи Word, Excel тощо.

Передумови

Перед тим як почати, переконайтеся, що у вас є:

  • A GroupDocs Cloud Account для отримання вашого Client ID та Client Secret.
  • .NET 6.0 або пізніша версія, встановлена на вашій системі.
  • Visual Studio або ваш улюблений IDE.

Встановіть API парсера PDF

Ви можете легко встановити SDK з NuGet, використовуючи команду нижче:

NuGet\Install-Package GroupDocs.Parser-Cloud -Version 25.7.0

Витягнення зображень з PDF за допомогою C# .NET

Дотримуйтеся цих простих кроків, щоб програмно витягти всі зображення з файлу PDF.

Крок 1: Налаштуйте конфігурацію.

var configuration = new Configuration("YOUR_CLIENT_ID", "YOUR_CLIENT_SECRET");
var parserApi = new ParserApi(configuration);

Крок 2: Вкажіть інформацію про файл.

var fileInfo = new FileInfo
{
    FilePath = "sample.pdf"
};

var options = new ImagesOptions
{
    FileInfo = fileInfo
};

var request = new ImagesRequest(options);

Крок 3: Витягти зображення з PDF.

var response = parserApi.Images(request);

foreach (var image in response.Images)
{
    Console.WriteLine($"Image Path: {image.Path}");
}
// Для більш детальних прикладів, будь ласка, відвідайте https://github.com/groupdocs-parser-cloud/groupdocs-parser-cloud-dotnet

var configuration = new Configuration("YOUR_CLIENT_ID", "YOUR_CLIENT_SECRET");
var parserApi = new ParserApi(configuration);

// specify the input PDF information
var fileInfo = new FileInfo
{
    FilePath = "input.pdf"
};

var options = new ImagesOptions
{
    FileInfo = fileInfo
};

// створити запит на вилучення зображення
var request = new ImagesRequest(options);

// отримати всі зображення з PDF у об'єкті відповіді
var response = parserApi.Images(request);

foreach (var image in response.Images)
{
    Console.WriteLine($"Extracted Image Path: {image.Path}");
}

Завантажте PDF-зображення за допомогою cURL

Альтернативно, ви також можете витягувати зображення за допомогою GroupDocs.Parser REST API та команд cURL.

Крок 1 – Сгенерувати токен доступу:

curl -X POST "https://api.groupdocs.cloud/connect/token" \
-d "grant_type=client_credentials&client_id=YOUR_CLIENT_ID&client_secret=YOUR_CLIENT_SECRET" \
-H "Content-Type: application/x-www-form-urlencoded"

Крок 2 – Витяг зображень через REST API:

curl -v -X POST "https://api.groupdocs.cloud/v1.0/parser/images" \
-H  "accept: application/json" \
-H  "authorization: Bearer {ACCESS_TOKEN}" \
-H  "Content-Type: application/json" \
-d "{  \"FileInfo\": {    \"FilePath\": \"Binder1.pdf\",    \"StorageName\": \"internal\"  },  \"OutputPath\": \"internal\",  \"StartPageNumber\": 1,  \"CountPagesToExtract\": 2}"
  • Замініть на той, який ви згенерували.

Спробуйте Інструмент для вилучення зображень з PDF в онлайн режимі

Хочете протестувати це перед кодуванням? Використовуйте безкоштовний Online PDF Image Extractor, підтримуваний GroupDocs.Parser Cloud — завантажте PDF і миттєво завантажте витягнуті зображення.

безкоштовний Image Extractor

Висновок

В цьому посібнику ми розглянули, як:

  • Витягти зображення з PDF, використовуючи C# .NET REST API.
  • Завантажити та обробити вбудовані зображення автоматично.
  • Використовуйте REST API або cURL для інтеграції.

Отже, за допомогою GroupDocs.Parser Cloud SDK для .NET ви можете легко створювати автоматизовані процеси для витягування вмісту PDF без необхідності у сторонньому програмному забезпеченні або ручних кроках.

📚 Додаткові ресурси

Часто задавані питання – FAQs

How do I extract images from Word?

Ви можете використовувати GroupDocs.Parser Cloud SDKs, щоб програмно витягувати зображення з файлів Word.

Яка модель ціноутворення?

Ми пропонуємо єдину модель оплати за використання. Для отримання додаткової інформації, будь ласка, відвідайте pricing guide.

Чи пропонуєте ви безкоштовний тестовий період?

Так. З безкоштовним тестовим обліковим записом ви можете зробити 150 викликів API на місяць безкоштовно і оцінити наші API без обмежень. Для отримання додаткової інформації, будь ласка, відвідайте Free Trial.

Супутні статті