نحوه استخراج صفحات از اسناد Word در پایتون

نحوه استخراج صفحات از اسناد Word در پایتون

ممکن است لازم باشد سند word را بر اساس صفحه به چندین سند تقسیم کنید. با تقسیم اسناد word، می توانید به راحتی صفحه را از سند word استخراج کنید و یک اطلاعات یا داده خاص را با ذینفعان به اشتراک بگذارید. به عنوان یک توسعه دهنده پایتون، می توانید سند word را به صورت آنلاین در فضای ابری به فایل های جداگانه تقسیم کنید. در این مقاله نحوه استخراج صفحات از اسناد word در پایتون را خواهید آموخت.

موضوعات زیر باید در این مقاله تقسیم صفحه word پوشش داده شود:

Word Documents Splitter REST API - Python SDK

برای تقسیم فایل word به چندین فایل، از Python SDK of GroupDocs.Merger Cloud API استفاده خواهم کرد. به شما امکان می‌دهد یک صفحه یا مجموعه‌ای از صفحات را از فرمت‌های سند پشتیبانی‌شده از Word، Excel، [Visio drawings] بچرخانید، تقسیم کنید، بپیوندید، حذف کنید و مرتب کنید. 6]، PDF و HTML. پایتون مخزن کد منبع به صورت رایگان در GitHub در دسترس است.

دانلود رایگان فایل word splitter در دسترس است. می توانید با استفاده از دستور زیر در ترمینال، splitter word doc را با PIP از PyPI در برنامه پایتون خود نصب کنید:

pip install groupdocs-merger-cloud

لطفاً قبل از انجام مراحل ذکر شده در زیر، [شناسه مشتری و راز12 خود را از داشبورد دریافت کنید. هنگامی که شناسه و راز خود را دریافت کردید، کد زیر را به برنامه خود اضافه کنید تا سند word را به فایل های جداگانه تقسیم کنید، همانطور که در زیر نشان داده شده است:

# SDK ادغام groupdocs را وارد کنید
import groupdocs_merger_cloud

# پس از ثبت نام رایگان، app_sid و app_key را از https://dashboard.groupdocs.cloud دریافت کنید.
app_sid = "xxxxxxx-xxxx-xxxx-xxxx-xxxxxxxxxxxx"
app_key = "xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx"

# پیکربندی های File API را دریافت کنید 
configuration = groupdocs_merger_cloud.Configuration(app_sid, app_key)
configuration.api_base_url = "https://api.groupdocs.cloud"
storage_name = "LocalStorage"

نحوه تقسیم سند ورد به سند واحد در پایتون

می توانید با دنبال کردن مراحل ذکر شده در زیر، docx را به صورت برنامه ریزی شده در فضای ابری تقسیم کنید.

سند Word را بارگذاری کنید

ابتدا، فایل‌های word را در فضای ابری آپلود می‌کنیم تا با استفاده از مثال کد زیر، صفحات را از word آنلاین استخراج کنیم:

# فایل Word را در فضای ذخیره سازی ابری آپلود کنید
# یک نمونه از API فایل ایجاد کنید
file_api = groupdocs_merger_cloud.FileApi.from_config(configuration)

# تماس درخواست آپلود فایل
request = groupdocs_merger_cloud.UploadFileRequest("python-testing\word-file.docx", "H:\\groupdocs-cloud-data\\word-file.docx", storage_name)

# فایل word را در فضای ابری آپلود کنید
response = file_api.upload_file(request)
print(response.uploaded)

در نتیجه، فایل‌های آپلود شده در بخش فایل‌ها داشبورد شما در فضای ابری در دسترس خواهند بود.

تقسیم صفحات سند ورد در پایتون

با دنبال کردن مراحل زیر می توانید صفحات word را به صورت برنامه ریزی شده به فایل های جداگانه تقسیم کنید:

  • ابتدا یک نمونه از DocumentApi ایجاد کنید.
  • سپس، یک نمونه از SplitOptions ایجاد کنید
  • اکنون یک نمونه از FileInfo ایجاد کنید
  • مسیر فایل ورودی را به عنوان آرگومان به FileInfo منتقل کنید
  • سپس مسیر فایل خروجی را ارائه دهید
  • شماره صفحات خاصی را در یک آرایه جدا شده با کاما تنظیم کنید
  • حال، docx split mode را روی Pages قرار دهید. این اجازه می دهد تا شماره صفحات را در یک آرایه جدا شده با کاما تقسیم کنید
  • SplitRequest را با SplitOptions ایجاد کنید
  • در نهایت، متد DocumentAPI.split() را با SplitRequest به عنوان آرگومان فراخوانی کنید و نتایج را دریافت کنید.

قطعه کد زیر نحوه تقسیم فایل word را به صفحات جداگانه با استفاده از REST API در پایتون نشان می دهد:

# نحوه تقسیم سند ورد به سند واحد در پایتون
try:
    # یک نمونه از Document API ایجاد کنید
    documentApi = groupdocs_merger_cloud.DocumentApi.from_keys(app_sid, app_key)
     
    options = groupdocs_merger_cloud.SplitOptions()
    options.file_info = groupdocs_merger_cloud.FileInfo("python-testing\word-file.docx")
    options.output_path = "python-testing"
    options.pages = [1, 3]
    options.mode = "Pages"

    result = documentApi.split(groupdocs_merger_cloud.SplitRequest(options))
    print("Successfully split word docx to single page document: " + result[0].path)
except groupdocs_merger_cloud.ApiException as e:
  print("Exception while calling API: {0}".format(e.message))
نحوه تقسیم فایل ورد به صفحات مجزا در پایتون

نحوه تقسیم فایل ورد به صفحات مجزا در پایتون

دانلود تک فایل

در نهایت، نمونه کد بالا فایل جدا شده را با استفاده از پایتون در فضای ابری ذخیره می کند. با استفاده از نمونه کد زیر قابل دانلود است:

# مقداردهی اولیه API برای دانلود فایل جدا شده
import shutil
file_api = groupdocs_merger_cloud.FileApi.from_config(configuration)

# درخواست فایل دانلود را ایجاد کنید
request = groupdocs_merger_cloud.DownloadFileRequest("python-testing\word-file.docx", storage_name)

# دانلود فایل جدا شده
response = file_api.download_file(request)

# فایل دانلود شده را به دایرکتوری خود منتقل کنید
shutil.move(response, "H:\\groupdocs-cloud-data\\")

سند ورد را بر اساس محدوده صفحه در پایتون به یک واحد تقسیم کنید

با استفاده از مراحل زیر که در زیر آورده شده است، می‌توانید سند word را به صورت آنلاین به چندین سند تقسیم کنید:

  • یک نمونه از DocumentApi ایجاد کنید
  • سپس، یک نمونه از SplitOptions ایجاد کنید
  • اکنون یک نمونه از FileInfo ایجاد کنید
  • مسیر فایل ورودی را به عنوان آرگومان به FileInfo منتقل کنید
  • سپس مسیر فایل خروجی را ارائه دهید as “python-testing”
  • مقادیر start\page\number و end\page\number را تنظیم کنید
  • حالت تقسیم docx را روی Pages برای تقسیم کلمه تنظیم کنید
  • SplitRequest را با SplitOptions ایجاد کنید
  • در نهایت، متد DocumentAPI.split() را با SplitRequest به عنوان آرگومان فراخوانی کنید.

قطعه کد زیر نحوه استخراج صفحات از یک سند word در پایتون را با استفاده از REST API نشان می دهد:

# چگونه یک سند ورد را بر اساس محدوده صفحه در پایتون به یک سند تقسیم کنیم
try:
    # یک نمونه از Document API ایجاد کنید
    documentApi = groupdocs_merger_cloud.DocumentApi.from_keys(app_sid, app_key)
     
    options = groupdocs_merger_cloud.SplitOptions()
    options.file_info = groupdocs_merger_cloud.FileInfo("python-testing\word-file.docx")
    options.output_path = "python-testing"
    options.start_page_number = 3
    options.end_page_number = 7
    options.mode = "Pages"

    result = documentApi.split(groupdocs_merger_cloud.SplitRequest(options))
    print("Successfully split Word to single files by page range: " + result[0].path)
except groupdocs_merger_cloud.ApiException as e:
  print("Exception while calling API: {0}".format(e.message))

با اعمال فیلتر، اسناد Word را به فایل های جداگانه تقسیم کنید

می‌توانید سند word را به صورت آنلاین با استفاده از حالت محدوده به چندین سند تقسیم کنید و به صورت برنامه‌ریزی فیلتر کنید، همانطور که در زیر نشان داده شده است:

  • یک نمونه از DocumentApi ایجاد کنید
  • سپس، یک نمونه از SplitOptions ایجاد کنید
  • اکنون یک نمونه از FileInfo ایجاد کنید
  • مسیر فایل ورودی را به عنوان آرگومان به FileInfo منتقل کنید
  • سپس مسیر فایل خروجی را ارائه دهید as “python-testing”
  • مقادیر start\page\number و end\page\number را تنظیم کنید
  • سپس، دامنه\حالت را روی «OddPages» تنظیم کنید
  • حالت تقسیم docx را روی Pages برای تقسیم کلمه تنظیم کنید
  • SplitRequest را با SplitOptions ایجاد کنید
  • در نهایت، متد DocumentAPI.split() را با SplitRequest به عنوان آرگومان فراخوانی کنید.

قطعه کد زیر نحوه استخراج صفحات سند word را با اعمال فیلتر با استفاده از REST API در پایتون نشان می دهد:

# چگونه با اعمال فیلتر، اسناد Word را به فایل های جداگانه تقسیم کنیم
try:
    # یک نمونه از Document API ایجاد کنید
    documentApi = groupdocs_merger_cloud.DocumentApi.from_keys(app_sid, app_key)
     
    options = groupdocs_merger_cloud.SplitOptions()
    options.file_info = groupdocs_merger_cloud.FileInfo("python-testing\word-file.docx")
    options.output_path = "python-testing"
    options.start_page_number = 3
    options.end_page_number = 7
    options.range_mode = "OddPages"
    options.mode = "Pages" # mode Intervals

    result = documentApi.split(groupdocs_merger_cloud.SplitRequest(options))
    print("Successfully split Word by range of pages and using filter: " + result[0].path)
except groupdocs_merger_cloud.ApiException as e:
  print("Exception while calling API: {0}".format(e.message))

نحوه تقسیم Word Doc به چندین فایل با استفاده از پایتون

با دنبال کردن مراحل زیر می توانید فایل word را به صورت برنامه ریزی شده به چندین سند تقسیم کنید:

  • یک نمونه از DocumentApi ایجاد کنید
  • سپس، یک نمونه از SplitOptions ایجاد کنید
  • اکنون یک نمونه از FileInfo ایجاد کنید
  • مسیر فایل ورودی را به عنوان آرگومان به FileInfo منتقل کنید
  • سپس مسیر فایل خروجی را ارائه دهید as “python-testing”
  • سپس مجموعه صفحات را در قالب آرایه تنظیم کنید
  • حالت تقسیم docx را روی Intervals برای تقسیم کلمه تنظیم کنید
  • SplitRequest را با SplitOptions ایجاد کنید
  • در نهایت، متد DocumentAPI.split() را با SplitRequest به عنوان آرگومان فراخوانی کنید.

قطعه کد زیر نحوه تقسیم docx را به چندین فایل با استفاده از REST API در پایتون نشان می دهد:

# نحوه تقسیم فایل های Docx به چندین فایل با استفاده از پایتون
try:
    # یک نمونه از Document API ایجاد کنید
    documentApi = groupdocs_merger_cloud.DocumentApi.from_keys(app_sid, app_key)
     
    options = groupdocs_merger_cloud.SplitOptions()
    options.file_info = groupdocs_merger_cloud.FileInfo("python-testing\word-file.docx")
    options.output_path = "python-testing"
    options.pages = [3, 6, 8]
    options.mode = "Intervals"

    result = documentApi.split(groupdocs_merger_cloud.SplitRequest(options))
    print("Successfully split Word file to multiple files: " + result[0].path)
except groupdocs_merger_cloud.ApiException as e:
  print("Exception while calling API: {0}".format(e.message))

فایل Split Word آنلاین

چگونه سند word را به صورت آنلاین رایگان به چندین فایل تقسیم کنیم؟ می توانید 22 سند word را به صورت آنلاین به چندین فایل به صورت آنلاین با تعداد ثابتی از صفحات یا در محدوده های مختلف صفحات تقسیم کنید. اسناد word چند صفحه ای به چندین فایل word با حفظ فرمت سند اصلی تقسیم می شوند.

نتیجه

در این آموزش یاد گرفتیم:

  • چگونه فایل word را در پایتون در فضای ابری به دو قسمت تقسیم کنیم.
  • نحوه تقسیم فایل docx به فایل های جداگانه در پایتون.
  • به صورت برنامه نویسی نحوه تقسیم سند word به صفحه در پایتون.
  • نحوه تقسیم سند word به چندین سند آنلاین به صورت برنامه نویسی در پایتون.
  • چگونه می توان فایل word را بصورت آنلاین و رایگان با استفاده از تقسیم کننده صفحه word آنلاین تقسیم کرد.

علاوه بر این، می‌توانید با استفاده از مستندات درباره GroupDocs.Merger Cloud API اطلاعات بیشتری کسب کنید. ما همچنین یک بخش API Reference ارائه می دهیم که به شما امکان می دهد API های ما را مستقیماً از طریق مرورگر تجسم کرده و با آنها ارتباط برقرار کنید. علاوه بر این، لطفاً GroupDocs.Merger Cloud SDK برای پایتون را ببینید مثال‌ها در اینجا.

یه سوال بپرس

اگر در مورد نحوه استخراج صفحات از سند word به صورت آنلاین سؤالی دارید، لطفاً از ما در [تالار گفتمان] بپرسید (https://forum.groupdocs.cloud/c/merger/18)

سوالات متداول

چگونه با استفاده از docx splitter API صفحات را از سند word به صورت آنلاین استخراج کنیم؟

دانلود رایگان تقسیم‌کننده اسناد کتابخانه پایتون برای استخراج صفحات word به صورت آنلاین. برای جزئیات کامل API می توانید از مستندات دیدن کنید.

سریعترین راه برای تقسیم سند word به صورت آنلاین چیست؟

Word page استخراج آنلاین بسیار سریع کار می کند و می توانید docx را به صورت آنلاین در چند ثانیه تقسیم کنید.

چگونه به صورت رایگان صفحه را از word آنلاین استخراج کنیم؟

  • [ استخراج کننده صفحه کلمه آنلاین 29 را باز کنید.
  • برای آپلود فایل word docx یا کشیدن و رها کردن فایل word روی قسمت رها کردن فایل کلیک کنید.
  • بر روی دکمه تبدیل کلیک کنید. سند شما آپلود و به فرمت DOC تبدیل می شود.
  • لینک دانلود فایل های خروجی بلافاصله پس از تقسیم در دسترس خواهد بود.

آیا استفاده از جداکننده اسناد آنلاین رایگان ایمن است؟

بله، word splitter document امن است و هیچکس به فایل های آپلود شده شما دسترسی ندارد. ما فایل های آپلود شده را بعد از 24 ساعت حذف می کنیم.

همچنین ببینید