پایتون حاشیه نویسی ها را از فایل های Word استخراج یا حذف می کند.

به‌عنوان یک توسعه‌دهنده پایتون، می‌توانید هر فایل Word (.doc یا .docx) را به‌صورت برنامه‌نویسی در فضای ابری حاشیه‌نویسی کنید. همچنین می توانید تمام حاشیه نویسی ها را از فایل های Word با استفاده از پایتون استخراج یا حذف کنید. حاشیه‌نویسی‌ها شامل نظرات، پنجره‌های بازشو و سایر اشیاء گرافیکی در سند هستند که اطلاعات بیشتری را ارائه می‌کنند. این مقاله بر نحوه استخراج یا حذف حاشیه نویسی از فایل های DOCX با استفاده از REST API در پایتون تمرکز خواهد کرد.

موضوعات زیر در این مقاله پوشش داده خواهد شد:

API REST Annotation Document و Python SDK

برای استخراج یا حذف حاشیه نویسی از فایل های DOC یا DOCX، از Python SDK of GroupDocs.Annotation Cloud API استفاده خواهم کرد. این به شما اجازه می دهد تا به صورت برنامه ریزی شده ابزارهای حاشیه نویسی آنلاین سند و تصویر بسازید. از چنین ابزارهایی می توان برای افزودن حاشیه نویسی، پوشش واترمارک، جایگزینی متن، ویرایش، یادداشت های چسبناک و نشانه گذاری متن به اسناد تجاری همه فرمت های رایج استفاده کرد. همچنین SDKهای دات نت، جاوا، PHP، روبی و Node.js را به عنوان [اعضای خانواده حاشیه نویسی سند4 برای Cloud API فراهم می کند.

می توانید با استفاده از دستور زیر در کنسول، GroupDocs.Annotation Cloud را در پروژه پایتون خود نصب کنید:

pip install groupdocs_annotation_cloud

لطفاً قبل از شروع به دنبال کردن مراحل و نمونه کدهای موجود، شناسه مشتری و راز مشتری خود را از داشبورد دریافت کنید. هنگامی که شناسه و راز خود را دریافت کردید، کد را مطابق شکل زیر اضافه کنید:

client_id = "da0c487d-c1c0-45ae-b7bf-43eaf53c5ad5"
client_secret = "479db2b01dcb93a3d4d20efb16dea971"

configuration = groupdocs_annotation_cloud.Configuration(client_id, client_secret)
configuration.api_base_url = "https://api.groupdocs.cloud"

استخراج یا حذف حاشیه نویسی از فایل های DOCX با استفاده از REST API در پایتون

می توانید با دنبال کردن مراحل ساده زیر، تمام حاشیه نویسی ها را از فایل های DOCX استخراج یا حذف کنید:

سند را آپلود کنید

ابتدا فایل DOCX را با استفاده از نمونه کد زیر در Cloud آپلود کنید:

# نمونه api
file_api = groupdocs_annotation_cloud.FileApi.from_config(configuration)

# آپلود فایل
request = groupdocs_annotation_cloud.UploadFileRequest("input.docx", "C:\\Files\\input.docx", my_storage)
response = file_api.upload_file(request)

در نتیجه، فایل DOCX آپلود شده (input.docx) در بخش فایل‌ها داشبورد شما در فضای ابری در دسترس خواهد بود.

استخراج حاشیه نویسی از فایل های DOCX در پایتون

لطفاً مراحل ذکر شده در زیر را برای استخراج حاشیه نویسی از سند Word به صورت برنامه ای دنبال کنید.

  • یک نمونه از AnnotateApi ایجاد کنید
  • یک نمونه FileInfo ایجاد کنید
  • مسیر فایل را تنظیم کنید
  • با فراخوانی متد ExtractRequest یک درخواست ایجاد کنید
  • با فراخوانی روش AnnotateApi.extract() به نتیجه برسید

قطعه کد زیر نحوه استخراج حاشیه نویسی از سند Word را با استفاده از REST API نشان می دهد.

# نمونه api
api = groupdocs_annotation_cloud.AnnotateApi.from_config(configuration)

# جزئیات فایل ورودی
file_info = groupdocs_annotation_cloud.FileInfo()
file_info.file_path = "input.docx"

# درخواست حاشیه نویسی را استخراج کنید
request = groupdocs_annotation_cloud.ExtractRequest(file_info)
result = api.extract(request)        

print("ExtractAnnotations: annotations count: " + str(len(result)))

نمونه کد بالا آرایه ای از تمام حاشیه نویسی ها را در قالب JSON به شکل زیر برمی گرداند:

استخراج حاشیه نویسی از فایل DOCX با استفاده از پایتون

استخراج حاشیه نویسی از فایل DOCX با استفاده از پایتون

حاشیه نویسی ها را از فایل های DOCX در پایتون حذف کنید

لطفاً مراحل ذکر شده در زیر را برای حذف حاشیه نویسی از سند Word به صورت برنامه ای دنبال کنید.

  • یک نمونه از AnnotateApi ایجاد کنید
  • یک نمونه FileInfo ایجاد کنید
  • مسیر فایل را تنظیم کنید
  • RemoveOptions را تعریف کنید
  • اطلاعات فایل را روی AnnotateOptions تنظیم کنید
  • شناسه حاشیه نویسی را برای حذف ارائه دهید
  • مسیر فایل خروجی را تنظیم کنید
  • با فراخوانی روش RemoveAnnotationsRequest یک درخواست ایجاد کنید
  • با فراخوانی روش AnnotateApi.remove\annotations() نتیجه بگیرید

قطعه کد زیر نحوه حذف حاشیه نویسی از سند Word را با استفاده از REST API نشان می دهد. باید شناسه های حاشیه نویسی را که باید از سند حذف شوند ذکر کنید.

# نمونه api
api = groupdocs_annotation_cloud.AnnotateApi.from_keys(client_id, client_secret)

# جزئیات فایل ورودی
file_info = groupdocs_annotation_cloud.FileInfo()
file_info.file_path = "input.docx"

# گزینه ها را حذف کنید
options = groupdocs_annotation_cloud.RemoveOptions()
options.file_info = file_info
options.annotation_ids = [0,1,2,3,4,5,6,7,8,9,10,11]

# فایل خروجی
options.output_path = "output.docx"

# حذف درخواست
request = groupdocs_annotation_cloud.RemoveAnnotationsRequest(options)
result = api.remove_annotations(request)

print("RemoveAnnotations: Annotations removed: " + result['href'])
حاشیه نویسی ها را از فایل DOCX با استفاده از پایتون حذف کنید

حاشیه نویسی ها را از فایل DOCX با استفاده از پایتون حذف کنید

فایل خروجی را دانلود کنید

نمونه کد بالا فایل DOCX خروجی (output.docx) را پس از حذف حاشیه نویسی در ابر ذخیره می کند. با استفاده از نمونه کد زیر می توانید آن را دانلود کنید:

# نمونه api
file_api = groupdocs_annotation_cloud.FileApi.from_config(configuration)

# درخواست دانلود فایل
request = groupdocs_annotation_cloud.DownloadFileRequest("output.docx", my_storage)
response = file_api.download_file(request)

# فایل دانلود شده را به دایرکتوری کاری خود منتقل کنید
shutil.move(response, "C:\\Files\\")

آنلاین را امتحان کنید

لطفاً ابزار حاشیه نویسی آنلاین رایگان DOCX زیر را که با استفاده از API بالا ایجاد شده است، امتحان کنید. https://products.groupdocs.app/annotation/docx

نتیجه

در این مقاله، نحوه استخراج یا حذف حاشیه نویسی از اسناد ورد در فضای ابری با استفاده از پایتون را آموختید. همچنین یاد گرفتید که چگونه فایل DOCX را به صورت برنامه‌نویسی در فضای ابری آپلود کنید و فایل را از ابر دانلود کنید. با استفاده از documentation می‌توانید درباره GroupDocs.Annotation Cloud API اطلاعات بیشتری کسب کنید. ما همچنین یک بخش API Reference ارائه می دهیم که به شما امکان می دهد API های ما را مستقیماً از طریق مرورگر تجسم کنید و با آنها تعامل داشته باشید. در صورت وجود هرگونه ابهام، لطفاً با ما در [تالار] تماس حاصل فرمایید15.

همچنین ببینید