بهعنوان یک توسعهدهنده پایتون، میتوانید هر فایل Word (.doc یا .docx) را بهصورت برنامهنویسی در فضای ابری حاشیهنویسی کنید. همچنین می توانید تمام حاشیه نویسی ها را از فایل های Word با استفاده از پایتون استخراج یا حذف کنید. حاشیهنویسیها شامل نظرات، پنجرههای بازشو و سایر اشیاء گرافیکی در سند هستند که اطلاعات بیشتری را ارائه میکنند. این مقاله بر نحوه استخراج یا حذف حاشیه نویسی از فایل های DOCX با استفاده از REST API در پایتون تمرکز خواهد کرد.
موضوعات زیر در این مقاله پوشش داده خواهد شد:
- API REST Annotation Document و Python SDK
- با استفاده از REST API، حاشیه نویسی را از فایل های DOCX استخراج یا حذف کنید
API REST Annotation Document و Python SDK
برای استخراج یا حذف حاشیه نویسی از فایل های DOC یا DOCX، از Python SDK of GroupDocs.Annotation Cloud API استفاده خواهم کرد. این به شما اجازه می دهد تا به صورت برنامه ریزی شده ابزارهای حاشیه نویسی آنلاین سند و تصویر بسازید. از چنین ابزارهایی می توان برای افزودن حاشیه نویسی، پوشش واترمارک، جایگزینی متن، ویرایش، یادداشت های چسبناک و نشانه گذاری متن به اسناد تجاری همه فرمت های رایج استفاده کرد. همچنین SDKهای دات نت، جاوا، PHP، روبی و Node.js را به عنوان [اعضای خانواده حاشیه نویسی سند4 برای Cloud API فراهم می کند.
می توانید با استفاده از دستور زیر در کنسول، GroupDocs.Annotation Cloud را در پروژه پایتون خود نصب کنید:
pip install groupdocs_annotation_cloud
لطفاً قبل از شروع به دنبال کردن مراحل و نمونه کدهای موجود، شناسه مشتری و راز مشتری خود را از داشبورد دریافت کنید. هنگامی که شناسه و راز خود را دریافت کردید، کد را مطابق شکل زیر اضافه کنید:
client_id = "da0c487d-c1c0-45ae-b7bf-43eaf53c5ad5"
client_secret = "479db2b01dcb93a3d4d20efb16dea971"
configuration = groupdocs_annotation_cloud.Configuration(client_id, client_secret)
configuration.api_base_url = "https://api.groupdocs.cloud"
استخراج یا حذف حاشیه نویسی از فایل های DOCX با استفاده از REST API در پایتون
می توانید با دنبال کردن مراحل ساده زیر، تمام حاشیه نویسی ها را از فایل های DOCX استخراج یا حذف کنید:
- آپلود فایل DOCX در Cloud
- استخراج حاشیه نویسی از فایل های DOCX در پایتون
- حذف حاشیه نویسی ها از فایل های DOCX در پایتون
- دانلود فایل به روز شده
سند را آپلود کنید
ابتدا فایل DOCX را با استفاده از نمونه کد زیر در Cloud آپلود کنید:
# نمونه api
file_api = groupdocs_annotation_cloud.FileApi.from_config(configuration)
# آپلود فایل
request = groupdocs_annotation_cloud.UploadFileRequest("input.docx", "C:\\Files\\input.docx", my_storage)
response = file_api.upload_file(request)
در نتیجه، فایل DOCX آپلود شده (input.docx) در بخش فایلها داشبورد شما در فضای ابری در دسترس خواهد بود.
استخراج حاشیه نویسی از فایل های DOCX در پایتون
لطفاً مراحل ذکر شده در زیر را برای استخراج حاشیه نویسی از سند Word به صورت برنامه ای دنبال کنید.
- یک نمونه از AnnotateApi ایجاد کنید
- یک نمونه FileInfo ایجاد کنید
- مسیر فایل را تنظیم کنید
- با فراخوانی متد ExtractRequest یک درخواست ایجاد کنید
- با فراخوانی روش AnnotateApi.extract() به نتیجه برسید
قطعه کد زیر نحوه استخراج حاشیه نویسی از سند Word را با استفاده از REST API نشان می دهد.
# نمونه api
api = groupdocs_annotation_cloud.AnnotateApi.from_config(configuration)
# جزئیات فایل ورودی
file_info = groupdocs_annotation_cloud.FileInfo()
file_info.file_path = "input.docx"
# درخواست حاشیه نویسی را استخراج کنید
request = groupdocs_annotation_cloud.ExtractRequest(file_info)
result = api.extract(request)
print("ExtractAnnotations: annotations count: " + str(len(result)))
نمونه کد بالا آرایه ای از تمام حاشیه نویسی ها را در قالب JSON به شکل زیر برمی گرداند:
حاشیه نویسی ها را از فایل های DOCX در پایتون حذف کنید
لطفاً مراحل ذکر شده در زیر را برای حذف حاشیه نویسی از سند Word به صورت برنامه ای دنبال کنید.
- یک نمونه از AnnotateApi ایجاد کنید
- یک نمونه FileInfo ایجاد کنید
- مسیر فایل را تنظیم کنید
- RemoveOptions را تعریف کنید
- اطلاعات فایل را روی AnnotateOptions تنظیم کنید
- شناسه حاشیه نویسی را برای حذف ارائه دهید
- مسیر فایل خروجی را تنظیم کنید
- با فراخوانی روش RemoveAnnotationsRequest یک درخواست ایجاد کنید
- با فراخوانی روش AnnotateApi.remove\annotations() نتیجه بگیرید
قطعه کد زیر نحوه حذف حاشیه نویسی از سند Word را با استفاده از REST API نشان می دهد. باید شناسه های حاشیه نویسی را که باید از سند حذف شوند ذکر کنید.
# نمونه api
api = groupdocs_annotation_cloud.AnnotateApi.from_keys(client_id, client_secret)
# جزئیات فایل ورودی
file_info = groupdocs_annotation_cloud.FileInfo()
file_info.file_path = "input.docx"
# گزینه ها را حذف کنید
options = groupdocs_annotation_cloud.RemoveOptions()
options.file_info = file_info
options.annotation_ids = [0,1,2,3,4,5,6,7,8,9,10,11]
# فایل خروجی
options.output_path = "output.docx"
# حذف درخواست
request = groupdocs_annotation_cloud.RemoveAnnotationsRequest(options)
result = api.remove_annotations(request)
print("RemoveAnnotations: Annotations removed: " + result['href'])
فایل خروجی را دانلود کنید
نمونه کد بالا فایل DOCX خروجی (output.docx) را پس از حذف حاشیه نویسی در ابر ذخیره می کند. با استفاده از نمونه کد زیر می توانید آن را دانلود کنید:
# نمونه api
file_api = groupdocs_annotation_cloud.FileApi.from_config(configuration)
# درخواست دانلود فایل
request = groupdocs_annotation_cloud.DownloadFileRequest("output.docx", my_storage)
response = file_api.download_file(request)
# فایل دانلود شده را به دایرکتوری کاری خود منتقل کنید
shutil.move(response, "C:\\Files\\")
آنلاین را امتحان کنید
لطفاً ابزار حاشیه نویسی آنلاین رایگان DOCX زیر را که با استفاده از API بالا ایجاد شده است، امتحان کنید. https://products.groupdocs.app/annotation/docx
نتیجه
در این مقاله، نحوه استخراج یا حذف حاشیه نویسی از اسناد ورد در فضای ابری با استفاده از پایتون را آموختید. همچنین یاد گرفتید که چگونه فایل DOCX را به صورت برنامهنویسی در فضای ابری آپلود کنید و فایل را از ابر دانلود کنید. با استفاده از documentation میتوانید درباره GroupDocs.Annotation Cloud API اطلاعات بیشتری کسب کنید. ما همچنین یک بخش API Reference ارائه می دهیم که به شما امکان می دهد API های ما را مستقیماً از طریق مرورگر تجسم کنید و با آنها تعامل داشته باشید. در صورت وجود هرگونه ابهام، لطفاً با ما در [تالار] تماس حاصل فرمایید15.