چگونه صفحه خالی را در ورد با استفاده از C# حذف کنیم

چگونه صفحه خالی را در ورد با استفاده از C# حذف کنیم

این آموزش سریع توضیح می‌دهد که چگونه می‌توان صفحات خالی را از اسناد ورد (DOCX، DOC و غیره) با استفاده از C# حذف کرد. این فرآیند شامل بارگذاری یک فایل ورد، تحلیل صفحات فردی، شناسایی صفحات خالی و در نهایت ایجاد یک سند جدید بدون صفحات خالی است.

مزایای حذف صفحات خالی در اسناد ورد

  1. سند تمیزتر:
    • خوانایی و حرفه‌ای بودن را بهبود می‌بخشد.
  2. کاهش اندازه فایل:
    • با حذف صفحات غیرضروری، ذخیره‌سازی کارآمدتری را فراهم می‌کند.
  3. قابلیت اتوماسیون:
    • ایده‌آل برای پاکسازی اسناد بزرگ به‌صورت خودکار.

پیش‌نیازها: آماده‌سازی محیط

  1. ویژوال استودیو یا IDE دیگر .NET.
  2. افزودن Aspose.Words از طریق مدیر بسته NuGet.

راهنمای گام به گام برای حذف صفحات خالی در ورد با استفاده از C#

گام 1: پیکربندی محیط

کتابخانه Aspose.Words را از طریق مدیر بسته NuGet نصب کنید.

Install-Package Aspose.Words

گام 2: بارگذاری سند ورد

فایل ورد اصلی خود را با استفاده از شیء کلاس Document بارگذاری کنید.

Document originalDoc = new Document("WordFileWithBlankPages.docx");

گام 3: استخراج هر صفحه به‌طور جداگانه

از طریق هر صفحه حلقه بزنید و هر صفحه را به یک سند جداگانه برای تحلیل استخراج کنید.

int totalPages = originalDoc.PageCount;

for (int i = 0; i < totalPages; i++)
{
    Document singlePageDoc = originalDoc.ExtractPages(i, 1);
    // تحلیل singlePageDoc در مراحل بعدی
}

گام 4: تحلیل اسناد تک صفحه‌ای

بررسی کنید که آیا سند تک صفحه‌ای حاوی متن یا اشکال است یا خیر.

int shapesCounter = 0;
string pageText = "";

foreach (Section docSection in singlePageDoc.Sections)
{
    pageText += docSection.Body.ToString(SaveFormat.Text);
    shapesCounter += docSection.Body.GetChildNodes(NodeType.Shape, true).Count;
}

گام 5: حفظ لیست صفحات غیر خالی

شماره صفحات حاوی محتوا را پیگیری کنید.

ArrayList blankPages = new ArrayList();
blankPages.Add(-1);

if (string.IsNullOrEmpty(pageText.Trim()) && shapesCounter == 0)
    blankPages.Add(i); // i ایندکس صفحه در حلقه است

گام 6: ضمیمه کردن صفحات غیر خالی به سند جدید

یک سند جدید ایجاد کنید و فقط صفحات غیر خالی را با استفاده از لیست پیگیری شده ضمیمه کنید.

Document finalDoc = (Document)originalDoc.Clone(false);
finalDoc.RemoveAllChildren();

blankPages.Add(totalPages);

for (int i = 1; i < blankPages.Count; i++)
{
    int index = (int)blankPages[i - 1] + 1;
    int count = (int)blankPages[i] - index;

    if (count > 0)
        finalDoc.AppendDocument(originalDoc.ExtractPages(index, count), ImportFormatMode.KeepSourceFormatting);
}

گام 7: ذخیره سند اصلاح‌شده

سند جدید را با حذف صفحات خالی ذخیره کنید.

finalDoc.Save(@"cleaned.docx");

مثال کد کامل برای حذف صفحات خالی در ورد با استفاده از C#

در زیر مثال کد اجرایی کامل که مراحل فوق را نشان می‌دهد، آورده شده است:

Document originalDoc = new Document("WordFileWithBlankPages.docx");

ArrayList blankPages = new ArrayList();
blankPages.Add(-1);

int totalPages = originalDoc.PageCount;

for (int i = 0; i < totalPages; i++)
{
    Document singlePageDoc = originalDoc.ExtractPages(i, 1);
    int shapesCounter = 0;
    string pageText = "";

    foreach (Section docSection in singlePageDoc.Sections)
    {
        pageText += docSection.Body.ToString(SaveFormat.Text);
        shapesCounter += docSection.Body.GetChildNodes(NodeType.Shape, true).Count;
    }

    if (string.IsNullOrEmpty(pageText.Trim()) && shapesCounter == 0)
        blankPages.Add(i);
}

blankPages.Add(totalPages);

Document finalDoc = (Document)originalDoc.Clone(false);
finalDoc.RemoveAllChildren();

for (int i = 1; i < blankPages.Count; i++)
{
    int index = (int)blankPages[i - 1] + 1;
    int count = (int)blankPages[i] - index;

    if (count > 0)
        finalDoc.AppendDocument(originalDoc.ExtractPages(index, count), ImportFormatMode.KeepSourceFormatting);
}

finalDoc.Save(@"NonEmptyPages.docx");
System.Console.WriteLine("صفحات خالی با موفقیت حذف شدند.");

نتیجه‌گیری

این مقاله توضیح داد که چگونه می‌توان صفحات خالی را در فایل‌های ورد با استفاده از C# حذف کرد. با دنبال کردن مراحل ارائه‌شده، می‌توانید به‌طور برنامه‌نویسی صفحات خالی را شناسایی و حذف کنید و در نتیجه یک سند تمیزتر داشته باشید. می‌توانید به بررسی بیشتر Aspose.Words برای انجام وظایف دیگر در زمینه دستکاری اسناد ورد بپردازید.

 فارسی