# چگونه صفحه خالی را در ورد با استفاده از C# حذف کنیم

# چگونه صفحه خالی را در ورد با استفاده از C# حذف کنیم

این راهنمای سریع توضیح می دهد که چگونه صفحات خالی را از اسناد Word (DOCX، DOC، و غیره) با استفاده از C# حذف کنیم.این فرآیند شامل بارگذاری یک فایل Word، تجزیه و تحلیل صفحات فردی، شناسایی صفحات خالی و در نهایت ایجاد یک سند جدید بدون صفحات خالی است.

مزایای حذف صفحات سفید در اسناد کلمه

  • تصمیم گیری برای تمیز کردن:- خواندن و حرفه ای شدن را بهبود می بخشد.

  • اندازه فایل کاهش یافته:- ذخیره سازی موثر با حذف صفحات غیر ضروری

  • توانایی اتوماسیون:- مناسب برای تمیز کردن اسناد بزرگ به صورت اتوماتیک

برچسب ها: آماده سازی محیط زیست

  • Visual Studio یا دیگر .NET IDE ها
  • Aspose.Words از طریق NuGet Package Manager اضافه شده است.

راهنمای گام به گام برای حذف صفحات سفید در کلمه با استفاده از C#

مرحله اول: ایجاد محیط زیست

کتابخانه Aspose.Words را از طریق مدیریت بسته NuGet نصب کنید.

Install-Package Aspose.Words

مرحله دوم: کلمه را وارد کنید

فایل اصلی Word خود را با استفاده از موضوع کلاس اسناد بارگذاری کنید.

Document originalDoc = new Document("WordFileWithBlankPages.docx");

مرحله سوم: هر صفحه را جدا کنید

از هر صفحه عبور کنید و هر صفحه را به یک سند جداگانه برای تجزیه و تحلیل استخراج کنید.

int totalPages = originalDoc.PageCount;

for (int i = 0; i < totalPages; i++)
{
    Document singlePageDoc = originalDoc.ExtractPages(i, 1);
    // Analyze singlePageDoc in next steps
}

مرحله چهارم: تجزیه و تحلیل اسناد یک صفحه ای

بررسی کنید که آیا سند یک صفحه حاوی متن یا اشکال است یا خیر.

int shapesCounter = 0;
string pageText = "";

foreach (Section docSection in singlePageDoc.Sections)
{
    pageText += docSection.Body.ToString(SaveFormat.Text);
    shapesCounter += docSection.Body.GetChildNodes(NodeType.Shape, true).Count;
}

مرحله پنجم: لیست صفحات خالی را حفظ کنید

تعداد صفحات حاوی محتوا را ردیابی کنید.

ArrayList blankPages = new ArrayList();
blankPages.Add(-1);

if (string.IsNullOrEmpty(pageText.Trim()) && shapesCounter == 0)
    blankPages.Add(i); // i is page index in loop

مرحله 6: اضافه کردن صفحات خالی به اسناد جدید

یک سند جدید ایجاد کنید و فقط صفحات غیر خالی را با استفاده از لیست ردیابی اضافه کنید.

Document finalDoc = (Document)originalDoc.Clone(false);
finalDoc.RemoveAllChildren();

blankPages.Add(totalPages);

for (int i = 1; i < blankPages.Count; i++)
{
    int index = (int)blankPages[i - 1] + 1;
    int count = (int)blankPages[i] - index;

    if (count > 0)
        finalDoc.AppendDocument(originalDoc.ExtractPages(index, count), ImportFormatMode.KeepSourceFormatting);
}

مرحله 7: ذخیره اسناد اصلاح شده

اسناد جدید را با صفحات سفید حذف کنید.

finalDoc.Save(@"cleaned.docx");

نمونه کامل کد برای حذف صفحات سفید در کلمه با استفاده از C#

در زیر نمونه کامل کد قابل اجرا است که نشان دهنده مراحل بالا است:

Document originalDoc = new Document("WordFileWithBlankPages.docx");

ArrayList blankPages = new ArrayList();
blankPages.Add(-1);

int totalPages = originalDoc.PageCount;

for (int i = 0; i < totalPages; i++)
{
    Document singlePageDoc = originalDoc.ExtractPages(i, 1);
    int shapesCounter = 0;
    string pageText = "";

    foreach (Section docSection in singlePageDoc.Sections)
    {
        pageText += docSection.Body.ToString(SaveFormat.Text);
        shapesCounter += docSection.Body.GetChildNodes(NodeType.Shape, true).Count;
    }

    if (string.IsNullOrEmpty(pageText.Trim()) && shapesCounter == 0)
        blankPages.Add(i);
}

blankPages.Add(totalPages);

Document finalDoc = (Document)originalDoc.Clone(false);
finalDoc.RemoveAllChildren();

for (int i = 1; i < blankPages.Count; i++)
{
    int index = (int)blankPages[i - 1] + 1;
    int count = (int)blankPages[i] - index;

    if (count > 0)
        finalDoc.AppendDocument(originalDoc.ExtractPages(index, count), ImportFormatMode.KeepSourceFormatting);
}

finalDoc.Save(@"NonEmptyPages.docx");
System.Console.WriteLine("Blank pages removed successfully.");

نتیجه گیری

در این مقاله توضیح داده شده است که چگونه برای حذف صفحات خالی در فایل های Word با استفاده از C#. با پیروی از مراحل ارائه شده، شما می توانید به طور برنامه نویسی صفحات خالی را شناسایی و حذف آنها، منجر به یک سند تمیز تر.

 فارسی