Як видалити порожню сторінку в Word за допомогою C#

Як видалити порожню сторінку в Word за допомогою C#

Цей швидкий посібник пояснює, як видалити порожні сторінки з документів Word (DOCX, DOC тощо) за допомогою C#. Процес включає завантаження файлу Word, аналіз окремих сторінок, ідентифікацію порожніх сторінок і, нарешті, створення нового документа без порожніх сторінок.

Переваги видалення порожніх сторінок у документах Word

  1. Чистіший документ:
    • Покращує читабельність і професіоналізм.
  2. Зменшений розмір файлу:
    • Ефективне зберігання шляхом усунення непотрібних сторінок.
  3. Можливість автоматизації:
    • Ідеально підходить для автоматичного очищення великих документів.

Передумови: Підготовка середовища

  1. Visual Studio або інша .NET IDE.
  2. Aspose.Words додано через менеджер пакетів NuGet.

Покроковий посібник з видалення порожніх сторінок у Word за допомогою C#

Крок 1: Налаштування середовища

Встановіть бібліотеку Aspose.Words через менеджер пакетів NuGet.

Install-Package Aspose.Words

Крок 2: Завантаження документа Word

Завантажте ваш оригінальний файл Word за допомогою об’єкта класу Document.

Document originalDoc = new Document("WordFileWithBlankPages.docx");

Крок 3: Витягнення кожної сторінки окремо

Пройдіть через кожну сторінку та витягніть кожну сторінку в окремий документ для аналізу.

int totalPages = originalDoc.PageCount;

for (int i = 0; i < totalPages; i++)
{
    Document singlePageDoc = originalDoc.ExtractPages(i, 1);
    // Аналізуйте singlePageDoc на наступних етапах
}

Крок 4: Аналіз документів з однією сторінкою

Перевірте, чи містить документ з однією сторінкою текст або фігури.

int shapesCounter = 0;
string pageText = "";

foreach (Section docSection in singlePageDoc.Sections)
{
    pageText += docSection.Body.ToString(SaveFormat.Text);
    shapesCounter += docSection.Body.GetChildNodes(NodeType.Shape, true).Count;
}

Крок 5: Збереження списку непорожніх сторінок

Ведіть облік номерів сторінок, що містять вміст.

ArrayList blankPages = new ArrayList();
blankPages.Add(-1);

if (string.IsNullOrEmpty(pageText.Trim()) && shapesCounter == 0)
    blankPages.Add(i); // i - індекс сторінки в циклі

Крок 6: Додавання непорожніх сторінок до нового документа

Створіть новий документ і додайте лише непорожні сторінки, використовуючи відстежуваний список.

Document finalDoc = (Document)originalDoc.Clone(false);
finalDoc.RemoveAllChildren();

blankPages.Add(totalPages);

for (int i = 1; i < blankPages.Count; i++)
{
    int index = (int)blankPages[i - 1] + 1;
    int count = (int)blankPages[i] - index;

    if (count > 0)
        finalDoc.AppendDocument(originalDoc.ExtractPages(index, count), ImportFormatMode.KeepSourceFormatting);
}

Крок 7: Збереження зміненого документа

Збережіть новий документ без порожніх сторінок.

finalDoc.Save(@"cleaned.docx");

Повний приклад коду для видалення порожніх сторінок у Word за допомогою C#

Нижче наведено повний виконуваний приклад коду, що демонструє наведені вище етапи:

Document originalDoc = new Document("WordFileWithBlankPages.docx");

ArrayList blankPages = new ArrayList();
blankPages.Add(-1);

int totalPages = originalDoc.PageCount;

for (int i = 0; i < totalPages; i++)
{
    Document singlePageDoc = originalDoc.ExtractPages(i, 1);
    int shapesCounter = 0;
    string pageText = "";

    foreach (Section docSection in singlePageDoc.Sections)
    {
        pageText += docSection.Body.ToString(SaveFormat.Text);
        shapesCounter += docSection.Body.GetChildNodes(NodeType.Shape, true).Count;
    }

    if (string.IsNullOrEmpty(pageText.Trim()) && shapesCounter == 0)
        blankPages.Add(i);
}

blankPages.Add(totalPages);

Document finalDoc = (Document)originalDoc.Clone(false);
finalDoc.RemoveAllChildren();

for (int i = 1; i < blankPages.Count; i++)
{
    int index = (int)blankPages[i - 1] + 1;
    int count = (int)blankPages[i] - index;

    if (count > 0)
        finalDoc.AppendDocument(originalDoc.ExtractPages(index, count), ImportFormatMode.KeepSourceFormatting);
}

finalDoc.Save(@"NonEmptyPages.docx");
System.Console.WriteLine("Порожні сторінки успішно видалено.");

Висновок

Ця стаття пояснила, як видалити порожні сторінки у файлах Word за допомогою C#. Дотримуючись наданих кроків, ви можете програмно виявляти пусті сторінки та видаляти їх, що призведе до більш чистого документа. Ви також можете далі досліджувати Aspose.Words для виконання інших завдань з маніпуляції документами Word.

 Українська