# Как удалить пустую страницу в Word с помощью C#

# Как удалить пустую страницу в Word с помощью C#

Этот быстрый урок объясняет, как удалить пустые страницы из Word-документов (DOCX, DOC, и т. д.) с помощью C#. Процесс включает загрузку файла Word, анализ отдельных страниц, идентификацию пустых страниц и, наконец, создание нового документа без пустых страниц.

Преимущества удаления белых страниц в документах Word

  • Чистый документ:- Улучшает читаемость и профессионализм.

  • Сниженный размер файла:- Эффективное хранение путем удаления ненужных страниц.

  • Автоматическая способность:- Идеально подходит для автоматического уборки больших документов.

Преимущества: Подготовка к окружающей среде

  • Visual Studio или другие .NET IDE.
  • Aspose.Words добавляется через NuGet Package Manager.

Шаг за шагом Руководство по удалению белых страниц в Word с помощью C#

Шаг 1: Настройка среды

Настройка библиотеки Aspose.Words через менеджер пакетов NuGet.

Install-Package Aspose.Words

Шаг 2: Загрузите документ слова

Загрузите оригинальный файл Word, используя объект класса Документа.

Document originalDoc = new Document("WordFileWithBlankPages.docx");

Шаг 3: Исключите каждую страницу отдельно

Пройдите через каждую страницу и выведите каждую страницу в отдельный документ для анализа.

int totalPages = originalDoc.PageCount;

for (int i = 0; i < totalPages; i++)
{
    Document singlePageDoc = originalDoc.ExtractPages(i, 1);
    // Analyze singlePageDoc in next steps
}

Шаг 4: Анализ односторонних документов

Проверьте, содержит ли документ одной страницы текст или формы.

int shapesCounter = 0;
string pageText = "";

foreach (Section docSection in singlePageDoc.Sections)
{
    pageText += docSection.Body.ToString(SaveFormat.Text);
    shapesCounter += docSection.Body.GetChildNodes(NodeType.Shape, true).Count;
}

Шаг 5: Сохранение списка пустых страниц

Следите за номерами страниц, содержащими контент.

ArrayList blankPages = new ArrayList();
blankPages.Add(-1);

if (string.IsNullOrEmpty(pageText.Trim()) && shapesCounter == 0)
    blankPages.Add(i); // i is page index in loop

Шаг 6: Добавьте непустые страницы к новому документу

Создайте новый документ и добавьте только неполные страницы, используя отслеженный список.

Document finalDoc = (Document)originalDoc.Clone(false);
finalDoc.RemoveAllChildren();

blankPages.Add(totalPages);

for (int i = 1; i < blankPages.Count; i++)
{
    int index = (int)blankPages[i - 1] + 1;
    int count = (int)blankPages[i] - index;

    if (count > 0)
        finalDoc.AppendDocument(originalDoc.ExtractPages(index, count), ImportFormatMode.KeepSourceFormatting);
}

Шаг 7: Сохраните измененный документ

Сохраните новый документ с удаленными белыми страницами.

finalDoc.Save(@"cleaned.docx");

Полный пример кода для удаления белых страниц в слове с помощью C#

Ниже представлен полный пример исполняемого кода, демонстрирующий вышеперечисленные шаги:

Document originalDoc = new Document("WordFileWithBlankPages.docx");

ArrayList blankPages = new ArrayList();
blankPages.Add(-1);

int totalPages = originalDoc.PageCount;

for (int i = 0; i < totalPages; i++)
{
    Document singlePageDoc = originalDoc.ExtractPages(i, 1);
    int shapesCounter = 0;
    string pageText = "";

    foreach (Section docSection in singlePageDoc.Sections)
    {
        pageText += docSection.Body.ToString(SaveFormat.Text);
        shapesCounter += docSection.Body.GetChildNodes(NodeType.Shape, true).Count;
    }

    if (string.IsNullOrEmpty(pageText.Trim()) && shapesCounter == 0)
        blankPages.Add(i);
}

blankPages.Add(totalPages);

Document finalDoc = (Document)originalDoc.Clone(false);
finalDoc.RemoveAllChildren();

for (int i = 1; i < blankPages.Count; i++)
{
    int index = (int)blankPages[i - 1] + 1;
    int count = (int)blankPages[i] - index;

    if (count > 0)
        finalDoc.AppendDocument(originalDoc.ExtractPages(index, count), ImportFormatMode.KeepSourceFormatting);
}

finalDoc.Save(@"NonEmptyPages.docx");
System.Console.WriteLine("Blank pages removed successfully.");

Заключение

В этой статье объясняется, как удалить пустые страницы в файлах Word с помощью C#. Следуя предусмотренным шагам, вы можете программически обнаружить пустые страницы и удалить их, что приводит к более чистым документам.

 Русский