Як видалити порожню сторінку в Word за допомогою C#
Цей швидкий посібник пояснює, як видалити порожні сторінки з документів Word (DOCX, DOC тощо) за допомогою C#. Процес включає завантаження файлу Word, аналіз окремих сторінок, ідентифікацію порожніх сторінок і, нарешті, створення нового документа без порожніх сторінок.
Переваги видалення порожніх сторінок у документах Word
- Чистіший документ:
- Покращує читабельність і професіоналізм.
- Зменшений розмір файлу:
- Ефективне зберігання шляхом усунення непотрібних сторінок.
- Можливість автоматизації:
- Ідеально підходить для автоматичного очищення великих документів.
Передумови: Підготовка середовища
- Visual Studio або інша .NET IDE.
- Aspose.Words додано через менеджер пакетів NuGet.
Покроковий посібник з видалення порожніх сторінок у Word за допомогою C#
Крок 1: Налаштування середовища
Встановіть бібліотеку Aspose.Words через менеджер пакетів NuGet.
Install-Package Aspose.Words
Крок 2: Завантаження документа Word
Завантажте ваш оригінальний файл Word за допомогою об’єкта класу Document.
Document originalDoc = new Document("WordFileWithBlankPages.docx");
Крок 3: Витягнення кожної сторінки окремо
Пройдіть через кожну сторінку та витягніть кожну сторінку в окремий документ для аналізу.
int totalPages = originalDoc.PageCount;
for (int i = 0; i < totalPages; i++)
{
Document singlePageDoc = originalDoc.ExtractPages(i, 1);
// Аналізуйте singlePageDoc на наступних етапах
}
Крок 4: Аналіз документів з однією сторінкою
Перевірте, чи містить документ з однією сторінкою текст або фігури.
int shapesCounter = 0;
string pageText = "";
foreach (Section docSection in singlePageDoc.Sections)
{
pageText += docSection.Body.ToString(SaveFormat.Text);
shapesCounter += docSection.Body.GetChildNodes(NodeType.Shape, true).Count;
}
Крок 5: Збереження списку непорожніх сторінок
Ведіть облік номерів сторінок, що містять вміст.
ArrayList blankPages = new ArrayList();
blankPages.Add(-1);
if (string.IsNullOrEmpty(pageText.Trim()) && shapesCounter == 0)
blankPages.Add(i); // i - індекс сторінки в циклі
Крок 6: Додавання непорожніх сторінок до нового документа
Створіть новий документ і додайте лише непорожні сторінки, використовуючи відстежуваний список.
Document finalDoc = (Document)originalDoc.Clone(false);
finalDoc.RemoveAllChildren();
blankPages.Add(totalPages);
for (int i = 1; i < blankPages.Count; i++)
{
int index = (int)blankPages[i - 1] + 1;
int count = (int)blankPages[i] - index;
if (count > 0)
finalDoc.AppendDocument(originalDoc.ExtractPages(index, count), ImportFormatMode.KeepSourceFormatting);
}
Крок 7: Збереження зміненого документа
Збережіть новий документ без порожніх сторінок.
finalDoc.Save(@"cleaned.docx");
Повний приклад коду для видалення порожніх сторінок у Word за допомогою C#
Нижче наведено повний виконуваний приклад коду, що демонструє наведені вище етапи:
Document originalDoc = new Document("WordFileWithBlankPages.docx");
ArrayList blankPages = new ArrayList();
blankPages.Add(-1);
int totalPages = originalDoc.PageCount;
for (int i = 0; i < totalPages; i++)
{
Document singlePageDoc = originalDoc.ExtractPages(i, 1);
int shapesCounter = 0;
string pageText = "";
foreach (Section docSection in singlePageDoc.Sections)
{
pageText += docSection.Body.ToString(SaveFormat.Text);
shapesCounter += docSection.Body.GetChildNodes(NodeType.Shape, true).Count;
}
if (string.IsNullOrEmpty(pageText.Trim()) && shapesCounter == 0)
blankPages.Add(i);
}
blankPages.Add(totalPages);
Document finalDoc = (Document)originalDoc.Clone(false);
finalDoc.RemoveAllChildren();
for (int i = 1; i < blankPages.Count; i++)
{
int index = (int)blankPages[i - 1] + 1;
int count = (int)blankPages[i] - index;
if (count > 0)
finalDoc.AppendDocument(originalDoc.ExtractPages(index, count), ImportFormatMode.KeepSourceFormatting);
}
finalDoc.Save(@"NonEmptyPages.docx");
System.Console.WriteLine("Порожні сторінки успішно видалено.");
Висновок
Ця стаття пояснила, як видалити порожні сторінки у файлах Word за допомогою C#. Дотримуючись наданих кроків, ви можете програмно виявляти пусті сторінки та видаляти їх, що призведе до більш чистого документа. Ви також можете далі досліджувати Aspose.Words для виконання інших завдань з маніпуляції документами Word.