Како уклонити белу страницу у речи користећи Ц #
Овај брз туториал објашњава како уклонити празне странице из Ворд докумената (ДОЦКС, ДОЦ, итд.) користећи Ц #. Процес укључује преузимање Ворд датотеке, анализује појединачне странице, идентификује празне странице и на крају ствара нови документ без празне странице.
Предности уклањања белих страница у Word документима
Очишћавајући документ:- Побољшава читавост и професионалност.
Смањена величина датотеке:- Ефикасно складиштење елиминисањем непотребних страница.
Капацитет аутоматизације:- Idealno za automatsko čišćenje velikih dokumenata.
Принципи: Припрема за животну средину
- Визуел Студио или други .NET ИДЕ.
- Aspose.Words je dodan preko NuGet Package Manager-a.
Корак по корак водич за уклањање белих страница у Ворду користећи Ц
Корак 1: Конфигурисање окружења
Инсталирајте Аппосе.Вордс библиотеку кроз НуГет менаџер пакета.
Install-Package Aspose.Words
Корак 2: Преузмите документ речи
Преузмите оригинални Word датотеку користећи објекат класе Документ.
Document originalDoc = new Document("WordFileWithBlankPages.docx");
Корак 3: Извлачите сваку страницу одвојено
Прођите кроз сваку страницу и извуците сваку страницу у одвојени документ за анализу.
int totalPages = originalDoc.PageCount;
for (int i = 0; i < totalPages; i++)
{
Document singlePageDoc = originalDoc.ExtractPages(i, 1);
// Analyze singlePageDoc in next steps
}
Корак 4: Анализа једностраних докумената
Проверите да ли је једнострани документ садржи текст или облике.
int shapesCounter = 0;
string pageText = "";
foreach (Section docSection in singlePageDoc.Sections)
{
pageText += docSection.Body.ToString(SaveFormat.Text);
shapesCounter += docSection.Body.GetChildNodes(NodeType.Shape, true).Count;
}
Корак 5: Држите листу празних страница
Пратите број страница који садрже садржај.
ArrayList blankPages = new ArrayList();
blankPages.Add(-1);
if (string.IsNullOrEmpty(pageText.Trim()) && shapesCounter == 0)
blankPages.Add(i); // i is page index in loop
Корак 6: Додајте непразне странице на нови документ
Креирајте нови документ и додајте само непразне странице користећи праћени списак.
Document finalDoc = (Document)originalDoc.Clone(false);
finalDoc.RemoveAllChildren();
blankPages.Add(totalPages);
for (int i = 1; i < blankPages.Count; i++)
{
int index = (int)blankPages[i - 1] + 1;
int count = (int)blankPages[i] - index;
if (count > 0)
finalDoc.AppendDocument(originalDoc.ExtractPages(index, count), ImportFormatMode.KeepSourceFormatting);
}
Корак 7: Сачувајте модификовани документ
Сачувајте нови документ са белим страницама уклоњеним.
finalDoc.Save(@"cleaned.docx");
Потпуни пример кода за уклањање белих страница у речи користећи Ц
Испод је комплетни пример извршног кода који показује горе наведене кораке:
Document originalDoc = new Document("WordFileWithBlankPages.docx");
ArrayList blankPages = new ArrayList();
blankPages.Add(-1);
int totalPages = originalDoc.PageCount;
for (int i = 0; i < totalPages; i++)
{
Document singlePageDoc = originalDoc.ExtractPages(i, 1);
int shapesCounter = 0;
string pageText = "";
foreach (Section docSection in singlePageDoc.Sections)
{
pageText += docSection.Body.ToString(SaveFormat.Text);
shapesCounter += docSection.Body.GetChildNodes(NodeType.Shape, true).Count;
}
if (string.IsNullOrEmpty(pageText.Trim()) && shapesCounter == 0)
blankPages.Add(i);
}
blankPages.Add(totalPages);
Document finalDoc = (Document)originalDoc.Clone(false);
finalDoc.RemoveAllChildren();
for (int i = 1; i < blankPages.Count; i++)
{
int index = (int)blankPages[i - 1] + 1;
int count = (int)blankPages[i] - index;
if (count > 0)
finalDoc.AppendDocument(originalDoc.ExtractPages(index, count), ImportFormatMode.KeepSourceFormatting);
}
finalDoc.Save(@"NonEmptyPages.docx");
System.Console.WriteLine("Blank pages removed successfully.");
Закључак
Овај чланак објашњава како да уклоните празне странице у Word датотеке користећи Ц #. Следећи постављене кораке, можете програматски открити празне странице и уклонити их, што резултира чистијим документом.