Wie man die Entdeckung und Ausfuhr von großen Dokumentararchiven automatisiert

Wie man die Entdeckung und Ausfuhr von großen Dokumentararchiven automatisiert

Aspose.Imaging für .NET vereinfacht den gesamten Prozess – Handhabung von Ordnern mit Tausenden von Dateien, Entfernung und Export sie in Menge, mit robustem Fehlerlogging und Ausgangsmanagement.

Real-Weltproblem

Manualdeckung und Export für große Archiven ist nicht skalierbar. Organisationen benötigen vollständig automatisierte Lösungen für Geschäfts-, juristische, historische oder wissenschaftliche Digitalisierungsprojekte.

Überblick der Lösung

Verwenden Sie ein recursives Batch-Script, um jedes unterstützte Bild in allen Unterfoldern, Log-Ergebnissen und Export in den gewünschten Formaten zu verarbeiten – ohne menschliche Intervention.

Voraussetzung

  • Visual Studio 2019 oder später
  • .NET 6.0 oder höher (oder .Net Framework 4.6.2+)
  • Aspose.Imaging für .NET von NuGet
  • Quellarchivmappe (lokale, Netzwerk oder Cloud-Mapped)
PM> Install-Package Aspose.Imaging

Schritt für Schritt Implementierung

Schritt 1: Wiederholung aller Bilddateien

string rootDir = "./archive_input";
string outputDir = "./archive_output";
Directory.CreateDirectory(outputDir);

// All supported types: jpg, png, tif, bmp, gif, etc.
var files = Directory.GetFiles(rootDir, "*.*", SearchOption.AllDirectories)
    .Where(f => f.EndsWith(".jpg", StringComparison.OrdinalIgnoreCase)
             || f.EndsWith(".jpeg", StringComparison.OrdinalIgnoreCase)
             || f.EndsWith(".png", StringComparison.OrdinalIgnoreCase)
             || f.EndsWith(".tif", StringComparison.OrdinalIgnoreCase)
             || f.EndsWith(".tiff", StringComparison.OrdinalIgnoreCase)
             || f.EndsWith(".bmp", StringComparison.OrdinalIgnoreCase)
             || f.EndsWith(".gif", StringComparison.OrdinalIgnoreCase))
    .ToArray();

Schritt 2: Batch Deskew und Export mit Fehlerbehandlung

using Aspose.Imaging;
using Aspose.Imaging.ImageOptions;

List<string> failedFiles = new List<string>();
foreach (var file in files)
{
    try
    {
        using (var image = (RasterImage)Image.Load(file))
        {
            image.NormalizeAngle(false, Color.White);
            string relPath = Path.GetRelativePath(rootDir, file);
            string outPath = Path.Combine(outputDir, relPath);
            Directory.CreateDirectory(Path.GetDirectoryName(outPath));
            image.Save(outPath, new TiffOptions(TiffExpectedFormat.Default));
        }
    }
    catch (Exception ex)
    {
        failedFiles.Add($"{file}: {ex.Message}");
    }
}

// Save log for failed files
File.WriteAllLines(Path.Combine(outputDir, "deskew_failed_files.log"), failedFiles);

Schritt 3: Schema und Monitoring

Set up as a Windows Task Scheduler job or similar to run on new scans automatically.

Verwendung von Fällen und Anwendungen

  • Business/Legal-Archive (Verträge, Falldateien)
  • Bibliothek und historische Digitalisierung
  • Wissenschaftliche oder Forschungsbild-Kollektionen
  • Ongoing Scan-Projekte für Einhaltung oder Audit

Gemeinsame Herausforderungen und Lösungen

Netzwerkstörungen: Verarbeiten lokaler Kopien und Resync oder Log und Retry.

Lange oder korrupte Dateien: Registrierung, Skip und Prüfung fehlender Elemente separat.

Mixed Dateiformate: Filter oder normalisieren während der Verarbeitung.

Beste Praktiken

  • Halten Sie Logs für die Traceability
  • Original Backup vor der Verarbeitung
  • Test auf kleinen Battchen vor vollständigen Archiv

FAQ

**Q: Kann ich Millionen von Dateien verarbeiten?**A: Ja – Skala durch Teilen von Arbeitsplätzen, parallel zu laufen oder Folder zu schneiden.

**Q: Kann ich dies mit Netzwerk-Dreams oder Cloud-Mapped-Foldern verwenden?**A: Ja, solange der Drive zum Script zugänglich ist.

**Q: Wie kann ich die Arbeit auf neuen Dateien halten?**A: Verwenden Sie Task Scheduler oder ein kontinuierliches Integrations-Tool.

Schlussfolgerungen

Mit Aspose.Imaging für .NET können selbst die größten Dateien automatisch abgeschaltet und exportiert werden. Aspose.Imaging für .NET API Referenz .

 Deutsch