Làm thế nào để tự động khai thác và xuất khẩu tài liệu lớn
Lưu trữ và số hóa các bộ sưu tập lớn các hình ảnh được quét đang diễn ra mà không cần tự động hóa. Aspose.Imaging cho .NET làm nhanh toàn bộ quá trình – xử lý các thư mục với hàng ngàn tập tin, tháo rời, và xuất chúng trong khối lượng, với việc đăng nhập lỗi mạnh mẽ và quản lý kết quả.
Vấn đề thế giới thực
Các tổ chức cần các giải pháp hoàn toàn tự động cho các dự án kỹ thuật số kinh doanh, pháp lý, lịch sử hoặc khoa học.
Giải pháp Overview
Sử dụng một kịch bản lặp lại để xử lý mọi hình ảnh được hỗ trợ trong tất cả các subfolders, kết quả log, và xuất khẩu trong các định dạng mong muốn – mà không có sự can thiệp của con người.
Nguyên tắc
- Visual Studio 2019 hoặc hơn
- .NET 6.0 hoặc mới hơn (hoặc .Net Framework 4.6.2+)
- Aspose.Imaging cho .NET từ NuGet
- Tài liệu tài liệu nguồn (cách địa phương, mạng hoặc bản đồ đám mây)
PM> Install-Package Aspose.Imaging
Chế độ thực hiện từng bước
Bước 1: Tìm lại tất cả các tập tin hình ảnh
string rootDir = "./archive_input";
string outputDir = "./archive_output";
Directory.CreateDirectory(outputDir);
// All supported types: jpg, png, tif, bmp, gif, etc.
var files = Directory.GetFiles(rootDir, "*.*", SearchOption.AllDirectories)
.Where(f => f.EndsWith(".jpg", StringComparison.OrdinalIgnoreCase)
|| f.EndsWith(".jpeg", StringComparison.OrdinalIgnoreCase)
|| f.EndsWith(".png", StringComparison.OrdinalIgnoreCase)
|| f.EndsWith(".tif", StringComparison.OrdinalIgnoreCase)
|| f.EndsWith(".tiff", StringComparison.OrdinalIgnoreCase)
|| f.EndsWith(".bmp", StringComparison.OrdinalIgnoreCase)
|| f.EndsWith(".gif", StringComparison.OrdinalIgnoreCase))
.ToArray();
Bước 2: Batch Deskew và Export With Error Handling
using Aspose.Imaging;
using Aspose.Imaging.ImageOptions;
List<string> failedFiles = new List<string>();
foreach (var file in files)
{
try
{
using (var image = (RasterImage)Image.Load(file))
{
image.NormalizeAngle(false, Color.White);
string relPath = Path.GetRelativePath(rootDir, file);
string outPath = Path.Combine(outputDir, relPath);
Directory.CreateDirectory(Path.GetDirectoryName(outPath));
image.Save(outPath, new TiffOptions(TiffExpectedFormat.Default));
}
}
catch (Exception ex)
{
failedFiles.Add($"{file}: {ex.Message}");
}
}
// Save log for failed files
File.WriteAllLines(Path.Combine(outputDir, "deskew_failed_files.log"), failedFiles);
Bước 3: Lịch trình và giám sát
Thiết lập như một Windows Task Scheduler công việc hoặc tương tự để chạy trên các quét mới tự động.
Sử dụng trường hợp và ứng dụng
- Tài liệu kinh doanh / pháp lý (thỏa thuận, tài liệu trường hợp)
- Thư viện và kỹ thuật số lịch sử
- Bộ sưu tập hình ảnh khoa học hoặc nghiên cứu
- Ongoing các dự án quét để tuân thủ hoặc kiểm toán
Những thách thức và giải pháp chung
Những chấm dứt mạng: Thực hiện bản sao địa phương và resync, hoặc đăng ký và rút lại.
Thông tin dài hoặc bị hư hỏng: Đăng ký, skip, và xem xét các mục thất bại riêng biệt.
** Định dạng tệp hỗn hợp:** Bộ lọc hoặc bình thường hóa trong quá trình xử lý.
Thực hành tốt nhất
- Giữ logs cho traceability
- Backup gốc trước khi xử lý
- Kiểm tra trên các đĩa nhỏ trước khi lưu trữ đầy đủ
FAQ
**Q: Tôi có thể xử lý hàng triệu tập tin không?**A: Có - quy mô bằng cách chia công việc, chạy song song, hoặc chunking thư mục.
**Q: Tôi có thể sử dụng điều này với các ổ đĩa mạng hoặc thư mục trên đám mây không?**A: Có, miễn là ổ đĩa có thể truy cập vào kịch bản.
**Q: Làm thế nào để tôi giữ công việc chạy trên các tập tin mới?**A: Sử dụng Task Scheduler hoặc một công cụ tích hợp liên tục.
Kết luận
Với Aspose.Imaging cho .NET, ngay cả các tập tin lớn nhất cũng có thể được tháo ra và xuất khẩu tự động. Aspose.Imaging cho .NET API Reference .