Cara mengidentifikasi teks tertulis tangan dalam gambar menggunakan Aspose.OCR
Notis bertulis tangan, entri formulir, dan tandatangan ada di mana-mana dalam bisnis, kesehatan dan pendidikan. transkripsi manual lambat, tidak konsisten dan merupakan tanda botol untuk digitalisasi. Aspose.OCR untuk .NET mendukung pengenalan teks tertulis secara langsung dari gambar dan pemindaian — input otomatis, audit, serta integrasi aliran kerja.
Masalah dunia nyata
Informasi kritis pada formulir kertas, preskripsi, kontrak, dan buku catatan sering ada hanya sebagai tulisan tangan. memasukkan data ini secara manual adalah membosankan, kesilapan-mengerti dan mahal di skala.
Penyelesaian Overview
Aspose.OCR untuk .NET menyediakan kemampuan pengenalan tulisan tangan, memungkinkan pengembang untuk mengekstrak konten tertulis tangan dari gambar dan formulir.Ia sempurna untuk arsip digital, jalur audit, perawatan kesehatan, dan pelayaran pelanggan.
Persyaratan
- Visual Studio 2019 atau lebih baru
- .NET 6.0 atau lebih baru (atau .Net Framework 4.6.2+)
- Aspose.OCR untuk .NET dari NuGet
- Keterampilan dasar C#
PM> Install-Package Aspose.OCR
Implementasi langkah demi langkah
Langkah 1: Menginstal dan mengkonfigurasi Aspose.OCR
using Aspose.OCR;
Langkah 2: Memindai atau memotret dokumen tertulis tangan
OcrInput input = new OcrInput(InputType.SingleImage);
input.Add("handwritten_note.jpg");
input.Add("signed_form.png");
Langkah 3: Mengkonfigurasi Pengenalan untuk Handwriting
RecognitionSettings settings = new RecognitionSettings();
settings.Language = Language.English; // Or match handwriting language
settings.DetectAreasMode = DetectAreasMode.HANDWRITING; // Important for handwritten text
Langkah 4: Mengekstrak teks tertulis tangan
AsposeOcr ocr = new AsposeOcr();
List<RecognitionResult> results = ocr.Recognize(input, settings);
Langkah 5: Ekspor atau validasi konten yang diakui
foreach (RecognitionResult result in results)
{
Console.WriteLine(result.RecognitionText);
result.Save("handwritten_output.txt", SaveFormat.Text);
}
Langkah 6: Tambahkan Error Handling dan Manual Review
try
{
AsposeOcr ocr = new AsposeOcr();
List<RecognitionResult> results = ocr.Recognize(input, settings);
// Post-process or review results
}
catch (Exception ex)
{
Console.WriteLine($"Error: {ex.Message}");
}
Langkah 7: Mengoptimalkan gaya dan kualitas tulisan tangan
- Gunakan pemindaian resolusi tinggi untuk ketepatan terbaik
- Preprocess (de-skew, meningkatkan kontras) untuk penulisan tangan yang lemah atau tidak baik
- Tes pada sampel handwriting dari pengguna tipikal Anda
foreach (string file in Directory.GetFiles("./handwritten_samples", "*.jpg"))
{
input.Add(file);
}
Langkah 8 : Contoh Lengkap
using Aspose.OCR;
using System;
using System.Collections.Generic;
class Program
{
static void Main(string[] args)
{
try
{
OcrInput input = new OcrInput(InputType.SingleImage);
input.Add("handwritten_note.jpg");
input.Add("signed_form.png");
RecognitionSettings settings = new RecognitionSettings();
settings.Language = Language.English;
settings.DetectAreasMode = DetectAreasMode.HANDWRITING;
AsposeOcr ocr = new AsposeOcr();
List<RecognitionResult> results = ocr.Recognize(input, settings);
foreach (RecognitionResult result in results)
{
Console.WriteLine(result.RecognitionText);
result.Save("handwritten_output.txt", SaveFormat.Text);
}
}
catch (Exception ex)
{
Console.WriteLine($"Error: {ex.Message}");
}
}
}
Menggunakan kasus dan aplikasi
Kesehatan dan resep
Digitalisasi rekaman medis tertulis dan resep untuk audit dan pencarian.
Banking dan Customer Onboarding
Mengekstrak tandatangan dan kotak formulir yang diisi untuk pembukaan akun, pematuhan, atau pemrosesan pinjaman.
Pendidikan dan penelitian
Digitalisasi catatan bertulis tangan, tes, atau dokumen sejarah untuk arkib atau peringkat.
Tantangan dan Solusi Umum
Tantangan 1: Penulisan tangan yang buruk atau tidak konsisten
** Solusi:** Menggalakkan praktik terbaik untuk tulisan tangan; preprocess gambar untuk ketelusan.
Tantangan 2: resolusi rendah atau pemindaian bunyi bising
Solusi: Scan pada 300 DPI+ dan deskew gambar sebelum pemrosesan.
Tantangan 3: Kandungan dicetak dan tertulis campuran
** Solusi:** Gunakan DetectAreasMode.AUTO atau coba kedua mode untuk mengoptimalkan ekstraksi.
Pertimbangan kinerja
- Menggunakan kualitas yang baik, pemindaian bersih
- Proses batch untuk skala
- Pertimbangkan dengan pemeriksaan manusia di mana mungkin
Praktik Terbaik
- Validasi output dengan pemeriksaan spot manual
- Tune DetectAreasMode untuk jenis dokumen tipikal Anda
- Data yang sensitif dan tertulis
- Mengemas kini Aspose.OCR secara teratur untuk hasil terbaik
Skenario Lanjutan
Skenario 1: Eksport ke Data Berstruktur
foreach (RecognitionResult result in results)
{
result.Save("handwritten_output.json", SaveFormat.Json);
}
Skenario 2: Proses batch format campuran
RecognitionSettings settings = new RecognitionSettings();
settings.DetectAreasMode = DetectAreasMode.AUTO; // For forms with both types
Kesimpulan
Aspose.OCR untuk .NET memungkinkan ekstraksi yang kuat dari teks, tandatangan, dan catatan tertulis – membantu Anda menghitung, mengaudit dan mengautomatikkan aliran kerja dengan keyakinan.
Untuk fitur pengenalan handwriting terbaru, lihat Aspose.OCR untuk .NET API Referensi .