문서 관리 시스템과 이미지 텍스트 검색기를 통합하는 방법
스캔된 이미지의 자동 분류 및 태그화는 모든 문서 관리 시스템 (DMS)의 가치와 사용 가능성을 향상시킵니다. .NET을 위한 Aspose.OCR Image Text Finder를 사용하면 디지털 아카이브 및 작업 흐름에 즉각적인 지능을 추가할 수 있습니다.
현실 세계 문제
수동 문서 태그 및 분류는 지루하고, 오류가 발생하며, 성장하는 디지털 아카이브로 확장되지 않습니다.비즈니스 작업 흐름과 준수는 정확하고 자동화 된 검색 및 라우팅을 필요로합니다.
솔루션 검토
OCR를 사용하여 이미지 파일에서 키 용어와 콘텐츠를 추출 한 다음 API/webhooks를 통해 DMS에서 태그를 누르거나 행동을 시작합니다.
원칙
- Visual Studio 2019 또는 이후
- .NET 6.0 또는 이후 (또는 .Net Framework 4.6.2+)
- NuGet에서 .NET을 위한 ASPOSE.OCR
- API 액세스 또는 DMS를 위한 Webhook Endpoint
- Tag list or search terms for 자율 분류
PM> Install-Package Aspose.OCR
단계별 실행
단계 1 : DMS 및 태그 목록을 준비하십시오.
- DMS API 또는 태그 / 분류에 사용하는 webhook를 식별하십시오.
- 탐지에 대한 태그 / 용어 목록을 준비하십시오
List<string> tags = new List<string> { "Contract", "Invoice", "Confidential", "HR" };
string dmsWebhook = "https://your-dms.com/api/tag";
단계 2: 태그를위한 배치 프로세스 이미지
string[] files = Directory.GetFiles("./archive", "*.png");
RecognitionSettings settings = new RecognitionSettings();
settings.Language = Language.English;
AsposeOcr ocr = new AsposeOcr();
단계 3 : 콘텐츠 추출 및 태그 할당
foreach (string file in files)
{
List<string> detectedTags = new List<string>();
foreach (string tag in tags)
{
if (ocr.ImageHasText(file, tag, settings))
detectedTags.Add(tag);
}
// Push tags to DMS API/webhook
if (detectedTags.Count > 0)
{
// Example webhook POST (simplified)
var postData = $"file={Uri.EscapeDataString(file)}&tags={string.Join(",", detectedTags)}";
using (var client = new System.Net.WebClient())
client.UploadString(dmsWebhook, postData);
}
}
단계 4 : 기록 및 감사 행동
File.AppendAllText("dms_tagging_log.csv", $"{file},{string.Join(";", detectedTags)}\n");
단계 5 : 완전한 예제
using Aspose.OCR;
using System;
using System.Collections.Generic;
using System.IO;
class Program
{
static void Main(string[] args)
{
List<string> tags = new List<string> { "Contract", "Invoice", "Confidential", "HR" };
string dmsWebhook = "https://your-dms.com/api/tag";
string[] files = Directory.GetFiles("./archive", "*.png");
RecognitionSettings settings = new RecognitionSettings();
settings.Language = Language.English;
AsposeOcr ocr = new AsposeOcr();
foreach (string file in files)
{
List<string> detectedTags = new List<string>();
foreach (string tag in tags)
{
if (ocr.ImageHasText(file, tag, settings))
detectedTags.Add(tag);
}
if (detectedTags.Count > 0)
{
var postData = $"file={Uri.EscapeDataString(file)}&tags={string.Join(",", detectedTags)}";
using (var client = new System.Net.WebClient())
client.UploadString(dmsWebhook, postData);
}
File.AppendAllText("dms_tagging_log.csv", $"{file},{string.Join(";", detectedTags)}\n");
}
}
}
사례 및 응용 프로그램 사용
자동 태그 및 분류
수동 작업 부하를 줄이십시오 - 자동으로 청구서, 계약, 인적 인증서 또는 기밀 파일을 표시합니다.
Workflow 라우팅
Trigger downstream 프로세스 (평가, 승인, 아카이브) 발견 된 콘텐츠 / 태그를 기반으로합니다.
준수 및 검색 가능성
법적 감사, 전자 발견 및 비즈니스 프로세스 자동화에 대한 정확한 태그를 보장합니다.
일반적인 도전과 해결책
도전 1 : DMS API 제한 또는 오류
솔루션: 후속 검토를 위해 HTTP 오류, 리트리 및 로그 실패 펌프를 처리합니다.
도전 2 : 태그 목록 완전성
솔루션: 비즈니스 요구를 바탕으로 정기적으로 검토/ 업데이트 태그.
도전 3 : 고량 아카이브
** 솔루션:** 배치 프로세스, 일정 및 가능한 한 병렬.
성과 고려 사항
- 네트워크/API 속도는 큰 배치 - 모니터 및 리트리
- 안전한 API 인증서 및 로그 민감한 데이터
모범 사례
- 리뷰 태그 논리 정기적으로 비즈니스 / IT와 함께
- 모든 행동을 기록하여 검토
- 모든 API 엔드 포인트 및 인증서 보안
- 먼저 작은 아카이브에 DMS 통합 테스트
고급 시나리오
시나리오 1 : 사용자 지정 비즈니스 논리로 역동적 인 태그링
복잡한 콘텐츠 분석을 기반으로 작업 흐름 또는 분류.
시나리오 2 : 사용자 리뷰를 위한 DMS UI와 통합
제안으로 자동 태그를 눌러; DMS에서 인간 검토 / 승인을 허용합니다.
결론
Aspose.OCR Image Text Finder를 사용하면 DMS에서 분류, 태그 및 작업 흐름 트리거를 자동화할 수 있으며, 이는 모든 디지털 아카이브에 대한 생산성과 감사 준비를 향상시킵니다.
더 깊은 DMS 통합 옵션을 위해, 방문 .NET API 참조를 위한 ASPOSE.OCR .