OCR Nedir?
İngilizce: OCR (Optical Character Recognition)
OCR, görüntü veya PDF içindeki basılı veya el yazısı metni makine tarafından okunabilir dijital metne dönüştüren teknolojidir.
OCR Nedir?
OCR (Optical Character Recognition), görüntü, taranmış belge veya PDF içindeki metni bilgisayarın işleyebileceği karakterlere dönüştürür. Amaç, görsel olarak duran bir faturayı, formu ya da kimlik belgesini aranabilir ve veri alanlarına ayrılabilir hale getirmektir.
OCR yalnızca harfleri okumak değildir. Başarılı bir süreçte görüntü iyileştirme, sayfa yönü düzeltme, metin alanı bulma, karakter tanıma ve çıktı doğrulama adımları birlikte çalışır.
OCR Nasıl Çalışır?
- Ön işleme: Gürültü azaltma, kontrast artırma, eğiklik düzeltme
- Yerleşim analizi: Paragraf, tablo, imza ve alanların ayrılması
- Karakter tanıma: Basılı veya el yazısı karakterlerin modele verilmesi
- Son işleme: Dil modeli, sözlük veya iş kuralı ile hataların azaltılması
- Yapılandırma: Fatura numarası, tarih, tutar gibi alanların ayrıştırılması
Tesseract, ABBYY, Google Document AI, AWS Textract ve Azure AI Document Intelligence gibi araçlar farklı doğruluk, maliyet ve entegrasyon seçenekleri sunar. OCR, computer vision alanının pratik iş uygulamalarından biridir.
İş Dünyasında Kullanımı
OCR; gelen faturaların okunması, kargo etiketlerinin ayrıştırılması, eski arşivlerin aranabilir hale getirilmesi, banka dekontlarının kontrol edilmesi ve form verilerinin sisteme aktarılması için kullanılır. Tek başına bırakıldığında hatalı karakterler üretebilir; bu yüzden kritik süreçlerde güven skoru, insan onayı ve alan bazlı doğrulama gerekir.
RPA akışlarında OCR, ekrandaki veya PDF içindeki veriyi alıp ERP, CRM ya da muhasebe sistemine aktarmak için sık kullanılan bir bileşendir.
İlgili Terimler
Bilgisayarlı görü, kamera ve görsellerden nesne, metin, kusur veya hareket bilgisini çıkaran yapay zeka ve görüntü işleme alanıdır.
Akıllı Belge İşleme (IDP)Akıllı belge işleme, OCR ve yapay zekayla fatura, form veya sözleşmelerden veriyi çıkarıp doğrulayan otomasyon yaklaşımıdır.
RPARPA, ekran ve formlar üzerinden tekrarlayan ofis işlemlerini yazılım botlarıyla yürüten, kural tabanlı otomasyon yaklaşımıdır.