Bilgisayarlı Görü Nedir?
İngilizce: Computer Vision
Bilgisayarlı görü, kamera ve görsellerden nesne, metin, kusur veya hareket bilgisini çıkaran yapay zeka ve görüntü işleme alanıdır.
Bilgisayarlı Görü Nedir?
Bilgisayarlı görü, yazılımların fotoğraf, video veya canlı kamera görüntüsünden anlamlı bilgi çıkarmasını sağlayan alandır. Bir üretim hattındaki çizik, faturadaki metin, raftaki ürün boşluğu veya güvenlik kamerasındaki hareket bilgisayarlı görüyle otomatik algılanabilir.
Nasıl Çalışır?
İlk adım görüntünün alınması ve modele uygun hale getirilmesidir: kırpma, çözünürlük ayarlama, gürültü azaltma ve renk dönüşümü gibi işlemler yapılır. Sonrasında model nesne tespiti, sınıflandırma, segmentasyon, yüz tanıma veya OCR gibi görevlere göre çıktı üretir.
Klasik görüntü işleme kenar bulma ve şablon eşleme gibi kurallara dayanır. Güncel uygulamalarda ise machine learning ve özellikle deep learning modelleri kullanılır. Modelin başarısı yalnızca algoritmaya değil; veri kalitesi, ışık koşulları, kamera açısı ve etiketleme doğruluğuna bağlıdır.
Kullanım Alanları
- Üretimde kalite kontrol ve hatalı ürün tespiti
- Depo ve mağazada stok veya raf analizi
- Belgelerden alan çıkarma, plaka okuma ve barkod okuma
- Sağlık görüntülerinde karar destek sistemleri
- Güvenlik ve erişim kontrolünde olay algılama
İş Dünyasında Kullanımı
Bilgisayarlı görü projelerinde en kritik karar, problemi kamera ile gerçekten ölçülebilir hale getirmektir. PoC aşamasında farklı ışık, açı ve ortam örnekleri toplanmalı; canlı sisteme geçmeden önce yanlış pozitif ve yanlış negatiflerin iş maliyeti değerlendirilmelidir.
İlgili Terimler
Derin öğrenme, çok katmanlı sinir ağlarıyla büyük veriden örüntü öğrenen ve görüntü, dil, ses gibi görevlerde kullanılan ML yaklaşımıdır.
Makine ÖğrenimiMakine öğrenimi, modellerin verideki örüntülerden öğrenip yeni örnekler için tahmin veya karar ürettiği yapay zeka alanıdır.
Çok Modlu Yapay Zeka (Multimodal AI)Çok modlu yapay zeka, metin, görüntü, ses, video veya tablo gibi farklı veri türlerini birlikte anlayıp üretebilen sistemdir.
OCROCR, görüntü veya PDF içindeki basılı veya el yazısı metni makine tarafından okunabilir dijital metne dönüştüren teknolojidir.