Semantik Arama Nedir?
İngilizce: Semantic Search
Semantik arama, kelime eşleşmesi yerine sorgu ve içerik anlamını vektörlerle karşılaştırarak ilgili sonuçları bulur.
Semantik Arama Nedir?
Semantik arama, kullanıcının yazdığı kelimeleri birebir aramak yerine niyeti ve anlam yakınlığını dikkate alır. “İade süresi kaç gün?” sorusu, dokümanda “cayma hakkı 14 gündür” cümlesini bulabilir.
Bu yaklaşımda metinler önce embedding vektörlerine dönüştürülür. Kullanıcı sorgusu da aynı uzaya çevrilir ve en yakın vektörler vektör veritabanı üzerinden bulunur.
Nasıl Çalışır?
Süreç genellikle veri hazırlama, parçalama, embedding üretme, indeksleme ve sorgu zamanında benzerlik araması adımlarından oluşur. Metadata filtreleri, örneğin dil, kategori, tarih veya müşteri segmenti, sonuçları daraltmak için eklenir.
Bazı sistemlerde semantik arama tek başına kullanılmaz. Anahtar kelime aramasıyla hibrit çalıştırılır ve sonuçlar reranking aşamasından geçirilir. Bu, hem tam terim eşleşmelerini hem de anlam yakınlığını korur.
İş Kullanımı
Semantik arama; teknik dokümantasyon, destek makaleleri, ürün katalogları, sözleşme arşivleri ve şirket içi bilgi tabanlarında değer üretir. RAG sistemlerinde doğru belgeyi getirmek, model yanıtının kalitesini doğrudan etkiler.
Başarılı kurulum için sadece model seçimi yetmez. Veri temizliği, chunk boyutu, güncelleme sıklığı ve ölçüm setleri arama kalitesini belirler.
İlgili Terimler
Embedding, metin, görsel veya ürün gibi verileri benzerlik hesabı yapılabilen sayısal vektörlere dönüştüren temsil yöntemidir.
Bilgi Grafiği (Knowledge Graph)Bilgi grafiği, kişi, ürün, süreç veya belge gibi varlıkları ilişkileriyle birlikte makinece sorgulanabilir ağ olarak modeller.
RAGRAG, büyük dil modelinin yanıt üretmeden önce kurumsal belge veya veri tabanından ilgili parçaları bulup bağlama eklediği yapay zeka mimarisidir.
Yeniden Sıralama (Reranking)Reranking, ilk arama sonuçlarını daha güçlü bir modele yeniden puanlatıp en alakalı belgeleri üst sıralara taşır.
Vektör VeritabanıVektör veritabanı, embedding kayıtlarını saklayıp anlamsal benzerliğe göre hızlı arama yapabilen yapay zeka altyapısıdır.