RAG Nedir?

RAG (Retrieval-Augmented Generation), büyük dil modelinin yanıt üretmeden önce dış bilgi kaynağından ilgili metin parçalarını bulup kullanmasıdır. Model yalnızca eğitiminde öğrendiklerine dayanmaz; şirket dokümanları, yardım merkezi, ürün verisi veya sözleşme arşivi gibi kaynaklardan bağlam alır.

Tipik akışta belgeler parçalara ayrılır, embedding vektörlerine dönüştürülür ve vektör veritabanına kaydedilir. Kullanıcı soru sorduğunda sistem benzer parçaları arar, gerekirse yeniden sıralar ve seçilen bağlamı modele gönderir. Model de cevabı bu bağlama dayanarak üretir.

Neden Kullanılır?

RAG, özel veya güncel bilgi gerektiren cevaplarda faydalıdır. İç prosedürler, ürün kullanım kılavuzları, mevzuat notları, destek kayıtları ve teknik dokümantasyon üzerinde çalışabilir. Ayrıca kaynak gösterme ve erişim kontrolü gibi kurumsal gereksinimler için daha denetlenebilir bir zemin sağlar.

Dikkat Edilecekler

Kötü ayrıştırılmış belge, eski bilgi, yetersiz arama veya yanlış erişim yetkisi RAG sonucunu güvenilmez hale getirir. Bu yüzden chunk stratejisi, metadata, güncelleme süreci, kullanıcı yetkileri ve cevap değerlendirme setleri tasarımın parçası olmalıdır.

Vektör veritabanı arama katmanını, LLM ise yanıt üretim katmanını sağlar.

RAG Nedir?

Neden Kullanılır?

Dikkat Edilecekler

İlgili Terimler