RAG Nedir?
İngilizce: RAG (Retrieval-Augmented Generation)
RAG, büyük dil modelinin yanıt üretmeden önce kurumsal belge veya veri tabanından ilgili parçaları bulup bağlama eklediği yapay zeka mimarisidir.
RAG Nedir?
RAG (Retrieval-Augmented Generation), büyük dil modelinin yanıt üretmeden önce dış bilgi kaynağından ilgili metin parçalarını bulup kullanmasıdır. Model yalnızca eğitiminde öğrendiklerine dayanmaz; şirket dokümanları, yardım merkezi, ürün verisi veya sözleşme arşivi gibi kaynaklardan bağlam alır.
Tipik akışta belgeler parçalara ayrılır, embedding vektörlerine dönüştürülür ve vektör veritabanına kaydedilir. Kullanıcı soru sorduğunda sistem benzer parçaları arar, gerekirse yeniden sıralar ve seçilen bağlamı modele gönderir. Model de cevabı bu bağlama dayanarak üretir.
Neden Kullanılır?
RAG, özel veya güncel bilgi gerektiren cevaplarda faydalıdır. İç prosedürler, ürün kullanım kılavuzları, mevzuat notları, destek kayıtları ve teknik dokümantasyon üzerinde çalışabilir. Ayrıca kaynak gösterme ve erişim kontrolü gibi kurumsal gereksinimler için daha denetlenebilir bir zemin sağlar.
Dikkat Edilecekler
Kötü ayrıştırılmış belge, eski bilgi, yetersiz arama veya yanlış erişim yetkisi RAG sonucunu güvenilmez hale getirir. Bu yüzden chunk stratejisi, metadata, güncelleme süreci, kullanıcı yetkileri ve cevap değerlendirme setleri tasarımın parçası olmalıdır.
Vektör veritabanı arama katmanını, LLM ise yanıt üretim katmanını sağlar.
İlgili Terimler
AI Agent, hedefe ulaşmak için LLM, araçlar ve veri kaynaklarını kullanarak adım adım karar veren yapay zeka bileşenidir.
Chunking (Metin Parçalama)Chunking, uzun metinleri arama ve RAG sistemlerinde kullanılabilecek anlamlı, yönetilebilir parçalara ayırma işlemidir.
Bağlam Penceresi (Context Window)Bağlam penceresi, bir dil modelinin tek istekte okuyup yanıt üretirken dikkate alabildiği toplam token kapasitesidir.
Halüsinasyon (LLM Uydurması)Halüsinasyon, bir yapay zeka modelinin gerçek gibi görünen ama doğrulanmamış, hatalı veya uydurma bilgi üretmesidir.
Bilgi Grafiği (Knowledge Graph)Bilgi grafiği, kişi, ürün, süreç veya belge gibi varlıkları ilişkileriyle birlikte makinece sorgulanabilir ağ olarak modeller.
LLMLLM, büyük metin veri kümeleri üzerinde eğitilen ve doğal dil anlayıp üretebildiği için ChatGPT gibi yapay zeka araçlarının temelini oluşturan model.
Prompt EngineeringPrompt engineering, dil modellerine verilen talimatları bağlam, örnek ve kısıtlarla tasarlayarak daha tutarlı ve denetlenebilir çıktı alma yöntemidir.
Yeniden Sıralama (Reranking)Reranking, ilk arama sonuçlarını daha güçlü bir modele yeniden puanlatıp en alakalı belgeleri üst sıralara taşır.
Semantik AramaSemantik arama, kelime eşleşmesi yerine sorgu ve içerik anlamını vektörlerle karşılaştırarak ilgili sonuçları bulur.
Vektör VeritabanıVektör veritabanı, embedding kayıtlarını saklayıp anlamsal benzerliğe göre hızlı arama yapabilen yapay zeka altyapısıdır.