Vektör İndeks (pgvector) Nedir?

İngilizce: Vector Index (pgvector)

Vektör indeks, embedding kayıtları arasında anlamsal olarak yakın sonuçları hızlı bulmak için kullanılan arama yapısıdır.

Vektör İndeks (pgvector) Nedir?

Vektör indeks, embedding olarak saklanan metin, görsel veya ürün kayıtları arasında en benzer sonuçları hızlı bulmak için kullanılır. Normal veritabanı indeksi belirli bir değeri ararken, vektör indeks “bu sorguya anlamsal olarak en yakın kayıtlar hangileri?” sorusuna yanıt verir.

Nasıl Çalışır?

Her belge, ürün açıklaması veya destek kaydı bir embedding modelinden geçirilir ve çok boyutlu sayısal vektöre dönüştürülür. Arama sırasında kullanıcının sorgusu da vektöre çevrilir. Sistem cosine similarity, inner product veya L2 distance gibi ölçülerle yakın komşuları bulur.

Küçük veri setlerinde düz tarama yeterli olabilir. Kayıt sayısı büyüdükçe HNSW veya IVFFlat gibi yaklaşık en yakın komşu indeksleri kullanılır. pgvector, PostgreSQL içinde HNSW ve IVFFlat indeksleriyle vektör araması yapmayı sağlar.

Kullanım Alanları

RAG tabanlı bilgi asistanları, ürün benzerliği, semantik doküman arama, destek talebi eşleştirme ve öneri sistemleri vektör indeksten yararlanır. Embedding kalitesi sonuç kalitesini doğrudan etkiler; PostgreSQL üzerinde pgvector kullanmak ilişkisel verilerle vektör aramasını aynı sistemde tutabilir.

Büyük hacim, çok düşük gecikme veya özel ölçekleme ihtiyacında ayrı bir vektör veritabanı tercih edilebilir.