Sorunuzu sorun ve bu sayfaya ve seçtiğiniz AI sağlayıcısına referans vererek belgenin bir özetini alın
Intlayer MCP Sunucusunu favori AI asistanınıza entegre ederek tüm belgeleri doğrudan ChatGPT, DeepSeek, Cursor, VSCode vb. üzerinden alabilirsiniz.
MCP Sunucu belgesini görüntüleBu sayfanın içeriği bir yapay zeka kullanılarak çevrildi.
Orijinal içeriğin İngilizce son sürümünü görüntüleyinBu dokümantasyonu geliştirmek için bir fikriniz varsa, lütfen GitHub'da bir çekme isteği göndererek katkıda bulunmaktan çekinmeyin.
Dokümantasyon için GitHub bağlantısıBelge Markdown'ını panoya kopyala
RAG Güçlendirmeli Dokümantasyon Asistanı Oluşturma (Chunking, Embeddings ve Arama)
Ne Elde Ediyorsunuz
RAG güçlendirmeli bir dokümantasyon asistanı oluşturdum ve bunu hemen kullanabileceğiniz bir boilerplate haline getirdim.
- Hazır kullanıma sahip bir uygulama (Next.js + OpenAI API)
- Çalışan bir RAG pipeline'ı (chunking, embeddings, kosinüs benzerliği)
- React ile oluşturulmuş tam bir chatbot UI'si
- Tüm UI bileşenleri Tailwind CSS ile tamamen düzenlenebilir
- Eksik dokümanları, kullanıcı acı noktalarını ve ürün fırsatlarını belirlemeye yardımcı olmak için her kullanıcı sorgusunu günlüğe kaydeder
👉 Canlı demo 👉 Kod boilerplate
Giriş
Eğer dokümantasyonlarda kaybolmuşsanız, bir cevap için sonsuzca kaydırma yaptığınızı biliyorsunuz, bu ne kadar acı verici olabilir. Dokümanlar yararlıdır, ama statiktirler ve arama yapmak genellikle hantaldır.
İşte burada RAG (Retrieval-Augmented Generation) devreye girer. Kullanıcıları metin içinde kazmaya zorlamak yerine, retrieval (dokümanın doğru kısımlarını bulma) ile generation (bir LLM'nin doğal olarak açıklaması) birleştirebiliriz.
Bu yazıda, RAG güçlendirmeli bir dokümantasyon chatbot'u nasıl oluşturduğumu ve bunun sadece kullanıcıların cevapları daha hızlı bulmasına yardımcı olmadığını, aynı zamanda ürün ekiplerine kullanıcı acı noktalarını anlamanın yeni bir yolunu verdiğini anlatacağım.
Dokümantasyon İçin Neden RAG Kullanılır?
RAG, büyük dil modellerini gerçekten kullanışlı hale getirmenin en pratik yollarından biri olduğu için popüler bir yaklaşım haline geldi.
Dokümantasyon için faydalar nettir:
- Anında cevaplar: kullanıcılar doğal dilde sorar ve ilgili cevaplar alır.
- Daha iyi bağlam: model sadece en ilgili doküman bölümlerini görür, halüsinasyonları azaltır.
- İnsan gibi arama: Algolia + SSS + chatbot'un bir araya gelmiş hali gibi.
- Geri bildirim döngüsü: sorguları depolayarak kullanıcıların neyle mücadele ettiğini keşfedersiniz.
Bu son nokta çok önemlidir. Bir RAG sistemi sadece sorulara cevap vermez, insanlara ne sorduğunu söyler. Bu şu anlama gelir:
- Dokümanlarınızda eksik bilgileri keşfedersiniz.
- Özellik isteklerinin ortaya çıktığını görürsünüz.
- Hatta ürün stratejisini yönlendirebilecek kalıpları fark edersiniz.
Yani RAG sadece bir destek aracı değildir. Aynı zamanda bir ürün keşif motorudur.
RAG Pipeline'ı Nasıl Çalışır
Yüksek seviyede, kullandığım tarif şöyle:
- Dokümantasyonu chunking Büyük Markdown dosyaları parçalara bölünür. Chunking, dokümantasyonun sadece ilgili kısımlarını bağlam olarak sağlamaya izin verir.
- Embeddings oluşturma Her parça, OpenAI'nin embedding API'si (text-embedding-3-large) veya bir vektör veritabanı (Chroma, Qdrant, Pinecone) kullanarak bir vektöre dönüştürülür.
- İndeksleme ve depolama Embeddings basit bir JSON dosyasında depolanır (demom için), ama üretimde muhtemelen bir vektör DB kullanırdınız.
- Retrieval (RAG'deki R) Bir kullanıcı sorgusu gömülür, kosinüs benzerliği hesaplanır ve en üstteki eşleşen parçalar alınır.
- Augmentation + Generation (RAG'deki AG) Bu parçalar ChatGPT için sistem prompt'una enjekte edilir, böylece model gerçek doküman bağlamıyla cevap verir.
- Geri bildirim için sorguları günlüğe kaydetme Her kullanıcı sorgusu depolanır. Bu, acı noktaları, eksik dokümanları veya yeni fırsatları anlamak için altın değerindedir.
Adım 1: Dokümanları Okuma
İlk adım basitti: docs/ klasöründeki tüm .md dosyalarını tarayacak bir yol gerekiyordu. Node.js ve glob kullanarak, her Markdown dosyasının içeriğini belleğe aldım.
Bu, pipeline'ı esnek tutar: Markdown yerine, bir veritabanından, CMS'den veya hatta bir API'den dokümanları çekebilirsiniz.
Adım 2: Dokümantasyonu Chunking
Neden chunking? Çünkü dil modellerinin bağlam limitleri vardır. Onlara bir kitap dolusu doküman beslemek işe yaramaz.
Yani fikri, metni yönetilebilir parçalara bölmektir (örneğin her biri 500 token) ve örtüşme ile (örneğin 100 token). Örtüşme, parça sınırlarında anlam kaybını önlemek için sürekliliği sağlar.
Örnek:
- Parça 1 → "…birçoğu tarafından unutulan eski kütüphane. Kule gibi rafları kitaplarla doluydu…"
- Parça 2 → "…raflar kitaplarla doluydu, her türlü türden kitaplar fısıldıyordu…"
Örtüşme, her iki parçanın paylaşılan bağlam içermesini sağlar, böylece retrieval tutarlı kalır.
Bu trade-off (parça boyutu vs örtüşme) RAG verimliliği için anahtardır:
- Çok küçük → gürültü alırsınız.
- Çok büyük → bağlam boyutunu patlatırsınız.
Adım 3: Embeddings Oluşturma
Dokümanlar parçalandıktan sonra, embeddings oluştururuz — her parçayı temsil eden yüksek boyutlu vektörler.
OpenAI'nin text-embedding-3-large modelini kullandım, ama herhangi bir modern embedding modelini kullanabilirsiniz.
Embedding örneği:
[ -0.0002630692, -0.029749284, 0.010225477, -0.009224428, -0.0065269712, -0.002665544, 0.003214777, 0.04235309, -0.033162255, -0.00080789323, //...+1533 element];
Her vektör, metnin matematiksel bir parmak izidir, benzerlik aramasını etkinleştirir.
Adım 4: Embeddings'i İndeksleme ve Depolama
Embeddings'i birden fazla kez yeniden oluşturmamak için, onları embeddings.json'da depoladım.
Üretimde, muhtemelen bir vektör veritabanı istersiniz:
- Chroma
- Qdrant
- Pinecone
- FAISS, Weaviate, Milvus, vb.
Vektör DB'ler indeksleme, ölçeklenebilirlik ve hızlı arama ile ilgilenir. Ama prototipim için yerel JSON yeterliydi.
Adım 5: Kosinüs Benzerliği ile Retrieval
Bir kullanıcı soru sorduğunda:
- Sorgu için bir embedding oluştur.
- Bunu tüm doküman embeddings'leriyle kosinüs benzerliği kullanarak karşılaştır.
- Sadece en üstteki N en benzer parçayı tut.
Kosinüs benzerliği iki vektör arasındaki açıyı ölçer. Mükemmel bir eşleşme 1.0 puan alır.
Bu şekilde, sistem sorguya en yakın doküman pasajlarını bulur.
Adım 6: Augmentation + Generation
Şimdi sihir geliyor. Üstteki parçaları ChatGPT için sistem promptuna enjekte ederiz.
Bu, modelin o parçalar konuşmanın bir parçasıymış gibi cevap vermesi anlamına gelir.
Sonuç: doğru, doküman-temelli cevaplar.
Adım 7: Kullanıcı Sorgularını Günlüğe Kaydetme
Bu gizli süper güç.
Sorulan her soru depolanır. Zamanla, şunları içeren bir veri seti oluşturursunuz:
- En sık sorulan sorular (SSS için harika)
- Cevaplanmamış sorular (dokümanlar eksik veya belirsiz)
- Soru kılığına girmiş özellik istekleri ("X ile entegre olur mu?")
- Planlamadığınız yeni kullanım durumları
Bu, RAG asistanınızı sürekli kullanıcı araştırma aracına dönüştürür.
Maliyeti Ne Kadar?
RAG'ye karşı yaygın bir itiraz maliyet. Pratikte, şaşırtıcı derecede ucuz:
- ~200 doküman için embeddings oluşturmak yaklaşık 5 dakika sürer ve 1–2 euro maliyet eder.
- Doküman arama özelliği %100 ücretsiz.
- Sorgular için gpt-4o-latest'i "düşünme" modu olmadan kullanırız. Intlayer'da ayda yaklaşık 300 sohbet sorgusu görüyoruz ve OpenAI API faturası nadiren 10$ı aşar.
Buna barındırma maliyetini de ekleyebilirsiniz.
Uygulama Detayları
Stack:
- Monorepo: pnpm workspace
- Doküman paketi: Node.js / TypeScript / OpenAI API
- Frontend: Next.js / React / Tailwind CSS
- Backend: Node.js API route / OpenAI API
@smart-doc/docs paketi, doküman işlemesini yöneten bir TypeScript paketidir. Bir markdown dosyası eklendiğinde veya değiştirildiğinde, paket her dilde doküman listesini yeniden oluşturmak, embeddings oluşturmak ve bunları embeddings.json dosyasında depolamak için bir build script'i içerir.
Frontend için, şunları sağlayan bir Next.js uygulaması kullanırız:
- Markdown'dan HTML'ye dönüştürme
- İlgili dokümanları bulmak için arama çubuğu
- Dokümanlar hakkında soru sormak için chatbot arayüzü
Bir doküman araması gerçekleştirmek için, Next.js uygulaması sorguyla eşleşen doküman parçalarını almak üzere @smart-doc/docs paketindeki bir fonksiyonu çağıran bir API route'u içerir. Bu parçaları kullanarak, kullanıcının aramasıyla ilgili doküman sayfalarının bir listesini döndürebiliriz.
Chatbot işlevselliği için, aynı arama sürecini takip ederiz ama ayrıca alınan doküman parçalarını ChatGPT'ye gönderilen prompt'a enjekte ederiz.
ChatGPT'ye gönderilen bir prompt örneği:
Sistem prompt'u:
Intlayer dokümantasyonu hakkında sorulara cevap verebilen yardımcı bir asistansınız.İlgili parçalar:-----docName: "getting-started"docChunk: "1/3"docUrl: "https://example.com/docs/en/getting-started"---# Nasıl başlanır...-----docName: "another-doc"docChunk: "1/5"docUrl: "https://example.com/docs/en/another-doc"---# Başka bir doküman...
Kullanıcı sorgusu:
Nasıl başlanır?
API route'undan yanıtı akış için SSE kullanırız.
Bahsedildiği gibi, "düşünme" modu olmadan gpt-4-turbo'yu kullanırız. Yanıtlar ilgili ve gecikme düşük. Gpt-5 ile denedik, ama gecikme çok yüksekti (bazen 15 saniyeye kadar bir yanıt). Ama gelecekte tekrar gözden geçireceğiz.
👉 Demoyu burada deneyin 👉 GitHub'da kod şablonunu kontrol edin
Daha İleriye Gitmek
Bu proje minimal bir uygulamadır. Ama birçok şekilde genişletebilirsiniz:
MCP sunucusu → doküman araştırma fonksiyonunu bir MCP sunucusuna bağlayarak dokümantasyonu herhangi bir AI asistanına bağlayın
- Vektör DB'ler → milyonlarca doküman parçasına ölçeklendirin
- LangChain / LlamaIndex → hazır RAG pipeline çerçeveleri
- Analitik dashboard'ları → kullanıcı sorgularını ve acı noktalarını görselleştirin
- Çok kaynaklı retrieval → sadece dokümanları değil, veritabanı girişlerini, blog gönderilerini, biletleri vb. çekin
- Geliştirilmiş prompting → reranking, filtreleme ve hibrit arama (anahtar kelime + semantik)
Karşılaştığımız Sınırlamalar
- Chunking ve örtüşme empirik. Doğru denge (parça boyutu, örtüşme yüzdesi, alınan parça sayısı) iterasyon ve test gerektirir.
- Dokümanlar değiştiğinde embeddings otomatik olarak yeniden oluşturulmaz. Sistemimiz, sadece parça sayısı farklıysa bir dosya için embeddings'i sıfırlar.
- Bu prototipte, embeddings JSON'da depolanır. Bu demolar için çalışır ama Git'i kirletir. Üretimde bir veritabanı veya özel vektör deposu daha iyidir.
Dokümanların Ötesinde Neden Önemli?
İlginç kısım sadece chatbot değil. Geri bildirim döngüsü.
RAG ile sadece cevap vermezsiniz:
- Kullanıcıları neyin şaşırttığını öğrenirsiniz.
- Hangi özelliklerin beklendiğini keşfedersiniz.
- Gerçek sorgulara göre ürün stratejinizi uyarlarsınız.
Örnek:
Yeni bir özellik başlattığınızı ve anında gördüğünüzü hayal edin:
- Soruların %50'si aynı belirsiz kurulum adımı hakkında
- Kullanıcılar desteklemediğimiz bir entegrasyon soruyor
- İnsanlar yeni bir kullanım durumu ortaya çıkaran terimler arıyor
Bu, kullanıcılarınızdan doğrudan ürün zekası.
Sonuç
RAG, LLM'leri pratik hale getirmenin en basit, en güçlü yollarından biridir. Retrieval + generation birleştirerek, statik dokümanları akıllı bir asistana dönüştürebilir ve aynı zamanda sürekli ürün içgörüleri akışı elde edebilirsiniz.
Benim için bu proje, RAG'nin sadece bir teknik hile olmadığını gösterdi. Dokümantasyonu dönüştürmenin bir yolu:
- etkileşimli bir destek sistemi
- bir geri bildirim kanalı
- bir ürün strateji aracı
👉 Demoyu burada deneyin 👉 GitHub'da kod şablonunu kontrol edin
Ve eğer siz de RAG ile deneme yapıyorsanız, nasıl kullandığınızı duymak isterim.