doc/AI/RAG2/readme.md
2025-11-05 20:57:00 +03:00

6.3 KiB
Raw Blame History

RAG doc

benchmarks

RAG

RAG ARC

Enterprise RAG

tools

book

  • На Neo4j в открытом доступе лежит книжка Essential GraphRAG. KNOWLEDGE GRAPHENHANCED RAG от TOMAŽ BRATANICˇ и OSKAR HANE https://go.neo4j.com/rs/710-RRC-335/images/Essential-GraphRAG.pdf отмечается, что извлечение (retrieval) по (одно)векторной схожести, простой семантический поиск, не дает ожидаемого результата. По этому поводу есть замечательное 20 минутное изложение Бена Клавье (Ben Clavié) - I dont use RAG, I just retrieve documents (https://hamel.dev/notes/llm/rag/p1-intro.html - слайды и конспект, видео: https://www.youtube.com/watch?v=Evlk9J-B_uc ) Тут 2 темы как минимум отлично раскрыты:
  1. Почему увеличение контекстного окна моделей не отменит RAG (распространенное заблуждение)
  2. Что означает Retrieval в технологии RAG, почему не работает простой семантический поиск, и куда движутся разработки в этом направлении сегодня.
  • у Фаулера есть неплохая статья с описанием общего шаблона для построения продуктов на основе Generative AI. И да, RAG там является одним из шагов в цепочке.

Type

  • СРАВНИТЕЛЬНЫЙ АНАЛИЗ МЕТОДОВ RAG рассмотрены несколько базовых методов RAG, включая наивный RAG, HyDE и BM25. В RAG поиск осуществляется путем вычисления сходства между эмбеддингами запросов и фрагментов документов, при этом ключевую роль играет способность моделей эмбеддингов к семантическому представлению. Наиболее популярные модели эмбеддингов - BERT
    Описание метрик оценки RAG-систем Mean Average Precision (MAP) - это метрика, используемая для оценки качества систем поиска информации, таких как системы поиска текста.

Eval RAG

оценка качества ответов RAG

Векторная БД

Создание RAG