doc/AI/RAG2 at c3399927c0f15ede6b1c2d81b899e65af3548cd4 - vrr/doc

vrr/doc

mirror of https://github.com/bpmbpm/doc.git synced 2026-04-28 11:30:42 +00:00

History

https://t.me/c/3082493669/372
поиск по библиотеке знаний рекламного агентства:
- постановка на github (https://github.com/airndlab/hackathon-hacks-ai-mediawise-qna/blob/main/docs/media-wise.pdf)
- разбор на youtube (https://youtu.be/oAfcJk73cRY?si=tLw1QD7EZ2xZHbI5)
поиск по нормативным документам для РЖД:
- постановка на github (https://github.com/airndlab/hackathon-hacks-ai-rzd-qna/blob/main/docs/case/rzd.pdf)
- разбор на youtube (https://youtu.be/9Xrz_tvTsnY?si=1QL19b9-hQkvo7RQ)
  Причем мы начали участвовать пару лет назад и в первый раз наше решение было без RAG, дальше изучили решения конкурентов и познакомились с RAG.
Как я построил RAG-систему за вечер с помощью 5 open source-инструментов

На Neo4j в открытом доступе лежит книжка Essential GraphRAG. KNOWLEDGE GRAPH–ENHANCED RAG от TOMAŽ BRATANICˇ и OSKAR HANE https://go.neo4j.com/rs/710-RRC-335/images/Essential-GraphRAG.pdf отмечается, что извлечение (retrieval) по (одно)векторной схожести, простой семантический поиск, не дает ожидаемого результата. По этому поводу есть замечательное 20 минутное изложение Бена Клавье (Ben Clavié) - I don’t use RAG, I just retrieve documents (https://hamel.dev/notes/llm/rag/p1-intro.html - слайды и конспект, видео: https://www.youtube.com/watch?v=Evlk9J-B_uc ) Тут 2 темы как минимум отлично раскрыты:

Почему увеличение контекстного окна моделей не отменит RAG (распространенное заблуждение)
Что означает Retrieval в технологии RAG, почему не работает простой семантический поиск, и куда движутся разработки в этом направлении сегодня.

у Фаулера есть неплохая статья с описанием общего шаблона для построения продуктов на основе Generative AI. И да, RAG там является одним из шагов в цепочке.

СРАВНИТЕЛЬНЫЙ АНАЛИЗ МЕТОДОВ RAG рассмотрены несколько базовых методов RAG, включая наивный RAG, HyDE и BM25. В RAG поиск осуществляется путем вычисления сходства между эмбеддингами запросов и фрагментов документов, при этом ключевую роль играет способность моделей эмбеддингов к семантическому представлению. Наиболее популярные модели эмбеддингов - BERT
Описание метрик оценки RAG-систем Mean Average Precision (MAP) - это метрика, используемая для оценки качества систем поиска информации, таких как системы поиска текста.

оценка качества ответов RAG

Пример использования RAG ваша система RAG получает запрос пользователя и извлекает соответствующий контекст из базы знаний, форматирует запрос LLM на основе запроса и контекста и генерирует ответ, используя этот запрос.
https://learn.microsoft.com/ru-ru/fabric/data-science/tutorial-evaluate-rag-performance
https://baguzin.ru/wp/glava-9-otsenka-rag-kolichestvenno-i-s-ispolzovaniem-vizualizatsij/
Коротко об оценке RAG