From e49358d7191fb2c836b91ca2cfe25a179d7e77fa Mon Sep 17 00:00:00 2001 From: Dmitry <121898072+bpmbpm@users.noreply.github.com> Date: Wed, 30 Apr 2025 11:34:57 +0300 Subject: [PATCH] Update README.md --- BPM/AI/CorpDOC/README.md | 19 +++++++++++++++---- 1 file changed, 15 insertions(+), 4 deletions(-) diff --git a/BPM/AI/CorpDOC/README.md b/BPM/AI/CorpDOC/README.md index 1a590d14..a8e17682 100644 --- a/BPM/AI/CorpDOC/README.md +++ b/BPM/AI/CorpDOC/README.md @@ -1,13 +1,24 @@ Лаборатории интеллектуальных систем ВятГУ -Для таких задач используют модели семейства Qwen, Llama и с недавних пор gemma. Размер LLM и глубину квантования можно посоветовать только исходя из понимания имеющейся видеокарты. Вариант - покупать токены у провайдеров опенсорсных LLM, но в таком случае это будет только демо вариант, т.к. выход за контур предприятия и потенциально ИБ может не пропустить. Далее. Обучение LLM на документах никто не делает - есть много исследований, которые ссылаться к тому, что это только портит модель. Грамотно обучить LLM мало кто у нас в стране может, да и железные ресурсы для этого нужны впечатляющие. Могу предложить такой вариант: отдаем вам нашу базовую RAG-систему бесплатно по соглашению, разрешающему ее неограниченное распространение и использование внутри организации, но с запретом на передачу другим юрлицам и на модификацию и использование кода или его частей. Она из коробки хорошо работает с документами, за исключением поиска по сложным таблицам, схемам и графикам. Здесь у нас скоро выйдет мультимодальный поиск, который уже умеет. +Для таких задач используют модели семейства Qwen, Llama и с недавних пор gemma. Размер LLM и глубину квантования можно посоветовать только исходя из понимания имеющейся видеокарты. Вариант - покупать токены у провайдеров опенсорсных LLM, но в таком случае это будет только демо вариант, т.к. выход за контур предприятия и потенциально ИБ может не пропустить. Далее. Обучение LLM на документах никто не делает - есть много исследований, которые ссылаться к тому, что это только портит модель. Грамотно обучить LLM мало кто в РФ может, а железные ресурсы для этого нужны впечатляющие. + +Вариант: отдаем вам нашу базовую RAG-систему бесплатно по соглашению, разрешающему ее неограниченное распространение и использование внутри организации, но с запретом на передачу другим юрлицам и на модификацию и использование кода или его частей. Она из коробки хорошо работает с документами, за исключением поиска по сложным таблицам, схемам и графикам. У нас скоро выйдет мультимодальный поиск, который уже умеет. задача сравнения и актуализации документов + +Про НД +- [Как сделать RAG для своей компании](https://habr.com/ru/articles/905076/#comment_28236148) +- [RAG-технология в действии: как создать интеллектуальную систему поиска по нормативным документам] + + ### RAG -- [Архитектура RAG: полный гайд](https://habr.com/ru/companies/raft/articles/791034/) +- [Архитектура RAG: полный гайд](https://habr.com/ru/companies/raft/articles/791034/) ; [Архитектура RAG: часть вторая — Advanced RAG](https://habr.com/ru/companies/raft/articles/818781/) - [Обзор техник RAG: Retrieval Augmented Generation](https://habr.com/ru/articles/904032/) - [Что такое RAG?](https://aws.amazon.com/ru/what-is/retrieval-augmented-generation/) - Основная проблема RAG-подхода, на которой многие спотыкаются - это сегментация [(чанкинг)](https://towardsdatascience.com/rag-101-chunking-strategies-fdc6f6c2aaec/). - [Создание решения RAG - Azure AI Search](https://learn.microsoft.com/ru-ru/azure/search/tutorial-rag-build-solution) - - +другое +- [Как мы челленджим бизнес в GenAI: от простых Naive RAG до workflow-агентских систем](https://habr.com/ru/companies/redmadrobot/articles/905628/) +- [Часть 3. Обзор технологий RAG для LLM: оптимизация извлеченных данных](https://habr.com/ru/articles/904232/) +- [RAG (Retrieval Augmented Generation) — простое и понятное объяснение](https://habr.com/ru/articles/779526/) +-