Calvin Candie
Вечный
Calvin Candie
Вечный
- 2 Сен 2018
- 47,469
- 5,060
- #1
Голосов: 0
Автор: Andreas Kretz
Название: Создание локальной системы RAG на основе LlamaIndex и Ollama (2025)

«Создание локальной системы RAG на основе LlamaIndex и Ollama» — это практический курс по разработке локального RAG-конвейера для поиска по PDF-документам и генерации обоснованных ответов с помощью локально развернутой LLM. В основе проекта используются LlamaIndex, Ollama, модель Mistral, Elasticsearch, Kibana, FastAPI, Streamlit и Docker Compose.
Курс помогает не просто повторить готовый шаблон, а понять, как устроена полноценная Retrieval-Augmented Generation система: как загружать документы, извлекать текст, превращать данные в структурированный JSON, разбивать контент на чанки, создавать эмбеддинги, индексировать данные, выполнять семантический поиск и подключать генерацию ответов через локальную языковую модель.
Что представляет собой курс:
Что вы будете делать в курсе:
От семантического поиска к полноценному RAG:
Как работает RAG и в чём его преимущества:
Интеграция с LlamaIndex:
Создание конвейера обработки PDF:
FastAPI как центр обработки данных:
Автоматизация с PyMuPDF и моделями Ollama:
Работа с Elasticsearch:
Векторные индексы и метаданные:
Анализ результатов через Kibana:
Построение интерфейса в Streamlit:
Чат с LLM и режимы отладки:
Оптимизация качества ответов:
Тонкая настройка поиска и генерации:
Docker-инфраструктура:
Бонус: архитектура для продакшена:
Кому подойдёт курс:
Какие навыки вы получите:
Язык: Английский
Подробнее:
Скачать:
Название: Создание локальной системы RAG на основе LlamaIndex и Ollama (2025)

«Создание локальной системы RAG на основе LlamaIndex и Ollama» — это практический курс по разработке локального RAG-конвейера для поиска по PDF-документам и генерации обоснованных ответов с помощью локально развернутой LLM. В основе проекта используются LlamaIndex, Ollama, модель Mistral, Elasticsearch, Kibana, FastAPI, Streamlit и Docker Compose.
Курс помогает не просто повторить готовый шаблон, а понять, как устроена полноценная Retrieval-Augmented Generation система: как загружать документы, извлекать текст, превращать данные в структурированный JSON, разбивать контент на чанки, создавать эмбеддинги, индексировать данные, выполнять семантический поиск и подключать генерацию ответов через локальную языковую модель.
Что представляет собой курс:
- практическое создание локальной RAG-системы;
- работа с PDF-документами и извлечением текста;
- использование LlamaIndex для построения RAG-логики;
- локальная генерация ответов через Ollama и Mistral;
- индексация данных в Elasticsearch;
- создание интерфейса поиска и чата на Streamlit;
- сборка всей инфраструктуры через Docker Compose;
- разбор подходов к продакшен-архитектуре RAG-систем.
Что вы будете делать в курсе:
- загружать PDF-документы через API;
- извлекать текст из файлов;
- формировать структурированный JSON;
- разбивать документы на чанки;
- создавать векторные представления текста;
- индексировать данные в Elasticsearch;
- анализировать результаты через Kibana;
- строить интерактивный интерфейс в Streamlit;
- подключать локальную LLM через Ollama;
- настраивать качество поиска и генерации.
От семантического поиска к полноценному RAG:
- понимание принципов Retrieval-Augmented Generation;
- поиск релевантных фрагментов перед генерацией ответа;
- использование контекста из документов для повышения точности LLM;
- снижение количества выдуманных ответов;
- создание более обоснованных и проверяемых результатов;
- переход от простого поиска к интеллектуальному ассистенту по документам.
Как работает RAG и в чём его преимущества:
- документы загружаются и проходят предварительную обработку;
- текст разбивается на смысловые фрагменты;
- каждый фрагмент превращается в векторное представление;
- по запросу пользователя система ищет релевантные чанки;
- найденный контекст передаётся в LLM;
- модель формирует ответ с опорой на извлечённые данные.
Интеграция с LlamaIndex:
- подключение источников данных;
- управление логикой RAG-конвейера;
- настройка чанкования документов;
- работа с retriever’ами;
- подключение моделей и эмбеддингов;
- оптимизация размера чанков и перекрытий;
- адаптация поиска под разные сценарии.
Создание конвейера обработки PDF:
- загрузка PDF-файлов;
- извлечение текста из документов;
- очистка и подготовка данных;
- формирование JSON-структур;
- разбиение текста на части;
- передача данных в индекс;
- обработка ошибок и нестандартных документов.
FastAPI как центр обработки данных:
- создание API для загрузки файлов;
- приём PDF-документов от пользователя;
- запуск извлечения текста;
- генерация структурированного JSON;
- отправка данных в Elasticsearch;
- организация backend-части RAG-приложения.
Автоматизация с PyMuPDF и моделями Ollama:
- извлечение текста из PDF через PyMuPDF;
- подготовка текстовых данных для дальнейшей обработки;
- использование локальной Mistral через Ollama;
- создание аккуратных JSON-структур;
- разработка устойчивых промптов;
- обработка ошибок при извлечении и генерации;
- повышение стабильности локального AI-конвейера.
Работа с Elasticsearch:
- создание поискового индекса;
- хранение текстовых чанков;
- добавление метаданных;
- работа с векторными представлениями;
- сравнение keyword-поиска и векторного поиска;
- подготовка данных для гибридного поиска;
- поиск релевантных фрагментов для RAG-ответов.
Векторные индексы и метаданные:
- создание векторных представлений текста;
- сохранение эмбеддингов в индексе;
- добавление вспомогательных полей;
- использование метаданных для фильтрации;
- поиск по навыкам, местоположению и другим параметрам;
- улучшение точности выдачи через структуру данных.
Анализ результатов через Kibana:
- проверка корректности индексированных данных;
- просмотр документов и полей;
- анализ точности поиска;
- исследование отдельных результатов;
- визуальная проверка структуры индекса;
- отладка поискового поведения системы.
Построение интерфейса в Streamlit:
- создание интерактивного интерфейса для пользователя;
- разработка чата с LLM;
- подключение интерфейса к RAG-конвейеру;
- отображение найденных фрагментов;
- использование фильтров и метаданных;
- режимы отладки для анализа ответов.
Чат с LLM и режимы отладки:
- передача пользовательского запроса в RAG-систему;
- извлечение релевантного контекста;
- генерация ответа через локальную модель;
- показ источников и найденных чанков;
- использование фильтров по метаданным;
- проверка качества ответа и логики поиска.
Оптимизация качества ответов:
- регулировка размеров чанков;
- настройка перекрытий между чанками;
- выбор top-K результатов;
- использование гибридных фильтров;
- эксперименты с эмбеддингами;
- улучшение промптов;
- структурированные ответы в JSON;
- повышение стабильности генерации.
Тонкая настройка поиска и генерации:
- подбор оптимального размера фрагментов;
- настройка перекрытия для сохранения контекста;
- сравнение разных вариантов retrieval;
- использование top-K выборки;
- комбинация семантического поиска и фильтров;
- создание промптов для контролируемых ответов;
- формирование JSON-ответов для предсказуемой структуры.
Docker-инфраструктура:
- объединение всех компонентов в единый стек;
- запуск FastAPI, Elasticsearch, Kibana, Streamlit и Ollama;
- создание Docker Compose окружения;
- предсказуемое развёртывание локальной системы;
- удобство разработки и повторного запуска;
- подготовка проекта к дальнейшему масштабированию.
Бонус: архитектура для продакшена:
- хранение файлов в data lake;
- обработка документов через очереди;
- горизонтальное масштабирование воркеров;
- единый API для разных LLM-провайдеров;
- интеграция с Bedrock, OpenAI и Ollama;
- переход от Streamlit к React или Next.js;
- хранение истории диалогов;
- подготовка RAG-системы к реальным нагрузкам.
Кому подойдёт курс:
- data engineers, которые хотят освоить практический RAG;
- backend-разработчикам, создающим AI-сервисы;
- ML-инженерам, работающим с LLM-приложениями;
- разработчикам, которые хотят запускать LLM локально;
- специалистам, интересующимся LlamaIndex и Ollama;
- тем, кто хочет построить поиск по PDF-документам;
- инженерам, которым нужна воспроизводимая локальная AI-инфраструктура.
Какие навыки вы получите:
- создание локальной RAG-системы с нуля;
- работа с LlamaIndex;
- использование Ollama и локальной модели Mistral;
- обработка PDF-документов через PyMuPDF;
- разработка API на FastAPI;
- индексация данных в Elasticsearch;
- анализ данных через Kibana;
- создание интерфейса на Streamlit;
- настройка Docker Compose окружения;
- оптимизация retrieval и генерации ответов.
- локальную RAG-систему для поиска по PDF;
- понимание архитектуры RAG-конвейера;
- практический опыт работы с LlamaIndex и Ollama;
- навык подключения локальной LLM к поисковой системе;
- готовый стек FastAPI, Elasticsearch, Kibana, Streamlit и Ollama;
- понимание настройки качества поиска и ответов;
- базу для развития проекта в сторону production-ready решения.
Язык: Английский
Подробнее:
Скрытое содержимое доступно для зарегистрированных пользователей!
Скачать:
Для просмотра скрытого содержимого вы должны войти или зарегистрироваться.