F2. Как выбрать подход: rules / Classic ML / LLM / RAG / RecSys

14 минintroБесплатно

Карта подходов: prediction, generation, retrieval, recommendation — и как выбрать под продуктовую задачу.

Чему научишься

✓Понимать разницу между prediction, generation, retrieval и recommendation
✓Выбирать подход под продуктовую задачу
✓Не путать RAG и fine-tuning

Четыре базовых типа ML-задач

Чтобы выбрать подход, сначала определите тип задачи:

Prediction (предсказание) — оценить число или класс по признакам. Отток, скоринг, спрос, фрод. → Classic ML.
Generation (генерация) — создать текст/контент. Письма, ответы, черновики. → LLM.
Retrieval (поиск/ответ по знаниям) — найти и собрать ответ из документов. → RAG.
Recommendation (рекомендация) — отранжировать объекты под пользователя. → RecSys.

Краткая шпаргалка подходов

Подход	Когда выбирать	Чего опасаться
Rules / эвристики	Логика описуема явно, нужна предсказуемость	Не масштабируется на сложные паттерны
Classic ML	Предсказание класса/числа на структурированных данных	Нужны разметка и фичи
LLM (prompt-only)	Генерация/трансформация текста, нет своей базы знаний	Галлюцинации, стоимость, латентность
RAG	Ответы по своей базе знаний, актуальность важна	Качество retrieval, чанкинг, citations
Fine-tuning	Нужен стабильный стиль/формат, узкий домен	Дорого, данные, переобучение
RecSys	Персональная выдача из большого каталога	Cold start, diversity, обратная связь

RAG vs fine-tuning — где путаются

RAG добавляет модели знания в момент ответа (подтягивает документы). Нужен, когда знания меняются и важны ссылки на источник.
Fine-tuning меняет поведение/стиль/формат модели. Нужен, когда промптом стабильно не добиться формата или тона.

Чаще продакту нужен RAG, а не fine-tuning. Дообучение — не способ «загрузить в модель базу знаний».

Hybrid — норма, а не исключение

Реальные продукты комбинируют: RecSys для кандидатов + бизнес-правила для фильтрации; RAG + classic-классификатор для маршрутизации; LLM-агент с вызовом инструментов и SQL. Не выбирайте «или-или» там, где выигрывает комбинация.

Алгоритм выбора (дерево)

Это работа с естественным языком? Нет → Classic ML или RecSys.
Если язык: нужна своя актуальная база знаний? Да → RAG.
Нужно ранжировать объекты под пользователя? Да → RecSys.
Достаточно генерации без своей базы? → LLM prompt-only.
Промптом не добиться стабильного формата/стиля? → рассмотреть fine-tuning.

Частые ошибки

Брать LLM для задачи классификации, где classic ML точнее и дешевле.
Делать fine-tuning вместо RAG для «знаний».
Игнорировать rules-baseline.

🧠 Запомни: RAG даёт модели знания, fine-tuning меняет поведение. Путаете эти два — путаете архитектуру и бюджет проекта.

Итог

Выбор подхода = тип задачи + данные + требования к точности/латентности/стоимости. Это первое решение, которое определяет всю архитектуру и метрики.

Проверь себя

1/2. Нужны ответы по своей обновляемой базе знаний со ссылками. Что выбрать?

2/2. Для чего нужен fine-tuning?

Вопросы на собеседовании

Так эту тему спрашивают на интервью на AI/ML Product Manager. Нажми на вопрос, чтобы увидеть эталонный ответ.

🎯 Закрепить практикой: База знаний поддержкиВ тренажёр →

← К программе

Ключевые понятия

Classic MLLLMRAGfine-tuningRecSyshybrid

Источники