ML
← Программа

F2. Как выбрать подход: rules / Classic ML / LLM / RAG / RecSys

14 минintroБесплатно

Карта подходов: prediction, generation, retrieval, recommendation — и как выбрать под продуктовую задачу.

Чему научишься
  • Понимать разницу между prediction, generation, retrieval и recommendation
  • Выбирать подход под продуктовую задачу
  • Не путать RAG и fine-tuning

Четыре базовых типа ML-задач

Чтобы выбрать подход, сначала определите тип задачи:

  • Prediction (предсказание) — оценить число или класс по признакам. Отток, скоринг, спрос, фрод. → Classic ML.
  • Generation (генерация) — создать текст/контент. Письма, ответы, черновики. → LLM.
  • Retrieval (поиск/ответ по знаниям) — найти и собрать ответ из документов. → RAG.
  • Recommendation (рекомендация) — отранжировать объекты под пользователя. → RecSys.

Краткая шпаргалка подходов

Подход Когда выбирать Чего опасаться
Rules / эвристики Логика описуема явно, нужна предсказуемость Не масштабируется на сложные паттерны
Classic ML Предсказание класса/числа на структурированных данных Нужны разметка и фичи
LLM (prompt-only) Генерация/трансформация текста, нет своей базы знаний Галлюцинации, стоимость, латентность
RAG Ответы по своей базе знаний, актуальность важна Качество retrieval, чанкинг, citations
Fine-tuning Нужен стабильный стиль/формат, узкий домен Дорого, данные, переобучение
RecSys Персональная выдача из большого каталога Cold start, diversity, обратная связь

RAG vs fine-tuning — где путаются

  • RAG добавляет модели знания в момент ответа (подтягивает документы). Нужен, когда знания меняются и важны ссылки на источник.
  • Fine-tuning меняет поведение/стиль/формат модели. Нужен, когда промптом стабильно не добиться формата или тона.

Чаще продакту нужен RAG, а не fine-tuning. Дообучение — не способ «загрузить в модель базу знаний».

Hybrid — норма, а не исключение

Реальные продукты комбинируют: RecSys для кандидатов + бизнес-правила для фильтрации; RAG + classic-классификатор для маршрутизации; LLM-агент с вызовом инструментов и SQL. Не выбирайте «или-или» там, где выигрывает комбинация.

Алгоритм выбора (дерево)

  1. Это работа с естественным языком? Нет → Classic ML или RecSys.
  2. Если язык: нужна своя актуальная база знаний? Да → RAG.
  3. Нужно ранжировать объекты под пользователя? Да → RecSys.
  4. Достаточно генерации без своей базы? → LLM prompt-only.
  5. Промптом не добиться стабильного формата/стиля? → рассмотреть fine-tuning.

Частые ошибки

  • Брать LLM для задачи классификации, где classic ML точнее и дешевле.
  • Делать fine-tuning вместо RAG для «знаний».
  • Игнорировать rules-baseline.

🧠 Запомни: RAG даёт модели знания, fine-tuning меняет поведение. Путаете эти два — путаете архитектуру и бюджет проекта.

Итог

Выбор подхода = тип задачи + данные + требования к точности/латентности/стоимости. Это первое решение, которое определяет всю архитектуру и метрики.

Проверь себя
1/2. Нужны ответы по своей обновляемой базе знаний со ссылками. Что выбрать?
2/2. Для чего нужен fine-tuning?
Вопросы на собеседовании

Так эту тему спрашивают на интервью на AI/ML Product Manager. Нажми на вопрос, чтобы увидеть эталонный ответ.

🎯 Закрепить практикой: База знаний поддержкиВ тренажёр →
Ключевые понятия
Classic MLLLMRAGfine-tuningRecSyshybrid