F2. Как выбрать подход: rules / Classic ML / LLM / RAG / RecSys
Карта подходов: prediction, generation, retrieval, recommendation — и как выбрать под продуктовую задачу.
- ✓Понимать разницу между prediction, generation, retrieval и recommendation
- ✓Выбирать подход под продуктовую задачу
- ✓Не путать RAG и fine-tuning
Четыре базовых типа ML-задач
Чтобы выбрать подход, сначала определите тип задачи:
- Prediction (предсказание) — оценить число или класс по признакам. Отток, скоринг, спрос, фрод. → Classic ML.
- Generation (генерация) — создать текст/контент. Письма, ответы, черновики. → LLM.
- Retrieval (поиск/ответ по знаниям) — найти и собрать ответ из документов. → RAG.
- Recommendation (рекомендация) — отранжировать объекты под пользователя. → RecSys.
Краткая шпаргалка подходов
| Подход | Когда выбирать | Чего опасаться |
|---|---|---|
| Rules / эвристики | Логика описуема явно, нужна предсказуемость | Не масштабируется на сложные паттерны |
| Classic ML | Предсказание класса/числа на структурированных данных | Нужны разметка и фичи |
| LLM (prompt-only) | Генерация/трансформация текста, нет своей базы знаний | Галлюцинации, стоимость, латентность |
| RAG | Ответы по своей базе знаний, актуальность важна | Качество retrieval, чанкинг, citations |
| Fine-tuning | Нужен стабильный стиль/формат, узкий домен | Дорого, данные, переобучение |
| RecSys | Персональная выдача из большого каталога | Cold start, diversity, обратная связь |
RAG vs fine-tuning — где путаются
- RAG добавляет модели знания в момент ответа (подтягивает документы). Нужен, когда знания меняются и важны ссылки на источник.
- Fine-tuning меняет поведение/стиль/формат модели. Нужен, когда промптом стабильно не добиться формата или тона.
Чаще продакту нужен RAG, а не fine-tuning. Дообучение — не способ «загрузить в модель базу знаний».
Hybrid — норма, а не исключение
Реальные продукты комбинируют: RecSys для кандидатов + бизнес-правила для фильтрации; RAG + classic-классификатор для маршрутизации; LLM-агент с вызовом инструментов и SQL. Не выбирайте «или-или» там, где выигрывает комбинация.
Алгоритм выбора (дерево)
- Это работа с естественным языком? Нет → Classic ML или RecSys.
- Если язык: нужна своя актуальная база знаний? Да → RAG.
- Нужно ранжировать объекты под пользователя? Да → RecSys.
- Достаточно генерации без своей базы? → LLM prompt-only.
- Промптом не добиться стабильного формата/стиля? → рассмотреть fine-tuning.
Частые ошибки
- Брать LLM для задачи классификации, где classic ML точнее и дешевле.
- Делать fine-tuning вместо RAG для «знаний».
- Игнорировать rules-baseline.
🧠 Запомни: RAG даёт модели знания, fine-tuning меняет поведение. Путаете эти два — путаете архитектуру и бюджет проекта.
Итог
Выбор подхода = тип задачи + данные + требования к точности/латентности/стоимости. Это первое решение, которое определяет всю архитектуру и метрики.
Так эту тему спрашивают на интервью на AI/ML Product Manager. Нажми на вопрос, чтобы увидеть эталонный ответ.