F1. Где ML реально нужен — а где дорогая ошибка
Как отличить задачу для ML от задачи для обычных правил и аналитики — и не тащить ML туда, где он не нужен.
- ✓Отличать ML от rules и аналитики
- ✓Понимать, когда LLM не нужен
- ✓Видеть first-principles подход к AI-фичам
Зачем продакту этот вопрос
Самая частая и дорогая ошибка в AI-продукте — применить ML там, где хватило бы правил, SQL-отчёта или нормального UX. ML добавляет неопределённость, требует данных, инфраструктуры и сопровождения. Прежде чем сказать «давайте обучим модель», продакт должен уметь честно ответить: а нужен ли здесь вообще ML.
Когда ML уместен
ML стоит рассматривать, когда выполняются все три условия:
- Есть закономерность, которую трудно описать явными правилами (распознать спам, оценить риск дефолта, предсказать отток).
- Есть данные с примерами «вход → ответ» в достаточном объёме и приемлемого качества.
- Цена ошибки терпима или управляема: одна неверная рекомендация не разрушает доверие и бизнес.
Когда ML не нужен
- Задачу можно решить детерминированными правилами ("если сумма > X и страна в списке → ручная проверка").
- Нужен точный, объяснимый, воспроизводимый результат (бухгалтерия, расчёт налога).
- Данных нет или они появятся только после запуска фичи.
- Достаточно аналитики и дашборда, чтобы человек принял решение.
Правило большого пальца: сначала самый простой baseline (правило, эвристика, топ-популярное). ML внедряем, только если baseline явно не вытягивает, а потенциальный выигрыш стоит сложности.
LLM — отдельная ловушка
LLM кажется универсальным решением, поэтому его суют везде. Но LLM не нужен, если:
- задача — это классификация в фиксированные категории на структурированных данных (classic ML дешевле и точнее);
- нужна детерминированность и нулевая галлюцинация;
- ответ можно получить прямым запросом в БД или вызовом API.
LLM хорош там, где есть работа с естественным языком: суммаризация, извлечение, генерация, диалог, рассуждение над текстом.
First-principles подход к AI-фиче
Задавайте вопросы в таком порядке:
- Какую пользовательскую/бизнес-проблему мы решаем?
- Какое решение в идеале принимается и кем (человек или система)?
- Можно ли решить без ML? Что будет baseline?
- Если ML — какой тип задачи: prediction, generation, retrieval, recommendation?
- Какая цена ошибки и кто её несёт?
Частые ошибки продакта
- «Добавим AI» как цель вместо решения проблемы.
- Пропуск baseline → невозможно доказать пользу модели.
- Игнор стоимости ошибки → запуск там, где ошибка модели бьёт по доверию или деньгам.
- ML ради строчки в резюме или в презентации инвесторам.
Что спросить у команды
- У DS: «Какой простой baseline мы можем поставить за неделю?»
- У аналитика: «Эту закономерность реально описать правилами?»
- У бизнеса: «Что произойдёт, если система ошибётся в 5% случаев?»
🧠 Запомни: «Закономерность + данные + терпимая цена ошибки» — три условия для ML. Нет хотя бы одного — берите baseline.
Итог
ML — это инструмент под конкретный класс задач, а не самоцель. Сильный AI-продакт так же легко говорит «здесь ML не нужен», как и «здесь он даст эффект».
Банк одобряет кредиты по правилу: «доход > 50 000 ₽ и стаж > 1 года → одобрить». Команда предлагает заменить это правило на ML-модель.
Стоит ли заменять правило на модель? Что ты спросишь первым?
Так эту тему спрашивают на интервью на AI/ML Product Manager. Нажми на вопрос, чтобы увидеть эталонный ответ.