Большинство кандидатов заходят на собеседование аналитика данных с ощущением, что главное — не облажаться в SQL. Это ошибка. Технический отбор на эту позицию проверяет сразу восемь измерений: от умения писать оконные функции до способности объяснить A/B-тест маркетологу, который слова «p-value» никогда не слышал. Статья даёт полную карту того, что именно и в какой момент оценивает интервьюер — чтобы вы пришли на интервью с картой, а не вслепую.
Структура технического собеседования аналитика данных

Процесс найма аналитика данных в большинстве российских и международных компаний включает пять последовательных этапов. Порядок иногда меняется, но структура давно устоялась.
Этапы отбора:
- Скрининг резюме. Автоматизированная или ручная проверка ключевых слов: SQL, Python, название BI-инструментов, опыт работы с данными. Резюме без конкретных цифр и результатов отсеивают быстро.
- HR-интервью. Звонок на 15–30 минут. Рекрутер проверяет мотивацию, зарплатные ожидания и способность связно рассказать о своём опыте. Задача кандидата — за две минуты объяснить, с какими данными работал и какой результат принёс.
- Техническое интервью. Ключевой фильтр. Длится от 45 до 90 минут, включает SQL-задачи в реальном времени, вопросы по статистике и Python. По данным kariernik.ru, именно на SQL-этапе отсеивают наибольшее число кандидатов.
- Тестовое задание. Домашняя работа на 2–6 часов: анализ реального или синтетического датасета, построение дашборда, формулировка выводов. Оценивают не только результат, но и чистоту кода и логику подачи.
- Финальная встреча. Разговор с нанимающим менеджером на 30–45 минут. Обсуждают подход к задачам, прошлые проекты, совместимость с командой. Могут дать мини-кейс: «Конверсия упала — что будете делать?»
По срокам: от первого контакта до оффера обычно проходит 2–4 недели. В крупных корпорациях процесс затягивается до 6–8 недель из-за бюрократических согласований. Стартапы нередко укладываются в 7–10 дней.
Форматы встреч варьируются: лайвкодинг в онлайн-редакторе (Google Colab, HackerRank, Replit), офлайн-интервью у доски, домашнее задание с презентацией результатов. Лайвкодинг — самый стрессовый формат, потому что интервьюер видит не только ответ, но и процесс мышления.
Различия по типу компании:
| Тип компании | Акцент на техничности | Инструменты | Особенности |
| Крупная корпорация | Высокий: SQL + статистика | SAP, Tableau, внутренние системы | Процесс длинный, много этапов согласования |
| Продуктовая компания | Очень высокий: SQL + Python + продуктовые метрики | Looker, Redash, ClickHouse | Ожидают понимания продукта, не только цифр |
| Стартап | Средний: SQL обязателен, остальное — по ситуации | Google Sheets, Metabase, Power BI | Гибкость важнее глубины, скорость найма выше |
Роль уровня позиции. Для Junior достаточно уверенного SQL, базового понимания метрик и готовности учиться. Middle должен самостоятельно проектировать аналитику с нуля, работать с A/B-тестами и читать данные без подсказок. Senior — это человек, который определяет аналитическую стратегию, менторит команду и ведёт диалог с бизнесом на равных. Ожидаемый технический уровень растёт нелинейно: от Junior к Middle разрыв значительно больше, чем кажется новичкам.

Знание SQL: ключевая проверка на собеседовании
SQL — не просто инструмент, это язык мышления аналитика. Без него не пройти даже первое техническое интервью. По данным Хекслет, SQL входит в обязательный минимум для junior-аналитика в 2026 году вне зависимости от отрасли и типа компании.
Базовые конструкции, которые спрашивают всегда:
- SELECT с фильтрацией через WHERE и сортировкой ORDER BY
- GROUP BY с агрегатными функциями: COUNT, SUM, AVG, MIN, MAX
- Фильтрация групп через HAVING — часто путают с WHERE, и это немедленно виден
- Работа с NULL: проверка через IS NULL / IS NOT NULL, использование COALESCE
- DISTINCT и разница с GROUP BY в контексте производительности
Сложные темы, без которых Middle не стать:
- JOIN всех видов. INNER, LEFT, RIGHT, FULL OUTER. Задачи на объединение трёх и более таблиц. Типичная ловушка — дубликаты после JOIN: интервьюер специально подбирает данные, где неаккуратный запрос раздует результат в несколько раз.
- Подзапросы и CTE (WITH). CTE делают многоступенчатые запросы читаемыми. Умение писать WITH...AS — признак профессионального кода.
- Оконные функции. ROW_NUMBER, RANK, DENSE_RANK, LAG, LEAD, SUM OVER, скользящие средние. Это самая частая тема на middle+ интервью. Задачи на retention, ранжирование, нарастающие итоги — классика жанра.
Оптимизация и дубликаты. На уровне middle и выше спрашивают про EXPLAIN / EXPLAIN ANALYZE: как читать план выполнения, где узкое место. Seq Scan на большой таблице без индекса — красный флаг. Коррелированный подзапрос в SELECT на миллионе строк — распространённая ошибка, которую просят переписать на JOIN или оконную функцию. По данным directprobi.ru, молчание во время решения — одна из главных ошибок: интервьюер оценивает ход мыслей, а не только итоговый запрос.
Как проходит практическая часть. Кандидату дают схему таблиц и задачу — написать запрос в онлайн-редакторе или на общем экране. Интервьюер смотрит: уточняете ли вы условие до начала написания, проговариваете ли подход вслух, насколько чисто структурирован код. Правильный ответ важен, но способность объяснить его — важнее.

Программирование на Python для аналитика данных
Python на собеседовании аналитика — это не олимпиадное программирование. Здесь проверяют умение работать с данными: загружать, чистить, трансформировать, визуализировать и делать выводы. Ожидания зависят от компании: в продуктовых командах Python обязателен наравне с SQL, в корпоративной аналитике его роль скромнее.
Списки, словари, кортежи, множества. Циклы for/while, list comprehension, функции и lambda. Условия, обработка исключений.
groupby, merge, pivot_table, работа с датами, фильтрация, обработка пропусков (fillna, dropna). Это ядро практической части.
Векторные операции, работа с массивами, базовые статистические функции (mean, std, percentile). Используется совместно с Pandas.
Построить линейный график, гистограмму, boxplot. Объяснить выбор типа графика под конкретную задачу. Seaborn ускоряет работу с табличными данными.
Удаление дубликатов, типизация столбцов, работа со строками, агрегация по временным периодам. Реальный датасет всегда грязный — умение это признавать ценится.
Загрузить CSV, очистить данные, посчитать метрику, построить график. Иногда — написать скрипт для автоматизации повторяющегося расчёта.
Что реально дают на интервью. Типичная задача: загрузить датафрейм, найти пропуски, удалить дубликаты, посчитать retention по когортам, визуализировать динамику. Иногда просят прокомментировать чужой код — объяснить, что он делает и где ошибка. Ключевой критерий оценки: пишет ли кандидат читаемый код или превращает блокнот в хаос из безымянных переменных.

Математика и статистика: что проверяют у кандидата
- Среднее, медиана, мода — в чём разница и когда что применять
- Стандартное отклонение, дисперсия, перцентили
- Нормальное распределение, скошенность, выбросы
- p-value: что это такое и что не означает
- Ошибки первого (ложноположительный) и второго рода (ложноотрицательный)
- Доверительные интервалы и как их интерпретировать
- Дизайн A/B-теста: размер выборки, MDE, длительность
- Множественное тестирование и поправка Бонферрони
- Условная вероятность, формула Байеса
- Независимость событий
- Комбинаторика: классические задачи на вероятность
- Векторы и матрицы: операции, транспонирование
- Понятие о корреляции и ковариации
- Для Middle+: связь с линейной регрессией
Как формулируются вопросы по статистике. Интервьюер редко спрашивает «дайте определение p-value» — это скучно и неинформативно. Чаще звучат сценарии: «Вы запустили A/B-тест, p-value = 0.03, директор хочет внедрять изменение. Что скажете?» Или: «Два источника данных показывают разные значения конверсии. Ваши действия?» Глубина ожиданий зависит от уровня: junior должен понимать, зачем нужна контрольная группа, middle — самостоятельно рассчитать размер выборки и назвать типичные ловушки эксперимента, по материалам kariernik.ru.

Аналитическое мышление и работа с бизнес-задачами
Антон Серов, старший аналитик данных
Я готовился к собеседованию в крупную продуктовую компанию три недели. SQL — уверенный, Python — рабочий, статистику повторил. Думал, что готов.
На кейс-интервью мне сказали: «Представьте, что DAU нашего приложения упал на 18% за неделю. Что будете делать?» Я начал перечислять технические причины: баги, серверная нагрузка, CDN. Интервьюер слушал вежливо, потом остановил: «А вы уточнили, какой именно сегмент пользователей упал? Это все пользователи или только новые? Это все платформы или только iOS?»
Я не уточнил. Я ринулся решать задачу, не поняв её. Именно это и провалило интервью — не отсутствие знаний, а отсутствие структуры мышления. Я не задал ни одного уточняющего вопроса и сразу полез в версии. Нанимающий менеджер потом написал в фидбеке: «Технически сильный, но не умеет декомпозировать проблему».
На следующем собеседовании, уже перед тем как отвечать, я всегда говорю вслух: «Прежде чем предложить версии, хочу уточнить несколько вещей». Это меняет всё. Второй оффер я получил через три недели.
Кейсовые задания на аналитическое мышление — это не проверка знаний, это проверка метода. Интервьюер смотрит, умеет ли кандидат разбить размытый вопрос на структурированные подзадачи, выбрать нужные метрики и обосновать логику.
Продуктовые метрики, которые нужно знать:
- Retention — доля пользователей, вернувшихся на N-й день после регистрации. Day-1, Day-7, Day-30 — стандартная разбивка.
- Conversion — доля пользователей, совершивших целевое действие на каждом шаге воронки.
- LTV (Lifetime Value) — суммарный доход от пользователя за всё время жизни. Рассчитывается через ARPU и среднюю длину жизни клиента.
- DAU / MAU — дневная и месячная активная аудитория. Соотношение DAU/MAU показывает «липкость» продукта (stickiness).
Перевод бизнес-вопроса в аналитическую задачу. Когда директор говорит «нам нужно понять, почему выручка упала», это не задача — это симптом. Аналитик должен преобразовать это в конкретные проверяемые гипотезы: изменился ли трафик, упала ли конверсия, снизился ли средний чек, появились ли новые паттерны отмен. Кандидатов, которые умеют это делать самостоятельно, нанимают охотно. Тех, кто ждёт точного ТЗ — рассматривают с оговорками.
Работа с неполными данными. На интервью могут намеренно дать задачу с пропусками: «Данные за апрель отсутствуют. Как поступите?» Правильный ответ — не угадывание, а честная декомпозиция: что известно, что можно приблизить, где нужно предупредить stakeholders о ненадёжности вывода.
Визуализация данных и инструменты отчётности
Умение красиво нарисовать график — не то, что проверяют на собеседовании. Проверяют понимание, почему именно этот тип графика уместен для данной задачи, и способность объяснить инсайт человеку без технического бэкграунда.
BI-инструменты, которые встречаются в вакансиях:
- Tableau — популярен в крупных корпорациях, международных компаниях. Мощный, но платный.
- Power BI — доминирует в российских enterprise-компаниях и банках. Интеграция с экосистемой Microsoft.
- Looker — типичен для технологических продуктовых компаний, часто с собственным LookML-слоем.
- Google Looker Studio (бывший Data Studio) — бесплатный, распространён в маркетинговой аналитике и стартапах.
- Redash, Metabase, Apache Superset — опенсорс-альтернативы, популярны в продуктовых командах с техническим стеком.
Принципы дашбордостроения. Интервьюер может попросить описать структуру дашборда для конкретной задачи. Ключевые принципы: одна метрика на один график, иерархия информации от общего к частному, отсутствие «украшений», которые не несут смысла. Выбор типа графика — не эстетика, а логика: линейный для временных рядов, столбчатый для сравнения категорий, scatter-plot для корреляции.
Презентация результатов. Один из стандартных вопросов финального интервью — «Расскажите о дашборде, который вы строили». Интервьюер ожидает услышать: какую бизнес-задачу решал дашборд, кто его использовал, как результаты повлияли на решения. Ответ «я построил несколько графиков в Tableau» — это не ответ.
Что спрашивают про опыт отчётности:
- Какие метрики отслеживали и как выбирали ключевые?
- Как организовывали обновление данных — автоматически или вручную?
- Был ли у вас опыт разработки отчётов для нетехнической аудитории?
- Как справлялись с ситуацией, когда данные в разных источниках расходились?
Soft skills и проверка на культурное соответствие
Технические навыки — это входной билет. Soft skills определяют, получите ли вы оффер или нет. Тимлид нанимает человека, с которым будет работать каждый день, а не просто набор компетенций.
Коммуникация и уточняющие вопросы. На кейс-интервью кандидат, который сразу приступает к решению без уточнений, демонстрирует самонадеянность или неопытность. Профессионал сначала уточняет: какие данные доступны, что считается успехом, кто стейкхолдер. Умение задавать точные вопросы — признак зрелости.
Методика STAR (Situation — Task — Action — Result) используется для поведенческих вопросов: «Расскажите о ситуации, когда данные показали неожиданный результат», «Как вы справлялись с конфликтом интересов между командами». Структурированный ответ по STAR показывает, что кандидат умеет рефлексировать и извлекать уроки из опыта.
Оценка мотивации и обучаемости. HR-специалисты фиксируют «красные флаги»: «я хочу в Data Science, аналитика мне как ступенька», «не люблю SQL», «всё посчитаю в ChatGPT». Всё это сигналы о том, что человек не готов к реальной работе. Противоположное — кандидат, который рассказывает, что читал, изучал, с какими данными экспериментировал самостоятельно. Это ценится даже при меньшем формальном опыте.
На что смотрит тимлид при найме:
- Способность признавать ошибки и не защищаться
- Готовность работать с неполными данными без паники
- Умение объяснить сложное простыми словами
- Ориентация на результат, а не на процесс
- Способность самостоятельно формулировать задачи, а не ждать детального ТЗ
Подготовка к собеседованию и оценка своего уровня
Чек-лист навыков перед интервью:
- ✅ SQL: SELECT, WHERE, GROUP BY, HAVING, агрегатные функции — без ошибок
- ✅ SQL: JOIN всех видов, CTE, оконные функции ROW_NUMBER / LAG / SUM OVER
- ✅ Python: Pandas groupby, merge, работа с пропусками, pivot_table
- ✅ Визуализация: построить и объяснить выбор графика
- ✅ Статистика: p-value, доверительные интервалы, ошибки I и II рода
- ✅ A/B-тест: как спроектировать, рассчитать размер выборки, интерпретировать результат
- ✅ Метрики: Retention, Conversion, LTV, DAU/MAU — формулы и смысл
- ✅ Кейс: умение декомпозировать бизнес-вопрос на аналитические гипотезы
- ✅ Портфолио: минимум 2–3 оформленных проекта на GitHub
Где брать практические задачи:
- LeetCode (раздел Database) — задачи из реальных собеседований крупных компаний, уровень от Junior до Senior
- HackerRank (SQL) — пошаговые задания с нарастающей сложностью
- sql-ex.ru — классика для русскоязычной аудитории, жёсткие практические задачи
- Kaggle — открытые датасеты для самостоятельных проектов, соревнования, ноутбуки с примерами
- StrataScratch — задачи из реальных собеседований с SQL-песочницей
По данным Хекслет, оптимальная стратегия — не гнаться за количеством, а разбирать каждую задачу до конца: понять паттерн, а не заучить решение. 30–50 разобранных задач по SQL покрывают 80% того, что встречается на интервью.
Как составить портфолио. GitHub открывают раньше, чем дочитывают резюме. Каждый проект должен содержать: чёткое описание бизнес-задачи в README, структурированный код с комментариями, визуализации, выводы. Курсовые проекты засчитываются, если они реально демонстрируют компетенции. Проект «скачал датасет, построил 10 графиков» — это не портфолио. Портфолио — это «исследовал отток клиентов, выявил три ключевых предиктора, предложил конкретные действия».
Типичные ошибки кандидатов:
- Молчат во время решения — интервьюер не видит хода мышления и не может помочь
- Не уточняют условие задачи перед ответом
- Знают синтаксис SQL, но не понимают, почему изменилось количество строк после JOIN
- Учат всё подряд одновременно — в итоге плохо знают всё
- Нет ни одного реального проекта, только список пройденных курсов
- Говорят «хочу в DS, аналитика — это ступенька» — это ставит крест на найме немедленно
- Не задают вопросы о компании и команде — воспринимается как отсутствие мотивации
Согласно данным hh.ru, спрос на аналитиков данных в России стабильно растёт: количество вакансий в категории «Data Analyst» в 2024–2025 годах увеличилось на 30–40% год к году. Конкуренция реальная — но она отсекает тех, кто готовился хаотично. Системная подготовка с конкретными практическими задачами переводит кандидата из «одного из многих» в «того, кому делают оффер».
| Уровень | SQL | Python | Статистика | Портфолио |
| Junior | Базовые запросы + JOIN | Pandas базово | Понятие p-value, A/B на уровне идеи | 1–2 учебных проекта |
| Middle | Оконные функции, CTE, оптимизация | Pandas + визуализация + скрипты | Расчёт выборки, ошибки I/II рода | 2–4 реальных или детальных проекта |
| Senior | Архитектурные решения, EXPLAIN | Пайплайны, воспроизводимый код | Множественное тестирование, байесовский подход | Измеримый бизнес-результат в каждом проекте |
Собеседование на аналитика данных — это не экзамен по синтаксису SQL и не тест на знание формулы LTV. Это проверка того, умеет ли кандидат думать структурно, работать с неопределённостью и доносить выводы до людей, которым нет дела до p-value. Технические навыки — необходимое условие, но недостаточное. Тот, кто приходит с чётким пониманием своих компетенций, умением задавать точные вопросы и хотя бы двумя реальными проектами в портфолио, имеет кратно больше шансов услышать слово «оффер», чем тот, кто знает все оконные функции, но не может объяснить, зачем они нужны бизнесу.
















