Проверьте свой английский и получите рекомендации по обучению

Проверить бесплатно

Что проверяют при поступлении на аналитика данных — все 8 уровней

Для кого эта статья:

Начинающие и практикующие аналитики данных (Junior/Middle), готовящиеся к техническому собеседованию
Люди, меняющие профессию или переходящие в аналитику данных из смежных областей
Студенты и выпускники технических специальностей, впервые выходящие на рынок труда в сфере Data Analytics

Что проверяют при поступлении на аналитика данных - все 8 уровней

NEW

Полный разбор технического собеседования на аналитика данных: SQL, Python, статистика, кейсы и типичные ошибки кандидатов.

Большинство кандидатов заходят на собеседование аналитика данных с ощущением, что главное — не облажаться в SQL. Это ошибка. Технический отбор на эту позицию проверяет сразу восемь измерений: от умения писать оконные функции до способности объяснить A/B-тест маркетологу, который слова «p-value» никогда не слышал. Статья даёт полную карту того, что именно и в какой момент оценивает интервьюер — чтобы вы пришли на интервью с картой, а не вслепую.

Структура технического собеседования аналитика данных

Процесс найма аналитика данных в большинстве российских и международных компаний включает пять последовательных этапов. Порядок иногда меняется, но структура давно устоялась.

Этапы отбора:

Скрининг резюме. Автоматизированная или ручная проверка ключевых слов: SQL, Python, название BI-инструментов, опыт работы с данными. Резюме без конкретных цифр и результатов отсеивают быстро.
HR-интервью. Звонок на 15–30 минут. Рекрутер проверяет мотивацию, зарплатные ожидания и способность связно рассказать о своём опыте. Задача кандидата — за две минуты объяснить, с какими данными работал и какой результат принёс.
Техническое интервью. Ключевой фильтр. Длится от 45 до 90 минут, включает SQL-задачи в реальном времени, вопросы по статистике и Python. По данным kariernik.ru, именно на SQL-этапе отсеивают наибольшее число кандидатов.
Тестовое задание. Домашняя работа на 2–6 часов: анализ реального или синтетического датасета, построение дашборда, формулировка выводов. Оценивают не только результат, но и чистоту кода и логику подачи.
Финальная встреча. Разговор с нанимающим менеджером на 30–45 минут. Обсуждают подход к задачам, прошлые проекты, совместимость с командой. Могут дать мини-кейс: «Конверсия упала — что будете делать?»

По срокам: от первого контакта до оффера обычно проходит 2–4 недели. В крупных корпорациях процесс затягивается до 6–8 недель из-за бюрократических согласований. Стартапы нередко укладываются в 7–10 дней.

Форматы встреч варьируются: лайвкодинг в онлайн-редакторе (Google Colab, HackerRank, Replit), офлайн-интервью у доски, домашнее задание с презентацией результатов. Лайвкодинг — самый стрессовый формат, потому что интервьюер видит не только ответ, но и процесс мышления.

Различия по типу компании:

Тип компании	Акцент на техничности	Инструменты	Особенности
Крупная корпорация	Высокий: SQL + статистика	SAP, Tableau, внутренние системы	Процесс длинный, много этапов согласования
Продуктовая компания	Очень высокий: SQL + Python + продуктовые метрики	Looker, Redash, ClickHouse	Ожидают понимания продукта, не только цифр
Стартап	Средний: SQL обязателен, остальное — по ситуации	Google Sheets, Metabase, Power BI	Гибкость важнее глубины, скорость найма выше

Роль уровня позиции. Для Junior достаточно уверенного SQL, базового понимания метрик и готовности учиться. Middle должен самостоятельно проектировать аналитику с нуля, работать с A/B-тестами и читать данные без подсказок. Senior — это человек, который определяет аналитическую стратегию, менторит команду и ведёт диалог с бизнесом на равных. Ожидаемый технический уровень растёт нелинейно: от Junior к Middle разрыв значительно больше, чем кажется новичкам.

Правила приема в Skypro колледж

Гайд по поступлению

Знание SQL: ключевая проверка на собеседовании

SQL — не просто инструмент, это язык мышления аналитика. Без него не пройти даже первое техническое интервью. По данным Хекслет, SQL входит в обязательный минимум для junior-аналитика в 2026 году вне зависимости от отрасли и типа компании.

Базовые конструкции, которые спрашивают всегда:

SELECT с фильтрацией через WHERE и сортировкой ORDER BY
GROUP BY с агрегатными функциями: COUNT, SUM, AVG, MIN, MAX
Фильтрация групп через HAVING — часто путают с WHERE, и это немедленно виден
Работа с NULL: проверка через IS NULL / IS NOT NULL, использование COALESCE
DISTINCT и разница с GROUP BY в контексте производительности

Сложные темы, без которых Middle не стать:

JOIN всех видов. INNER, LEFT, RIGHT, FULL OUTER. Задачи на объединение трёх и более таблиц. Типичная ловушка — дубликаты после JOIN: интервьюер специально подбирает данные, где неаккуратный запрос раздует результат в несколько раз.
Подзапросы и CTE (WITH). CTE делают многоступенчатые запросы читаемыми. Умение писать WITH...AS — признак профессионального кода.
Оконные функции. ROW_NUMBER, RANK, DENSE_RANK, LAG, LEAD, SUM OVER, скользящие средние. Это самая частая тема на middle+ интервью. Задачи на retention, ранжирование, нарастающие итоги — классика жанра.

Оптимизация и дубликаты. На уровне middle и выше спрашивают про EXPLAIN / EXPLAIN ANALYZE: как читать план выполнения, где узкое место. Seq Scan на большой таблице без индекса — красный флаг. Коррелированный подзапрос в SELECT на миллионе строк — распространённая ошибка, которую просят переписать на JOIN или оконную функцию. По данным directprobi.ru, молчание во время решения — одна из главных ошибок: интервьюер оценивает ход мыслей, а не только итоговый запрос.

Как проходит практическая часть. Кандидату дают схему таблиц и задачу — написать запрос в онлайн-редакторе или на общем экране. Интервьюер смотрит: уточняете ли вы условие до начала написания, проговариваете ли подход вслух, насколько чисто структурирован код. Правильный ответ важен, но способность объяснить его — важнее.

Английский, который ты выучишь!

Обычно мы даём эти материалы за деньги. Но тебе ⬇️

Программирование на Python для аналитика данных

Python на собеседовании аналитика — это не олимпиадное программирование. Здесь проверяют умение работать с данными: загружать, чистить, трансформировать, визуализировать и делать выводы. Ожидания зависят от компании: в продуктовых командах Python обязателен наравне с SQL, в корпоративной аналитике его роль скромнее.

🐍 Что проверяют по Python на собеседовании

Базовый синтаксис

Списки, словари, кортежи, множества. Циклы for/while, list comprehension, функции и lambda. Условия, обработка исключений.

Pandas

groupby, merge, pivot_table, работа с датами, фильтрация, обработка пропусков (fillna, dropna). Это ядро практической части.

NumPy

Векторные операции, работа с массивами, базовые статистические функции (mean, std, percentile). Используется совместно с Pandas.

Визуализация: Matplotlib и Seaborn

Построить линейный график, гистограмму, boxplot. Объяснить выбор типа графика под конкретную задачу. Seaborn ускоряет работу с табличными данными.

Очистка и трансформация данных

Удаление дубликатов, типизация столбцов, работа со строками, агрегация по временным периодам. Реальный датасет всегда грязный — умение это признавать ценится.

Типичные практические задачи

Загрузить CSV, очистить данные, посчитать метрику, построить график. Иногда — написать скрипт для автоматизации повторяющегося расчёта.

Что реально дают на интервью. Типичная задача: загрузить датафрейм, найти пропуски, удалить дубликаты, посчитать retention по когортам, визуализировать динамику. Иногда просят прокомментировать чужой код — объяснить, что он делает и где ошибка. Ключевой критерий оценки: пишет ли кандидат читаемый код или превращает блокнот в хаос из безымянных переменных.

Английский на чемоданах

Без воды и духоты: только реально полезная лексика и много практики

Математика и статистика: что проверяют у кандидата

📊 Статистика на собеседовании: карта тем

📌 Описательная статистика

Среднее, медиана, мода — в чём разница и когда что применять
Стандартное отклонение, дисперсия, перцентили
Нормальное распределение, скошенность, выбросы

🔬 Проверка гипотез и A/B-тесты

p-value: что это такое и что не означает
Ошибки первого (ложноположительный) и второго рода (ложноотрицательный)
Доверительные интервалы и как их интерпретировать
Дизайн A/B-теста: размер выборки, MDE, длительность
Множественное тестирование и поправка Бонферрони

🎲 Теория вероятностей

Условная вероятность, формула Байеса
Независимость событий
Комбинаторика: классические задачи на вероятность

📐 Линейная алгебра (базовый уровень)

Векторы и матрицы: операции, транспонирование
Понятие о корреляции и ковариации
Для Middle+: связь с линейной регрессией

Как формулируются вопросы по статистике. Интервьюер редко спрашивает «дайте определение p-value» — это скучно и неинформативно. Чаще звучат сценарии: «Вы запустили A/B-тест, p-value = 0.03, директор хочет внедрять изменение. Что скажете?» Или: «Два источника данных показывают разные значения конверсии. Ваши действия?» Глубина ожиданий зависит от уровня: junior должен понимать, зачем нужна контрольная группа, middle — самостоятельно рассчитать размер выборки и назвать типичные ловушки эксперимента, по материалам kariernik.ru.

Видеоуроки по произношению с носителями!

Узнаете особенности английской фонетики и начнёте понимать носителей!

Аналитическое мышление и работа с бизнес-задачами

Антон Серов, старший аналитик данных

Я готовился к собеседованию в крупную продуктовую компанию три недели. SQL — уверенный, Python — рабочий, статистику повторил. Думал, что готов.

На кейс-интервью мне сказали: «Представьте, что DAU нашего приложения упал на 18% за неделю. Что будете делать?» Я начал перечислять технические причины: баги, серверная нагрузка, CDN. Интервьюер слушал вежливо, потом остановил: «А вы уточнили, какой именно сегмент пользователей упал? Это все пользователи или только новые? Это все платформы или только iOS?»

Я не уточнил. Я ринулся решать задачу, не поняв её. Именно это и провалило интервью — не отсутствие знаний, а отсутствие структуры мышления. Я не задал ни одного уточняющего вопроса и сразу полез в версии. Нанимающий менеджер потом написал в фидбеке: «Технически сильный, но не умеет декомпозировать проблему».

На следующем собеседовании, уже перед тем как отвечать, я всегда говорю вслух: «Прежде чем предложить версии, хочу уточнить несколько вещей». Это меняет всё. Второй оффер я получил через три недели.

Кейсовые задания на аналитическое мышление — это не проверка знаний, это проверка метода. Интервьюер смотрит, умеет ли кандидат разбить размытый вопрос на структурированные подзадачи, выбрать нужные метрики и обосновать логику.

Продуктовые метрики, которые нужно знать:

Retention — доля пользователей, вернувшихся на N-й день после регистрации. Day-1, Day-7, Day-30 — стандартная разбивка.
Conversion — доля пользователей, совершивших целевое действие на каждом шаге воронки.
LTV (Lifetime Value) — суммарный доход от пользователя за всё время жизни. Рассчитывается через ARPU и среднюю длину жизни клиента.
DAU / MAU — дневная и месячная активная аудитория. Соотношение DAU/MAU показывает «липкость» продукта (stickiness).

Перевод бизнес-вопроса в аналитическую задачу. Когда директор говорит «нам нужно понять, почему выручка упала», это не задача — это симптом. Аналитик должен преобразовать это в конкретные проверяемые гипотезы: изменился ли трафик, упала ли конверсия, снизился ли средний чек, появились ли новые паттерны отмен. Кандидатов, которые умеют это делать самостоятельно, нанимают охотно. Тех, кто ждёт точного ТЗ — рассматривают с оговорками.

Работа с неполными данными. На интервью могут намеренно дать задачу с пропусками: «Данные за апрель отсутствуют. Как поступите?» Правильный ответ — не угадывание, а честная декомпозиция: что известно, что можно приблизить, где нужно предупредить stakeholders о ненадёжности вывода.

Визуализация данных и инструменты отчётности

Умение красиво нарисовать график — не то, что проверяют на собеседовании. Проверяют понимание, почему именно этот тип графика уместен для данной задачи, и способность объяснить инсайт человеку без технического бэкграунда.

BI-инструменты, которые встречаются в вакансиях:

Tableau — популярен в крупных корпорациях, международных компаниях. Мощный, но платный.
Power BI — доминирует в российских enterprise-компаниях и банках. Интеграция с экосистемой Microsoft.
Looker — типичен для технологических продуктовых компаний, часто с собственным LookML-слоем.
Google Looker Studio (бывший Data Studio) — бесплатный, распространён в маркетинговой аналитике и стартапах.
Redash, Metabase, Apache Superset — опенсорс-альтернативы, популярны в продуктовых командах с техническим стеком.

Принципы дашбордостроения. Интервьюер может попросить описать структуру дашборда для конкретной задачи. Ключевые принципы: одна метрика на один график, иерархия информации от общего к частному, отсутствие «украшений», которые не несут смысла. Выбор типа графика — не эстетика, а логика: линейный для временных рядов, столбчатый для сравнения категорий, scatter-plot для корреляции.

Презентация результатов. Один из стандартных вопросов финального интервью — «Расскажите о дашборде, который вы строили». Интервьюер ожидает услышать: какую бизнес-задачу решал дашборд, кто его использовал, как результаты повлияли на решения. Ответ «я построил несколько графиков в Tableau» — это не ответ.

Что спрашивают про опыт отчётности:

Какие метрики отслеживали и как выбирали ключевые?
Как организовывали обновление данных — автоматически или вручную?
Был ли у вас опыт разработки отчётов для нетехнической аудитории?
Как справлялись с ситуацией, когда данные в разных источниках расходились?

Soft skills и проверка на культурное соответствие

Технические навыки — это входной билет. Soft skills определяют, получите ли вы оффер или нет. Тимлид нанимает человека, с которым будет работать каждый день, а не просто набор компетенций.

Коммуникация и уточняющие вопросы. На кейс-интервью кандидат, который сразу приступает к решению без уточнений, демонстрирует самонадеянность или неопытность. Профессионал сначала уточняет: какие данные доступны, что считается успехом, кто стейкхолдер. Умение задавать точные вопросы — признак зрелости.

Методика STAR (Situation — Task — Action — Result) используется для поведенческих вопросов: «Расскажите о ситуации, когда данные показали неожиданный результат», «Как вы справлялись с конфликтом интересов между командами». Структурированный ответ по STAR показывает, что кандидат умеет рефлексировать и извлекать уроки из опыта.

Оценка мотивации и обучаемости. HR-специалисты фиксируют «красные флаги»: «я хочу в Data Science, аналитика мне как ступенька», «не люблю SQL», «всё посчитаю в ChatGPT». Всё это сигналы о том, что человек не готов к реальной работе. Противоположное — кандидат, который рассказывает, что читал, изучал, с какими данными экспериментировал самостоятельно. Это ценится даже при меньшем формальном опыте.

На что смотрит тимлид при найме:

Способность признавать ошибки и не защищаться
Готовность работать с неполными данными без паники
Умение объяснить сложное простыми словами
Ориентация на результат, а не на процесс
Способность самостоятельно формулировать задачи, а не ждать детального ТЗ

Подготовка к собеседованию и оценка своего уровня

Чек-лист навыков перед интервью:

✅ SQL: SELECT, WHERE, GROUP BY, HAVING, агрегатные функции — без ошибок
✅ SQL: JOIN всех видов, CTE, оконные функции ROW_NUMBER / LAG / SUM OVER
✅ Python: Pandas groupby, merge, работа с пропусками, pivot_table
✅ Визуализация: построить и объяснить выбор графика
✅ Статистика: p-value, доверительные интервалы, ошибки I и II рода
✅ A/B-тест: как спроектировать, рассчитать размер выборки, интерпретировать результат
✅ Метрики: Retention, Conversion, LTV, DAU/MAU — формулы и смысл
✅ Кейс: умение декомпозировать бизнес-вопрос на аналитические гипотезы
✅ Портфолио: минимум 2–3 оформленных проекта на GitHub

Где брать практические задачи:

LeetCode (раздел Database) — задачи из реальных собеседований крупных компаний, уровень от Junior до Senior
HackerRank (SQL) — пошаговые задания с нарастающей сложностью
sql-ex.ru — классика для русскоязычной аудитории, жёсткие практические задачи
Kaggle — открытые датасеты для самостоятельных проектов, соревнования, ноутбуки с примерами
StrataScratch — задачи из реальных собеседований с SQL-песочницей

По данным Хекслет, оптимальная стратегия — не гнаться за количеством, а разбирать каждую задачу до конца: понять паттерн, а не заучить решение. 30–50 разобранных задач по SQL покрывают 80% того, что встречается на интервью.

Как составить портфолио. GitHub открывают раньше, чем дочитывают резюме. Каждый проект должен содержать: чёткое описание бизнес-задачи в README, структурированный код с комментариями, визуализации, выводы. Курсовые проекты засчитываются, если они реально демонстрируют компетенции. Проект «скачал датасет, построил 10 графиков» — это не портфолио. Портфолио — это «исследовал отток клиентов, выявил три ключевых предиктора, предложил конкретные действия».

Типичные ошибки кандидатов:

Молчат во время решения — интервьюер не видит хода мышления и не может помочь
Не уточняют условие задачи перед ответом
Знают синтаксис SQL, но не понимают, почему изменилось количество строк после JOIN
Учат всё подряд одновременно — в итоге плохо знают всё
Нет ни одного реального проекта, только список пройденных курсов
Говорят «хочу в DS, аналитика — это ступенька» — это ставит крест на найме немедленно
Не задают вопросы о компании и команде — воспринимается как отсутствие мотивации

Согласно данным hh.ru, спрос на аналитиков данных в России стабильно растёт: количество вакансий в категории «Data Analyst» в 2024–2025 годах увеличилось на 30–40% год к году. Конкуренция реальная — но она отсекает тех, кто готовился хаотично. Системная подготовка с конкретными практическими задачами переводит кандидата из «одного из многих» в «того, кому делают оффер».

Уровень	SQL	Python	Статистика	Портфолио
Junior	Базовые запросы + JOIN	Pandas базово	Понятие p-value, A/B на уровне идеи	1–2 учебных проекта
Middle	Оконные функции, CTE, оптимизация	Pandas + визуализация + скрипты	Расчёт выборки, ошибки I/II рода	2–4 реальных или детальных проекта
Senior	Архитектурные решения, EXPLAIN	Пайплайны, воспроизводимый код	Множественное тестирование, байесовский подход	Измеримый бизнес-результат в каждом проекте

Собеседование на аналитика данных — это не экзамен по синтаксису SQL и не тест на знание формулы LTV. Это проверка того, умеет ли кандидат думать структурно, работать с неопределённостью и доносить выводы до людей, которым нет дела до p-value. Технические навыки — необходимое условие, но недостаточное. Тот, кто приходит с чётким пониманием своих компетенций, умением задавать точные вопросы и хотя бы двумя реальными проектами в портфолио, имеет кратно больше шансов услышать слово «оффер», чем тот, кто знает все оконные функции, но не может объяснить, зачем они нужны бизнесу.

К предыдущей статье