ОП Науки о Данных

Приёмная кампания МКН СПбГУ 2026

Науки о данных

Фундаментальные знания о математике и программировании, помогающие решать задачи, максимально приближенные к реальным

Описание

Программа реализуется при поддержке и участии компании Яндекс. На первых курсах закладывается сильная база как по математике, так и по программированию: за два года студенты познакомятся как с теорией меры и динамическими системами, так и с архитектурой компьютера и языками Python и C++. В конце второго курса начинается полуторагодичный цикл курсов по машинному обучению, на которых студенты освоят методы обучения, анализа и внедрения широкого спектра моделей машинного обучения от градиентных бустингов, до генеративно‑состязательных сетей.

Математические курсы ведут действующие ученые, а прикладные — сотрудники ведущих IT‑компаний. С третьего курса студенты получают возможность заниматься как математическими исследованиями, так и прикладными проектами, максимально приближенными к реальным, а также получают доступ к огромному и постоянно обновляющемуся набору курсов по выбору, который позволит им сформировать свою собственную траекторию развития.

Небольшие учебные группы и сильный набор позволяет студентам раскрыть свой потенциал, а преподавателям дает возможность читать продвинутые курсы и взаимодействовать с каждым студентом в отдельности.

На выходе открываются пути как в индустрию с упором на решение бизнес‑задач, так и в академию с упором на исследования в актуальных областях ML.

Cтраница программы на сайте МКН

Стипендии

Стипендия от партнёров факультета составляет 20–40 тысяч рублей в месяц.

В первом семестре призёры и победители ВСОШ получают повышенную стипендию в размере 40 тысяч рублей в месяц. БВИ (попавшие в топ30%) получают повышенную стипендию в размере 25 тысяч рублей в месяц

Начиная со второго семестра, стипендии распределяются среди 30% лучших студентов на основе рейтинга.

Список курсов по выбору в 2026-2027 учебном году доступен по ссылке.

Преимущества программы

Создана при поддержке компании Яндекс

Практическая работа

Студенты участвуют в проектах под руководством профессионалов и занимаются прикладными исследованиями
Теоретическая база

Участие в фундаментальных исследованиях и конференциях разного уровня
Индивидуальная траектория обучения

С третьего курса большую часть дисциплин студенты выбирают сами
Обучение от практиков

Преподаватели — действующие учёные и сотрудники IT-компаний

Карьерные перспективы

Выпускникам программы открываются пути как в индустрию с упором на решение бизнес‑задач, так и в академию с упором на исследования в актуальных областях ML.

Дата-аналитик

Собирает и обрабатывает данные, находит закономерности и связи, а также визуализирует результаты через графики и дашборды
Data Scientist

Применяет алгоритмы машинного обучения, чтобы строить и тестировать математические модели данных
Разработчик ИИ

Исследует архитектуры моделей машинного обучения, чтобы‑улучшать качество существующих ML‑моделей

Студенческие проекты

Начиная со второго курса студенты могут выбрать в качестве учебной практики теоретическую курсовую или практический проект.

Практиками руководят сильнейшие учёные или ведущие сотрудники IT-компаний. Проекты могут быть самыми разными: браузерная игра, которая знакомит с машиной Тьюринга, сервис для изучения генома человека, предсказание цены продажи недвижимости, сервис для удалённого интервью, прототип датчика, который подсчитывает проехавшие мимо машины и другие.

End2End моделирование голоса

Синтез речи (или text-to-speech) — это задача формирования сигнала, похожего на человеческую речь, по тексту. Обычно решение этой задачи разделяется на три части (модели): G2P, акустическая модель и вокодер.

Основная проблема подхода в том, что эти три модели обучаются независимо друг от друга. Именно поэтому в последнее время распространяется использование end2end обучения, которое использует единую модель для решения всей задачи, без разбиения на несколько независимых моделей. Глобальная задача этого проекта — построить end2end модель для синтеза речи.

PCB routing

Цель проекта — создать алгоритм (и имплементировать достаточно быстро работающий прототип), который решит автоматически задачу прокладки проводов, соединяющих компоненты на печатной плате.

Размеры компонент и их расположение на верхнем и нижнем слое уже дано, нужно только соединить их так, чтобы провода удовлетворяли определенным ограничительным условиям.
Проект выполнен совместно с лабораторией Huawei.

Смотреть проект

Создание численного алгоритма по оптимизации обратной закачки газа с учетом технологических ограничений

Необходимо разработать эффективный численный алгоритм оптимизации, который помогал бы выбрать оптимальную последовательность скважин, в которые будет закачиваться газ (такой метод помогает увеличивать нефтеотдачу). Целевая функция — экономическая эффективность проекта по итогам 20 лет.

Образ результата: либо адаптация «классического» численного алгоритм для black-box оптимизации со штрафной функцией, либо разработка алгоритма, напрямую учитывающего упомянутые особенности задачи.

Verification of Truly Stateless model checker algorithm in Coq

Довольно часто в многопоточных программах случаются нестабильные баги. Чтобы ловить их, можно использовать модел-чекеры (далее MC). Это специальные программы, которые на вход берут ваш многопоточный код и стараются некоторым способом обойти все возможные сцены его исполнения. Работа велась над одним из таких MC.

Смотреть проект

Наши преподаватели

Математические курсы ведут действующие учёные, а прикладные — сотрудники ведущих IT‑компаний

Сергей Игоревич Николенко

Д.ф.-м.н., профессор, руководитель образовательной программы «Науки о данных», ведущий н.с. лаборатории математической логики ПОМИ РАН

Личный сайт
Максим Сергеевич Николаев

К.ф.-м.н., н.с. лаборатории им. А.А. Маркова. Читает курсы по математической статистике и ML

Мат. статистика
Иван Сергеевич Казменко

Научные интересы — соревнования по программированию, алгоритмы и структуры данных. Ведёт практические занятия по Математическим основам алгоритмов

Личный сайт
Александр Сергеевич Охотин

Ph.D. (Queen's University, Canada), профессор, заместитель декана.
Научные интересы — формальные грамматики, вопросы сложности в теории автоматов, алгоритмы синтаксического анализа

Теор. информатика
Константин Сергеевич Яковлев

К.ф.-м.н., доцент, руководитель лаборатории им. А.А. Маркова

Личный сайт
Михаил Анатольевич Лифшиц

Д.ф.-м.н., профессор.
Научные интересы — теории случайных процессов

Теория случайных процессов
Никита Игоревич Лисица

Разработчик движка рендеринга Яндекс Карт. Области интересов: компьютерная графика, вычислительная физика, численное моделирование, разработка игр.
Стаж промышленной разработки ПО 11+ лет
Сергей Юрьевич Пилюгин

Д.ф.-м.н., профессор.
Научные интересы — теория дифференциальных уравнений и динамических систем

Динамические системы
Георгий Иванович Сурин

Разработчик моделей глубокого обучения (computer vision), опытный участник соревнований по машинному обучению
Мария Владимировна Платонова

К.ф.-м.н., старший н.с. лаборатории статистических методов ПОМИ РАН.
Научные интересы — ветвящееся случайное блуждание, вероятностное представление решения задачи Коши