I graduated from Saint-Petersburg University, faculty of mathematics and mechanics in 2007 with masters degree (more precisely russian "специалист" degree). Then, I entered postgraduate school and worked under supervision of Boris Novikov. During this time I also worked for a few industry companies as a programmer (see cv for details).
Now, I'm with JetBrains Research. I also teach at Saint Petersburg State University and Saint Petersburg Academic University. My courses are (were) advanced databases, recommender systems and entry-level computer programming.
My current research interests are databases and information management in general.
My contacts:
Mer de glace, 2010
Ivoire, 2010
Me & Kirill Smirnov@SIGMOD, 2010
AMNH, 2010
Me, Cherednik Kirill, Pavel Fedotovsky, Kirill Smirnov (left to right) SIGMOD Conference, 2013
Cherednik Kirill, Pavel Fedotovsky, SIGMOD Conference, 2013
Me & Kirill, Google, Bay Bridge view
At SIGMOD/PODS'16
Golden Gate Bridge
R-tree - классическая структура данных для многомерного индексирования данных малой размерности. Эту структуру можно использовать для быстрого ответа на такие запросы как “найти все звезды в заданном квадрате” или “найти ближайший ресторан”. В данном проекте мы занимаемся в основновном экспериментальным исследованием существующих алгоритмов разделения вершин.
Данный проект нацелен на разработку PosDB - исследовательской СУБД с поколоночным хранением данных. Одна из отличительных особенностей нашей системы - распределенный характер обработки. Планируются исследования различных стратегий исполнения и оптимизации запросов, адаптивности, а также физического дизайна.
RDF - формат представления знаний, в виде троек <субъект, предикат, объект>. Данные представленные в этом формате можно рассматривать как граф. Для получения информации существует SQL-подобный язык, запросы на котором можно трактовать как графовые шаблоны. Форма представления исходных данных существенно влияет на скорость выполнения запросов к ним. В этом проекте мы исследуем вопросы фрагментирования и размещения данных, представленные в таком формате.
В данном проекте мы исследуем возможности использования автоматически найденных функциональных и других зависимостей для выработки лучшего физического дизайна СУБД. В планах разработка эффективных алгоритмов нахождения таких зависимостей, а также разработка новых типов зависимостей.
Основная идея данного проекта это выделение в рамках большой истории группового чата мини-разговоров - фрагментов, объединенных единым смысловым контекстом. Кроме выделения планируется классификация данных фрагментов и делание их пригодными к интеллектуальном поиску. Другой аспект - разработка методов и метафор эффективного браузинга по истории сообщений. Недавний прогресс в области человеко-машинного взаимодействия предлагает множество новых способов представления информации.