Привет, я

Дмитрий Береснев

ML-инженер и Data Scientist

Dmitry Beresnev
Available
Магистрант Computer Science, специализирующийся на ИИ и науке о данных, с глубоким исследовательским интересом в математической оптимизации, больших языковых моделях и Deep Reinforcement Learning. Создаю передовые ML-решения.
AI ResearchData ScienceML OptimizationLLMDeep Learning

О себе

Я магистрант по направлению Computer Science в Университете Иннополис, специализируюсь на ИИ и науке о данных с глубоким исследовательским фокусом на оптимизации, больших языковых моделях и глубоком обучении.

Моя область интересов охватывает разработку и внедрение новых ML-моделей и функциональных пайплайнов с использованием PyTorch. Имею практический опыт работы с классическими DRL-алгоритмами, включая DQN, A2C и REINFORCE.

Также у меня есть опыт руководства проектами от идеи до внедрения, включая разработку EdTech-платформы c AI возможностями, используемой образовательными организациями.

В настоящее время ищу амбициозные и интересные R&D позиции, где смогу внести вклад в создание передовых решений в области машинного обучения и ИИ.

Исследования

Глубокое обучение, большие языковые модели и оптимизация

Технические навыки

PyTorch, PuLP, Scikit-learn, TRL и современные ML-фреймворки

Образование

Магистрант ИИ и науки о данных

Проекты

Full-stack ML-системы от исследований до внедрения

Языки

Русский Носитель
Английский C1 (Продвинутый)

Образование

Магистр, Компьютерные науки

Университет Иннополис

Иннополис, Россия

2024 — 2026

Специализация: Искусственный интеллект и наука о данных

Дипломная работа

Новые и эффективные методы идентификации на основе граней для факторизации матриц с симплексной структурой и неполным рангом

Научный руководитель: Valentin Leplat

Со-руководители:

  • Nicolas Gillis

Ключевые курсы

Анализ многомерных данных Продвинутая статистика Продвинутое машинное обучение

Бакалавр, Компьютерные науки

Университет Иннополис

Иннополис, Россия

4.95/5.0 GPA
2020 — 2024

Специализация: Искусственный интеллект и наука о данных

Дипломная работа

Определение текстового плагиата в области больших языковых моделей с использованием обучения с подкреплением

Научный руководитель: Армен Бекларян

Ключевые курсы

Методы оптимизации в машинном обучении Обучение с подкреплением Обработка естественного языка Практическое глубокое обучение

Исследовательский опыт

Huawei: Беспроводная передача данных

Исследователь, ML-инженер

ИСП РАН и Университет Иннополис

2024 — Настоящее время

Проектирование и симуляция глубоких ИИ моделей для распределения устройств беспроводной на базовые станций с учетом временных и ресурсных ограничений для Huawei

Руководитель: Александр Безносиков

Обязанности

  • Разработка и внедрение моделей на PyTorch
  • Создание и расширение пайплайна обучения-тестирования
  • Проведение экспериментов

Концепции

Transformers GNNs Deep Learning

Технологии

PyTorchNumpy

Diligent Learning: Перспективы и Применения

Исследователь, ML-инженер

ИИ Центр МГУ

2025 — Настоящее время

Реализация и тестирование Diligent Learning: нового подхода к файнтьюнингу LLMs для решения задач логического мышления. На основе статьи 'From Reasoning to Super-Intelligence: A Search-Theoretic Perspective' by Shai Shalev-Shwartz and Amnon Shashua

Руководитель: Петр Анохин

Обязанности

  • Создание и внедрение пайплайна diligent learning
  • Файнтьюнинг больших языковых моделей в новой парадигме
  • Проведение экспериментов

Концепции

LLMs Reasoning Deep Learning

Технологии

PythonTRLTensorBoard

Новые и эффективные методы идентификации на основе граней для факторизации матриц с симплексной структурой и неполным рангом

Исследователь

Университет Иннополис

2025 — Настоящее время

Исследование в рамках дипломной работы магистра о новых методов идентификации граней многогранников для SSMF с целью улучшения существующего алгоритма GFPI

Руководитель: Valentin Leplat

Со-руководители:

  • Nicolas Gillis

Обязанности

  • Разработка и реализация новых методов идентификации граней многогранников
  • Обзор современных методов SSMF и методов идентификации граней
  • Проведение экспериментов

Концепции

Оптимизация с ограничениями Линейное программирование

Технологии

PuLPNumpyCVXPYScikit-Learn

Applied AlphaEvolve: CAD Reconstruction and Combinatorial Geometry

Исследователь

Skoltech Summer School of Machine Learning (SMILES-2025)

2025

Исследовательский проект по применению OpenEvolve (открытая реализация AlphaEvolve) для реконструкции CAD-моделей из текстовых описаний и решения задач комбинаторной геометрии с использованием эволюционного поиска на основе больших языковых моделей

Руководитель: Петр Анохин

Достижения

  • Достигнут комбинированный показатель 6.728 при реконструкции трубы с использованием эволюционного подхода
  • Получены оптимальные результаты разбиения шара, соответствующие теоретическим границам в размерностях 2-13
  • Превзойдены базовые показатели zero-shot LLM на множестве сложных 3D-форм
  • Разработан комплексный алгоритм бенчмарка для реконструкции CAD с 7 метриками оценки

Обязанности

  • Реализация фреймворка OpenEvolve для задачи реконструкции CAD
  • Разработка метрик оценки, включая IoU, Chamfer Distance и Hausdorff Distance
  • Анализ эволюционных траектории для коррекции структурных и параметрических ошибок

Концепции

LLMs Evolutionary Algorithms CAD Reconstruction Multi-Agent Systems

Технологии

PythonCadQueryNumPyTrimeshSciPy

Обнаружение текстового плагиата в области LLM с использованием RL

Исследователь

Университет Иннополис

2024

Исследование в рамках дипломной работы бакалавра о новом подходе к обнаружению текстового плагиата с использованием Deep Reinforcement Learning

Руководитель: Армен Бекларян

Достижения

  • Наилучший MSE 0.108 на синтетическом наборе данных
  • Предложены три архитектуры на основе DQN, A2C и REINFORCE
  • Наилучшие результаты достигнуты моделью на основе REINFORCE

Обязанности

  • Разработан новый подход на основе DRL
  • Реализованы и протестированы несколько архитектур
  • Проведены и проанализированы комплексные эксперименты

Концепции

Reinforcement Learning LLM Deep Learning

Технологии

PyTorchNumpyPandas

Ресурсы

Опыт работы

ML-разработчик

ЦИПР Иннополис

2025

Проектирование и реализация RAG-пайплайна для проприетарных репозиториев фронтенда на Angular

Достижения

  • Подтверждение качества RAG-пайплайна по gold queries, предоставленным экспертами

Обязанности

  • Создание индексеров: Invert Index, BallTree с эмбеддингами, полученными от предобученной модели, и частично Faiss
  • Подключение локальных генеративных моделей
  • Проектирование пайплайна сбора данных, генерации эмбеддингов, индексации и запроса

Концепции

RAG LLM Indexing

Технологии

PyTorchHuggingFaceDockerPostgreSQLFastAPI

ML-инженер

Газпром ЦПС

2024

Разработка и обучение предсказательной ML-модели для выявления причин дефектов на строительных объектах

Достижения

  • Достижение точности 80% на проприетарном наборе данных

Обязанности

  • Предварительная обработка данных и инжиниринг признаков
  • Создание и валидация модели
  • Разработка полного рабочего пайплайна

Концепции

Модели на основе деревьев MLP-модели Ансамблевые методы Трансформеры

Технологии

PyTorchNumpyScikit-learnPandas

ML-разработчик

Передовая инженерная школа УИ

2023

Разработка модели генерации кода с использованием архитектуры трансформера

Достижения

  • Значительный вклад в исследование

Обязанности

  • Дообучение модели Gorilla на проприетарном наборе данных

Концепции

LLM Transformers LoRa

Технологии

PyTorchNumpyPandas

Ресурсы

Опыт преподавания

Ассистент преподавателя

Университет Иннополис

2025

Ассистент преподавателя по курсу 'Введение в методы оптимизации' для бакалавров второго курса

Обязанности

  • Проведение тестов и лабораторных работ

Концепции

Оптимизация Линейное программирование

Технологии

NumpyCVXPYPyTorch

Ассистент преподавателя

Летняя школа Яндекса по математике в ИИ

2024

Ассистент преподавателя в студенческом лагере по курсу 'Методы оптимизации в машинном обучении'

Руководитель: Александр Безносиков

Обязанности

  • Разработка и преподавание материалов для семинаров и домашних заданий

Концепции

Оптимизация Линейное программирование

Технологии

PyTorchNumpyJAXCVXPY

Проекты

Избранное

Accept School

2023 — Настоящее время

Основатель, CEO; ранее — Ведущий разработчик

Комплексная EdTech-платформа, которая объединяет машинное обучение с современными веб-технологиями для обеспечения интерактивного опыта обучения для студентов программирования

✨ Достижения

  • Используется в образовательных организациях
  • Около 200 активных пользователей

Обязанности

  • Руководство полным циклом проектирования решения
  • Определение процессов разработки и эксплуатации
  • Разработка системы обнаружения плагиата в коде на основе ML
  • Внедрение генеративного ИИ для подсказок, генерации текста и изображений с использованием LLM с открытым исходным кодом
  • Разработка бэкенда на FastAPI и MongoDB
  • Создание фронтенда на Next.js

Концепции

EdTechGenerative AIML

Технологии

PyTorchFastAPINext.jsMongoDBDockerApache Kafka
Избранное

DoWell

2025

ML-разработчик, Технический руководитель

Интеллектуальная диалоговая система, которая использует Retrieval-Augmented Generation (RAG) для симуляции экспертных консультаций в различных профессиональных областях

Обязанности

  • Реализация RAG-архитектуры для узкоспециализированных ответов
  • Развертывание и подключение генеративных моделей
  • Разработка бэкенда на FastAPI

Концепции

RAGLLMIndexing

Технологии

PyTorchHuggingFaceBeautifulSoupDockerFastAPI

Ресурсы

EBREG-RL: Example-Based Regular Expression Generation via Reinforcement Learning

2025

Разработчик

Система обучения с подкреплением (RL) для автоматической генерации регулярных выражений из размеченных примеров. Проект формулирует генерацию регулярных выражений как Марковский процесс принятия решений с использованием обратной польской нотации для обработки приоритета операторов

✨ Достижения

  • Успешно сгенерированы оптимальные шаблоны регулярных выражений для задач извлечения чисел и слов
  • Реализованы новые функции вознаграждения, сочетающие F1-метрику, метрики точности и штрафы за длину

Обязанности

  • Сформулирована генерация регулярных выражений как MDP с пространством из 104 действий с использованием токенов ОПН
  • Разработаны пользовательские функции вознаграждения, балансирующие точность шаблона и сложность выражения
  • Реализованы и сравнены алгоритмы REINFORCE и A2C

Концепции

Deep Reinforcement LearningPolicy Gradient MethodsNLP

Технологии

PythonPyTorch

Ресурсы

PyFinder: быстрый поиск по документации Python

2025

Разработчик

Система информационного поиска, обеспечивающая быстрый поиск по встроенной документации Python. Платформа сочетает традиционное обратное индексирование с современным семантическим поиском на основе LLM и RAG для обработки запросов на естественном языке, включая модерацию контента и исправление орфографии

✨ Достижения

  • Показатели с индексатором на основе LLM-эмбеддингов и Ball Tree: F1@1=0.53, nDCG@1=0.83

Обязанности

  • Реализован семантический поиск с использованием эмбеддингов sentence-transformers и индексирования Ball Tree
  • Разработан RAG-пайплайн с prompt engineering, извлечением контекста и отслеживанием источников
  • Разработан корректор орфографии Норвига с частотной языковой моделью
  • Проведена оценка с использованием метрик: специфичных для LLM и ранжирующих метрик
  • Спроектированы FastAPI-бэкенд и Next.js-фронтенд с двумя режимами: поиск и чат

Концепции

Deep Reinforcement LearningPolicy Gradient MethodsNLP

Технологии

PythonPyTorch

Ресурсы

Обнаружение ИИ-сгенерированного Python кода с помощью ML

2025

Разработчик

Система машинного обучения для обнаружения ИИ-сгенерированного Python кода в соревнованиях по программированию. Проект сравнивает два подхода: трансформеры (CodeBERT, DeBERTa) для глубокого семантического анализа и легковесные модели на основе AST (случайный лес, деревья решений, MLP) для эффективного распознавания структурных паттернов

✨ Достижения

  • Достигнута точность 95.9% с моделью CodeBERT на синтетическом наборе данных
  • Разработан эффективный случайный лес на основе AST, достигающий точности 83.5% со временем работы 2мс

Обязанности

  • Разработан пайплайн генерации набора данных с использованием 4 LLM (Evil, Llama-3.2-3b, BLACKBOX.AI, DeepSeek) со специализированными промптами
  • Дообучены модели DeBERTa-v3 и CodeBERT
  • Реализовано извлечение признаков на основе AST с использованием библиотеки Tree-sitter для структурного анализа кода
  • Интегрирован фреймворк интерпретируемости LIME для интерпретации модели
  • Проведена оценка моделей по 6 метрикам: F1 Score, ROC/AUC, Precision, Recall, Accuracy и время вывода

Концепции

TreesTransformersASTEdTech

Технологии

PythonPyTorchTransformersTree-sitterscikit-learnLIME

Ресурсы

Рекомендательная система по методам приближенной факторизации матриц

2024

Разработчик

Рекомендательная система, построенная на методах приближенной факторизации матриц для синтетического набора данных. Проект исследует множество подходов к оптимизации, таких как градиентные методы с различными стратегиями выбора шага (правило Армихо, условия Вольфе, оценка константы Липшица), продвинутые оптимизаторы (Adam, RMSprop, AdaGrad, Heavy Ball, Nesterov) и векторные обновления для решения задачи collaborative filtering

✨ Достижения

  • Реализовано 12+ алгоритмов оптимизации с 7 стратегиями выбора шага
  • Проведено сравнение полноматричных и построчных/постолбцовых (Vector GD) стратегий обновления

Обязанности

  • Сформулирована задача рекомендации как задача факторизации матриц
  • Реализовано 6 продвинутых оптимизаторов: Adaptive GD, Heavy Ball, Nesterov momentum, AdaGrad, RMSprop, Adam, BFGS
  • Проведены эксперименты с неотрицательной матричной факторизацией (NNMF) с использованием мультипликативных обновлений
  • Обучена нейронная сеть в качестве базовой модели с признаками жанров и демографии

Концепции

Matrix FactorizationCollaborative FilteringRecSys

Технологии

PythonNumPyscikit-learnPyTorch

Ресурсы

Коллаборации

Paradise Crane logo

Paradise Crane

Основатель, ранее — ведущий разработчик

2023 — Настоящее время

Команда разработчиков, революционизирующая образовательные технологии через инновационные EdTech-решения. Организация сочетает машинное обучение с современными веб-технологиями для создания доступного и функционального образовательного опыта для студентов и преподавателей. Основной текущий проект — образовательная платформа Accept

Избранные проекты

Комплексная EdTech-платформа, сочетающая машинное обучение с современными веб-технологиями для интерактивного обучения программированию, включающая систему обнаружения плагиата кода, генеративный ИИ для подсказок и автоматизированные системы оценивания

PyTorchFastAPINext.jsMongoDBDocker
Документация Accept

Подробная документация платформы Accept для преподавателей и студентов, также содержащая примеры использования AI-функций

Astro
Маркетинговый лендинг Accept

Маркетинговый веб-сайт, демонстрирующий возможности, преимущества и образовательное влияние платформы Accept для потенциальных пользователей и образовательных учреждений

Next.jsTypeScript
Crogs Foundation logo

Crogs Foundation

Основатель, участник исследований

2025 — Настоящее время

Сообщество увлеченных исследователей и разработчиков, посвященное продвижению передовых технологий через исследования, основанные на любознательности, и практические приложения. Фонд соединяет передовые исследования с пользовательскими реализациями, специализируясь на эволюции ИИ и интеллектуальных системах автоматизации

Избранные проекты

Интеллектуальная диалоговая система, использующая Retrieval-Augmented Generation (RAG) для имитации экспертных консультаций в различных профессиональных областях

PythonHuggingFaceRAGLLM
Прикладной AlphaEvolve (SMILES'25)

Исследовательский проект, применяющий OpenEvolve (открытую версию AlphaEvolve) для реконструкции CAD-моделей из текстовых описаний и решения комбинаторных геометрических задач с использованием эволюционного поиска на основе LLM

PythonLLMsEvolutionary AlgorithmsCadQuerySciPy
Crogs Bot

Многофункциональный Telegram-бот, предоставляющий интеллектуальную автоматизацию и интерактивные функции для парсинга новостей, переводов и развлечения пользователей через обработку естественного языка

PythonTelegram Bot APINLP

Связаться

В настоящее время ищу интересные R&D возможности в области машинного обучения и ИИ. Буду рад связи!

GitHub

@dsomni

Telegram

@dsomni