Привет, я
Дмитрий Береснев
ML-инженер и Data Scientist
О себе
Я магистрант по направлению Computer Science в Университете Иннополис, специализируюсь на ИИ и науке о данных с глубоким исследовательским фокусом на оптимизации, больших языковых моделях и глубоком обучении.
Моя область интересов охватывает разработку и внедрение новых ML-моделей и функциональных пайплайнов с использованием PyTorch. Имею практический опыт работы с классическими DRL-алгоритмами, включая DQN, A2C и REINFORCE.
Также у меня есть опыт руководства проектами от идеи до внедрения, включая разработку EdTech-платформы c AI возможностями, используемой образовательными организациями.
В настоящее время ищу амбициозные и интересные R&D позиции, где смогу внести вклад в создание передовых решений в области машинного обучения и ИИ.
Исследования
Глубокое обучение, большие языковые модели и оптимизация
Технические навыки
PyTorch, PuLP, Scikit-learn, TRL и современные ML-фреймворки
Образование
Магистрант ИИ и науки о данных
Проекты
Full-stack ML-системы от исследований до внедрения
Языки
Образование
Магистр, Компьютерные науки
Университет Иннополис
Иннополис, Россия
Специализация: Искусственный интеллект и наука о данных
Дипломная работа
Новые и эффективные методы идентификации на основе граней для факторизации матриц с симплексной структурой и неполным рангом
Научный руководитель: Valentin Leplat
Со-руководители:
- ▸ Nicolas Gillis
Ключевые курсы
Бакалавр, Компьютерные науки
Университет Иннополис
Иннополис, Россия
Специализация: Искусственный интеллект и наука о данных
Дипломная работа
Определение текстового плагиата в области больших языковых моделей с использованием обучения с подкреплением
Научный руководитель: Армен Бекларян
Ключевые курсы
Исследовательский опыт
Huawei: Беспроводная передача данных
Исследователь, ML-инженер
ИСП РАН и Университет Иннополис
Проектирование и симуляция глубоких ИИ моделей для распределения устройств беспроводной на базовые станций с учетом временных и ресурсных ограничений для Huawei
Руководитель: Александр Безносиков
Обязанности
- ▸ Разработка и внедрение моделей на PyTorch
- ▸ Создание и расширение пайплайна обучения-тестирования
- ▸ Проведение экспериментов
Концепции
Технологии
Diligent Learning: Перспективы и Применения
Исследователь, ML-инженер
ИИ Центр МГУ
Реализация и тестирование Diligent Learning: нового подхода к файнтьюнингу LLMs для решения задач логического мышления. На основе статьи 'From Reasoning to Super-Intelligence: A Search-Theoretic Perspective' by Shai Shalev-Shwartz and Amnon Shashua
Руководитель: Петр Анохин
Обязанности
- ▸ Создание и внедрение пайплайна diligent learning
- ▸ Файнтьюнинг больших языковых моделей в новой парадигме
- ▸ Проведение экспериментов
Концепции
Технологии
Ресурсы
Новые и эффективные методы идентификации на основе граней для факторизации матриц с симплексной структурой и неполным рангом
Исследователь
Университет Иннополис
Исследование в рамках дипломной работы магистра о новых методов идентификации граней многогранников для SSMF с целью улучшения существующего алгоритма GFPI
Руководитель: Valentin Leplat
Со-руководители:
- ▸ Nicolas Gillis
Обязанности
- ▸ Разработка и реализация новых методов идентификации граней многогранников
- ▸ Обзор современных методов SSMF и методов идентификации граней
- ▸ Проведение экспериментов
Концепции
Технологии
Applied AlphaEvolve: CAD Reconstruction and Combinatorial Geometry
Исследователь
Skoltech Summer School of Machine Learning (SMILES-2025)
Исследовательский проект по применению OpenEvolve (открытая реализация AlphaEvolve) для реконструкции CAD-моделей из текстовых описаний и решения задач комбинаторной геометрии с использованием эволюционного поиска на основе больших языковых моделей
Руководитель: Петр Анохин
Достижения
- ▸ Достигнут комбинированный показатель 6.728 при реконструкции трубы с использованием эволюционного подхода
- ▸ Получены оптимальные результаты разбиения шара, соответствующие теоретическим границам в размерностях 2-13
- ▸ Превзойдены базовые показатели zero-shot LLM на множестве сложных 3D-форм
- ▸ Разработан комплексный алгоритм бенчмарка для реконструкции CAD с 7 метриками оценки
Обязанности
- ▸ Реализация фреймворка OpenEvolve для задачи реконструкции CAD
- ▸ Разработка метрик оценки, включая IoU, Chamfer Distance и Hausdorff Distance
- ▸ Анализ эволюционных траектории для коррекции структурных и параметрических ошибок
Концепции
Технологии
Ресурсы
Обнаружение текстового плагиата в области LLM с использованием RL
Исследователь
Университет Иннополис
Исследование в рамках дипломной работы бакалавра о новом подходе к обнаружению текстового плагиата с использованием Deep Reinforcement Learning
Руководитель: Армен Бекларян
Достижения
- ▸ Наилучший MSE 0.108 на синтетическом наборе данных
- ▸ Предложены три архитектуры на основе DQN, A2C и REINFORCE
- ▸ Наилучшие результаты достигнуты моделью на основе REINFORCE
Обязанности
- ▸ Разработан новый подход на основе DRL
- ▸ Реализованы и протестированы несколько архитектур
- ▸ Проведены и проанализированы комплексные эксперименты
Концепции
Технологии
Ресурсы
Опыт работы
ML-разработчик
ЦИПР Иннополис
Проектирование и реализация RAG-пайплайна для проприетарных репозиториев фронтенда на Angular
Достижения
- ▸ Подтверждение качества RAG-пайплайна по gold queries, предоставленным экспертами
Обязанности
- ▸ Создание индексеров: Invert Index, BallTree с эмбеддингами, полученными от предобученной модели, и частично Faiss
- ▸ Подключение локальных генеративных моделей
- ▸ Проектирование пайплайна сбора данных, генерации эмбеддингов, индексации и запроса
Концепции
Технологии
ML-инженер
Газпром ЦПС
Разработка и обучение предсказательной ML-модели для выявления причин дефектов на строительных объектах
Достижения
- ▸ Достижение точности 80% на проприетарном наборе данных
Обязанности
- ▸ Предварительная обработка данных и инжиниринг признаков
- ▸ Создание и валидация модели
- ▸ Разработка полного рабочего пайплайна
Концепции
Технологии
ML-разработчик
Передовая инженерная школа УИ
Разработка модели генерации кода с использованием архитектуры трансформера
Достижения
- ▸ Значительный вклад в исследование
Обязанности
- ▸ Дообучение модели Gorilla на проприетарном наборе данных
Концепции
Технологии
Ресурсы
Опыт преподавания
Ассистент преподавателя
Университет Иннополис
Ассистент преподавателя по курсу 'Введение в методы оптимизации' для бакалавров второго курса
Обязанности
- ▸ Проведение тестов и лабораторных работ
Концепции
Технологии
Ассистент преподавателя
Летняя школа Яндекса по математике в ИИ
Ассистент преподавателя в студенческом лагере по курсу 'Методы оптимизации в машинном обучении'
Руководитель: Александр Безносиков
Обязанности
- ▸ Разработка и преподавание материалов для семинаров и домашних заданий
Концепции
Технологии
Ресурсы
Проекты
Accept School
2023 — Настоящее времяОснователь, CEO; ранее — Ведущий разработчик
Комплексная EdTech-платформа, которая объединяет машинное обучение с современными веб-технологиями для обеспечения интерактивного опыта обучения для студентов программирования
✨ Достижения
- ▸ Используется в образовательных организациях
- ▸ Около 200 активных пользователей
Обязанности
- ▸ Руководство полным циклом проектирования решения
- ▸ Определение процессов разработки и эксплуатации
- ▸ Разработка системы обнаружения плагиата в коде на основе ML
- ▸ Внедрение генеративного ИИ для подсказок, генерации текста и изображений с использованием LLM с открытым исходным кодом
- ▸ Разработка бэкенда на FastAPI и MongoDB
- ▸ Создание фронтенда на Next.js
Концепции
Технологии
Ресурсы
DoWell
2025ML-разработчик, Технический руководитель
Интеллектуальная диалоговая система, которая использует Retrieval-Augmented Generation (RAG) для симуляции экспертных консультаций в различных профессиональных областях
Обязанности
- ▸ Реализация RAG-архитектуры для узкоспециализированных ответов
- ▸ Развертывание и подключение генеративных моделей
- ▸ Разработка бэкенда на FastAPI
Концепции
Технологии
Ресурсы
EBREG-RL: Example-Based Regular Expression Generation via Reinforcement Learning
2025Разработчик
Система обучения с подкреплением (RL) для автоматической генерации регулярных выражений из размеченных примеров. Проект формулирует генерацию регулярных выражений как Марковский процесс принятия решений с использованием обратной польской нотации для обработки приоритета операторов
✨ Достижения
- ▸ Успешно сгенерированы оптимальные шаблоны регулярных выражений для задач извлечения чисел и слов
- ▸ Реализованы новые функции вознаграждения, сочетающие F1-метрику, метрики точности и штрафы за длину
Обязанности
- ▸ Сформулирована генерация регулярных выражений как MDP с пространством из 104 действий с использованием токенов ОПН
- ▸ Разработаны пользовательские функции вознаграждения, балансирующие точность шаблона и сложность выражения
- ▸ Реализованы и сравнены алгоритмы REINFORCE и A2C
Концепции
Технологии
Ресурсы
PyFinder: быстрый поиск по документации Python
2025Разработчик
Система информационного поиска, обеспечивающая быстрый поиск по встроенной документации Python. Платформа сочетает традиционное обратное индексирование с современным семантическим поиском на основе LLM и RAG для обработки запросов на естественном языке, включая модерацию контента и исправление орфографии
✨ Достижения
- ▸ Показатели с индексатором на основе LLM-эмбеддингов и Ball Tree: F1@1=0.53, nDCG@1=0.83
Обязанности
- ▸ Реализован семантический поиск с использованием эмбеддингов sentence-transformers и индексирования Ball Tree
- ▸ Разработан RAG-пайплайн с prompt engineering, извлечением контекста и отслеживанием источников
- ▸ Разработан корректор орфографии Норвига с частотной языковой моделью
- ▸ Проведена оценка с использованием метрик: специфичных для LLM и ранжирующих метрик
- ▸ Спроектированы FastAPI-бэкенд и Next.js-фронтенд с двумя режимами: поиск и чат
Концепции
Технологии
Ресурсы
Обнаружение ИИ-сгенерированного Python кода с помощью ML
2025Разработчик
Система машинного обучения для обнаружения ИИ-сгенерированного Python кода в соревнованиях по программированию. Проект сравнивает два подхода: трансформеры (CodeBERT, DeBERTa) для глубокого семантического анализа и легковесные модели на основе AST (случайный лес, деревья решений, MLP) для эффективного распознавания структурных паттернов
✨ Достижения
- ▸ Достигнута точность 95.9% с моделью CodeBERT на синтетическом наборе данных
- ▸ Разработан эффективный случайный лес на основе AST, достигающий точности 83.5% со временем работы 2мс
Обязанности
- ▸ Разработан пайплайн генерации набора данных с использованием 4 LLM (Evil, Llama-3.2-3b, BLACKBOX.AI, DeepSeek) со специализированными промптами
- ▸ Дообучены модели DeBERTa-v3 и CodeBERT
- ▸ Реализовано извлечение признаков на основе AST с использованием библиотеки Tree-sitter для структурного анализа кода
- ▸ Интегрирован фреймворк интерпретируемости LIME для интерпретации модели
- ▸ Проведена оценка моделей по 6 метрикам: F1 Score, ROC/AUC, Precision, Recall, Accuracy и время вывода
Концепции
Технологии
Ресурсы
Рекомендательная система по методам приближенной факторизации матриц
2024Разработчик
Рекомендательная система, построенная на методах приближенной факторизации матриц для синтетического набора данных. Проект исследует множество подходов к оптимизации, таких как градиентные методы с различными стратегиями выбора шага (правило Армихо, условия Вольфе, оценка константы Липшица), продвинутые оптимизаторы (Adam, RMSprop, AdaGrad, Heavy Ball, Nesterov) и векторные обновления для решения задачи collaborative filtering
✨ Достижения
- ▸ Реализовано 12+ алгоритмов оптимизации с 7 стратегиями выбора шага
- ▸ Проведено сравнение полноматричных и построчных/постолбцовых (Vector GD) стратегий обновления
Обязанности
- ▸ Сформулирована задача рекомендации как задача факторизации матриц
- ▸ Реализовано 6 продвинутых оптимизаторов: Adaptive GD, Heavy Ball, Nesterov momentum, AdaGrad, RMSprop, Adam, BFGS
- ▸ Проведены эксперименты с неотрицательной матричной факторизацией (NNMF) с использованием мультипликативных обновлений
- ▸ Обучена нейронная сеть в качестве базовой модели с признаками жанров и демографии
Концепции
Технологии
Ресурсы
Accept School
2023 — Настоящее времяОснователь, CEO; ранее — Ведущий разработчик
Комплексная EdTech-платформа, которая объединяет машинное обучение с современными веб-технологиями для обеспечения интерактивного опыта обучения для студентов программирования
✨ Достижения
- ▸ Используется в образовательных организациях
- ▸ Около 200 активных пользователей
Обязанности
- ▸ Руководство полным циклом проектирования решения
- ▸ Определение процессов разработки и эксплуатации
- ▸ Разработка системы обнаружения плагиата в коде на основе ML
- ▸ Внедрение генеративного ИИ для подсказок, генерации текста и изображений с использованием LLM с открытым исходным кодом
- ▸ Разработка бэкенда на FastAPI и MongoDB
- ▸ Создание фронтенда на Next.js
Концепции
Технологии
Ресурсы
EBREG-RL: Example-Based Regular Expression Generation via Reinforcement Learning
2025Разработчик
Система обучения с подкреплением (RL) для автоматической генерации регулярных выражений из размеченных примеров. Проект формулирует генерацию регулярных выражений как Марковский процесс принятия решений с использованием обратной польской нотации для обработки приоритета операторов
✨ Достижения
- ▸ Успешно сгенерированы оптимальные шаблоны регулярных выражений для задач извлечения чисел и слов
- ▸ Реализованы новые функции вознаграждения, сочетающие F1-метрику, метрики точности и штрафы за длину
Обязанности
- ▸ Сформулирована генерация регулярных выражений как MDP с пространством из 104 действий с использованием токенов ОПН
- ▸ Разработаны пользовательские функции вознаграждения, балансирующие точность шаблона и сложность выражения
- ▸ Реализованы и сравнены алгоритмы REINFORCE и A2C
Концепции
Технологии
Ресурсы
Обнаружение ИИ-сгенерированного Python кода с помощью ML
2025Разработчик
Система машинного обучения для обнаружения ИИ-сгенерированного Python кода в соревнованиях по программированию. Проект сравнивает два подхода: трансформеры (CodeBERT, DeBERTa) для глубокого семантического анализа и легковесные модели на основе AST (случайный лес, деревья решений, MLP) для эффективного распознавания структурных паттернов
✨ Достижения
- ▸ Достигнута точность 95.9% с моделью CodeBERT на синтетическом наборе данных
- ▸ Разработан эффективный случайный лес на основе AST, достигающий точности 83.5% со временем работы 2мс
Обязанности
- ▸ Разработан пайплайн генерации набора данных с использованием 4 LLM (Evil, Llama-3.2-3b, BLACKBOX.AI, DeepSeek) со специализированными промптами
- ▸ Дообучены модели DeBERTa-v3 и CodeBERT
- ▸ Реализовано извлечение признаков на основе AST с использованием библиотеки Tree-sitter для структурного анализа кода
- ▸ Интегрирован фреймворк интерпретируемости LIME для интерпретации модели
- ▸ Проведена оценка моделей по 6 метрикам: F1 Score, ROC/AUC, Precision, Recall, Accuracy и время вывода
Концепции
Технологии
Ресурсы
DoWell
2025ML-разработчик, Технический руководитель
Интеллектуальная диалоговая система, которая использует Retrieval-Augmented Generation (RAG) для симуляции экспертных консультаций в различных профессиональных областях
Обязанности
- ▸ Реализация RAG-архитектуры для узкоспециализированных ответов
- ▸ Развертывание и подключение генеративных моделей
- ▸ Разработка бэкенда на FastAPI
Концепции
Технологии
Ресурсы
PyFinder: быстрый поиск по документации Python
2025Разработчик
Система информационного поиска, обеспечивающая быстрый поиск по встроенной документации Python. Платформа сочетает традиционное обратное индексирование с современным семантическим поиском на основе LLM и RAG для обработки запросов на естественном языке, включая модерацию контента и исправление орфографии
✨ Достижения
- ▸ Показатели с индексатором на основе LLM-эмбеддингов и Ball Tree: F1@1=0.53, nDCG@1=0.83
Обязанности
- ▸ Реализован семантический поиск с использованием эмбеддингов sentence-transformers и индексирования Ball Tree
- ▸ Разработан RAG-пайплайн с prompt engineering, извлечением контекста и отслеживанием источников
- ▸ Разработан корректор орфографии Норвига с частотной языковой моделью
- ▸ Проведена оценка с использованием метрик: специфичных для LLM и ранжирующих метрик
- ▸ Спроектированы FastAPI-бэкенд и Next.js-фронтенд с двумя режимами: поиск и чат
Концепции
Технологии
Ресурсы
Рекомендательная система по методам приближенной факторизации матриц
2024Разработчик
Рекомендательная система, построенная на методах приближенной факторизации матриц для синтетического набора данных. Проект исследует множество подходов к оптимизации, таких как градиентные методы с различными стратегиями выбора шага (правило Армихо, условия Вольфе, оценка константы Липшица), продвинутые оптимизаторы (Adam, RMSprop, AdaGrad, Heavy Ball, Nesterov) и векторные обновления для решения задачи collaborative filtering
✨ Достижения
- ▸ Реализовано 12+ алгоритмов оптимизации с 7 стратегиями выбора шага
- ▸ Проведено сравнение полноматричных и построчных/постолбцовых (Vector GD) стратегий обновления
Обязанности
- ▸ Сформулирована задача рекомендации как задача факторизации матриц
- ▸ Реализовано 6 продвинутых оптимизаторов: Adaptive GD, Heavy Ball, Nesterov momentum, AdaGrad, RMSprop, Adam, BFGS
- ▸ Проведены эксперименты с неотрицательной матричной факторизацией (NNMF) с использованием мультипликативных обновлений
- ▸ Обучена нейронная сеть в качестве базовой модели с признаками жанров и демографии
Концепции
Технологии
Ресурсы
Коллаборации
Команда разработчиков, революционизирующая образовательные технологии через инновационные EdTech-решения. Организация сочетает машинное обучение с современными веб-технологиями для создания доступного и функционального образовательного опыта для студентов и преподавателей. Основной текущий проект — образовательная платформа Accept
Избранные проекты
Accept School
Комплексная EdTech-платформа, сочетающая машинное обучение с современными веб-технологиями для интерактивного обучения программированию, включающая систему обнаружения плагиата кода, генеративный ИИ для подсказок и автоматизированные системы оценивания
Документация Accept
Подробная документация платформы Accept для преподавателей и студентов, также содержащая примеры использования AI-функций
Crogs Foundation
Основатель, участник исследований
Сообщество увлеченных исследователей и разработчиков, посвященное продвижению передовых технологий через исследования, основанные на любознательности, и практические приложения. Фонд соединяет передовые исследования с пользовательскими реализациями, специализируясь на эволюции ИИ и интеллектуальных системах автоматизации
Избранные проекты
DoWell
Интеллектуальная диалоговая система, использующая Retrieval-Augmented Generation (RAG) для имитации экспертных консультаций в различных профессиональных областях
Исследовательский проект, применяющий OpenEvolve (открытую версию AlphaEvolve) для реконструкции CAD-моделей из текстовых описаний и решения комбинаторных геометрических задач с использованием эволюционного поиска на основе LLM
Связаться
В настоящее время ищу интересные R&D возможности в области машинного обучения и ИИ. Буду рад связи!