Дмитрий Береснев

Документация

Избранное

DoWell

2025

ML-разработчик, Технический руководитель

Интеллектуальная диалоговая система, которая использует Retrieval-Augmented Generation (RAG) для симуляции экспертных консультаций в различных профессиональных областях

Обязанности

▸ Реализация RAG-архитектуры для узкоспециализированных ответов
▸ Развертывание и подключение генеративных моделей
▸ Разработка бэкенда на FastAPI

Концепции

RAGLLMIndexing

Технологии

PyTorchHuggingFaceBeautifulSoupDockerFastAPI

Ресурсы

EBREG-RL: Example-Based Regular Expression Generation via Reinforcement Learning

2025

Разработчик

Система обучения с подкреплением (RL) для автоматической генерации регулярных выражений из размеченных примеров. Проект формулирует генерацию регулярных выражений как Марковский процесс принятия решений с использованием обратной польской нотации для обработки приоритета операторов

✨ Достижения

▸ Успешно сгенерированы оптимальные шаблоны регулярных выражений для задач извлечения чисел и слов
▸ Реализованы новые функции вознаграждения, сочетающие F1-метрику, метрики точности и штрафы за длину

Обязанности

▸ Сформулирована генерация регулярных выражений как MDP с пространством из 104 действий с использованием токенов ОПН
▸ Разработаны пользовательские функции вознаграждения, балансирующие точность шаблона и сложность выражения
▸ Реализованы и сравнены алгоритмы REINFORCE и A2C

Концепции

Deep Reinforcement LearningPolicy Gradient MethodsNLP

Технологии

PythonPyTorch

Ресурсы

PyFinder: быстрый поиск по документации Python

2025

Разработчик

Система информационного поиска, обеспечивающая быстрый поиск по встроенной документации Python. Платформа сочетает традиционное обратное индексирование с современным семантическим поиском на основе LLM и RAG для обработки запросов на естественном языке, включая модерацию контента и исправление орфографии

✨ Достижения

▸ Показатели с индексатором на основе LLM-эмбеддингов и Ball Tree: F1@1=0.53, nDCG@1=0.83

Обязанности

▸ Реализован семантический поиск с использованием эмбеддингов sentence-transformers и индексирования Ball Tree
▸ Разработан RAG-пайплайн с prompt engineering, извлечением контекста и отслеживанием источников
▸ Разработан корректор орфографии Норвига с частотной языковой моделью
▸ Проведена оценка с использованием метрик: специфичных для LLM и ранжирующих метрик
▸ Спроектированы FastAPI-бэкенд и Next.js-фронтенд с двумя режимами: поиск и чат

Концепции

Deep Reinforcement LearningPolicy Gradient MethodsNLP

Технологии

PythonPyTorch

Ресурсы

Обнаружение ИИ-сгенерированного Python кода с помощью ML

2025

Разработчик

Система машинного обучения для обнаружения ИИ-сгенерированного Python кода в соревнованиях по программированию. Проект сравнивает два подхода: трансформеры (CodeBERT, DeBERTa) для глубокого семантического анализа и легковесные модели на основе AST (случайный лес, деревья решений, MLP) для эффективного распознавания структурных паттернов

✨ Достижения

▸ Достигнута точность 95.9% с моделью CodeBERT на синтетическом наборе данных
▸ Разработан эффективный случайный лес на основе AST, достигающий точности 83.5% со временем работы 2мс

Обязанности

▸ Разработан пайплайн генерации набора данных с использованием 4 LLM (Evil, Llama-3.2-3b, BLACKBOX.AI, DeepSeek) со специализированными промптами
▸ Дообучены модели DeBERTa-v3 и CodeBERT
▸ Реализовано извлечение признаков на основе AST с использованием библиотеки Tree-sitter для структурного анализа кода
▸ Интегрирован фреймворк интерпретируемости LIME для интерпретации модели
▸ Проведена оценка моделей по 6 метрикам: F1 Score, ROC/AUC, Precision, Recall, Accuracy и время вывода

Концепции

TreesTransformersASTEdTech

Технологии

PythonPyTorchTransformersTree-sitterscikit-learnLIME

Ресурсы

Accept School

2023 — Настоящее время

Основатель, CEO; ранее — Ведущий разработчик

Комплексная EdTech-платформа, которая объединяет машинное обучение с современными веб-технологиями для обеспечения интерактивного опыта обучения для студентов программирования

✨ Достижения

▸ Используется в образовательных организациях
▸ Около 200 активных пользователей

Обязанности

▸ Руководство полным циклом проектирования решения
▸ Определение процессов разработки и эксплуатации
▸ Разработка системы обнаружения плагиата в коде на основе ML
▸ Внедрение генеративного ИИ для подсказок, генерации текста и изображений с использованием LLM с открытым исходным кодом
▸ Разработка бэкенда на FastAPI и MongoDB
▸ Создание фронтенда на Next.js

Концепции

EdTechGenerative AIML

Технологии

PyTorchFastAPINext.jsMongoDBDockerApache Kafka

Ресурсы

О платформе

Документация

EBREG-RL: Example-Based Regular Expression Generation via Reinforcement Learning

2025

Разработчик

Система обучения с подкреплением (RL) для автоматической генерации регулярных выражений из размеченных примеров. Проект формулирует генерацию регулярных выражений как Марковский процесс принятия решений с использованием обратной польской нотации для обработки приоритета операторов

✨ Достижения

▸ Успешно сгенерированы оптимальные шаблоны регулярных выражений для задач извлечения чисел и слов
▸ Реализованы новые функции вознаграждения, сочетающие F1-метрику, метрики точности и штрафы за длину

Обязанности

▸ Сформулирована генерация регулярных выражений как MDP с пространством из 104 действий с использованием токенов ОПН
▸ Разработаны пользовательские функции вознаграждения, балансирующие точность шаблона и сложность выражения
▸ Реализованы и сравнены алгоритмы REINFORCE и A2C

Концепции

Deep Reinforcement LearningPolicy Gradient MethodsNLP

Технологии

PythonPyTorch

Ресурсы

Обнаружение ИИ-сгенерированного Python кода с помощью ML

2025

Разработчик

Система машинного обучения для обнаружения ИИ-сгенерированного Python кода в соревнованиях по программированию. Проект сравнивает два подхода: трансформеры (CodeBERT, DeBERTa) для глубокого семантического анализа и легковесные модели на основе AST (случайный лес, деревья решений, MLP) для эффективного распознавания структурных паттернов

✨ Достижения

▸ Достигнута точность 95.9% с моделью CodeBERT на синтетическом наборе данных
▸ Разработан эффективный случайный лес на основе AST, достигающий точности 83.5% со временем работы 2мс

Обязанности

▸ Разработан пайплайн генерации набора данных с использованием 4 LLM (Evil, Llama-3.2-3b, BLACKBOX.AI, DeepSeek) со специализированными промптами
▸ Дообучены модели DeBERTa-v3 и CodeBERT
▸ Реализовано извлечение признаков на основе AST с использованием библиотеки Tree-sitter для структурного анализа кода
▸ Интегрирован фреймворк интерпретируемости LIME для интерпретации модели
▸ Проведена оценка моделей по 6 метрикам: F1 Score, ROC/AUC, Precision, Recall, Accuracy и время вывода

Концепции

TreesTransformersASTEdTech

Технологии

PythonPyTorchTransformersTree-sitterscikit-learnLIME

Ресурсы

Избранное

DoWell

2025

ML-разработчик, Технический руководитель

Интеллектуальная диалоговая система, которая использует Retrieval-Augmented Generation (RAG) для симуляции экспертных консультаций в различных профессиональных областях

Обязанности

▸ Реализация RAG-архитектуры для узкоспециализированных ответов
▸ Развертывание и подключение генеративных моделей
▸ Разработка бэкенда на FastAPI

Концепции

RAGLLMIndexing

Технологии

PyTorchHuggingFaceBeautifulSoupDockerFastAPI

Ресурсы

PyFinder: быстрый поиск по документации Python

2025

Разработчик

Система информационного поиска, обеспечивающая быстрый поиск по встроенной документации Python. Платформа сочетает традиционное обратное индексирование с современным семантическим поиском на основе LLM и RAG для обработки запросов на естественном языке, включая модерацию контента и исправление орфографии

✨ Достижения

▸ Показатели с индексатором на основе LLM-эмбеддингов и Ball Tree: F1@1=0.53, nDCG@1=0.83

Обязанности

▸ Реализован семантический поиск с использованием эмбеддингов sentence-transformers и индексирования Ball Tree
▸ Разработан RAG-пайплайн с prompt engineering, извлечением контекста и отслеживанием источников
▸ Разработан корректор орфографии Норвига с частотной языковой моделью
▸ Проведена оценка с использованием метрик: специфичных для LLM и ранжирующих метрик
▸ Спроектированы FastAPI-бэкенд и Next.js-фронтенд с двумя режимами: поиск и чат

Концепции

Deep Reinforcement LearningPolicy Gradient MethodsNLP

Технологии

PythonPyTorch

Ресурсы

Коллаборации

Paradise Crane

Основатель, ранее — ведущий разработчик

2023 — Настоящее время

Сайт

Paradise Crane

Основатель, ранее — ведущий разработчик

2023 — Настоящее время

Сайт

Команда разработчиков, революционизирующая образовательные технологии через инновационные EdTech-решения. Организация сочетает машинное обучение с современными веб-технологиями для создания доступного и функционального образовательного опыта для студентов и преподавателей. Основной текущий проект — образовательная платформа Accept

Избранные проекты

Accept School

Комплексная EdTech-платформа, сочетающая машинное обучение с современными веб-технологиями для интерактивного обучения программированию, включающая систему обнаружения плагиата кода, генеративный ИИ для подсказок и автоматизированные системы оценивания

PyTorchFastAPINext.jsMongoDBDocker

Документация Accept

Сайт

Подробная документация платформы Accept для преподавателей и студентов, также содержащая примеры использования AI-функций

Astro

Маркетинговый лендинг Accept

Маркетинговый веб-сайт, демонстрирующий возможности, преимущества и образовательное влияние платформы Accept для потенциальных пользователей и образовательных учреждений

Next.jsTypeScript

Crogs Foundation

Основатель, участник исследований

2025 — Настоящее время

Crogs Foundation

Основатель, участник исследований

2025 — Настоящее время

Сообщество увлеченных исследователей и разработчиков, посвященное продвижению передовых технологий через исследования, основанные на любознательности, и практические приложения. Фонд соединяет передовые исследования с пользовательскими реализациями, специализируясь на эволюции ИИ и интеллектуальных системах автоматизации

Избранные проекты

DoWell