Конференция R&D команд по развитию machine learning
24 сентября, 11:00 (МСК, GMT+3), Москва+онлайн
Конференция R&D команд по развитию machine learning
24 сентября, 11:00 (МСК, GMT+3), Москва+онлайн
расписание
Александр Нагаев Модератор
Дмитрий Балиев Модератор
Трек 2
19:00 – 21:30
Афтерпати для офлайн-участников
16:00 – 16:30
Кофе-брейк
13:30 – 14:30
Обед
Александр Капитанов Модератор
Борис Жестков Модератор
Трек 1
Открытие
11:00 – 11:30
10:00 – 11:00
Регистрация офлайн-участников
19:00 – 21:30
Афтерпати для офлайн-участников
16:00 – 16:30
Кофе-брейк
13:30 – 14:30
Обед
Открытие
11:00 – 11:30
10:00 – 11:00
Регистрация офлайн-участников
расписание
Александр Капитанов Модератор
Борис Жестков Модератор
19:00 – 21:30
Афтерпати для офлайн-участников
16:00 – 16:30
Кофе-брейк
13:30 – 14:30
Обед
Открытие
11:00 – 11:30
10:00 – 11:00
Регистрация офлайн-участников
расписание
Александр Нагаев Модератор
Дмитрий Балиев Модератор
Письмо со ссылкой на трансляцию придет на ваш e-mail за час до начала события
Количество мест в очном формате ограничено, организаторы направят приглашение на e-mail
Сбер — один из крупнейших банков в России и ведущих глобальных финансовых институтов.

Важной частью работы Сбера является создание и внедрение современных технологий, таких как искусственный интеллект, направленных на благо как компании, так и государства.

Сбер входит в состав «Альянса в сфере искусственного интеллекта», активно взаимодействует с передовыми образовательными, научными и технологическими компаниями страны.

Сбер — организатор крупнейшей в России международной ежегодной конференции по искусственному интеллекту и машинному обучению AI Journey («Путешествие в мир искусственного интеллекта»), которая собирает ведущих ИИ-экспертов со всего мира для обсуждения применения технологий в науке, бизнесе и социальной сфере.

Сбер предлагает широкие перспективы для профессионального роста и развития благодаря современному техническому обеспечению, глубокой экспертизе, эффективной системе менторства и многообразию проектных направлений
Ctrl+Z для LLM: учим модели откатывать глупости
Инесса Фёдорова
Senior NLP Engineer, TechLead направления развития reasoning-способностей моделей команды R&D NLP
Расскажу, как научить LLM не просто выдавать ответы, а рассуждать и исправлять свои ошибки. Объясню, почему даже самые продвинутые языковые модели часто ошибаются, несмотря на уверенные ответы. Разберу методы, которые позволяют генерировать хорошие цепочки рассуждений для разных этапов обучения моделей. В результате вы поймете, почему
для практического применения важна не только точность ответа, но и прозрачность рассуждений — и как это оценить
О чём доклад?
Сбер
Как мы обучаем модели GigaCode
Дмитрий Бабаев
Руковожу исследованиями и обучением моделей для Гигакода. Много лет занимаюсь R&D в ML/AI в таких компаниях, как Сбер, AIRI и Яндекс
GigaCode — это AI-помощник для разработчика в виде плагина для популярных IDE. Его используют десятки тысяч разработчиков в Сбере и других компаниях России. Основа GigaCode — две кодовые модели: GigaCodeCompletion и GigaCodeChat. Я расскажу о том, как мы создавали эти модели и как нам удалось превзойти качество открытых моделей такого же класса на важных для продукта задачах
О чём доклад?
Сбер
Оценка и развитие инструктивных способностей эмбеддинг-моделей
Сбер
Артём Снегирев
ML Engineer, исследователь в области эмбеддинг-моделей. Автор модели FRIDA и бенчмарка ruMTEB
О чём доклад?
Эмбеддинг-модели широко используются в задачах семантического поиска, кластеризации, рекомендаций и других NLP-приложениях. Однако, в отличие от генеративных языковых моделей, их способность адаптироваться к новым задачам по инструкции остаётся ограниченной

В этом докладе мы поговорим про инструктивные способности эмбеддинг-моделей: что это такое, как их развивать и измерять. Мы обсудим открытые бенчмарки, SOTA-решения в части подготовки данных. Также поделюсь подходом нашей команды к созданию инструктивно-гибкой модели. Доклад будет полезен разработчикам и исследователям, стремящимся повысить адаптируемость и эффективность своих моделей
От MERA Code к SWE-MERA: новые подходы к оценке моделей и развитию кодовых агентов
Сбер
Алёна Феногенова
TeamLead команды AGI NLP. Лидер проекта бенчмарков MERA. Создатель таких открытых независимых бенчмарков как RussianSuperGLUE, DRAGON, POLLUX, LIBRA, и др. h-index 14
TeamLead команды SWE-Agent. Занимаюсь агентными системами для генерации кода внутри GigaCode
Сбер
Павел Адаменко
О чём доклад?
Доклад посвящен репрезентативным метрикам для оценки способностей LLM генерировать код и решать задачи, с которыми разоработчик встречается каждый день. Мы расскажем про:

MERA Code — открытый бенчмарк на русском языке, покрывающий реальные задачи программистов в форматах text2code, code2text и code2code по 8 языкам программирования

SWE-MERA — фреймворк для оценки полноценных SWE-агентов, способных к итеративной работе с инструментами, тестами и дебагом

Обсудим вызовы: баланс между синтетическими и боевыми данными, разберёмся, сколько реальных задач существует и хватает ли их для дообучения моделей, границу между «код сгенерирован» и «продукт работает» и, конечно, какое будущее нас ждёт
Тайны древних. Ищем знания в средневековых манускриптах
Сбер
Максим Новопольцев
TeamLead R&D-команды в Сочи. Лидер направления AI4SocialGood
О чём доклад?
Как прочитать язык без гласных, в котором одна буква может иметь 3−4 начертания, а одна точка может изменить смысл целого предложения? Расскажу, как мы учим модели понимать древнеарабские документы и зачем вообще нужно копаться в архивах
Панельная дискуссия: Какими будут и какими не будут большие нейросети будущего?
Сбер
Сергей Марков
Директор по развитию технологий искусственного интеллекта
От синтеза речи к дуплексной диалоговой модели
Сбер
Артемий Таразанов
TechLead команды R&D.TTS. Занимаюсь различными разработками в области синтеза речи
О чём доклад?
Расскажу про развитие говорящих LLM, про подготовку датасетов для обучения дуплексной модели. Про особенности выравнивания данных и дальнейшие перспективы технологии
Multi-Task фундаментальная модель для временных рядов
Сбер
Алина Костромина
Лидер направления Time Series в команде ML 2.0 Центра ПИИ. Основной разработчик библиотеки Tsururu. Исследователь в области in-context-learning подходов на структурированных данных, в частности, в Time Series домене
О чём доклад?
В настоящее время большинство задач анализа временных рядов решаются узкоспециализированными методами, которые требуют ресурсоемкой адаптации под каждый конкретный случай. В докладе представлена мультизадачная фундаментальная модель, обученная на большом корпусе данных и готовая «из коробки» одновременно решать несколько задач: очищать временные ряды от шума, прогнозировать будущие значения и выполнять декомпозицию на интерпретируемые компоненты
как на историческом, так и на прогнозном периоде, и др. В результате модель позволяет сократить время внедрения и снизить зависимость от экспертной настройки
Норм или стрем? Оценка генераций в динамическом RAG бенчмарке
Сбер
Данил Астафуров
TechLead в команде AGI NLP
О чём доклад?
Покажем на примере русскоязычных бенчмарков POLLUX и DRAGoN, как сегодня адекватно оценивать LLM. POLLUX — объективный бенчмарк генеративных навыков с детальной таксономией и fine-grained критериями: 2166 оригинальных инструкций от экспертов, 35 групп и 3 уровня сложности; вместо трудоёмкого side-by-side — LM-as-Judge с объяснимыми оценками. DRAGoN — открытый динамический бенчмарк для RAG в новостном домене на русском (совместно с MTS AI), показывающий, как корректно оценивать современные RAG-системы. Вместе POLLUX и DRAGoN дают «живую» и воспроизводимую картину: первый — про интерпретируемую генерацию, второй — про работу с актуальным новостным потоком
Сбер
Мария Тихонова
Руководитель направления AGI NLP, доцент факультета ВШЭ
Наука доставки R&D в продакшн
Сбер
Валентина Хлебутина
Руководитель направления R&D для B2C. Специализация: вывод на рынок ML-решений и трансформация RnD-команд через внедрение продуктовых методологий
О чём доклад?
Создание ML-модели с высокими метриками — это только начало. Настоящая задача — преодолеть разрыв между прототипом и промышленной эксплуатацией, где 80% разработок не доходят до пользователя. Успешный вывод технологии в продакшен — это сложная сфера, выходящая далеко за рамки Data Science.

Доклад раскрывает, что необходимо построить кроме модели, чтобы она стала частью работающего продукта. Мы обсудим полный цикл превращения гипотезы в ценность:
— Этапы и подводные камни: от сбора требований, создания продуктового видения, декомпозиции задачи до мониторинга и поддержки в продакшне. На каких этапах закладываются фундаментальные риски и как их избежать
— Критерии успеха: как перевести расплывчатые «хотелки» продукта и бизнеса на язык конкретных технических метрик и целей для технической команды
— Сопоставление технологий и продукта: почему начинать диалог с продуктовой командой нужно до начала исследований и как сохранить драгоценное время в постоянной гонке с конкурентами
Генерация изображений и видео: тренды, вызовы и применения
Сбер
Денис Димтров
Управляющий директор по исследованию данных— руководитель управления базовых моделей Kandinsky
О чём доклад?
Последние несколько лет можно назвать расцветом генеративных моделей, работающих с самыми разными типами данных.

Доклад будет посвящён одним из самых трудоёмких и сложных задач этого направления — синтезу изображений и видео по текстам на естественном языке (text-to/image, text-to-video), а также подходам к решению этой задачи на основе диффузии.

Обсудим разные аспекты диффузионного процесса, его преимущества и недостатки. Разберёмся с задачей генерации видео по текстовому описанию, затронем основные трудности обучения и сложности оценивания качества генеративных моделей такого рода.

Поговорим об архитектурах Kandinsky-4 и Kandinsky-5, особенностях их обучения, нюансах сбора, фильтрации, хранения данных для обучения и полученных результатах. В заключение обсудим применение text-to-video моделей и их потенциал в настоящем и будущем
Мечтают ли языковые модели смотреть видео?
Сбер
Павел Коротаев
ML Research Engineer в команде Computer Vision R&D. Выпускник YSDA и AI Masters
О чём доклад?
Расскажу о подходах к обучению LLM для понимания видео и о сложностях, с которыми мы столкнулись. Немного разберу модальность видео + аудио. А также идеи для обработки длинных видео
По образу и подобию: учим text-to-image модели генерировать по референсам
Сбер
Александр Мазурин
Главный инженер по разработке. Занимаюсь разработками в проектах RAG Kandinsky и Computer Operator
О чём доклад?
Зачастую даже обученные на больших объёмах данных text-to-image модели не справляются с точной генерацией определённых объектов, будь то что-то знакомое всем (собор Василия Блаженного, Владимир Ленин и т. д.) или, тем более, что-то, заведомо известное только самому пользователю (как например: двор моего дома, мой коллега т.д.)

В докладе я расскажу о том, как можно при помощи механизма conditioning научить модель «перерисовывать» объект с референса, а также поделюсь наработками и подводными камнями на примере генерации в доменах лиц, достопримечательностей и предметов
Сделай комнату чистой: инструктивное редактирование фото с помощью мультимодальных ассистентов
Сбер
Григорий Алексеенко
Руководитель направления в команде Layer CV R&D. Большой промышленный опыт в видеоаналитике, оптимизациях, мультимодальных системах и генеративных моделях, особенно в задаче инструктивного редактирования изображений
О чём доклад?
Расскажу о текущем состоянии рынка и научных достижений в области ИИ-редактирования изображений. Коротко напомню про наш проект, поделюсь болями в задаче, а также ключевыми техническими решениями. В докладе — перспективы, новые итерации улучшения пайплайна и инженерные тонкости для повышения качества
AI4SPORT. Как и зачем использовать AI в самом популярном спорте в мире
Сбер
Константин Митин
Руковожу направлением внедрения AI в спортивную индустрию. Большой опыт работы в сфере спорта. В том числе занимался цифровизацией Федерации регби России. В рамках проекта AI4SPORT вывел его из состояния «идеи» в отдельную команду разработки. На данный момент уже переходим из стадии R&D в продуктивизацию
О чём доклад?
Расскажу про AI4SPORT — проект разработки ИИ для спорта, где мы объединяем компьютерное зрение, графовые и вероятностные модели, LLM-агентов (на самом деле практически весь стек DS). На примерах покажу, как это работает, с какими сложностями и задачами мы сталкиваемся в каких видах спорта, каких результатов достигли на сегодня и что планируем делать в 2026 году. В рамках доклада постараюсь ответить, почему применение DS в спорте так актуально и неизбежно уже сегодня
Что мы поняли без слов. Распознавание непрерывного жестового языка
Сбер
Илья Оводов
Руководитель направления в команде RnD CV
О чём доклад?
Расскажу об особенностях обучения мультимодальной модели для распознавания русского жестового языка. Почему подход «в лоб» не дает результатов и какие трюки пришлось применить, чтобы получить качество перевода, сравнимое с тем, которое дают живые переводчики. Возможно, часть идей пригодится и для более широкого круга мультимодальных задач
AI-Generated Music: подготовка данных и музыкальные фичи
Сбер
Максим Метальников
TechLead команды генеративной музыки R&DML
О чём доклад?
Расскажу про работу с данными для обучения моделей генеративной музыки и использование возможностей LLM для авторазметки и обогащения датасетов
Генеративный ИИ в задачах проектирования: тренды и вызовы
Сбер
Андрей Кузнецов
Директор лаборатории Fusion Brain Института AIRI
О чём доклад?
Расскажу о задачах генеративного проектирования в строительстве, архитектуре и промышленности в контексте трендов и актуальных вызовов. Это обзорный доклад по направлениям, которые реализуются в рамках трека: от бенчмарков до конкретных решений, детализация по которым будет приведена в следующих докладах. Детальнее в докладе погрузимся в задачи автоматизации в строительстве и архитектуре
Реверс-инжиниринг как первый шаг на пути создания копилота для инженера
Сбер
Антон Конушин
К.ф.-м.н., руководитель группы «Пространственный интеллект» Института AIRI. Научный руководитель центра ИИ МГУ. Программный директор Фонда «Интеллект»
О чём доклад?
Когда ребенок разбирает и собирает игрушку, он решает задачу реверс-инжиниринга. Так он познаёт конструирование на практике, а потом накладывает на это теорию из учебников. Такой же подход мы выбрали для создания инженерного ИИ. Я расскажу, что такое САПР, CAD-модели, при чём тут программирование, объясню задачу реверс-инжиниринга. Покажу, как мы развиваем мультимодальные LLM для неё и как в процессе будет появляться копилот
Генеративное проектирование в промышленности. Задачи, решения, перспективы
Сбер
Игорь Пасечник
Испонительный директор, руководитель R&D XR
О чём доклад?
Расскажу про разработку и обучение генеративных моделей и ассистентов для промышленности: какие задачи и ожидания есть от ИИ в этой области. Обсудим переспективы создания автономного ИИ, который сможет проектировать приницпиально новые изделия и системы
Оборотное зелье — конверсия любого голоса в целевой в высоком качестве
Сбер
Борис Жестков
Руководитель команды R&D. TTS — исследования в области мультимодальных LLM и генерации речи
О чём доклад?
Как мы разрабатывали и улучшали модели конверсии голоса. Какие задачи уже решаем с помощью конверсии. Перенос семантики и интонации между голосами с сохранением выравнивания во времени
Виртуальные руки: как большие мультимодальные модели управляют компьютером через GUI
Сбер
Дмитрий Балиев
Главный эксперт по технологиям. Research Lead проекта Computer Operator
О чём доклад?
Мы привыкли работать за компьютером, использовать различные программы, взаимодействовать с разными пользовательскими интерфейсами. А как все это сделать с помощью большой мультимодальной модели? Можно ли на нее спихнуть скучную рутину? Какие плюсы это дает в автоматизации? Что за технологические вызовы стоят перед нами в решении этой задачи? Сколько подводных камней мы встретим при оценке качества таких моделей? Об этом поговорим в моём докладе
зарегистрироваться
Мы используем файлы cookies 🍪 — это улучшает работу сайта и делает его более эффективным. Продолжая использовать этот сайт, вы соглашаетесь с нашей политикой обработки данных
Принять
© 2012–2025 JUG Ru Group
Реклама. ПАО Сбербанк. ИНН 7707083893. Erid: 2Ranynhh4dF