День, когда говорят инженеры
Офлайн/Онлайн
10 декабря
г. Москва
AI-карьера в Сбере: консультации, открытые позиции, знакомство с командами
Карьерная зона
Практика с инженерами Сбера — бери ноутбук и включайся
Воркшопы
Демо-стенды и постерные сессии от команд Сбера
«Гига Город»
Тех-доклады команд GigaChat, Kandinsky, GigaData
Главная сцена
Что такое «Салют, Гига!»
«Салют, Гига!» — пространство для тех, кто создает, обучает и запускает AI в прод.

Весь день будем говорить про технологии, исследования и людей, которые делают искусственный интеллект в Сбере.
Программа
Большая сцена
Малая сцена
Постерные сессии
Скоро появится— не пропустите!
Эльдар Дамиров, Дарья Хомич
Расскажем, как мы создали reasoning-модель: пайплайн генерации данных, продуктовые требования и другие аспекты.
Reasoning Pro или рассуждения, которые помогают
GigaChat Prod Data
Игорь Карпиков
Постер об обучении Scaling Laws для предсказания batch size и learning rate при обучении больших MoE-моделей. Расскажем, какие нововведения внесла наша команда в стандартный пайплайн обучения Scaling Laws, и к каким результатам это привело.
Законы скейлинга с поправкой на время обучения
GigaChat Pretrain
Станислав Жбанников
Расскажем подробно, как обрабатывать случаи сильного дисбаланса распределения токенов по экспертам, а также покажем, как это влияет на качество.
Почему drop токенов сложнее чем кажется
GigaChat Pretrain
Валентин Мамедов, Никита Ермолаев
Постер по мотивам выступления на основной сцене, чтобы обсудить отдельные моменты подробнее и в более спокойной обстановке.
Независимость весов GigaChat Ultra и стабилизация обучения
GigaChat Pretrain
Антон Белецкий
Расскажем, как мы добавляли продвинутые режимы Fill-In-the-Middle в наши модели: зачем это нужно, какие проблемы возникали у наивной реализации и как все работает сейчас.
Улушаем понимание кода через sFIM
GigaChat Pretrain
Арсений Полюбин, Евгений Гуров
Расскажем о различных факторах, влияющих на обучение в онлайн RL: точность обучения, формат инференса, домены, шедулеры и другие аспекты.
Влияние различных факторов на RL
GigaChat RL
Евгения Никишкина
Расскажем о различных стратегиях балансирующих лоссов в MoE-моделях, нашем опыте и внесенных улучшениях.
Стратегии балансировки в MoE моделях
GigaChat Pretrain
Артем Черепанов
Расскажем о современных подходах в онлайн RL: обзор методов и эксперименты.
Методы онлайн RL (обзорная)
GigaChat RL
Кирилл Семин
Расскажем о сборе данных, архитектуре модели, пайплайне обучения и метриках качества для обработки мультимодальных диалогов (текст, изображения, звук) — production-модель. Также поговорим о MVP-модели для видео и аудио.
GigaChat Omni-Input
GigaChat Audio
Олег Кутузов, Александр Максименко
Покажем и расскажем об улучшениях в новой версии модели GigaChat-Audio: изменения в стадиях обучения (AudioLLM-pretrain, AudioLLM-targeted SSL), улучшение данных, многоязычность и рост метрик.
GigaChat Audio v2
GigaChat Audio
Никита Ноев
Продемонстрируем пайплайн распознавания речи по спикерам в SaluteSpeech.
Speaker-Attributed ASR
ASR
Денис Родионов, Андрей Сапожников
Продемонстрируем мультимодальный подход в определении конца запроса (End of Utterance), который снижает задержку на 25% по сравнению с «audio-only» подходом.
Multimodal EoU
ASR
Александр Куцаков, Мария Садовина
Покажем и расскажем, как мы работали с temporal grounding для GigaChat Audio: Q&A с вопросами по времени и суммаризация с таймстемпами. Продемонстрируем сбор данных, фильтрацию, архитектурные решения, обсудим трудности и финальное качество.
GigaChat Audio Timings
GigaChat Audio
Андрей Кузьменко
Продемонстрируем пайплайн разработки систем распознавания речи при ограниченных объемах обучающих данных, особая ценность которого проявляется при работе с иностранными языками. В качестве примера возьмём киргизский.
Low resource ASR
ASR
Юрий Федоров
Расскажем о функции долговременной памяти в GigaChat.
Память в GigaChat
GigaChat Prod
Денис Маликов
B2C-функции: как они реализованы и как происходит взаимодействие.
Расширем возможности Гигачата: пользовательские функции на проде
GigaChat Prod Data
Светлана Лундина, Павел Филимонов, Владимир Карлов
Расскажем про подготовку данных для нового TTS.
Пайплайны подготовки данных для TTS
GigaChat Prod
Артемий Захаров
Расскажем, как мы генерировали и валидировали новые задачи по физике.
Генерация задач по физике
GigaChat Pretrain Data
Никита Жуковский
Покажем, что добавление логических задачек (судоку и др.) повышает метрики на основных бенчмарках.
Генерация логических задачек
GigaChat Pretrain Data
Данил Сахаров
Расскажем, как превратить LLM в автора задач и строгого судью: короткий рецепт сквозной генерации, автопроверки и надежного отбора синтетических данных по программированию.
SynthContest+: генерация и валидация датасета по олимпиадному программированию
GigaChat Pretrain Data
Вячеслав Чуб, Арсен Закарян
Расскажем, как качественно перевести датасеты с инструкциями на примере задач по математике.
LLM перевод для pretrain
GigaChat Pretrain Data
Айнур Исрафилова, Анастасия Казакова
Тут нужно итоговое описание — непонятно, что в итоге будет.
Качество Pretrain данных
GigaChat Pretrain Data
Максим Савинов
Подробно расскажем и нарисуем наши пайплайны обработки данных, YT + AirFlow.
Инфраструктура обработки данных на YT
GigaChat Pretrain Data
Расскажем о подходе к генерации инструктивных синтетических данных для разных доменов.
Покажем, что нужно сделать, чтобы GigaChat Audio заговорил.
Покажем, как мы сделали клонирование голосов, представим метрики и дадим послушать примеры — наши и 11лабс.
Постер с описанием нашего нового синтеза, основными буллетами и картинками.
Расскажем о нашем Web SDK для SpeechEnhancement.
Расскажем, как запускать распределенные огромные MoE для эффективной утилизации ресурсов и поддержания высокой производительности кластера.
Расскажем о задаче токенизации медиа и о том, как мы создали лучший в мире токенизатор KVAE 1.0 (запись от 24.11.2025) — личный комментарий: не понимаю про запись, к чему это?
Расскажем, как мы разработали и применили метод разреженного внимания NABLA (Neighborhood Adaptive Block-Level Attention) для ускорения инференса и обучения Kandinsky 5 Video.
Расскажем, как мы обучаем open-source GigaEmbeddings.
Расскажем о модели-эмбеддере в нашей системе аналитики SaluteSpeech Insights: зачем мы ее создали, с какими трудностями столкнулись и какие задачи решаем. Покажем ценность — интересные приложения и уникальный пайплайн генерации данных для обучения модели: мы полностью генерируем данные и умно очищаем их с помощью LLM.
Что следует за стандартным предобучением диффузионных моделей: SFT и RLHF этапы обучения Kandinsky 5.0 Image.
Kandinsky
Расскажем, как адаптировали модели GigaVision для нужд робототехники.
GigaVision
Расскажем, как мы с нуля построили систему anomaly detection на конвейере для проверки качества сборки телевизоров.
GigaChat Vision
Инженерам инфраструктуры и data-специалистам, работающим с нагрузками, пайплайнами и продакшеном
Исследователям и лидам AI-проектов, которым важны подходы и данные из первых рук
Middle и Senior разработчикам, ML-инженерам и тем, кто живет в коде
Что ждёт на конференции?
Команды GigaChat, Kandinsky и другие направления Сбера покажут, как рождаются масштабные AI-системы — от первых прототипов до решений, которыми пользуются миллионы.

Доклады, постеры, демо-стенды и воркшопы: ты сможешь увидеть технологии в действии, задать вопросы напрямую командам, протестировать модели и обсудить архитектурные решения. В «Гига Городе» тебя ждут задачи, с которыми сталкиваются инженеры Сбера и подходы, которые работают на продакшене.

Когда ивент пройдет, ты останешься с ощущением, что технологии — это не просто инструменты, а пространство для экспериментов, решений и идей, которые двигают AI вперед.
Кому будет интересно?
Доклад посвящен современным моделям генерации изображений, видео и синхронного аудио.

Мы разберем ключевые принципы работы диффузионных моделей, их преимущества и ограничения, обсудим современные архитектуры text-to-image и text-to-video систем, а также типичные сложности обучения и оценки качества таких моделей.

Отдельный блок посвятим новой линейке Kandinsky-5: подходам к обучению, сбору и фильтрации данных.

Также поговорим о связи text-to-video с моделями мира и рассмотрим прикладные сценарии использования генеративных моделей сегодня и в ближайшем будущем.
О чем доклад
Создатель и руководитель разработки линейки моделей Kandinsky, Kandinsky
Денис Димитров
Старший управляющий директор -директор департамента ИИ-платформы и моделей
Андрей Карлов
CTO платформы искусственного интеллекта GigaPlatform
Фёдор Минькин
Андрей Белевцев
Старший вице-президент — руководитель блока «Технологическое развитие»
Расскажем о том, как мы обучали GigaTTS: про данные, архитектуру и ключевые особенности.

Покажем примеры и метрики, а также анонсируем end-to-end multimodal GigaChat.
О чем доклад
Руководитель команды данных TTS и Speech2Speech, GigaChat
Владимир Карлов
Лид команды синтеза речи, GigaChat
Гриша Стерлинг
Расскажем про обучение GigaAM-v3: как удалось улучшить качество и сделать ее end-to-end с поддержкой нормализации текста.
О чем доклад
ML инженер, GigaChat
Александр Куцаков
В докладе представим сервис потоковой LLM-аналитики на платформе GigaLytics: какие бизнес-задачи он решает, как устроен и какие результаты уже показывает.

Покажем примеры применения — от анализа диалогов и отзывов клиентов до генерации синтетических данных — и поделимся основными выводами из внедрения.
О чем доклад
Старший бизнес-аналитик, GigaData
Григорий Букия
Старший руководитель проекта, GigaData
Евгений Семенюк
В докладе расскажем, как и зачем мы используем разметку данных в поисковом сервисе GigaSearch.

Покажем основные типы разметочных проектов и процесс запуска нового задания.

Сравним Я. Задания и TagMe по качеству, скорости и стоимости, обсудим автоматический контроль качества и то, как обученные модели помогают оптимизировать бюджет.

Завершим обзором областей, где люди все еще превосходят авторазметку.
О чем доклад
Лид ML инженер, GigaData
Ян Власов
Расскажем про путь, который мы прошли, чтобы обучить сильнейшую модель GigaChat Ultra.
О чем доклад
Старший ML инженер, GigaChat
Никита Ермолаев
Лид ML инженер, GigaChat
Валентин Мамедов
Расскажем об инфраструктуре экспериментов и генерации синтетических данных: новый CPU-кластер на десятки тысяч ядер для подготовки данных, разные типы синтетики, алгоритмические задачи и сотни экспериментов по валидации данных.
О чем доклад
Руководитель Synthetic Data, GigaChat
Дмитрий Козлов
Pretrain Data Pipelines Lead, GigaChat
Валерий Березовский
© 2012–2025 JUG Ru Group
Реклама. ПАО Сбербанк. ИНН 7707083893. Erid: 2RanynrftYq
Мы используем файлы cookies 🍪 — это улучшает работу сайта и делает его более эффективным. Продолжая использовать этот сайт, вы соглашаетесь с нашей политикой обработки данных
Принять