Инженерам инфраструктуры и data-специалистам, работающим с нагрузками, пайплайнами и продакшеном
Исследователям и лидам AI-проектов, которым важны подходы и данные из первых рук
Middle и Senior разработчикам, ML-инженерам и тем, кто живет в коде
Что ждёт на конференции?
Команды GigaChat, Kandinsky и другие направления Сбера покажут, как рождаются масштабные AI-системы — от первых прототипов до решений, которыми пользуются миллионы.
Доклады, постеры, демо-стенды и воркшопы: ты сможешь увидеть технологии в действии, задать вопросы напрямую командам, протестировать модели и обсудить архитектурные решения. В «Гига Городе» тебя ждут задачи, с которыми сталкиваются инженеры Сбера и подходы, которые работают на продакшене.
Когда ивент пройдет, ты останешься с ощущением, что технологии — это не просто инструменты, а пространство для экспериментов, решений и идей, которые двигают AI вперед.
Кому будет интересно?
Доклад посвящен современным моделям генерации изображений, видео и синхронного аудио.
Мы разберем ключевые принципы работы диффузионных моделей, их преимущества и ограничения, обсудим современные архитектуры text-to-image и text-to-video систем, а также типичные сложности обучения и оценки качества таких моделей.
Отдельный блок посвятим новой линейке Kandinsky-5: подходам к обучению, сбору и фильтрации данных.
Также поговорим о связи text-to-video с моделями мира и рассмотрим прикладные сценарии использования генеративных моделей сегодня и в ближайшем будущем.
О чем доклад
Создатель и руководитель разработки линейки моделей Kandinsky, Kandinsky
Денис Димитров
CTO платформы искусственного интеллекта GigaPlatform
Фёдор Минькин
Старший управляющий директор-директор департамента ИИ-платформы и моделей
Андрей Карлов
Расскажем о том, как мы обучали GigaTTS: про данные, архитектуру и ключевые особенности.
Покажем примеры и метрики, а также анонсируем end-to-end multimodal GigaChat.
О чем доклад
Руководитель команды данных TTS и Speech2Speech, GigaChat
Владимир Карлов
Лид команды синтеза речи, GigaChat
Гриша Стерлинг
Расскажем про обучение GigaAM-v3: как удалось улучшить качество и сделать ее end-to-end с поддержкой нормализации текста.
О чем доклад
ML инженер, GigaChat
Александр Куцаков
В докладе представим сервис потоковой LLM-аналитики на платформе GigaLytics: какие бизнес-задачи он решает, как устроен и какие результаты уже показывает.
Покажем примеры применения — от анализа диалогов и отзывов клиентов до генерации синтетических данных — и поделимся основными выводами из внедрения.
О чем доклад
Старший бизнес-аналитик, GigaData
Григорий Букия
Старший руководитель проекта, GigaData
Евгений Семенюк
В докладе расскажем, как и зачем мы используем разметку данных в поисковом сервисе GigaSearch.
Покажем основные типы разметочных проектов и процесс запуска нового задания.
Сравним Я. Задания и TagMe по качеству, скорости и стоимости, обсудим автоматический контроль качества и то, как обученные модели помогают оптимизировать бюджет.
Завершим обзором областей, где люди все еще превосходят авторазметку.
О чем доклад
Лид ML инженер, GigaData
Ян Власов
Расскажем про путь, который мы прошли, чтобы обучить сильнейшую модель GigaChat Ultra.
О чем доклад
Старший ML инженер, GigaChat
Никита Ермолаев
Лид ML инженер, GigaChat
Валентин Мамедов
Расскажем об инфраструктуре экспериментов и генерации синтетических данных: новый CPU-кластер на десятки тысяч ядер для подготовки данных, разные типы синтетики, алгоритмические задачи и сотни экспериментов по валидации данных.
О чем доклад
Руководитель Synthetic Data, GigaChat
Дмитрий Козлов
Pretrain Data Pipelines Lead, GigaChat
Валерий Березовский
Доклад о том, как мы делали агентный SDK для GigaChat на базе LangChain, получили санкционный бан, но выжили и вошли в топ‑2% всех библиотек в мире по скачиваниям с PyPI.
В конце покажем продвинутый пример агента с открытым исходным кодом, созданного на нашем стеке — GigaAgent.
Расскажем, что он умеет и как его использовать для решения своих задач.
О чем доклад
Техлид проекта GigaChain
Константин Крестников
Расскажем про сервис GigaSearch, который обеспечивает LLM доступ к внешним данным.
Разберем архитектуру, сравним наше API с конкурентами и покажем результаты по ключевым метрикам качества в сравнении с известными поисковиками для LLM.
О чем доклад
Лид команды GigaSearch
Валерия Гурьянова
Расскажем, почему поиск в LLM важен, и какие задачи мы решили на пути к идеальному поисковому агенту.
Покажем, как GigaChat Ultra выжимает максимум из любого RAG‑индекса, кто ему в этом помогает, и как вы можете использовать это уже сейчас.
О чем доклад
LLM B2C&Domain Search Lead
София Солдатова
LLM Search Toolkit Lead
Анатолий Анисимов
Расскажем про Модели Мира (World Models), текущие SoTA, их проблемы, зачем они нужны и как будем строить модель мира на базе Kandinsky.
О чем доклад
Тимлид группы Kandinsky World Model
Андрей Иванюта
Расскажем, как мы готовили обучающий датасет для pretrain‑моделей Kandinsky, с какими вызовами столкнулись и какие подходы оказались наиболее эффективными.
О чем доклад
Руководитель команды исследований больших данных
Иван Кириллов
Расскажем об инфраструктуре, архитектуре модели, пайплайне обучения, сборе инструктивного датасета и пайплайне RL — с инженерной точки зрения.
О чем доклад
Лид команды Kandinsky Pretrain
Владимир Архипкин
Доклад о Post‑Train Kandinsky (SFT & RLHF), сборе данных и процедуре обучения.
О чем доклад
Post-Train & Production Lead Kandinsky
Николай Герасименко
Расскажем про многоэтапный пайплайн дистилляции Kandinsky 5.0 и о том, как мы ускорили модель в 6 раз.
О чем доклад
Руководитель направления по исследованию данных
Лев Новицкий
Расскажем, почему поиск в LLM важен, и какие задачи мы решили на пути к идеальному поисковому агенту.
Покажем, как GigaChat Ultra выжимает максимум из любого RAG‑индекса, кто ему в этом помогает, и как вы можете использовать это уже сейчас.
О чем доклад
GigaChat Data Disrupt Lead
Эльдар Дамиров
GigaChat Reasoning&Tool Use Lead
Даша Хомич
GigaChat RL Team lead
Александр Прошунин
Покажем, как вырастить ML‑команду, которая масштабируется сама: через автономное развитие людей, обмен знаниями, оптимизацию процессов (CI/CD, стандартизация) и развитие инфраструктуры (ключевое — модульность и переиспользование).
Результат — единая инфраструктура для обучения всех моделей Гига, сквозной пайплайн, где улучшения (архитектура, данные, обучение) мгновенно распространяются на все модели, а единые автометрики и фидбэк‑циклы позволяют системе расти и оптимизироваться самостоятельно.
О чем доклад
Руководитель команды претрейна GigaChat
Евгений Косарев
Лучшие агентные практики.
Тема
Техлид проекта GigaChain
Константин Крестников
Расскажем о дообучении моделей генерации изображений и видео для персонализации и добавления новых сущностей.
В формате лайв‑кодинга подготовим датасет, соберем все необходимое для обучения и сгенерируем контент с новой сущностью.
Тема
ML Research Engineer
Никита Киселев
Расскажем и покажем, как модель умеет генерировать движения камеры «из коробки», а также как дообучить её на более редкие движения.
Мы используем файлы cookies 🍪 — это улучшает работу сайта и делает его более эффективным. Продолжая использовать этот сайт, вы соглашаетесь с нашей политикой обработки данных