SmartData 2025. Конференция по инженерии данных [Тариф Online] [JUG Ru Group]
SmartData — единственная в России специализированная конференция по инженерии данных.
В докладах много технической конкретики по всем темам — от отказоустойчивости до MLOps и BI. В этом году спикеры также расскажут и про внутреннее устройство баз данных.
Темы выступлений:
Тариф Online
SmartData — единственная в России специализированная конференция по инженерии данных.
В докладах много технической конкретики по всем темам — от отказоустойчивости до MLOps и BI. В этом году спикеры также расскажут и про внутреннее устройство баз данных.
Темы выступлений:
- Data Tools
- Data Management
- Architecture of Data Platforms
- Use Cases
- AI/LLM in Data
- Database Internals
- DQ
- MPP
Перспективы развития Apache Iceberg
Владимир Озеров
Spark — всё!
Евгений Глотов
GP2S3 по-взрослому
Владимир Ермаков, Андрей Кошкин
Spark Connect: новый подход для работы с Apache Spark
Александр Токарев
Способы организации CDC в PostgreSQL и почему Debezium из коробки может не решить всех проблем
Никита Рьянов
StarRocks — реальность современной платформы данных
Станислав Лысиков
Сторонние движки исполнения для Apache Spark: опыт использования
Никита Благодарный
Apache Spark SQL. Расширяй и управляй
Дмитрий Вертлиб
Мониторинг DWH: от метаданных до DataOps
Данил Захаров
DataRentgen: чем плох lineage в OSS Data Catalog и как сделать лучше
Максим Мартынов
Как в хранилище Яндекс Маркета начали писать документацию к объектам
Павел Колодкин
Хорошие данные не случаются случайно
Юрий Горынцев
Data Catalog: искажение метаданных или продуктовый подход
Анна Мавлютова
Дата-контракты: ожидания от данных без иллюзий
Валерия Терова
Что такое metastore и с чем его едят
Михаил Иванов
Как мы строили lakehouse на Ozone
Виталий Моисеев
От бакета в S3 к Data Lakehouse: эволюция платформы данных в гонке за автономией
Никита Бандурко, Георгий Попов
Как в Авито обеспечивают self-service разработки и деплоя витрин
Айк Оганесян
Как организовать масштабируемый ресерч-кластер для более чем 600 дата-сайентистов с помощью JupyterHub в Kubernetes
Даниил Понизов
TEDI под микроскопом: CRD и Kubernetes-операторы для жизненного цикла «ETL-пробирок»
Сергей Бойко
Выбираем СУБД для хранения больших денег
Василий Осадчий
Критерии хорошей платформы данных от Яндекс Доставки
Владислав Гоцуляк
Как непростые времена вынудили нас построить лучший BI
Роман Назаренко, Екатерина Щербакова
Как мы улучшили процессы по работе с данными в Airflow: практические кейсы
Дмитрий Морозов
Hadoop Is Not Dead — Just Secure!
Антон Александров
Как X5 Tech дает аналитику по данным без привлечения аналитиков, специалистов и иных посредников
Владимир Ермаченков
Автоматизация конфигурирования ETL-процессов на основе Apache Spark 3, используя RAG и LLM МТС
Илья Кочагин
ИИ под замком: как мы развернули безопасный LLM-сервис для 3000 разработчиков
Илья Дарковский
Semantic RAG: аналитический подход к моделированию знаний для LLM
Ольга Татаринова
AI-ассистенты в управлении данными
Олег Сагитов
Использование кодеков в ClickHouse: преимущества и недостатки
Анастасия Афанасьева
Алгоритмы векторного поиска в современных базах данных
Александр Зевайкин
Алгоритмы векторного поиска в YDB
Александр Зевайкин
Как мы искали инструменты для DQ и к чему в итоге пришли
Павел Павлюков
Data Quality as a Service — инструмент самообслуживания в большой компании
Андрей Азеев, Богдан Петров
DWH на StarRocks: год в production
Артем Маркин
Владимир Озеров
Spark — всё!
Евгений Глотов
GP2S3 по-взрослому
Владимир Ермаков, Андрей Кошкин
Spark Connect: новый подход для работы с Apache Spark
Александр Токарев
Способы организации CDC в PostgreSQL и почему Debezium из коробки может не решить всех проблем
Никита Рьянов
StarRocks — реальность современной платформы данных
Станислав Лысиков
Сторонние движки исполнения для Apache Spark: опыт использования
Никита Благодарный
Apache Spark SQL. Расширяй и управляй
Дмитрий Вертлиб
Мониторинг DWH: от метаданных до DataOps
Данил Захаров
DataRentgen: чем плох lineage в OSS Data Catalog и как сделать лучше
Максим Мартынов
Как в хранилище Яндекс Маркета начали писать документацию к объектам
Павел Колодкин
Хорошие данные не случаются случайно
Юрий Горынцев
Data Catalog: искажение метаданных или продуктовый подход
Анна Мавлютова
Дата-контракты: ожидания от данных без иллюзий
Валерия Терова
Что такое metastore и с чем его едят
Михаил Иванов
Как мы строили lakehouse на Ozone
Виталий Моисеев
От бакета в S3 к Data Lakehouse: эволюция платформы данных в гонке за автономией
Никита Бандурко, Георгий Попов
Как в Авито обеспечивают self-service разработки и деплоя витрин
Айк Оганесян
Как организовать масштабируемый ресерч-кластер для более чем 600 дата-сайентистов с помощью JupyterHub в Kubernetes
Даниил Понизов
TEDI под микроскопом: CRD и Kubernetes-операторы для жизненного цикла «ETL-пробирок»
Сергей Бойко
Выбираем СУБД для хранения больших денег
Василий Осадчий
Критерии хорошей платформы данных от Яндекс Доставки
Владислав Гоцуляк
Как непростые времена вынудили нас построить лучший BI
Роман Назаренко, Екатерина Щербакова
Как мы улучшили процессы по работе с данными в Airflow: практические кейсы
Дмитрий Морозов
Hadoop Is Not Dead — Just Secure!
Антон Александров
Как X5 Tech дает аналитику по данным без привлечения аналитиков, специалистов и иных посредников
Владимир Ермаченков
Автоматизация конфигурирования ETL-процессов на основе Apache Spark 3, используя RAG и LLM МТС
Илья Кочагин
ИИ под замком: как мы развернули безопасный LLM-сервис для 3000 разработчиков
Илья Дарковский
Semantic RAG: аналитический подход к моделированию знаний для LLM
Ольга Татаринова
AI-ассистенты в управлении данными
Олег Сагитов
Использование кодеков в ClickHouse: преимущества и недостатки
Анастасия Афанасьева
Алгоритмы векторного поиска в современных базах данных
Александр Зевайкин
Алгоритмы векторного поиска в YDB
Александр Зевайкин
Как мы искали инструменты для DQ и к чему в итоге пришли
Павел Павлюков
Data Quality as a Service — инструмент самообслуживания в большой компании
Андрей Азеев, Богдан Петров
DWH на StarRocks: год в production
Артем Маркин
- Прямой эфир
- Бессрочный доступ к видео
https://smartdataconf.ru/