В поддержку нашего нового курса для дата-инженеров Школа Больших Данных проводит очередной бесплатный митап для аналитиков, архитекторов, инженеров данных, разработчиков, DataOps- инженеров и тех, кто интересуется современными технологиями обработки данных.
Trino – это распределенный SQL-движок с массово-параллельной архитектурой и открытым исходным кодом. Он предназначен для работы с большими объемами данных в разных неоднородных источниках: реляционные базы данных и NoSQL, потоковые платформы передачи событий, файловые и объектные хранилища. Trino позволяет делать федеративные аналитические запросы, используя классические SQL-операторы.
На митапе вы узнаете, как устроен кластер Trino и разберетесь с его архитектурой, познакомитесь с особенностями работы планировщика и оптимизатора запросов на примере бенчмарка TPC-DS, а также поймете, почему этот фреймворк быстрее Apache Spark.
Специальной подготовки не требуется, все будет происходить в интерактивной среде в Yandex Cloud, подготовленной специалистами Школы Больших Данных.
Программа митапа
- Краткий обзор
- История
- Архитектура
- Обзор рабочего кластера (trino, spark)
- Обзор рабочего места – как «общаться» с движками
- Процесс исполнения
- Принципы исполнения запросов в trino
- Подход к анализу процесса исполнения
- Принципы исполнения запросов в spark
- Подход к анализу процесса исполнения
- Сравнение на реальных запросах
- Кратко о бенчмарке TPC-DS
- Обзор подготовленных данных
- Сравнение движков
- Заключение и выводы
Продолжительность митапа — 2 часа.
Как обычно, после митапа вы получите раздаточные материалы и набор упражнений для закрепления полученных навыков. А также сможете задать вопросы преподавателю-эксперту и обсудить, как можно применять рассмотренные технологии для решения реальных задач.
Ссылка придет на почту за час до начала мероприятия.
Контактная информация: info@bigdataschool.ru или +7 (495) 41-41-121, +7 (915) 307 0074, @Bigdataschool_mck