Школа Больших Данных продолжает серию митапов по Apache Spark. Третий митап состоится 24 мая в 17:00 МСК по теме «Spark или pandas? Spark и pandas!».
Apache Spark – это Big Data фреймворк с открытым исходным кодом для распределённой пакетной и потоковой обработки неструктурированных и слабоструктурированных данных, входящий в экосистему проектов Hadoop. Проводит митап «Школа больших данных» — https://bigdataschool.ru
Митап рассчитан на инженеров данных, разработчиков и просто интересующихся: обсудим общие черты и различия Spark и pandas, а также разберемся, как они работают вместе. Во время митапа будет немного теории и много практики — будем вместе в облаке практиковаться и разбираться в плюсах, еще раз плюсах и совместной работе Spark и pandas. На выходе вы сможете лучше понять, какие задачи лучше решать с помощью pandas, а какие — с помощью Apache Spark. Как обычно, материалы митапа — Jupyter ноутбуки — позволят вам продолжить изучение проблематики митапа — совместного использования Spark и pandas — самостоятельно. Для эффективного участия в митапе необходимо предварительное знакомство со Spark (хотя бы в объеме нашего предыдущих митапов).
Программа митапа
1. Теория: краткое знакомство с Apache Spark и pandas
Немного теории — архитектура и принципы работы
2. Практика: Совместное использование Apache Spark и pandas
Разбираем возможности, решаем задачи, обсуждаем нюансы.
Длительность: 2 ак. часа
МЕРОПРИЯТИЕ БУДЕТ ПРОВОДИТЬСЯ НА ПЛАТФОРМЕ ZOOM. Ссылка на зум придет за час до начала мероприятия.
Контактная информация: info@bigdataschool.ru или +7 (495) 41-41-121, +7 (915) 307 0074