Рет қаралды 12,563
Техносфера Mail.ru Group, МГУ им. М.В. Ломоносова.
Курс "Методы распределенной обработки больших объемов данных в Hadoop"
Лекция №12 "Spark"
Лектор - Алексей Романенко.
Мотивация. RDD. Программная модель Spark. Higher-Order Functions. Трансформация RDD (Map, Reduce, Join, CoGroup, Union и Sample). RDD actions. SparkContext. Создание RDD. Общие переменные (broadcast, accumulator). Движок Apache Spark. Программный интерфейс Spark. Lineage. Зависимости между RDD (Narrow, Wide). Расписание задач. Отказоустойчивость RDD. Управление памятью. Приложения, которые подходят и не подходят для RDD.
Слайды лекции www.slideshare....
Другие лекции курса | • Курс · Hadoop (осень 2...
Наш видеоканал | www.youtube.com...
Официальный сайт Технопарка | tech-mail.ru/
Официальный сайт Техносферы | sfera-mail.ru/
Технопарк в ВКонтакте | tpmailru
Техносфера в ВКонтакте | tsmailru
Блог на Хабре | habrahabr.ru/co...
#ТЕХНОПАРК
#ТЕХНОСФЕРА
x