Контрольные вопросы

Понятие больших данных.
Технологии, предназначенные для обработки больших данных.
Эволюция файловых систем.
Иерархическая организация памяти в файловой системе. Возможные уровни размещения данных.
Распределённые файловые системы. Причины появления. Основные классы.
MPI. Эволюция. Возможности. Применение.
Преимущества NoSQL СУБД. Типы NoSQL СУБД. Чем обусловлена востребованность NoSQL СУБД?
Hadoop. Принципы построения. Состав. HDFS.
Схема выполнения задач MapReduce.
Эволюция Hadoop в версиях 2.Х–3.Х
Коммерческие дистрибутивы Hadoop. Почему на практике чаще используются коммерческие дистрибутивы Hadoop при наличии Open Source дистрибутива?
Платформы на основе дистрибутивов Hadoop.
Основные принципы построения интегрированных платформ обработки больших данных и основные классы этих платформ.
Третье поколение платформ обработки больших данных.
Четвёртое поколение платформ больших данных.
Озеро данных как способ организации данных.
Архитектуры систем, производных от озера данных.
Лямда-архитектура для диалоговых систем обработки больших данных