- Понятие больших данных.
- Технологии, предназначенные для обработки больших данных.
- Эволюция файловых систем.
- Иерархическая организация памяти в файловой системе. Возможные уровни размещения данных.
- Распределённые файловые системы. Причины появления. Основные классы.
- MPI. Эволюция. Возможности. Применение.
- Преимущества NoSQL СУБД. Типы NoSQL СУБД. Чем обусловлена востребованность NoSQL СУБД?
- Hadoop. Принципы построения. Состав. HDFS.
- Схема выполнения задач MapReduce.
- Эволюция Hadoop в версиях 2.Х–3.Х
- Коммерческие дистрибутивы Hadoop. Почему на практике чаще используются коммерческие дистрибутивы Hadoop при наличии Open Source дистрибутива?
- Платформы на основе дистрибутивов Hadoop.
- Основные принципы построения интегрированных платформ обработки больших данных и основные классы этих платформ.
- Третье поколение платформ обработки больших данных.
- Четвёртое поколение платформ больших данных.
- Озеро данных как способ организации данных.
- Архитектуры систем, производных от озера данных.
- Лямда-архитектура для диалоговых систем обработки больших данных