Zpracování dat v prostředí Hadoop
Abstrakt
Tato bakalářská práce se zabývá zpracování dat v prostředí Hadoop. V teoretické části je představena architektura Apache Hadoop, distribuovaný souborový systém HDFS, paralelní zpracování dat pomocí MapReduce a dalších nástrojů Hadoop. V praktické části je popsána konfigurace Hadoop a spuštění na vybraném serveru. Následné otestování jeho funkčnosti na vzorové úloze "wordcount". Závěrem práce budou získána data z Twitteru a provedena jejich analýza.