Fornendo un framework di archiviazione dati distribuita e calcolo parallelo, Hadoop si è evoluto da un'astrazione del calcolo clusterizzato a un sistema operativo big data. Questo libro mira a fornire ai data scientist una comprensione approfondita di specifiche aree tematiche, fornendo una panoramica del cluster computing e dell'analisi in modo leggibile e intuitivo, introducendo il cluster computing e l'analisi di Hadoop dal punto di vista di un data scientist. Il libro è diviso in due parti: la prima parte introduce il calcolo distribuito a un livello molto alto, discutendo come eseguire il calcolo su un cluster; La seconda parte si concentra sugli strumenti e le tecniche che i data scientist dovrebbero conoscere per supportare varie analisi e gestione dati su larga scala.
Turisti, se volete vedere il contenuto nascosto di questo post, vi prego Risposta
|