Durch die Bereitstellung eines Frameworks für verteilte Datenspeicherung und paralleles Rechnen hat sich Hadoop von einer Abstraktion von Clustered Computing zu einem Big-Data-Betriebssystem entwickelt. Dieses Buch soll Data Scientists ein tiefgehendes Verständnis spezifischer Fachgebiete vermitteln, indem es einen Überblick über Cluster-Computing und -Analyse auf lesbare und intuitive Weise bietet und Hadoop-Cluster-Computing und -Analyse aus der Perspektive eines Data Scientists einführt. Das Buch ist in zwei Teile unterteilt: Der erste Teil stellt verteiltes Rechnen auf sehr hohem Niveau vor und behandelt, wie man Rechnen auf einem Cluster betreibt; Der zweite Teil konzentriert sich auf die Werkzeuge und Techniken, die Data Scientists beherrschen sollten, um verschiedene Analytik und groß angelegtes Datenmanagement zu steuern.
Touristen, wenn ihr den versteckten Inhalt dieses Beitrags sehen wollt, bitte Antwort
|