Door een gedistribueerd datageheugen en parallel rekenraamwerk te bieden, is Hadoop geëvolueerd van een abstractie van geclusterde computing naar een big data-besturingssysteem. Dit boek heeft als doel data scientists een diepgaand begrip van specifieke onderwerpen te geven door op een leesbare en intuïtieve manier een overzicht te geven van cluster computing en analyse, waarbij Hadoop-clustercomputing en analyse vanuit het perspectief van een datawetenschapper worden geïntroduceerd. Het boek is verdeeld in twee delen, het eerste deel introduceert gedistribueerd rekenen op een zeer hoog niveau en bespreekt hoe je rekenen op een cluster kunt uitvoeren; Het tweede deel richt zich op de tools en technieken die datawetenschappers moeten kennen om diverse analyses en grootschalig databeheer aan te drijven.
Toeristen, als jullie de verborgen inhoud van dit bericht willen zien, alsjeblieft Antwoord
|