Ved at tilbyde en distribueret datalagrings- og parallel computing-ramme har Hadoop udviklet sig fra en abstraktion af clustered computing til et big data-operativsystem. Denne bog har til formål at give data scientists en dybdegående forståelse af specifikke fagområder ved at give et overblik over cluster computing og analyse på en læsbar og intuitiv måde, og introducere Hadoop cluster computing og analyse fra en data scientists perspektiv. Bogen er delt i to dele, hvor den første del introducerer distribueret databehandling på et meget overordnet niveau og diskuterer, hvordan man kører beregninger på en klynge; Den anden del fokuserer på de værktøjer og teknikker, som data scientists bør kende til at drive forskellige analyser og storskala datastyring.
Turister, hvis I vil se det skjulte indhold i dette indlæg, så vær venlig Svar
|