Genom att erbjuda ett distribuerat datalagrings- och parallellt databehandlingsramverk har Hadoop utvecklats från en abstraktion av klustrade databehandlingar till ett stordataoperativsystem. Denna bok syftar till att ge data scientists en djupgående förståelse för specifika ämnesområden genom att ge en översikt av klusterberäkning och analys på ett läsbart och intuitivt sätt, och introducera Hadoop-klusterberäkning och analys ur en data scientists perspektiv. Boken är uppdelad i två delar, den första delen introducerar distribuerad databehandling på en mycket övergripande nivå och diskuterar hur man kör beräkningar på ett kluster; Den andra delen fokuserar på de verktyg och tekniker som data scientists bör känna till för att driva olika analyser och storskalig datahantering.
Turister, om ni vill se det dolda innehållet i detta inlägg, snälla Svar
|