Prin furnizarea unui cadru distribuit de stocare a datelor și calcul paralel, Hadoop a evoluat de la o abstractizare a calculului clusterizat la un sistem de operare big data. Această carte își propune să ofere oamenilor de știință a datelor o înțelegere aprofundată a unor domenii specifice, oferind o privire de ansamblu asupra calculului cluster și analizei într-un mod lizibil și intuitiv, introducând calculul și analiza clusterului Hadoop din perspectiva unui data scientist. Cartea este împărțită în două părți: prima parte introduce calculul distribuit la un nivel foarte înalt, discutând cum să rulezi calculul pe un cluster; A doua parte se concentrează pe instrumentele și tehnicile pe care oamenii de știință de date ar trebui să le cunoască pentru a susține diverse analize și managementul datelor la scară largă.
Turiști, dacă vreți să vedeți conținutul ascuns al acestei postări, vă rog Răspunde
|