Чрез предоставяне на рамка за разпределено съхранение на данни и паралелни изчисления, Hadoop се е развила от абстракция на клъстерирани изчисления към операционна система за големи данни. Тази книга има за цел да предостави на учените по данни задълбочено разбиране на конкретни тематични области, като предоставя преглед на клъстерните изчисления и анализа по четим и интуитивен начин, представяйки Hadoop клъстерни изчисления и анализ от гледна точка на специалист по данни. Книгата е разделена на две части: първата част въвежда разпределени изчисления на много високо ниво, обсъждайки как да се изпълняват изчисления върху клъстер; Втората част се фокусира върху инструментите и техниките, които специалистите по данни трябва да знаят, за да поддържат различни анализи и управление на мащабни данни.
Туристи, ако искате да видите скритото съдържание на този пост, моля Отговор
|