Предоставляя распределённую структуру хранения данных и параллельные вычисления, Hadoop эволюционировала от абстракции кластерных вычислений к операционной системе больших данных. Эта книга направлена на то, чтобы дать дата-сайентистам глубокое понимание конкретных предметных областей, предоставляя обзор кластерных вычислений и анализа в читаемой и интуитивной форме, знакомя с кластерными вычислениями и анализом Hadoop с точки зрения дата-сайентиста. Книга разделена на две части: первая часть знакомит с распределёнными вычислениями на очень высоком уровне, обсуждая, как запускать вычисления на кластере; Вторая часть посвящена инструментам и техникам, которые должны знать дата-сайентисты для поддержки различных аналитик и крупномасштабного управления данными.
Туристы, если вы хотите увидеть скрытое содержание этого поста, пожалуйста Ответ
|