Al proporcionar un marco de almacenamiento de datos distribuido y computación paralela, Hadoop ha evolucionado de una abstracción de la computación en clúster a un sistema operativo de big data. Este libro pretende proporcionar a los científicos de datos una comprensión profunda de áreas temáticas específicas, proporcionando una visión general de la computación y el análisis en clústeres de forma legible e intuitiva, introduciendo la computación y el análisis en clústeres de Hadoop desde la perspectiva de un científico de datos. El libro está dividido en dos partes: la primera introduce la computación distribuida a un nivel muy general, hablando sobre cómo ejecutar la computación en un clúster; La segunda parte se centra en las herramientas y técnicas que los científicos de datos deberían conocer para impulsar diversas analíticas y gestión de datos a gran escala.
Turistas, si queréis ver el contenido oculto de esta publicación, por favor Respuesta
|