En fournissant un cadre de stockage distribué des données et de calcul parallèle, Hadoop est passé d’une abstraction de l’informatique en cluster à un système d’exploitation big data. Ce livre vise à fournir aux data scientists une compréhension approfondie de domaines spécifiques en offrant un aperçu de l’informatique en cluster et de l’analyse de manière lisible et intuitive, introduisant l’informatique en cluster Hadoop et l’analyse du point de vue d’un data scientist. Le livre est divisé en deux parties : la première introduit l’informatique distribuée à un niveau très général, expliquant comment exécuter le calcul sur un cluster ; La seconde partie se concentre sur les outils et techniques que les data scientists devraient connaître pour alimenter diverses analyses et gestion de données à grande échelle.
Touristes, si vous voulez voir le contenu caché de ce post, s’il vous plaît Répondre
|