Забезпечуючи фреймворк розподіленого зберігання даних і паралельних обчислень, Hadoop еволюціонував від абстракції кластерних обчислень до операційної системи великих даних. Ця книга має на меті надати дата-сайентістам глибоке розуміння конкретних галузей, надаючи огляд кластерних обчислень і аналізу у зрозумілій та інтуїтивній формі, знайомлячи кластерні обчислення та аналіз Hadoop з точки зору дата-сайентіста. Книга поділена на дві частини: перша частина вводить розподілені обчислення на дуже високому рівні, обговорюючи, як запускати обчислення на кластері; Друга частина зосереджена на інструментах і техніках, які дата-сайентисти повинні знати для забезпечення різноманітної аналітики та управління великими даними.
Туристи, якщо ви хочете побачити прихований контент цього допису, будь ласка Відповідь
|