Książka ta jest praktycznym przewodnikiem, kt ry skupia się wylącznie na rzeczywistych wdrożeniach i rozwiązaniach wykonywalnych przy użyciu Hadoop oraz jego ekosystemu. Zostala zaprojektowana jako zas b zorientowany na laboratorium, w kt rym czytelnicy uczą się technologii Big Data poprzez bezpośrednie wykonywanie konfiguracji, komend i zadań analitycznych. Książka rozpoczyna się od konfiguracji i instalacji Hadoop zar wno w trybie pseudo-rozproszonym, jak i w pelni rozproszonym. Następnie czytelnicy wdrażają kluczowe zadania zarządzania plikami HDFS, w tym dodawanie plik w i katalog w, pobieranie danych z HDFS oraz usuwanie plik w. Ćwiczenia te pomagają użytkownikom oswoic się z pracą w rozproszonych systemach przechowywania danych. Książka zawiera wiele implementacji MapReduce, zaczynając od rozwiązania Word Count do obliczania liczby wystąpień każdego slowa w dużych plikach wejściowych. Ponadto zawiera programy do wyszukiwania sl w na podstawie sl w kluczowych oraz eliminacji sl w stop (stop words) z dużych zbior w danych tekstowych. Dedykowana sekcja skupia się na eksploracji danych pogodowych przy użyciu MapReduce, gdzie wdrażane są programy do obliczania średnich, maksymalnych i minimalnych temperatur dla każdego roku oraz filtrowania rekord w na podstawie prog w temperatury.
ThriftBooks sells millions of used books at the lowest
everyday prices. We personally assess every book's quality and offer rare, out-of-print treasures. We
deliver the joy of reading in recyclable packaging with free standard shipping on US orders over $15.
ThriftBooks.com. Read more. Spend less.