Celem niniejszej pracy bylo zbadanie zastosowania algorytmu grupowania K-Means r wnoleglego, opartego na modelu programowania MapReduce, w celu poprawy czasu odpowiedzi eksploracji danych. Wydajnośc algorytmu zostala oceniona pod kątem SpeedUp i ScaleUp. W tym celu przeprowadzono eksperymenty w klastrze Hadoop zlożonym z sześciu komputer w o standardowej specyfikacji sprzętowej. Zgrupowane dane to pomiary wież przeplywowych region w rolniczych i należą do Ameriflux. Eksperymenty przeprowadzono przy użyciu odpowiednio 3, 4 i 6 maszyn. Wyniki pokazaly, że wraz ze wzrostem liczby maszyn nastąpil wzrost wydajności, przy czym najlepszy czas uzyskano przy użyciu sześciu maszyn, osiągając SpeedUp na poziomie 3,25. Stwierdzono, że aplikacja dobrze skaluje się wraz z r wnoważnym wzrostem rozmiaru danych i liczby maszyn w klastrze, osiągając zbliżoną wydajnośc w testach.
ThriftBooks sells millions of used books at the lowest
everyday prices. We personally assess every book's quality and offer rare, out-of-print treasures. We
deliver the joy of reading in recyclable packaging with free standard shipping on US orders over $15.
ThriftBooks.com. Read more. Spend less.