Ziel dieser Arbeit war es, die Verwendung eines parallelen K-Means-Clustering-Algorithmus auf Basis des MapReduce-Programmiermodells zu untersuchen, um die Reaktionszeit beim Data Mining zu verbessern. Die Leistung des Algorithmus wurde hinsichtlich SpeedUp und ScaleUp bewertet. Zu diesem Zweck wurden Experimente in einem Hadoop-Cluster durchgef hrt, der aus sechs Computern mit handels blicher Hardware bestand. Die gruppierten Daten sind Messungen von Str mungst rmen in landwirtschaftlichen Regionen und stammen von Ameriflux. Die Experimente wurden mit 3, 4 bzw. 6 Maschinen durchgef hrt. Die Ergebnisse zeigten, dass mit der Erh hung der Anzahl der Maschinen eine Leistungssteigerung erzielt wurde, wobei die beste Zeit mit sechs Maschinen erreicht wurde und ein SpeedUp von 3,25 erzielt wurde. Es wurde festgestellt, dass die Anwendung mit der entsprechenden Erh hung der Datenmenge und der Anzahl der Maschinen im Cluster gut skaliert und in den Tests eine hnliche Leistung erzielt.
ThriftBooks sells millions of used books at the lowest
everyday prices. We personally assess every book's quality and offer rare, out-of-print treasures. We
deliver the joy of reading in recyclable packaging with free standard shipping on US orders over $15.
ThriftBooks.com. Read more. Spend less.