Ce travail avait pour objectif d' tudier l'utilisation d'un algorithme de regroupement K-Means parall le, bas sur le mod le de programmation MapReduce, afin d'am liorer le temps de r ponse de l'exploration de donn es. Les performances de l'algorithme ont t valu es en termes de SpeedUp et ScaleUp. Pour cela, des exp riences ont t men es sur un cluster Hadoop compos de six ordinateurs mat riel standard. Les donn es regroup es sont des mesures de flux provenant de tours situ es dans des r gions agricoles et appartiennent Ameriflux. Les exp riences ont t men es l'aide de 3, 4 et 6 machines, respectivement. Les r sultats ont montr qu'avec l'augmentation du nombre de machines, les performances ont t am lior es, le meilleur temps ayant t obtenu avec six machines, atteignant un SpeedUp de 3,25. Il a t constat que l'application s'adapte bien l'augmentation quivalente de la taille des donn es et du nombre de machines dans le cluster, atteignant des performances similaires lors des tests.
ThriftBooks sells millions of used books at the lowest
everyday prices. We personally assess every book's quality and offer rare, out-of-print treasures. We
deliver the joy of reading in recyclable packaging with free standard shipping on US orders over $15.
ThriftBooks.com. Read more. Spend less.