Hadoop, l'impl mentation open source et bas e sur Java du framework Map/Reduce de l'Apache Software Foundation, est un framework informatique distribu con u pour les applications distribu es gourmandes en donn es. Il fournit les outils n cessaires au traitement de grandes quantit s de donn es l'aide du framework Map/Reduce et impl mente en outre un syst me de fichiers distribu similaire celui de Google. Il peut tre utilis pour traiter de grandes quantit s de donn es en parall le sur de grands clusters de mani re fiable et tol rante aux pannes. Depuis longtemps, Java est utilis par de nombreux programmeurs pour le traitement des donn es. Dans cet ouvrage, nous avons compar et analys les performances de Hadoop avec Java, de Hadoop avec Hadoop Optimize et de Hadoop Optimize avec Java en fonction de diff rents crit res de performance, tels que le traitement (utilisation du CPU), le stockage et l'efficacit lors du traitement des donn es. Nos r sultats exp rimentaux montrent une am lioration du temps d'ex cution lors de l'utilisation de l'algorithme Map/Reduce optimis . En comparant Hadoop et Java, Hadoop est plus performant lorsque nous avons un cluster plusieurs noeuds et que la taille des donn es est importante. Cependant, lorsque nous avons un seul noeud et une petite taille de donn es, m me Java peut tre plus performant.
ThriftBooks sells millions of used books at the lowest everyday prices. We personally assess every book's quality and offer rare, out-of-print treasures. We deliver the joy of reading in recyclable packaging with free standard shipping on US orders over $20. ThriftBooks.com. Read more. Spend less.