Questo libro una guida pratica che si concentra esclusivamente su implementazioni reali e soluzioni eseguibili utilizzando Hadoop e il suo ecosistema. progettato come una risorsa orientata al laboratorio in cui i lettori apprendono le tecnologie Big Data eseguendo direttamente configurazioni, comandi e attivit di analisi. Il libro inizia con l'impostazione e l'installazione di Hadoop sia in modalit operativa pseudo-distribuita che completamente distribuita. I lettori implementano quindi le attivit essenziali di gestione dei file HDFS, tra cui l'aggiunta di file e directory, il recupero di dati da HDFS e l'eliminazione di file. Questi esercizi aiutano gli utenti a prendere confidenza con i sistemi di archiviazione distribuiti. Il libro fornisce molteplici implementazioni MapReduce, iniziando con una soluzione Word Count per calcolare il numero di occorrenze di ogni parola in file di input di grandi dimensioni. Include inoltre programmi per la ricerca di parole basata su parole chiave e l'eliminazione delle stop word da grandi set di dati testuali. Una sezione dedicata si concentra sul data mining meteorologico utilizzando MapReduce, in cui vengono implementati programmi per calcolare le temperature medie, massime e minime per ogni anno e per filtrare i record in base alle soglie di temperatura.
ThriftBooks sells millions of used books at the lowest
everyday prices. We personally assess every book's quality and offer rare, out-of-print treasures. We
deliver the joy of reading in recyclable packaging with free standard shipping on US orders over $15.
ThriftBooks.com. Read more. Spend less.