L'extraction et l'analyse des donn es ont r cemment fait l'objet d'une attention particuli re en raison de l' volution des m dias sociaux et du grand volume de donn es disponibles sous une forme non structur e. Hadoop et Map-Reduce ont t continuellement mis en oeuvre et ont analys de grandes quantit s de donn es. Dans ce livre, Apache Pig, qui est l'une des plateformes de haut niveau pour l'analyse d'un grand volume de donn es et qui fonctionne au-dessus de Hadoop, est utilis pour analyser des fichiers journaux non structur s et en extraire des informations. Dans ce livre, les fichiers de serveurs de blogs sont utilis s pour analyser et extraire des informations significatives sous une forme non structur e vers une forme structur e dans le cadre d'Apache Pig. Nous mesurerons l'efficacit et les performances lorsqu'un grand volume de donn es est trait en mode Map-Reduce et en mode local.
ThriftBooks sells millions of used books at the lowest everyday prices. We personally assess every book's quality and offer rare, out-of-print treasures. We deliver the joy of reading in recyclable packaging with free standard shipping on US orders over $20. ThriftBooks.com. Read more. Spend less.