Os outliers s?o considerados como dados ruidosos nas estat?sticas, revelou-se um problema importante que est? a ser investigado em diversos campos de investiga??o e dom?nios de aplica??o. Muitas t?cnicas de detec??o de outliers foram desenvolvidas especificamente para certos dom?nios de aplica??o, enquanto que algumas t?cnicas s?o mais gen?ricas. Alguns dom?nios de aplica??o est?o a ser pesquisados em estrita confidencialidade, como a investiga??o sobre crime e actividades terroristas. As t?cnicas e os resultados de tais t?cnicas n?o s?o prontamente divulgados. As grandes an?lises de dados tornaram-se muito populares no cen?rio actual e a manipula??o de grandes dados ganhou a grande aten??o dos investigadores no campo da an?lise de dados. A computa??o em nuvem fornece recursos infra-estruturais poderosos e econ?micos para os utilizadores da nuvem lidarem com grandes dados cada vez maiores com estruturas de processamento de dados tais como MapReduce. Este trabalho considera dois algoritmos de clustering conhecidos como DBScan e K-Means e implementados com o conjunto de dados Sensed da Intel Corporation.
ThriftBooks sells millions of used books at the lowest
everyday prices. We personally assess every book's quality and offer rare, out-of-print treasures. We
deliver the joy of reading in recyclable packaging with free standard shipping on US orders over $15.
ThriftBooks.com. Read more. Spend less.