Un'enorme quantit di dati viene raccolta e archiviata nei database di tutto il mondo. Questi dati si accumulano e continuano ad aumentare ogni anno. Estrarre le informazioni nascoste in questi database e classificare le informazioni estratte sono i compiti pi importanti del data mining. Se questi insiemi di dati sono sbilanciati, diventa difficile gestirli. La previsione del futuro uno dei compiti fondamentali del data mining. Lavorare con insiemi di dati sbilanciati per prevedere i possibili risultati un compito molto noioso. Un set di dati sbilanciato quando non viene classificato correttamente, quando una classe contiene pi istanze di altre. Spesso vengono rappresentate come una classe positiva (minoranza) e una negativa (maggioranza). La classe che ha un numero minore di campioni chiamata classe minoritaria, mentre quella che ne ha di pi chiamata classe maggioritaria. I dataset sbilanciati causano molti problemi seri nel data mining, per lo pi l'algoritmo di classificazione standard considera il dataset come bilanciato, che a sua volta parziale verso la classe maggioritaria. Per applicazioni come la diagnosi medica, ci provoca effetti molto gravi. Il bilanciamento del set di dati quindi fondamentale per molte applicazioni in tempo reale.
ThriftBooks sells millions of used books at the lowest
everyday prices. We personally assess every book's quality and offer rare, out-of-print treasures. We
deliver the joy of reading in recyclable packaging with free standard shipping on US orders over $15.
ThriftBooks.com. Read more. Spend less.