Cet ouvrage a pour objectif de d?velopper un mod?le permettant de classer un certain site Web comme l?gitime ou malveillant ? l'aide de m?thodologies d'apprentissage automatique et de d?terminer si l'augmentation du nombre de caract?ristiques d'un mod?le entra?ne une augmentation de ses performances. Les auteurs ont utilis? trois cas distincts pour g?n?rer un mod?le optimal, chaque cas diff?rant par le nombre de caract?ristiques utilis?es dans l'ensemble de donn?es. Le premier cas a utilis? la base ou l'ensemble de donn?es original. Le deuxi?me cas a utilis? un ensemble de caract?ristiques ?tendu. Un algorithme de s?lection des caract?ristiques a ?t? utilis? dans l'ensemble de caract?ristiques ?tendu pour cr?er un nouvel ensemble de donn?es pour le troisi?me cas. Les classificateurs utilis?s pour g?n?rer les mod?les sont Random Forest, J48, C-SVC et kNN. Le r?sultat a montr? une augmentation des performances en comparant les mod?les du premier cas ? ceux du deuxi?me cas. Aucun changement significatif n'a ?t? observ? lorsque les mod?les du deuxi?me cas ont ?t? compar?s ? ceux du troisi?me. L'?tude a montr? qu'il existe une relation directement proportionnelle entre le nombre de fonctionnalit?s d'un mod?le et les performances de ce dernier. L'augmentation du nombre de caract?ristiques de l'ensemble de donn?es conduit ? une augmentation de la performance de chaque mod?le.
ThriftBooks sells millions of used books at the lowest everyday prices. We personally assess every book's quality and offer rare, out-of-print treasures. We deliver the joy of reading in recyclable packaging with free standard shipping on US orders over $15. ThriftBooks.com. Read more. Spend less.