Dans ce document, nous proposons une nouvelle strat?gie de v?rification de faits (recherche de la v?rit?), bas?e sur le clustering de donn?es en apprentissage automatique avec la m?thode des k-moyennes combin?e ? l'indice de silhouette pour d?terminer la valeur optimale de k, afin de d?tecter la partition optimale de l'ensemble des attributs. Une telle partition optimale maximise la pr?cision du processus de recherche de la v?rit? sans avoir ? explorer toutes les partitions possibles. Les r?sultats de nos exp?rimentations intensives sur des donn?es synth?tiques et r?elles montrent que notre approche surpasse celles dans (Lamine Ba et al., 2015), avec un co?t en temps de calcul plus raisonnable. Enfin, nous esquissons une mani?re de parall?liser un processus de recherche de la v?rit? donn? en utilisant le paradigme MapReduce en vue d'?viter l'explosion du temps d'ex?cution lorsque la taille des donn?es d'entr?e augmente.
ThriftBooks sells millions of used books at the lowest
everyday prices. We personally assess every book's quality and offer rare, out-of-print treasures. We
deliver the joy of reading in recyclable packaging with free standard shipping on US orders over $15.
ThriftBooks.com. Read more. Spend less.