In questo lavoro proponiamo una nuova strategia di verifica dei fatti (truth-finding), basata sul clustering dei dati di apprendimento automatico con il metodo k-means combinato con l'indice di silhouette per determinare il valore ottimale di k, al fine di individuare la partizione ottimale dell'insieme di attributi. Tale partizione ottimale massimizza l'accuratezza del processo di ricerca della verit? senza dover esplorare tutte le partizioni possibili. I risultati dei nostri esperimenti intensivi su dati sintetici e reali mostrano che il nostro approccio supera quelli di (Lamine Ba et al., 2015), con un costo di calcolo pi? ragionevole. Infine, abbozziamo un modo per parallelizzare un determinato processo di truth-finding utilizzando il paradigma MapReduce, al fine di evitare l'esplosione del tempo di esecuzione quando la dimensione dei dati di input aumenta.
ThriftBooks sells millions of used books at the lowest everyday prices. We personally assess every book's quality and offer rare, out-of-print treasures. We deliver the joy of reading in recyclable packaging with free standard shipping on US orders over $15. ThriftBooks.com. Read more. Spend less.