Lays Helena Lopes Veloso / Luciano José Senger
Librería Samer Atenea
Librería Aciertas (Toledo)
Kálamo Books
Librería Perelló (Valencia)
Librería Elías (Asturias)
Donde los libros
Librería Kolima (Madrid)
Librería Proteo (Málaga)
Questo lavoro aveva come obiettivo quello di studiare l’utilizzo di un algoritmo di raggruppamento K-Means parallelo, basato sul modello di programmazione MapReduce, per migliorare i tempi di risposta del data mining. Le prestazioni dell’algoritmo sono state valutate in termini di SpeedUp e ScaleUp. A tal fine sono stati eseguiti esperimenti su un cluster Hadoop composto da sei computer con hardware comune. I dati raggruppati sono misurazioni delle torri di flusso delle regioni agricole e appartengono ad Ameriflux. Gli esperimenti sono stati eseguiti utilizzando rispettivamente 3, 4 e 6 macchine. I risultati hanno mostrato che con l’aumento del numero di macchine si è ottenuto un miglioramento delle prestazioni, con il miglior tempo ottenuto utilizzando sei macchine, raggiungendo uno SpeedUp di 3,25. È stato verificato che l’applicazione scala bene con l’aumento equivalente della dimensione dei dati e del numero di macchine nel cluster, raggiungendo prestazioni simili nei test.