Lays Helena Lopes Veloso / Luciano José Senger
Librería Samer Atenea
Librería Aciertas (Toledo)
Kálamo Books
Librería Perelló (Valencia)
Librería Elías (Asturias)
Donde los libros
Librería Kolima (Madrid)
Librería Proteo (Málaga)
Celem niniejszej pracy było zbadanie zastosowania algorytmu grupowania K-Means równoległego, opartego na modelu programowania MapReduce, w celu poprawy czasu odpowiedzi eksploracji danych. Wydajność algorytmu została oceniona pod kątem SpeedUp i ScaleUp. W tym celu przeprowadzono eksperymenty w klastrze Hadoop złożonym z sześciu komputerów o standardowej specyfikacji sprzętowej. Zgrupowane dane to pomiary wież przepływowych regionów rolniczych i należą do Ameriflux. Eksperymenty przeprowadzono przy użyciu odpowiednio 3, 4 i 6 maszyn. Wyniki pokazały, że wraz ze wzrostem liczby maszyn nastąpił wzrost wydajności, przy czym najlepszy czas uzyskano przy użyciu sześciu maszyn, osiągając SpeedUp na poziomie 3,25. Stwierdzono, że aplikacja dobrze skaluje się wraz z równoważnym wzrostem rozmiaru danych i liczby maszyn w klastrze, osiągając zbliżoną wydajność w testach.