W artykule prezentujemy szczegóły projektowo-implementacyjne naszego modularnego kodu symulacyjnego z wykorzystaniem MPI, w tym nakładaniem obliczeń i komunikacji. Podkreślamy modularność naszej implementacji pozwalającą na łatwą adaptację kodu dla innych zasotosowań. Prezentujemy związek pomiędzy przyspieszeniem obliczeń, rozmiarem i kształtami trójwymiarowych domen z różnymi stosunkami liczby węzłów aktualizowanych przez procesor do liczby węzłów wymienianych z sąsiednimi procesorami. Prezentujemy również związek pomiędzy efektywnością i czasem bezczynności przy finalizowaniu nieblokującej komunikacji, dla wszystkich testowanych konfiguracji, od 1 do 32 procesorów. Może to być pomocne przy wstępnej ocenie innych aplikacji uruchomionych na tym samym klastrze.
Autorzy
Informacje dodatkowe
- Kategoria
- Publikacja w czasopiśmie
- Typ
- artykuły w czasopismach recenzowanych i innych wydawnictwach ciągłych
- Język
- angielski
- Rok wydania
- 2005