W artykule prezentujemy szczegóły projektowo-implementacyjne naszego modularnego kodu symulacyjnego z wykorzystaniem MPI, w tym nakładaniem obliczeń i komunikacji. Podkreślamy modularność naszej implementacji pozwalającą na łatwą adaptację kodu dla innych zasotosowań. Prezentujemy związek pomiędzy przyspieszeniem obliczeń, rozmiarem i kształtami trójwymiarowych domen z różnymi stosunkami liczby węzłów aktualizowanych przez procesor do liczby węzłów wymienianych z sąsiednimi procesorami. Prezentujemy również związek pomiędzy efektywnością i czasem bezczynności przy finalizowaniu nieblokującej komunikacji, dla wszystkich testowanych konfiguracji, od 1 do 32 procesorów. Może to być pomocne przy wstępnej ocenie innych aplikacji uruchomionych na tym samym klastrze.
Authors
Additional information
- Category
- Publikacja w czasopiśmie
- Type
- artykuły w czasopismach recenzowanych i innych wydawnictwach ciągłych
- Language
- angielski
- Publication year
- 2005