EPISODE · Aug 31, 2017 · 32 MIN
Analysing colliding particles with 256 Threads - Performance of an embarrassingly parallel problem on the Intel Xeon Phi Knights Landing (mrmcd17)
from Chaos Computer Club - archive feed (high quality) · host chrysh
Ich habe ein Jahr lang am CERN meine Masterarbeit zum Thema Vektorisierung/Parallelisierung eines CERN-Photon-Pattern-Recognition-Algorithmus geschrieben. Das Hauptaugenmerk lag auf Optimierung der Performance durch Vektorisierung/Parallelisierung, sodass der Algorithmus auf einem Intel Xeon Phi Knights Landing (64 Kerne à 4 Hyperthreads) möglichst performant läuft. Kurz gesagt, ich habe versucht ein "inherently embarrassingly parallel problem" mit OpenMP, Vector libraries, Variablen im Speicher an Cacheline-Grenzen ausrichten, Mathe-Tricks, etc so schnell wie möglich zu kriegen. Dieser Vortrag gibt eine Einführung in die Welt der manycore-Systeme aus Sicht eines Informatikers. about this event: https://c3voc.de
NOW PLAYING
Analysing colliding particles with 256 Threads - Performance of an embarrassingly parallel problem on the Intel Xeon Phi Knights Landing (mrmcd17)
No transcript for this episode yet
Similar Episodes
No similar episodes found.