3 - Kernel Offloading for FPGA with Optimized Remote Accesses/ClipID:2197 vorhergehender Clip nächster Clip

Die automatischen Untertitel, die mit Whisper Open AI in diesem Video-Player (und im Multistream-Video-Player) generiert werden, dienen der Bequemlichkeit und Barrierefreiheit. Es ist jedoch zu beachten, dass die Genauigkeit und Interpretation variieren können. Für mehr Informationen lesen Sie bitte die FAQs (Absatz 14)
Aufnahme Datum 2012-05-18

Lehrende(r)

PD Dr. Alain Darte

Zugang

Frei

Sprache

Deutsch

Einrichtung

Sonderforschungsbereich/Transregio 89 Invasives Rechnen

Produzent

MultiMediaZentrum

Format

Vortrag

Some data- and compute-intensive applications can be accelerated by offloading portions of codes to platforms such as GPGPUs or FPGAs. However, to get high performance for these kernels, it is mandatory to restructure the application, to generate adequate communication mechanisms for the transfer of remote data, and to make good usage of the memory bandwidth. In the context of the high-level synthesis (HLS), from a C program, of hardware accelerators on FPGA, we show how to automatically generate optimized remote accesses for an accelerator communicating to an external DDR memory. Loop tiling is used to enable block communications, suitable for DDR memories. Pipelined communication processes are generated to overlap communications and computations, thereby hiding some latencies, in a way similar to double buffering. Finally, data reuse among tiles is exploited to avoid remote accesses when data are already available in the local memory.

Nächstes Video

Mitra
Prof. Subhasish Mitra
2012-05-24
Frei
Schloss1
Prof. Dr. Lothar Thiele
2012-07-06
Frei
Mueller-Schloer
Prof. Dr. Christian Müller-Schloer
2012-07-25
Frei

Mehr Videos aus der Kategorie "Friedrich-Alexander-Universität Erlangen-Nürnberg Zentralbereich"

2024-03-19
Passwort
geschützte Daten  
2024-03-14
Passwort
geschützte Daten  
2024-03-08
IdM-Anmeldung
geschützte Daten  
2024-03-06
Passwort
geschützte Daten