12 - Rechnerarchitektur [ID:10880]
50 von 693 angezeigt

irgendwie kommt mir das in einem neuen Jahr so unscharf vor.

Und da ist auch noch Platz frei.

Also wir hatten diese Auflistung da, die ich Ihnen gezeigt habe,

die mir die ganzen Unterschiede darstellt, die wir bei den Prozessoren haben.

Wir haben die CIS-Gris-Prozessoren, die wir von Anfang an im Kapitel 2

und im Kapitel 1 schon kennengelernt haben.

Dann haben wir diese Mikrocontroller, digitalen DSPs, digitalen Signalprozessoren.

Die Application-Specific Instruction Set Processor und so ein DSP

ist im Prinzip ein Beispiel für ein Application-Specific Instruction Set Processor.

Also der hat für eine bestimmte Anwendung einen spezifischen Buffet-Satz.

Und speziell bei diesen Signalprozessoren, die sind darauf geeicht,

solche Mac-Operationen durchzuführen, Multiply and Accumulate.

Dann haben wir hier die programmierbare Hardware.

Ich denke, das könnte ich heute noch schaffen,

mal je nachdem, wie viel Zeit wir brauchen für die Prüfungstermine auszumachen.

Und am Ende hier die ASICs.

Und wenn man sich das also anschaut, dann nimmt die Stückzahl hier jetzt als klasse betrachtet,

von oben nach unten zu, das heißt, dass in der Welt haben wir viel mehr ASICs als Intel-Prozessoren.

Ich denke, das ist aber verblüffend.

Durchaus der Fall, gucken Sie ruhig mal ins Auto rein, was da alles an ASICs drin sind.

Übrigens, hier ist noch ein Platz.

Dann setzen Sie sich doch da hin, bevor Sie da für eineinhalb Stunden lang stehen müssen.

Und ja, hinsichtlich der Flexibilität habe ich natürlich bei den Universalprozessoren

die höchsten Freiheitsgrade, hier habe ich so gut wie Null Flexibilität bei diesen ASICs.

Weil ein ASIC ist tatsächlich gemacht worden für eine spezielle Funktion.

Den habe ich in Hardware gegossen und der führt diese Funktion aus und sonst eigentlich nichts.

Die macht er besonders gut.

Und wenn es faire Bedingungen wären, faire Bedingungen heißt, dass ich die gleiche Technologie

für diesen ASIC anwende wie für diese Universalprozessoren, dann sollte der ASIC natürlich

für diese spezielle Funktion wesentlich schneller sein, sonst ist da irgendwas schief gelaufen.

In der Regel würde das aber gar nicht sein, weil für diese ASICs ich nicht unbedingt den

höchst aggressivsten Technologieprozess anwende wie bei Ziskprozessoren, bei Intel, wo wir jetzt bei 14 Nanometer sind.

Das wäre allerdings für die ASICs völlig übertrieben.

Das würde die Kosten so in die Höhe treiben, dass heute wird es mal richtig voll.

Ich habe wahrscheinlich jetzt hier umgesprochen, ich mache die Termine aus.

Das würde die Kosten so in die Höhe treiben, dass das eigentlich sich nicht mehr lohnen würde.

So, da kann ich noch gleich einen Stuhl spendieren.

So, und voila, machen sie sich bequem.

So, die Grafik hatte ich Ihnen letzte Woche schon mal gezeigt.

Und wie gesagt, in den Prüfungen, manchmal lege ich die auf und bzw. ne, die lege ich nicht auf.

Hier sage ich, wie kann man die klassifizieren.

Das wäre jetzt zu einfach, die auch noch aufzulegen.

Das kann man sich schon nur merken.

Und dann, wie sind die hinsichtlich der verschiedenen Eigenschaften da eben zu bewerten?

Okay, auch vom elektrischen Leistungsverbrauch ist es natürlich so, dass die wesentlich höher sind als die ASICs.

Es ist ja klar, weil die schleppen unheimlich viel Overhead mit.

Die haben ein Leitwerk und komplizierte Dinge, was wir kennengelernt haben, Sprungvorhersagen usw.

Das kostet natürlich alles letztendlich auch Energie, was wir hier unten bei dem ASICs nicht haben.

Ja, und da wollen wir jetzt noch ein bisschen einsteigen und erklären das, bevor ich dann zu konkreteren Beispielen übergehe.

Ja, dann haben wir also diese Universalprozessoren oder General Purpose Prozessoren, Hochleistungsprozessoren,

Teil einer Videoserie :

Zugänglich über

Offener Zugang

Dauer

01:19:21 Min

Aufnahmedatum

2018-01-22

Hochgeladen am

2019-05-01 12:49:03

Sprache

de-DE

Die Vorlesung baut auf die in den Grundlagen der Rechnerarchitektur und -organisation vermittelten Inhalte auf und setzt diese mit weiterführenden Themen fort. Es werden zunächst grundlegende fortgeschrittene Techniken bei Pipelineverarbeitung und Cachezugriffen in modernen Prozessoren und Parallelrechnern behandelt. Ferner wird die Architektur von Spezialprozessoren, z.B. DSPs und Embedded Prozessoren behandelt. Es wird aufgezeigt, wie diese Techniken in konkreten Architekturen (Intel Nehalem, GPGPU, Cell BE, TMS320 DSP, Embedded Prozessor ZPU) verwendet werden. Zur Vorlesung werden eine Tafel- und eine Rechnerübung angeboten, durch deren erfolgreiche Beteiligung abgestuft mit der Vorlesung 5 bzw. 7,5 ECTS erworben werden können. In den Tafelübungen werden die in der Vorlesung vermittelten Techniken durch zu lösende Aufgaben vertieft. In der Rechnerübung soll u.a. ein einfacher Vielkern-Prozessor auf Basis des ZPU-Prozessors mit Simulationswerkzeugen aufgebaut werden. Im Einzelnen werden folgende Themen behandelt:
  • Organisationsaspekte von CISC und RISC-Prozessoren

  • Behandlung von Hazards in Pipelines

  • Fortgeschrittene Techniken der dynamischen Sprungvorhersage

  • Fortgeschritten Cachetechniken, Cache-Kohärenz

  • Ausnutzen von Cacheeffekten

  • Architekturen von Digitalen Signalprozessoren

  • Architekturen homogener und heterogener Multikern-Prozessoren (Intel Corei7, Nvidia GPUs, Cell BE)

  • Architektur von Parallelrechnern (Clusterrechner, Superrechner)

  • Effiziente Hardware-nahe Programmierung von Mulitkern-Prozessoren (OpenMP, SSE, CUDA, OpenCL)

  • Leistungsmodellierung und -analyse von Multikern-Prozessoren (Roofline-Modell)

Empfohlene Literatur
  • Patterson/Hennessy: Computer Organization und Design
  • Hennessy/Patterson: Computer Architecture - A Quantitative Approach

  • Stallings: Computer Organization and Architecture

  • Märtin: Rechnerarchitekturen

Einbetten
Wordpress FAU Plugin
iFrame
Teilen