Zen 2 Architektur: Ryzen 3000 sind AMDs stärkste Desktop-Prozessoren
tl;dr: Nach der Computex-Ankündigung von 15 Prozent mehr IPC hat AMD heute alle technischen Details zur neuen Architektur Zen 2 verraten. Geändert wurde fast jedes Detail, am Ende kommt mit Ryzen 3000 ein rundherum schnelleres Paket zum Vorschein, das sich mit bis zu 16 Kernen zum stärksten Desktop-Prozessor aufschwingt.
26 Monate nach dem Start der ersten Zen-Prozessorgeneration startet AMD mit Zen 2 durch. Viele der ursprünglichen Ideen werden fortgesetzt, doch nicht weniger viele Dinge wurden auch geändert. Dies beginnt beim sichtbaren Teil der Prozessoren, sofern kein Heatspreader vorhanden ist, wie der Auslagerung vieler elementar wichtiger Funktionen einer CPU in einen speziellen, separaten I/O-Die, und setzt sich bis auf Transistorebene fort. Kombiniert mit einem optimierten Infinity Fabric wurden bisherige Schwachstellen angegangen, fortan soll Zen 2 beispielsweise deutlich schnelleren Speicher ansprechen können. Garniert wird das mit der erstmaligen Nutzung von PCI Express 4.0, das die gesamte Plattform aufwerten soll.
Zen 2 soll kleiner, stärker, skalierbarer und kompatibel sein
AMDs Design-Richtlinien an die eigene CPU-Abteilung für die Entwicklung von Zen 2 waren klar: Im Desktop sollte nicht nur die Leistung gesteigert werden, sondern auch die Skalierbarkeit auf dem bekannten Sockel AM4 beibehalten werden. Dabei herausgekommen sind mehr Kerne, aber auch eine verbesserte I/O, und das alles auf der gleichen AM4-Plattform, sodass ältere Mainboards bei einem CPU-Upgrade beibehalten werden können.
Durch den Sprung in der Fertigung von 14 nm und 12 nm mit Zen und Zen+ auf die junge 7-nm-Fertigung soll die Effizienz deutlich zulegen. TSMC sorgt mit AMDs Vorgaben für die Umsetzung und liefert beeindruckende Zahlen: Ein CPU-Complex (CCX), bestehend aus vier Kernen und 16 MB L3-Cache, ist im Jahr 2019 47 Prozent kleiner als beim Vorgänger: 31,3 mm² zu 60 mm².
Aus zwei CCX entsteht ein CPU-Die, der für acht Kerne, 32 MB L3-Cache sowie Teile des Interconnects Infinity Fabric 74 mm² groß ist. Ein Ryzen 7 3700X als direkter Nachfolger des Ryzen 7 2700X ist bei gleicher Anzahl an Kernen und Threads 75 Prozent effizienter – ein gewaltiger Sprung.
Alles beginnt beim Kern
Nach der Kehrtwende von der Modul-Architektur zurück zum klassischen CPU-Design setzt AMD diesen Weg fort. Die Basiskonfiguration ist identisch: Ein Kern soll auch in Zukunft zwei Threads bereitstellen, die sogenannte SMT-Unterstützung.
Verdoppelter L0-Cache und verbesserte Sprungvorhersage
Wie bei jedem CPU-Hersteller ist die erste Anlaufstelle für Leistungssteigerungen die Sprungvorhersage. Bei allen modernen Prozessoren von Intel und AMD wird diese von einem Micro-Op-Cache unterstützt, der Daten, die er bereits kennt, vorhält. So muss nicht die komplette Pipeline in Beschlag genommen werden, stattdessen darf dieser abkürzen und die Daten direkt zur Ausführung übergeben. Den großen Wert dieses mit Zen erstmals bei AMD eingeführten Quasi-L0-Caches hat auch AMD erkannt, er ist nun doppelt so groß wie beim Vorgänger und umfasst 4.096 Einträge.
Gehen die Anfragen den klassischen Weg, hilft die neue Sprungvorhersage, für die viele kleine Parameter geändert und größtenteils aufgebohrt wurden. Der auffälligste Punkt ist aber der von 64 KB auf 32 KB halbierte L1-Instruction-Cache. Mit von vierfach auf achtfach erhöhter Assoziativität sowie weiteren Anpassungen soll der L1-Instruction-Cache dennoch effektiver zu Werke gehen. Wie die Vorgängergeneration dekodiert jeder Zen-Kern am Ende vier Instruktionen pro Taktzyklus, und füttert zusammen mit dem Micro-Op-Cache die beiden Scheduler für Integer- und Fließkommaberechnungen.
Integer- und Fließkomma-Ausführungseinheiten ausgebaut
Die markantesten Änderungen im Bereich der ausführenden Einheiten sind auf der Integer-Seite zu finden. Auch dort wurden wie in allen anderen Teilbereichen die Buffer erweitert, eine zusätzliche AGU (Adress-Generierungs-Einheit) für Speicherbefehle markiert den Unterschied zu Zen.
Der Fließkommabereich bietet als große Neuerung nun die doppelte Bandbreite, was den modernen AVX2-Instruktionen zugute kommt. Bei der bisherigen Architektur mussten zwei 128-Bit-Leitungen zu einem AVX-256 zusammengeschaltet werden, nun erledigt den Auftrag eine Pipeline allein. Effektiv verdoppelt sich dadurch die Leistung.
Load/Store-Einheiten und der Cache folgen dem Schema
Dem allgemeinen Trend zur Optimierung und Vergrößerung folgen die Load- und Store-Einheiten. Die TLBs fassen mehr Daten, die Latenz wurde verringert. Daran schließt der 32 KB große L1-Datencache an, der von der verdoppelten Bandbreite profitieren soll.
Die Caches sind und bleiben ein Kernthema von Zen 2, die das Zusammenspiel aller Teilbereiche möglichst vielfältig und schnell unterstützen sollen. An den L1-Cache schließt traditionell ein L2-Cache an, der nach wie vor 512 KB pro CPU-Kern groß ist. Pro CCX, also für vier Kerne, gibt es einen gemeinsam genutzten 16 MB großen L3-Cache. Dieser ist aber aufgeteilt in vier Slices mit je vier Megabyte – auch dies sah bei Zen bereits so aus.
Aus zwei CCX wird ein CCD
Das CCX-Prozedere aus der Vorgängergeneration Zen wird so fortgeführt wie bisher. Doch fehlen nun der Speichercontroller und I/O-Features wie beispielsweise die PCIe-Lanes, diese sind stattdessen im neuen I/O-Die vertreten. Je nach Modell aus der Ryzen-3000-Familie kommt ein sogenannter CCD, der aus zwei CCX besteht, zum Einsatz, oder eben zwei – für 8 Kerne oder 16 Kerne der CPU.
Der Multi-Chip-Ansatz wird auf Sockel AM4 imposant fortgesetzt
Zen brachte das Multi-Chip-Design zurück auf die große Bühne. Früher war diese Herangehensweise einmal der Normalzustand, alle ersten Quad-Core-Prozessoren von Intel waren Multi-Chip-CPUs, basierend auf zwei Dies. Seinerzeit brachte AMD das native Design und stichelte gegen Intel, vor zwei Jahren kam Intels Retourkutsche gegen AMD und der Konkurrent sprach von „zusammengeklebten Dies“. Doch ohne Multi-Chip-Lösungen geht es nicht, das weiß auch Intel und bietet seit Neuestem wieder solche CPUs an. Und AMDs bestätigter Ansatz geht mit Zen 2 bei Ryzen 3000 in die nächste Stufe.
Ein oder zwei CPU-Dies nutzen gemeinsam einen I/O-Die
Multiple Chips auf einem Package sorgen für einen Kostenvorteil. Denn kleinere Chips zu fertigen, ist einfacher, die Ausbeute pro Wafer ist höher, denn der Platz wird besser genutzt. Beides trägt dazu bei, dass Ryzen 3000 trotz der Nutzung der teuren 7-nm-Fertigung von TSMC am Ende nicht teurer wird. Kombiniert werden die CPU-Dies mit dem I/O-Die, bei dem die Fertigungsstufe nicht im selben Maße wichtig ist. Deshalb nutzt AMD dort das deutlich günstigere 12-nm-Verfahren von Globalfoundries.
Neues Infinity Fabric ist deutlich schneller und effizienter
Der Ansatz der multiplen Chips steht und fällt mit der Verbindung. Die zweite Generation Infinity Fabric geht nicht nur mit dem modularen Aufbau noch besser um, zu aller erst wurde die Bandbreite erhöht, damit PCIe Express 4.0 realisiert werden konnte. Gleichzeitig wurde an der Verbindung in dem Sinne gearbeitet, dass sie sowohl Daten von einem Cache zu einem anderen schneller transferiert als auch Anfragen an den RAM mit geringerer Latenz ermöglicht. Insbesondere die unterschiedlichen Latenzen waren bei der ersten Generation mitunter ein Problem, was jedoch primär im Serverbereich zugegen war. Hier wird sich zeigen müssen, wie gut das neue Infinity Fabric mit acht CPU-Dies und einem I/O-Die umgeht.
Für die Desktop-Seite stehen andere Dinge im Vordergrund. Die Taktgeber CPU (fclk) und Speichercontroller (uclk) wurden entkoppelt, sind bis zu einem gewissen Grad aber noch an das Infinity Fabric gekoppelt, was sich unterm Strich aber positiv auf das Verhalten von (übertaktetem) DDR4-Speicher auswirkt. Ab DDR4-3733 wechselt der Teiler intern von 1:1 auf 2:1, mit leichtem Nachteil für die Latenz.
Fortan ist nicht mehr nur maximal beispielsweise DDR4-3800 möglich, AMD demonstrierte bereits Werte jenseits von DDR4-5100 mit den neuen Prozessoren. Nativ wird DDR4-3200 genutzt, als beste Lösung in Sachen Preis/Leistung empfiehlt AMD DDR4-3600. An dieser Empfehlung ist angesichts niedriger und weiter fallender Preise für DDR4-Speicher von ComputerBase-Seite nichts auszusetzen.
Der „alte“ Sockel AM4 gibt die Regeln beim Package vor
Eine Herausforderung war laut AMD die Weiterführung des komplett neuen Designs auf dem bisherigen Sockel. Die bis zu drei Dies erfordern ein 12-schichtiges Package, um die Signale sauber zu ihren jeweiligen Bestimmungsorten zu bringen. Dies ist nicht nur PCIe 4.0 geschuldet, nahezu jeder Teilbereich des Gesamtprodukts sitzt im Vergleich zu Ryzen 2000 an einer anderen Stelle, die gelieferten Daten müssen aber dennoch zu den passenden Pins geführt werden.
Hinzu kommt die Mischung aus zwei verschiedenen Technologiestufen auf einem Package, für die unterschiedliche Materialien verwendet werden. Die Chiplets setzten nicht mehr auf klassisch verlötete BGA-Kontakte wie bis Ryzen 2000, sondern auf sogenannte Copper Pillar. Diese sind deutlich kleiner und versprechen eine höhere Stromtragfähigkeit bei gleichzeitig geringerem elektrischen Widerstand, geringerer Induktivität sowie ̆besserer Widerstandsfähigkeit gegenüber Elektromigration. Das Verfahren ist seit 15 Jahren im CPU-Bereich bewährt, Intel nutzt es seit Presler, Yonah & Co.
Zu guter Letzt müssen alle Veränderungen auf dem Package untergebracht werden. Da es kleine Prozessoren gibt, die nur einen CPU-Die neben dem I/O-Die nutzen, andere aber zwei, musste das Produktionsverfahren diese Schritte beinhalten. Insgesamt hat allein diese Ausrichtung in den Fertigungslinien viel logistische Arbeit erfordert, erklärte AMD. Am Ende sind dafür drei große Firmen und Länder zuständig, die auch auf dem Heatspreader der CPU verewigt sind: Globalfoundries aus den USA für den I/O-Chip, TSMC aus Taiwan für die CPU-Dies und die Packaging-Werke von AMD in China: „Diffused in USA, Diffused in Taiwan, Made in China“.
Multi-Threaded ein Kaiser, Single-Threaded nun auch?
Seit dem Start der ersten Zen-Generation wird trotz des großen Sprungs zum Vorgänger Bulldozer noch immer der Rückstand bei der Leistung in Anwendungen für nur einen Kern moniert. Doch die Mischung aus neuer Fertigungsstufe, höherem Takt und nochmals verbesserter IPC sorgen bei Ryzen 3000 für einen gewaltigen Satz in der Leistungsklasse Single-Thread. Das Plus liegt laut AMD bei bis zu 21 Prozent gegenüber Zen+, also den Ryzen 2000.
Die Multi-Thread-Leistung bestimmen die Anzahl der Kerne sowie der Takt, hinzu kommt SMT. SMT soll sich ähnlich wie zuvor verhalten, eventuell sogar ein wenig besser, erklärt AMD, denn einige Optimierungen gab es auch dort. Hinsichtlich des Taktes greift zudem die Boni von Precision Boost 2 und Precision Boost Overdrive. Mit guter Kühlung sind durch eine automatische Übertaktung bis zu 200 MHz zusätzlich drin. XFR, wie es früher vorhanden war, gibt es nicht mehr. Das läuft jetzt alles im Rahmen des normalen Turbos.
Die Modellpalette von Ryzen 3000 zum Start
Sechs Prozessoren wird AMD als Matisse-Prozessorfamilie in den Handel schicken, ab dem 7. Juli sollen fünf verfügbar sein und damit am selben Tag wie die Radeon RX 5700 XT und die Radeon RX 5700, das Flaggschiff Ryzen 9 3950X mit 16 Kernen folgt im September. Diese CPU konkurriert bei der Die-Ausbeute mit den Epyc-2-Serverprozessoren, die auf Acht-Kern-Dies angewiesen ist, um ihrerseits 64 Kerne bereitzustellen. Solch ein Ableger wird als Threadripper 3000 im High-End-Bereich erwartet, doch nicht vor dem Jahresende oder gar erst 2020.
Wie zuletzt eingeführt, wird es keine reinen Ryzen-3-CPUs mehr geben, diese Aufgabe fällt den APUs zu, erst bei den Ryzen 5 starten die CPUs. Passend dazu hat AMD mit den beiden Picasso-Desktop-Prozessoren zwei neue Lösungen seit heute offiziell im Programm.
Kerne/Threads | Takt Basis / Turbo | L3 | TDP | Preis (Launch) | |
---|---|---|---|---|---|
Ryzen 9 3950X | 16/32 | 3,5 / 4,7 GHz | 64 MB | 105 W | ab September |
Ryzen 9 3900X | 12/24 | 3,8 / 4,6 GHz | 64 MB | 105 W | 499 USD |
Ryzen 7 3800X | 8/16 | 3,9 / 4,5 GHz | 32 MB | 105 W | 399 USD |
Ryzen 7 3700X | 8/16 | 3,6 / 4,4 GHz | 32 MB | 65 W | 329 USD |
Ryzen 7 1800X | 8/16 | 3,6 / 4,0 GHz | 16 MB | 95 W | 499 USD |
Ryzen 7 2700X | 8/16 | 3,7 / 4,3 GHz | 16 MB | 105 W | 329 USD |
Ryzen 7 1700X | 8/16 | 3,4 / 3,8 GHz | 16 MB | 95 W | 399 USD |
Ryzen 7 2700 | 8/16 | 3,2 / 4,1 GHz | 16 MB | 65 W | 299 USD |
Ryzen 7 1700 | 8/16 | 3,0 / 3,7 GHz | 16 MB | 65 W | 329 USD |
Ryzen 5 3600X | 6/12 | 3,8 / 4,4 GHz | 32 MB | 95 W | 229 USD |
Ryzen 5 2600X | 6/12 | 3,6 / 4,2 GHz | 16 MB | 95 W | 229 USD |
Ryzen 5 1600X | 6/12 | 3,6 / 4,0 GHz | 16 MB | 95 W | 249 USD |
Ryzen 5 3600 | 6/12 | 3,6 / 4,2 GHz | 32 MB | 65 W | 199 USD |
Ryzen 5 2600 | 6/12 | 3,4 / 3,9 GHz | 16 MB | 65 W | 199 USD |
Ryzen 5 1600 | 6/12 | 3,2 / 3,6 GHz | 16 MB | 65 W | 219 USD |
Optimierungen mit Windows 10 May 2019
AMDs CPU-Architekturen und Windows 10 standen zum Start oft auf Kriegsfuß. Es funktioniert zwar alles, doch lange nicht so gut wie mit späteren Patches. Dies war bereits bei Bulldozer & Co. der Fall, auch Zen spielte sein volles Potential zum Launch nicht aus. Das aktuelle Mai-2019-Update von Windows 10 bringt einige Verbesserungen und Optimierungen für die Ryzen-3000-Familie mit. Dabei geht es unter anderem darum, dass zuerst die Kerne in einem CCX genutzt werden, bevor zu einem anderen gesprungen wird. Dadurch lässt sich die Latenz deutlich reduzieren, im Best-Case-Szenario, wenn Spiele auf wenige Kerne setzen, diese zuvor aber ungleichmäßig über die CCX verteilt waren, nennt AMD 15 Prozent Leistungsgewinn.
Die Collaborative Processor Performance Control (CPPC2) auf der anderen Seite sorgt automatisch für die richtige Leistung basierend auf den Anforderungen, aber auch basierend auf den thermischen Gegebenheiten, die unter anderem durch Informationen vom Betriebssystem bereitgestellt werden. Das neue Windows-10-Update sorgt zusammen mit der neuen Hardware und vollem CPPC2-Support beispielsweise bei PCMark 10 für einen kleinen Geschwindigkeitsschub beim Start von Anwendungen.
Zen 2 ist (fast) vollständig sicher
Die riesigen Sicherheitslücken in modernen Prozessoren haben den Glauben in die Industrie zum Teil stark erschüttert. Nahezu alle Hersteller sind das Ziel, aber nicht alle sind gleich stark betroffen. AMD ist im Gegensatz zu Intel, die nahezu über jeder Lücke angreifbar waren, nur in einigen Teilbereichen betroffen gewesen. Die beiden Spectre-Varianten werden nun aber zum Teil durch die Hardware unterdrückt, ganz ohne das Betriebssystem geht es aber selbst mit Zen 2 nicht. Gegen alle anderen Probleme ist AMDs Architektur nach derzeitigem Stand immun.
Erster Eindruck
Äußerst solides CPU-Handwerk trifft auf sehr gute Fertigung, und das, was dabei herausgekommen ist, weiß nach erster Einschätzung zu gefallen. Die wenigen Schwachstellen der ersten Generation wurden auf dem Papier nahezu alle beseitigt, die Stärken zudem ausgebaut. Die IPC-Steigerung von 15 Prozent gegenüber Zen+ ist beeindruckend, binnen zwei Jahren diese Messlatte auf knapp 20 Prozent zu ziehen, nachdem Zen gegenüber Bulldozer schon mehr als 50 Prozent brachte, gab es in den vergangenen 30 Jahren nur selten.
Zudem ist die Leistung nicht mehr nur bei Mehr-Kern-Last-Szenarien sehr hoch, sondern auch im Single-Thread und insbesondere beim Gaming, wo Intel der Platzhirsch war. Dies lies den blauen Riesen zu einem frühen Konter ausholen, den Core i9-9900KS mit 5 GHz über alle Kerne und Threads – doch der kommt erst im vierten Quartal.
Durch die alsbaldige Verfügbarkeit von Ryzen 3000 steht einer unabhängigen Beurteilung der Prozessoren in den kommenden drei Wochen nichts im Weg. AMD stellt dafür nicht nur die neue X570-Plattform bereit, auch zwei Jahre alte Mainboards sollen funktionieren. Dort steht aber noch ein kleines Fragezeichen, bis heute sind lauffähige BIOS kaum verfügbar, viele Hersteller sprechen frühestens von Mitte Juni – ComputerBase musste das bereits aus erster Hand lernen. Doch die Mehrzahl der Kunden dürfte ohnehin einen kompletten Neukauf erwägen, um alle Features wie etwa PCIe 4.0 nutzen zu können.
ComputerBase hat die Informationen zu diesem Bericht von AMD unter NDA erhalten. Die einzige Vorgabe war der Zeitpunkt zur Veröffentlichung, der von AMD festgesetzt worden war. Der Bereitstellung dieser Materialien war die Teilnahme an einer Presseveranstaltung Mitte Juni in Los Angeles, USA, vorausgegangen. Die Kosten für An- und Abreise sowie Unterkunft wurden von AMD getragen.
Dieser Artikel war interessant, hilfreich oder beides? Die Redaktion freut sich über jede Unterstützung durch ComputerBase Pro und deaktivierte Werbeblocker. Mehr zum Thema Anzeigen auf ComputerBase.