Bericht AMD Polaris: So viel Leistung bringt die 4. Generation GCN

Krautmaster · 15. August 2016

Ne der Vergleich wäre fürn Arsch, es geht hier nicht um OC sondern um das Architektur Scaling. Genauso Verbrauch usw total hier fehl am Platz.

Flare · 15. August 2016

Super Artikel Wolfgang, Danke

Es hat teilweise mit der Speicher-Roh-Bandbreite zu tun aber auch mit den fehlenden Rendering bzw. Rastering Techniken die Nvidia seit Maxwell nutzt.
Die wiederum ihre Effektivität erst zeigen wenn mann massive Leistung zur Erstellung der 3D-Vertex-Szenerie (Geometrie/Tesselation/teilweise auch bei Rasterisierung) zur Verfügung hat, dort wird dann sozusagen Vorgetestet was sich überhaupt zu berechnen lohnt,

Nvidia nutzt die massive Dreiecksleistung um eine aus dem Mobile-Bereich stammende Technik anzuwenden die eigentlich in Real-Time-Rendering nicht verwendbar ist weil aus Zeitgründen nichts Vorrausberechnet werden kann, nebenbei wird ja auchnoch spekulativ in die Zukunft geschaut/vorberechnet, das schafft AMD aktuell nicht in dem Maß,

ABER Nvidia ist so schnell und effizient das es doch geht.
Gut das ist nicht alles worauf es ankommt, aber es hebt massiv die Gesamteffizienz.

Culled-Leistung RX 480 4861
Culled-Leistung GTX 1060 7111 +46%
http://www.hardware.fr/articles/953-7/performances-theoriques-geometrie.html

Krautmaster · 15. August 2016

Nvidia hat ziemlich genial Tiled Rastering mit Maxwell eingeführt was wohl der das Geheimnis hinter der hohen Effizienz zu sein scheint.

http://www.anandtech.com/show/10536/nvidia-maxwell-tile-rasterization-analysis

Deathangel008 · 15. August 2016

sehr interessanter test, danke dafür.

EchoeZ · 15. August 2016

Krautmaster schrieb:
Genauso Verbrauch usw total hier fehl am Platz.

Man kann eine Architektur schneller und/oder effizienter machen. Hier wurde nur ein Teil der Verbesserung beleuchtet. Der andere Teil wäre aber auch wichtig. Der absolute Verbrauch ist mir seit einigen Generationen wumpe, soviel zocke ich nicht daß mir 'ne Graka die Haare vom Kopf frisst (die würde in dem Fall sowieso verhungern

) und die resultierende Wärme krieg ich ebenso lange recht lautlos in den Griff...
aber alleine um die Veresserungen über die Gens hinweg vollständig bewerten zu können, wären ein paar Wattangaben schon schön gewesen.

Ergänzung (15. August 2016)

Krautmaster schrieb:
Nvidia hat ziemlich genial Tiled Rastering mit Maxwell eingeführt was wohl der das Geheimnis hinter der hohen Effizienz zu sein scheint.

http://www.anandtech.com/show/10536/nvidia-maxwell-tile-rasterization-analysis

Sowas in der Art hat doch auch Polaris 11, ungenutze Shader werden deaktiviert, wenn ich das richtig verstanden habe

Ned Flanders · 15. August 2016

Ist denn Speicherbandbreite wirklich alles bei Grafikkarten? Die Zugriffszeiten sind ja schon Takt abhängig und nicht von der Breite des Interfaces.

Nitschi66 · 15. August 2016

Sowas in der Art hat doch auch Polaris 11, ungenutze Shader werden deaktiviert, wenn ich das richtig verstanden habe

Dann hast du das falsch verstanden. Tiled Rastering und PowerGating sind zwei völlig verschiedene Sachen.
Das eine (TR) ist eine Methode ein Bild zu berechnen und das andere (PG) schaltet bestimmte Bereiche des Chips aus, wenn die Karte nicht zu 100% ausgelastet ist.

Krautmaster · 15. August 2016

@EchoeZ

Naja aber über mehrere Fertigungstufen hinweg kann man das Effizienz Thema 0 beleuchten. Viel eher könnte man das noch versuchen in Relation zu Transistor Count zu setzen aber im Prinzip hat sich GCN doch kaum verändert. Denke die Änderungen Seitens Performance gehen auf Kappe der ACE und anderen Frontend Anpassungen die die eigentlichen Shader deckeln.

eSportWarrior · 15. August 2016

Na warum sollte denn da was groß optimiert werden wenn HBM2 vor der Tür steht.

Sind ja auch wieder etliche 1000 Arbeitsstunden die man wo anders besser einsetzen kann.

Amd hat halt nicht die Ressourcen von Intel+Nvidia. Jetzt ne Grafikkarte kaufen währe eh schmarrn (wenn man nicht gerade von einer sehr schwachen kommt), HBM2 ist der real deal für die Zukunft (bei Nvidia und AMD) und so viele Monate sinds da auch nicht mehr hin.

neueinsteiger84 · 15. August 2016

Na bzgl. des Verbrauchs kann man doch auch mal schnell zum Test der RX 470 gehen.
Dann sollte man noch im Hinterkopf behalten, dass die Asus RX-470 Strix üblicherweise zwischen 1075-1185 Mhz taktet. Das ist bereits schneller als in dem Test hier, bei dem der Takt auf 1040MHz gehalten wurde. Daher kann man wohl mit einer Leistungsaufnahme des Gesamtsystems beim Gaming von 200W (oder gar noch weniger) ausgehen.

Wenn man dann noch den alten Test zur R9 380X anschaut erkennt man, dass die R9 380X Nitro ebenfalls mit den 1040MHz läuft.

Diese ist glücklicherweise im Test zur RX-470 auch angegeben und da verbraucht das Gesamtsystem 264W.

Kurz gesagt, ich schätze mal mit einer geringeren Leistungsaufnahme von 60-70W. Ist zwar jetzt nicht super genau, aber so als grobe Richtlinie kann es wohl dienen. Sollte ich einen Fehler gemacht haben, bitte weißt mich darauf hin

Krautmaster · 15. August 2016

Sagt halt 0 über die Architektur aus und um die dreht sich der Artikel...

neueinsteiger84 · 15. August 2016

@ Krautmaster:
Ja und? Ich habe auch nicht gesagt, dass es in den Artikel gehört. Aber ein paar Leute interessieren sich dafür, also habe ich mal eine grobe Abschätzung gemacht.

Wenn es dir egal ist, ok. Andere können vielleicht damit was anfangen.

Krautmaster · 15. August 2016

das war auch keine Kritik an deiner Aussage sondern eine Feststellung

Wenns drum geht den Verbrauch Polaris 10 in einer RX 480 vs eine 380X zu stellen kann man den Launch Artikel lesen. (oder halt den der RX 470...)

EchoeZ · 15. August 2016

Nitschi66 schrieb:
Dann hast du das falsch verstanden. Tiled Rastering und PowerGating sind zwei völlig verschiedene Sachen.
Das eine (TR) ist eine Methode ein Bild zu berechnen und das andere (PG) schaltet bestimmte Bereiche des Chips aus, wenn die Karte nicht zu 100% ausgelastet ist.

ok, danke..Eigentlich interessieren mich die feinen Details wenig bis garnicht, mir kommts darauf an was unterm Strich rumkommt.
Deswegen habe ich Krautmasters link garnicht erst angesehen.

@Krautmaster
Sind denn nicht ACE und Frontend Teile der Architektur?

neueinsteiger84 · 15. August 2016

Alles klar, klang irgendwie so negativ

Geschriebener Text erlaubt leider keine Betonung wie die gesprochene Sprache.

Ich habe dann auch extra auf die entsprechenden Tests verlinkt, damit Leute, die sich für den Verbrauch interessieren da auch nachschauen können

Unnu · 15. August 2016

incurable schrieb:
Naja, dann würde die 480 halt näher an den 12,5% mehr Rohleistungvorteil liegen

Sicher?
Erstens kann man den GDDR5X besser übertakten. Höher taktet er sowieso.
Ausserdem gäbe es mehr CUs (40?) anstatt derer 36 und mehr Bandbreite hilft auch noch. (Ich glaube AMD immer noch nicht so ganz, dass diese 36CUs der Vollausbau sein sollen!)
Das wäre dann eine schöne RX490 und keine mit Ach und Krach auf "Effizienz" getrimmte RX480.
Naja, und wenn nicht, dann hoffen wir, sie haben für Vega gelernt.

Nitschi66 · 15. August 2016

eSportWarrior schrieb:
HBM2 ist der real deal für die Zukunft (bei Nvidia und AMD) und so viele Monate sinds da auch nicht mehr hin.

Bis das in Mainstream karten kommt dauert es aber noch länger als ein jahr. NVidia und der GDDR5X-Hersteller (hynix?) haben selbst gesagt, dass diese Technologien noch eine Zeit parallel angeboten werden, da GDDR5(X) in einer anderen Preisregion spielt und für günstigere Karten, die halt nicht diese fette Bandbreite benötigen, völlig ausreichend ist.

Krautmaster · 15. August 2016

EchoeZ schrieb:
@Krautmaster
Sind denn nicht ACE und Frontend Teile der Architektur?

doch natürlich, aber viele sprechen da meist von GCN oder "Shadern" die verbessert werden. Und der Shader ist doch der einzelne GCN "Kern" der an der Mehrleistung aber wohl nur zu sehr geringem Teil beiträgt.

Tessellation ist ja der aktuell wohl größere Flaschenhals:

...das große Problem ist aber eine andere Limitierung: Mittlerweile reicht die mit jeder Generation verbesserte Tessellation-Leistung bei der ersten GCN-Generation in vielen Spielen nicht mehr aus. In allen Spielen, die viel Tessellation-Leistung benötigen, fällt die erste GCN-Iteration deutlich zurück.

Je mehr Tessellation, desto größer der Vorsprung

Und der gehört natürlich auch zur Architektur.

Was Nvidia da bei Tiled Based Rendering veranstaltet scheint aber deutlich weitreichendere Änderungen mit sich gebracht zu haben. Wäre interessant ob AMD einen ähnlichen Ansatz abkupfern kann. Bis Maxwell hatte man bei der Effizienz ja kaum das Nachsehen oder lag gar vorn.
Von Architektur zu Architektur die Tessellationsleistung aufzubohren klingt jetzt weniger nach der ultimativen Herausforderung.

Edit:

GCN 2012

GCN 2016

Edit2:

Und nochmal der ganze Aufbau im Überblick. Finde das eigentlich sprechender als bei CB im Text, da hätte ich mir etwas mehr Tiefgang mit Bildern gewünscht.

Finde da sieht man gut wie nun das Frontend quasi verdoppelt wurde. Doppelte ACE, Rasterizierer und Tessellatoren.

Ansonsten scheint so ne GPU Entwicklung heute eher Copy Paste zu sein

Edit3: Da sich von Tonga auf Polaris wenig am Frontend rein vom Aufbau getan hat muss die Mehrleistung da dann wirklich eher aus der Tessellationsleistung kommen.

EchoeZ · 15. August 2016

Krautmaster schrieb:
doch natürlich, aber viele sprechen da meist von GCN oder "Shadern" die verbessert werden. Und der Shader ist doch der einzelne GCN "Kern" der an der Mehrleistung aber wohl nur zu sehr geringem Teil beiträgt.

Das ist mein Aufhänger, GCN ist die Architektur, mit allem drum und dran (ACE,Frontend und Co) und darum gehts im Artikel. Wenn Effizenzverbesserungen durch alles andere ausser den Shadern verursacht wird, finde ich das schon wissenswert.
Gerde wo hier so schön die einheitlichen Taktraten usw gewählt wurden, macht es das noch aussagekräftiger als die Leistungsaufnahme bei den üblichen Kartentests.
Aber wie bei allen anderen Themen rund ums Spielzeug ist mir das im Grunde egal

zeedy · 15. August 2016

Warum ein Verbrauchsvergleich fehlt, verstehe ich allerdings auch nicht. Gerade weil alle GPUs taktnormiert miteinander verglichen wurden, wäre das interessant gewesen.

@Wolfgang

Einer weiterhin ineffizienten Auslastung der Recheneinheiten kann dieses Verhalten allerdings nicht zugesprochen werden. Das Problem liegt vielmehr darin, dass die vorhandene Speicherbandbreiten nicht groß genug ist beziehungsweise die Speicherkompression nicht gut genug funktioniert. Das merkt man an einem deutlichen Geschwindigkeitssprung durch das Übertakten des Speichers.

Also ich sehe im Bericht keine Übertaktung des Speichers. Was ich auch sehr schade finde, denn in den entsprechenden Grafikkartentests wird ja auch die GPU übertaktet. Wenn du also behauptest, die Bandbreite würde so sehr limitieren, wäre ein entsprechender Test sinnvoll...

Die beiden Polaris Karten hätte man außerdem ruhig mit 1,25 GHz takten können, die meisten Käufer einer 470/480 werden sie sicherlich nicht @ 1150 Mhz betreiben.

Insgesamt ist liegen die 470 und 480 zu nah beieinander. In anderen Tests ist der Abstand größer. Zb bei PCGH ist diese Sapphire 470 @ 1230 MHz meist nur gleich schnell wie eine 480 @ 1150 MHz.

Krautmaster schrieb:
Denke das hat quasi 0 mit der GCN Kernleistung zu tun, viel mehr hat man es geschafft die Auslastung etwas zu verbessern.

Die GCN Shader sind doch laut Präsentation identisch zu Gen 1.

Laut Folie sinds 4th Gen GCN CUs
http://www.3dcenter.org/dateien/abbildungen/AMD-Polaris-Praesentation-Slide15.jpg

Bericht AMD Polaris: So viel Leistung bringt die 4. Generation GCN

Fleet Admiral

Commander

Fleet Admiral

Grauer Jedi

Commander

Fleet Admiral

Kreisklassenmeister Pro

Fleet Admiral

Lieutenant

Lieutenant

Fleet Admiral

Lieutenant

Fleet Admiral

Commander

Lieutenant

Captain

Kreisklassenmeister Pro

Fleet Admiral

Commander

Captain

Ähnliche Themen