KAOZNAKE schrieb:
Einfaches Bild für dich: AMD hat aus ner 5-spurigen Straße eine 4-spurige gemacht (mit breiteren Einzelspuren). Logisch das 4 Spuren weniger Platz brauchen als 5
weshalb ich auch von der Fläche bezogen auf die Leistung sprach.
Um bei deinem Fahrstreifen zu bleiben wäre das wie 5 Streifen + Standstreifen vs. 4 Streifen mit Standstreifen. Klar braucht letzteres weniger Platz, und klar geht bei 5 Streifen im Maximum mehr durch, die 5+1 sind aber flächeneffektiver bei Maximallast.
So braucht ein 4D Cluster natürlich weniger Platz als ein 5D, aber minimal. Nicht so dass es 1/5tel der Leistung aufwiegen würde. Sonst wäre die HD6970 vom Chip her wohl kaum (sogar deutlich) größer als der der HD5870.
Rein aus Auslastungsgründen wurde so vorgegangen.
Das kannst du so nicht vergleichen, da die zusätzlichen Transistoren vermutlich nur in geringem Umfang dem Gaming-Potential zu Gute kommen, sondern bspw. fürs GPU-Computing eingesetzt werden. Selbes Spielchen bei der HD7k...
Die HD6 hat zur HD5 er eher nachgelassen was Computing angeht. Zumindest dann wenn die Karte auch maximal ausgelastet werden konnte, was ja wie gesagt bei der HD6 einfacher als bei der HD5 ist. Nimm BitCoin zB, kleinerer Chip, weniger Transistoren, deutlich mehr Dampf auf HD58XX Seite.
Die HD7 kann man weniger vergleichen, hier werden durchaus einige Transistoren für Computing drauf gehen.
Das sind bei mir 1408 Shader gegen 1600 die dazu noch geringer getaktet sind mit gleicher Leistung. Wie war das noch mit der Effizienz?
Du meinst HD5870 vs. HD6950 da genau gleich schnell in SPIELEN?
Wie gesagt, Auslastung. Hier kann man also davon ausgehen, dass die 5D ShaderCluster, 1600 an der Zahl, nur zu vllt 75% ausglastet werden konnten, die 4D ShaderCluster der HD6950 zu 85%, deswegen hält man sich hier in Waage.
Rohleistung hat die HD5870 aber deutlich mehr.
2.720 GFLOPs vs . 2.253 GFLOPs
Dazu der Ram Unterschied + mehr TMUs auf HD6950 Seite.
Keine Sorge, natürlich ist in Spielen die HD6950 Minimum gleich schnell, warum aber einen Chip von 2,15 auf 2,64 Mrd Transistoren aufblasen und mehr DIE verschwenden um gleiche Gamingleistung zu erziehen? Auch hier was der Grund nicht Effizienz der 4D Cluster sondern ein anderer, offensichtlich lassen sich 4D leichter/ konstanter auslasten, vllt. muss man weniger Treiberoptimierung betreiben... es ist aber nicht effizienter wenn es um Maximalleistung geht, im Gegenteil, es ist sogar ineffizienter da die HD6950 gleichzieht bei mehr "verbratenen" Ressourcen.
Die HD5870 wäre sogar deutlich sparsamer und günstiger zu produzieren wenn sie den optimierten Prozess der HD6950 abbekommen hätte, kleinere DIE...
(deswegen denke ich dass man kleine Chips, unter HD79XX, eventuell sogar nach wie vor 5D fertigen wird, zumindest 4D)
Wie gesagt so pauschal kann man das nicht vergleichen. Und der Grund war natürlich die bessere Auslastung, weil AMD festgestellt hat, dass sich diese mit der Zeit geändert hat (
auf durchschnittlich 3,4 Shader der 5VLIW-Shader )
da lag ich mit meinem 75% oben nicht schlecht, siehe 3,4 von 5.
Auslastung war ein Grund, wie ich sagte. Was aber stört AMD an 75% Auslastung?
Wir haben einen neuen VLIW4 Chip, der einiges größer ist, und bei dem
352 4D Clustern recht genau 320 5D Clustern performancetechnisch in Spielen aufwiegen kann. Komischerweise brauchen die 352 Cluster offensichtlich weit mehr Platz. Denn der Chip wird größer, die Transistoren-zahl steigt von 2,15M auf 2,64M.
Genau deswegen sage ich, dass AMD irgend wo anders noch an die Wand gefahren sein muss und sich letztendlich auf den Umstieg auf 1D / GCN entschieden hat.
Eben gerade im Computing war die HD5870 mal ratz fatz mal langsam, genau wie du im letzten Absatz zitierst.
Deswegen verstehe ich auch AMDs Umstieg auf 1D. Für die Spieler hier ist die HD7970 genau aus diesem Grund nun aber ineffizient geworden in Relation zu 4 und 5D.
Dafür ist die Leistung konstanter.
Die ganze Diskussion ging auch nicht darum ob GCN gut oder schlecht ist, es ist ineffizienter was Spiele angeht, schön für die Programmierung und schon für Computing. Genau deswegen setzt Nvidia seit jeher darauf. Für Gaming allein wärs vllt. schön gewesen AMD hätte einen 3200 Shaderklotz bei 75% gebracht. 5D.
Da nun AMD und Nvidia 1D fahren kann man davon ausgehen, dass wir nicht mehr den großen Effizienzunterschied sehen werden wie er Stand heute noch gegeben ist.
28nm vs 28nm und 1D vs. 1D spielen hier in einer ganz neuen Liga, Nvidia hatte daran bisher immer etwas zu knabbern da ihre 1D Architektur bezogen auf Spieleleistung mehr Strom schluckte. Dieser Nachteil fällt nun weg (sobald natürlich beide auf 28nm fahren).
Genau deswegen wäre es auch denkbar, dass Nvidia als langjähriger 1D Optimierer AMD dahingehen überholt.