ATi HD5800 und nVidia GTX400 (DX11 Gerüchteküche)

Status
Für weitere Antworten geschlossen.
Sontin schrieb:
GF100 hat 16 FF-Tessellationsunit. Cypress hat eine FF-Tessellationsunit. GF100 ist also in "Tessellation" 16x schneller als Cypress. Das heißt, nVidia erreicht immer noch die selbe Tessellationsleistung, wenn sie GF100 auf 1/16 kürzen.
Du weißt aber schon, dass der Domain- und Hull-Shader durch die ALUs läuft und daher bei weniger SMs auch eine geringere Tessellationsleistung eintritt? Wenn du nur noch 12 statt 16 SMs hast, dann hast du zwar noch 12 Polymorph-Engines, aber eben nur noch 384 ALUs. Und da diese außer Domain und Hull nach wie vor anderes Zeug berechnen müssen, sinkt natürlich die Tessellationsleistung. Und eine Polymorph-Engine ist mitnichten so schnell wie die Unit eines Cypress oder Juniper - schön wärs :freak:
 
@Florian; selbstverständlich werden auch bei ATI die Entwicklungskosten verringert, die ableger Juniper, Cedar und Redwood, welche auf die selbe Architektur basieren, sind ebenso skalierbar aufgebaut.

Bezüglich der Tesselation Leistung; wieviel so eine Midrange Karte an Tess Leistung benötigt weiß soweit wohl niemand, jedoch wird eine halbierte Tess Leistung selbst verständlich auch die Performance ebenso beeinflussen. Tesselation macht eine Grafikkarte nicht schneller, Tesselation ist nicht direkt abhängig von dem Performancesektor. Tesselation errechnet aus einem Polygon ein vielfaches an Polygonen für eine höheren Detailgrad. GTX480 wäre also nicht nur Aufgrund der Rohleistung einer GTX 450 (als Beispiel mit nur 8 SMs) überlegen, bei aktivierter Tesselation sinkt also auch die Leistung drastisch für die Berechung der zusätzlichen Polygone.

Wie sich das in der Praxis auswirkt weiß ich nicht, jedoch sollte es nicht schwer sein zu dem Schluss zu kommen, das hier die vollen 16 SMs mit ihren Polymorph Engines von vorne herein so viel Tesselation Leistung bereit stellen müssen, das die halbierte Tesselation Leistung das Spiel in DX11 nicht noch weiter herunterziehen. Hier hat die Tesselation Leistung in eben der propagierten Skalierung eine ganz klare Schwäche, ATI muß nur zusehen mit ihrer Fixen Einheit genug Tesselation Performance Bereitzustellen, um Spiele mit Tesselation nicht zu sehr einbrechen zu lassen. Ob und wie das der Fall ist, werden wir in den nächsten 1-2 Jahren sehen. Zumal das ja auch ganz auf das Spiel ankommt, in wie weit die Tesselation Funktionen der Karten von Nvidia und ATI gefordert werden.
 
So etwas wie in der Unigine Heaven werden wir wohl kaum sehen. AvP, Dirt 2, Metro 2033 und Stalker CoP tessellieren ja nur ein bisschen die (einige, nicht alle!) NPCs und teils noch anderes Zeug wie Fahnen, Wasser oder Umgebung. Aber auch nur dezent - schließlich ist es erst mal wichtig, dass der restliche Renderer läuft.
 
acc schrieb:
1. bei dem beispiel haut es hin, weil auch die 470 anscheinend mit allen 4 clustern kommt. andere wie der gf104 hat gerüchten nur 2 cluster und damit ist er günstiger herzustellen.

2. sicher, tesselation-leistung wird wie soviele andere grafikoptionen einfach über einen slider/dropbox einstellbar sein. es gibt an der stelle kein problem.

3. kleinere ableger brauchen auch keine volle tesselation-leistung, weil sie damit sowieso überlastet wären.

4. imemr schön an die eigene nase fassen ;).

1. Das ist klar, ableger für MidRange und Entry werden natürlich aus weniger Streaming Multiprozessoren bestehen, und daher kleinere Chips darstellen ... nur hat davon noch niemand etwas gesehen.
Und das ist das selbe was ATI mit dem Juniper, Redwood und Cedar macht. Schon seit September letzten Jahres.

2. Wie erkärt ist das Problem, das bei zur Zeit angenommener Tesselation Leistung von 1,5-2x gegenüber dem RV870, nur die hälfte oder weniger bei z.b. Karten im Midrange Sektor zur Verfügung steht. Und je weniger SM Einheiten verbaut sind, desto geringer wird die Tesselation Performance.

Das heißt das Nvidia Käufer mit ihrem bigger PhysX Logo und DX11 Support in Midrange nicht nur für manche Titel nicht die Leistung für PhysX haben, sondern auch Tesselation deaktivieren über deinen Slider, weil mit Tesselation die Performance stark einzubrechen droht.

3. Siehe den Kommentar von y33H@, siehe die Benchmark Daten vom RV840 (5770) die ich verlinkt habe; ohne die Tesselation Leistung wäre diese Karte in DX11 aufgeschmissen, in Dirt 2 vermutlich unspielbar.

4. Ich Poste hier schon ne Knappe woche nicht mehr, und ich werde es auch nicht mehr oft tun, bei diesen Unsinn den man hier oftmals liest. Es ist einfach überflüssig.
Außerdem erträume ich mir nicht den Fermi zu einer Wunderkarte, wie es hier sehr viele tun. (wie ich mir auch die HD5000er nicht schön gemalt habe, im Gegenteil).
Die Gerüchte, Hinweise und Vorzeichen sind da, aber so einige verschließen davor ganz kräftig die Augen, und phantasieren sich ihre eigenen Vorstellungen zur Wahrheit.
 
Sontin schrieb:
Nein, das ist falsch. Siehe Microsoftseite. nVidia hat 16x Geometrieeinheiten mit je einer dedizierten "fixed function Tessellationunit". AMD hat eine Single-Frontend Einheit mit einer Geometrie- und Tessellationeinheit.
Dies sind die Anforderungen von Microsoft - ob das bei Nvidia so umgesetzt wurde ist noch gar nicht geklärt. Bisher habe ich noch keine Nvidia Karte mit DX11 Zertifizierung gesehen ;)
In jedem Fall ist die Polymorphe Engine keine Fixed Function Unit. Und hier ist noch lange nicht erklärt worden wie das im Einklang mit den DX11 Spezifikationen steht. Nvidia vbersucht das hier mit Wortklaubeei, indem sie einfach behaupten dass die Polymorphe Engine nicht programmierbar ist und somit eine fixed Function Unit - das stimmt auch :) Aber sie hat 5 Funktionen und kann jeweils nur eine davon zeitgleich übernehmen:
  • nicht programmierbar - ja
  • Fixed Function - Ja
Microsoft hat vergessen das ausschließlich oder exklusiv in die Spezifikationen hervorzuheben und daher wird man wohl auch hier ein DX11 Logo drauf kleben.
Nur hier wird es darauf ankommen wie viel Rechenzeit die einzelnen Aufgaben belegen werden. Wird Tessellation 10%, 20% oder gar 90% der Rechenzeit bekommen? Nvidia will dass verbaut Ressourcen immer in vollem Umfang genutzt werden und sich nicht langweilen - guter Ansatz. Wir werden sehen ob das auch beim skalieren funktionieren wird.

florian. schrieb:
zwecks Tesselation:
wieso braucht eine Midrange Karte die gleiche Tesselation Leistung wie eine Highend Karte?
gibt für mich keinen Sinn.
Ganz einfach: Die allgemeine Annahme hier ist offensichtlich dass eine kleine Karte nicht die Anzahl von Polygonen rendern kann wie eine grosse - dem ist aber nicht so. Eine kleine Karte nimmt AA und AF raus und kann dann ebenso Tessallation verwenden. Es ist wie bisher auch lediglich eine Frage der Qualität.
 
HappyMutant schrieb:
@Sontin: Wäre diese Beschreibung nicht zu vereinfachend? Oder sollte es tatsächlich so sein, dass die Leistungswerte der Einheiten exakt gleich sind. Und was spielt es für eine Rolle, wenn selbst im heftigsten Anwendungsfall, den Nvidia gerne vorführt, der Effekt ein paar Frames Vorsprung sind. Da spielen genug andere Sachen mit rein, die offenbar einen Flaschenhals darstellen, selbst wenn die Tesselation-Leistung unrealistischerweise derart höher ausfallen würde.

Es war auch im Grunde nicht ernst gemeint, sondern sollte nur darstellen, wie unsinnig diese Vereinfachung von DX11 Tessellation ist.

milamber! schrieb:
@Sontin: Amüsant wie du mir "simplifizierung" Unterstellst, aber selbst mit so einer Milchmädchenrechnung die (möglicherweise) 16 PolyMorph Engines des Fermi mit der fixen Tesselation Einheit des RV870 vergleichst. Das sind zwei völlig unterschiedliche Dinge.

Nein. Das ist falsch. Siehe Whitepaper von nVidia.

y33H@ schrieb:
Du weißt aber schon, dass der Domain- und Hull-Shader durch die ALUs läuft und daher bei weniger SMs auch eine geringere Tessellationsleistung eintritt? Wenn du nur noch 12 statt 16 SMs hast, dann hast du zwar noch 12 Polymorph-Engines, aber eben nur noch 384 ALUs. Und da diese außer Domain und Hull nach wie vor anderes Zeug berechnen müssen, sinkt natürlich die Tessellationsleistung.

Hull und Domain laufen auch bei AMD über die Recheneinheiten. Das ist durch Microsoft vorgegeben.

Und eine Polymorph-Engine ist mitnichten so schnell wie die Unit eines Cypress oder Juniper - schön wärs :freak:

Das basiert auf welche Fakten? In der Polymorpheinheit befinden sich mindesten alle Funktionen, die es auch in der GT200 Geometrieienheit gab.
Ergänzung ()

Complication schrieb:
Dies sind die Anforderungen von Microsoft - ob das bei Nvidia so umgesetzt wurde ist noch gar nicht geklärt. Bisher habe ich noch keine Nvidia Karte mit DX11 Zertifizierung gesehen ;)

Bitte das Whitepaper lesen. Dort steht es genau drin, wie nVidia die Anforderungen von Microsoft umgesetzt hat.

In jedem Fall ist die Polymorphe Engine keine Fixed Function Unit. Und hier ist noch lange nicht erklärt worden wie das im Einklang mit den DX11 Spezifikationen steht. Nvidia vbersucht das hier mit Wortklaubeei, indem sie einfach behaupten dass die Polymorphe Engine nicht programmierbar ist und somit eine fixed Function Unit - das stimmt auch :) Aber sie hat 5 Funktionen und kann jeweils nur eine davon zeitgleich übernehmen:
  • nicht programmierbar - ja
  • Fixed Function - Ja

Bitte das Whitepaper lesen:
On prior architectures, fixed function operations were performed with a single pipeline. On GF100, both fixed function and programmable operations are parallelized, resulting in vastly improved performance.

Microsoft hat vergessen das ausschließlich oder exklusiv in die Spezifikationen hervorzuheben und daher wird man wohl auch hier ein DX11 Logo drauf kleben.

Nein, Microsoft gibt klar den Funktionsumfang vor und Tessellator != Polymorphengine.
Each of the 16 PolyMorph engines has its own dedicated vertex fetch unit and tessellator

Nur hier wird es darauf ankommen wie viel Rechenzeit die einzelnen Aufgaben belegen werden. Wird Tessellation 10%, 20% oder gar 90% der Rechenzeit bekommen? Nvidia will dass verbaut Ressourcen immer in vollem Umfang genutzt werden und sich nicht langweilen - guter Ansatz. Wir werden sehen ob das auch beim skalieren funktionieren wird.

Bitte das Whitepaper lesen. Der Tessellator nimmt genau 0% der "Unified Shader" in Anspruch:
In the second stage, the PolyMorph Engine reads the tessellation factors. The Tessellator dices the
patch (a smooth surface defined by a mesh of control points) and outputs a mesh of vertices. The mesh
is defined by patch (u,v) values, and how they are connected to form a mesh.
The new vertices are sent to the SM where the Domain Shader and Geometry Shader are executed. The
Domain Shader calculates the final position of each vertex based on input from the Hull Shader and
Tessellator. At this stage, a displacement map is usually applied to add detailed features to the patch.
The Geometry Shader conducts any post processing, adding and removing vertices and primitives
where needed. The results are sent back to the Tessellation Engine for the final pass.

Ich kann es nur wiederholen: Wenn man über die GF100 Architektur reden will, sollte man bitte auch die veröffentlichten Informationen verstehen.
 
milamber! schrieb:
Im Whitepaper steht, das der Fermi mit 16 SMs 16x schneller als des RV870 Fixed Function ist? Achso. ;)
Ach ja stimmt, ist hier ja klar bewiesen worden.

Ich bin wieder raus, das wird mir zu bunt.

Ja, steht es:
Each of the 16 PolyMorph engines has its own dedicated vertex fetch unit and tessellator

16 Tessellatoren > 1 Tessellator.
Es sollte doch jetzt endlich klar sein, dass GF100 16 FF-Tessellatoren hat. Kein Unterschied zu AMD.
 
Tessellator ist aber nicht gleich Tessellator, vor allem in Sachen Speed.
 
y33H@ schrieb:
Tessellator ist aber nicht gleich Tessellator, vor allem in Sachen Speed.

Erkläre doch bitte, wieso AMD's FF-Tessellatoreinheit leistungsfähiger wäre als ein FF-Tessellator in einer Polymorpheinheit.
 
@Sontin
Ja, GF100 hat 16 dedizierte Tessellation-Units. Eine einzelne GF100-TU hat aber mitnichten die gleiche Transistoranzahl (und somit Leistungsumfang) wie diejenige der ATi GPUs.
 
R0flcopt3r schrieb:
@Sontin
Ja, GF100 hat 16 dedizierte Tessellation-Units. Eine einzelne GF100-TU hat aber mitnichten die gleiche Transistoranzahl (und somit Leistungsumfang) wie diejenige der ATi GPUs.

Was? :freak:
Der Funktionsumfang ist durch MS vorgegeben - deswegen Fixed Function. Dazu weiß niemand, wieviele Transistoren die FF-Units benötigen.
 
Ja der Funktionsumfang ist vorgeben, aber nicht wie schnell eine Einheit diese Funktion abarbeiten kann oder soll. Sonst müssten ja alle DirectX 9, 10, 11-Chips jeweils im Endeffekt genauso schnell sein, weil sie den gleichen Funktionsumfang haben.
 
R0flcopt3r schrieb:
Lesen! Leistungsumfang, nicht Funktionsumfang.

Ja, "Leistungsumfang". Wieso sollte AMD's FF-Tessellator leistungsfähiger sein als die von nvidia? Der Funktionsumfang ist durch Microsoft vorgegeben. Demnach kann ma durch freie Programmierung keine Leistung gewinnen.
 
Das habe ich nie behauptet. Ich sage, dass eine einzelne(!) TU in der Polymorph-Engine mitnichten die Leistung bringt, wie die grosse Cypress-TU. In der Summe siehts natürlich wieder anders aus.
 
R0flcopt3r schrieb:
Das habe ich nie behauptet. Ich sage, dass eine einzelne(!) TU in der Polymorph-Engine mitnichten die Leistung bringt, wie die grosse Cypress-TU. In der Summe siehts natürlich wieder anders aus.

Doch hast du:
Ja, GF100 hat 16 dedizierte Tessellation-Units. Eine einzelne GF100-TU hat aber mitnichten die gleiche Transistoranzahl (und somit Leistungsumfang) wie diejenige der ATi GPUs.

Und dafür gibt es keine Beweise.
 
Leute, es gibt weder für das eine noch das andere Beweise. Die Annahme ist aber nicht ganz zu unrecht, dass die Tesselation-Einheiten nicht 1:1 vergleichbar sind.

Solange man einerseits behauptet, dass 16 Tesselation Einheiten auch die sechzehnfache Leistung bieten müssen, solange kann man andererseits niemanden vorwerfen, wenn sie das anders sehen. Im übrigen sagst du, Sontin, ja genau das, dass es nicht so simpel wäre, doch am Ende schreibst du dann doch, dass 16 besser sein muss als 1, weil sowieso alles fest vorgegeben sei. Ich mag mich täuschen, aber nicht mal Nvidia nimmt für sich in Anspruch soviel mehr Tesselation-Leistung zu liefern.
 
Zuletzt bearbeitet:
@Sotin: Nvidia selbst sprach von bis zu sechsfacher (woanders achtfacher) Tesselation Leistung, und zeigte derer nicht einmal die zweifache Leistung, in einem Tesselation Benchmark der in der Praxis nur wenig Relevanz besitzt. Da hast du deinen Beweis.

Hingegen hast du keinen Beweis dafür, das die TU (PolyMorph Engine) vom Fermi ein und das selbe mit der TU des RV8x0 ist.

Und was du roflcopter vorwirfst ist ebenfalls nicht korrekt; er sprach von der einzelnen TU (einer PolyMorph Engine), nicht derer 16 Zusammen bzw. der Karten für sich.
 
Status
Für weitere Antworten geschlossen.
Zurück
Oben