ATi HD5800 und nVidia GTX400 (DX11 Gerüchteküche)

Status
Für weitere Antworten geschlossen.
HappyMutant schrieb:
Leute, es gibt weder für das eine noch das andere Beweise. Die Annahme ist aber nicht ganz zu unrecht, dass die Tesselation-Einheiten nicht 1:1 vergleichbar sind.

Kannst du es auch belegen, dass sie nicht vergleichbar sind? Solche Aussagen finde ich riskant, da es nichtmal Informationen über die Leistungsfähigkeit von AMD's FF-Tessellator gibt.

Solange man einerseits behauptet, dass 16 Tesselation Einheiten auch die sechzehnfache Leistung bieten müssen, solange kann man andererseits niemanden vorwerfen, wenn sie das anders sehen. Im übrigen sagst du, Sotin, ja genau das, das es nicht so simpel wäre, doch am Ende schreibst du dann doch dass 16 besser sein muss als 1, weil alles fest vorgegeben sei. Ich mag mich täuschen, aber nicht mal Nvidia nimmt für sich in Anspruch soviel mehr Tesselation-Leistung zu liefern.

Ich dachte, es war offensichtlich, dass ich ein einfaches, selbsterklärendes Schaubeispiel verwendete, um darzustellen, wieso diese Vereinfachungen von DX11 Tessellation unsinnig ist. Es wurde behauptet, dass durch die Reduzierung der Polymorpheinheiten die Leistung stark einbrechen würde. Ich wollte nur zeigen, dass die Leistung dann auch um das 16 fache besser wäre, weil nVidia eben auch 16x FF-Tessellatoren besitzt.
 
Deine Annahme beruht darauf, dass eine Polymorph-Engine so schnell ist wie der Cypress-Tessellator.

Angesichts der Aussagen von NV und der bereits extrem mit HWT um sich werfenden Heaven-Demo ist es äußerst unwahrscheinlich, dass eine PE es mit dem Tessellator des Cypress aufnehmen kann. Zumal unklar ist (zumindest ich weiß es nicht), ob die Polymorph-Engine nur die 32 ALUs ihres SM nutzen kann oder auch auf andere SMs bzw. deren ALUs zugreifen kann. Cypress stehe imo alle 1.6k 5-Vecs zur Verfügung um den Domain und den Hull zu berechnen.
 
y33H@ schrieb:
Deine Annahme beruht darauf, dass eine Polymorph-Engine so schnell ist wie der Cypress-Tessellator.
Angesichts der Aussagen von NV und der bereits extrem mit HWT um sich werfenden Heaven-Demo ist es äußerst unwahrscheinlich, dass eine PE es mit dem Tessellator des Cypress aufnehmen kann.

Bitte sich die Microsoftseite durchlesen, was mit Tessellation unter DX11 geschieht. Deiner Aussage nach dürfte Juniper nicht langsamer als Cypress sein. Der Funktionsumfang ist stark beschränkt, denn der Tessellator ist für eine, explizierte Aufgabe gedacht.

Zumal unklar ist (zumindest ich weiß es nicht), ob die Polymorph-Engine nur die 32 ALUs ihres SM nutzen kann oder auch auf andere SMs bzw. deren ALUs zugreifen kann. Cypress stehe imo alle 1.6k 5-Vecs zur Verfügung um den Domain und den Hull zu berechnen.

Die Polymorpheinheiten arbeiten an allen Daten und kommunizieren über eine Interconnectverbindung miteinander, um die Bearbeitungsreihenfolge einzuhalten. Durch den Unified L2-Cache können sie die Daten dann zu jedem SM schicken und von jedem SM erhalten ohne über den GDRAM zugehen.
 
Woraus leitest du ab, Juniper dürfte nicht langsamer als Cypress sein? Und hmmm, den L2 habe ich nicht bedacht.
 
Sontin schrieb:
Deiner Aussage nach dürfte Juniper nicht langsamer als Cypress sein.

Was soll diese Aussage? Der Juniper ist doch von Grund auf langsamer, besitzt er doch unter anderem nur die halbe Anzahl an SIMD Einheiten.
Jedoch verliert er durch DX11 und Tesselation in Dirt 2 ebenso wie der Cypress bei gleichen Settings etwa 35% an Frames. Wo ist die Tesselation Leistung hier also geringer vom Juniper zum Cypress?

Hast du deinen Account tatsächlich nur erstellt, um hier mit erfunden Behauptungen die keiner widerlegen, du hingegen nicht mal belegen kannst, zu trollen?

Deine geforderten Beweise sind hier, nuff said.
 
Zuletzt bearbeitet:
y33H@ schrieb:
Woraus leitest du ab, Juniper dürfte nicht langsamer als Cypress sein? Und hmmm, den L2 habe ich nicht bedacht.

Aus dieser Behauptung:
Angesichts der Aussagen von NV und der bereits extrem mit HWT um sich werfenden Heaven-Demo ist es äußerst unwahrscheinlich, dass eine PE es mit dem Tessellator des Cypress aufnehmen kann.

Damit wird DX11 Tessellation auf die FF-Tessellatoren vereinfacht.
 
y33H@ schrieb:
Das leitet sich daraus nicht ab, sorry.

Abgesehen das sowas immer kindisch ist, daher hiernach EoD:
Der Satz impliziert es haargenau:
Angesichts [...] der bereits extrem mit HWT um sich werfenden Heaven-Demo ist es äußerst unwahrscheinlich, dass eine PE es mit dem Tessellator des Cypress aufnehmen kann.

Du bringst den Leistungsunterschied klar mit den FF-Tessellatoren in Verbindung. Damit dürfte Juniper nicht langsamer sein als Cypress.
 
@Sontin: Was ist denn so schwer daran zu begreifen, das man den Tesselator von ATI nicht mit einer Ploymorph Engine vergleichen kann? Vom Ergebnis natürlich, aber doch nicht von der Leistungsfähigkeit!

Überleg mal bitte kurz, wieviele verschieden leistungsfähige 4 Zylinder Ottomotoren (PS!!!) existieren, obwohl sie vom Prinzip her alle gleich sind (4 Takte usw, jaja ich weiß, der Autovergleich, aber hier ist ja echt Hopfen und Malz verloren :freak:)


Wenn NVIDIA die 1,6-1,8, ach was, sagen wir die 2fache Performance des Cypress in einem tesselationslastigen Benchmark erreicht, was lässt dich bitteschön schlussfolgern, dass die tesselationsperformance bei der 470/460/450 whatever genau so gut ist?

Wenn das so wäre, hätte man ja wohl nur einen (genau wie ATI) Tesselator eingebaut, denn wenn 16Units genauso schnell sind wie sagen wir acht, dann hätts eine ja auch getan oder nicht?
 
milamber! schrieb:
@Sotin: Nvidia selbst sprach von bis zu sechsfacher (woanders achtfacher) Tesselation Leistung, und zeigte derer nicht einmal die zweifache Leistung, in einem Tesselation Benchmark der in der Praxis nur wenig Relevanz besitzt. Da hast du deinen Beweis.

Sontin schrieb:
Bitte sich die Microsoftseite durchlesen, was mit Tessellation unter DX11 geschieht. Deiner Aussage nach dürfte Juniper nicht langsamer als Cypress sein. Der Funktionsumfang ist stark beschränkt, denn der Tessellator ist für eine, explizierte Aufgabe gedacht.
So und da kommen wir nämlich im Marketing an und wo es zu diesen unterschiedlichen Leistungsinterpretationen kommt.

Zunächst mal ist es Tatsache dass bei allen Ati GPU die selbe Tessellation Einheit verbaut wird.
Somit ist auch die Tessellationleistung identisch bei einer 5570 und einer 5870.
Die Tessellationleistung heisst lediglich wie viele kleine Poloygone aus einem großen Polygon berechnet werden - das sagt noch nichts darüber aus mit wie vielen frames pro Sekunde diese Polygone dann auf den Bildschirm gerendert werden. Hier kommt es darauf an womit diese Polygone befüllt werden (Texturleistung)

Daraus folgert dass ich auch mit 8facher Tessellation Leistung noch lange nicht mehr Frames pro Sekunde auf den Bildschirm bringen muss. Ich muss nur noch mehr Polygone befüllen und berechnen mit den restlichen Shadern.

Also was sagt uns dann eine 8fache Tessellation Leistung die unterm Strich zu doppelten Frames pro Sekunde in einem Benchmark führt? Als isolierter Wert gar nichts und es lässt keinerlei Rückschlüße auf die Spieleleistung zu. Es wiederspricht sich aber auch nicht.
 
Es ist ja noch nicht einmal bekannt, ob wirklich die Tessellationsleistung (Tessellation + Hull und Domainshader) den Vorsprung in Unigine bewirkt, oder die Überlegenheit von GF100 in der Geometrieleistung (Tris/sec). Klären kann man dies erst nach dem Launch...
 
KAOZNAKE schrieb:
@Sontin: Was ist denn so schwer daran zu begreifen, das man den Tesselator von ATI nicht mit einer Ploymorph Engine vergleichen kann? Vom Ergebnis natürlich, aber doch nicht von der Leistungsfähigkeit!

Dann belege das doch bitte. Am besten fängst du mit der Leistungsfähigkeit dem FF-Tessellator von AMD an. Denn die haben dazu nämlich überhaupt nichts veröffentlicht.

Wenn NVIDIA die 1,6-1,8, ach was, sagen wir die 2fache Performance des Cypress in einem tesselationslastigen Benchmark erreicht, was lässt dich bitteschön schlussfolgern, dass die tesselationsperformance bei der 470/460/450 whatever genau so gut ist?

Bitte endlich verstehen, dass Tessellation, auch unter DX11, ein komplexes Aufgabengebiet ist. Es ist essentiell sich in das Thema einzulesen. Dann merkt man, dass die FF-Tessellatoren das geringste Problem der Architekturen darstellen wird.
Die kleinen Karten werden natürlich nicht die selbe Leistung bringen, da sie auch weniger Recheneinheiten (bedeutend für Hull und Domainshader), weniger Geometrieeinheiten (weniger Leistung bei der Abarbeitung und weniger Tessellatoren), weniger L2 Cache (damit weniger Informationen auf dem Die) und weniger Setup-Engines (geringere Dreiecksdurchsatz) haben. Fermi ist mit seiner flexiblen Geometriepipeline skalierbar - nach oben wie nach unten. Im Gegensatz zu Evergreen, die nur eine Geometrieeinheit, einen Tessellator und eine Setup-Engines hat. Dadurch wird beim Skalieren nach oben irgendwann der Punkt erreicht sein, indem nicht mehr die Recheneinheiten limitieren.

Wenn das so wäre, hätte man ja wohl nur einen (genau wie ATI) Tesselator eingebaut, denn wenn 16Units genauso schnell sind wie sagen wir acht, dann hätts eine ja auch getan oder nicht?

Bitte das Whitepaper lesen. Dort wird genau erklärt mit welchen Gedanken man GF100 gebaut hat.
 
milamber! schrieb:
1. Das ist klar, ableger für MidRange und Entry werden natürlich aus weniger Streaming Multiprozessoren bestehen, und daher kleinere Chips darstellen ... nur hat davon noch niemand etwas gesehen.
Und das ist das selbe was ATI mit dem Juniper, Redwood und Cedar macht. Schon seit September letzten Jahres.

auch ati hat nicht alles auf einen schlag herausgebracht, das ging über monate stück für stück.

2. Wie erkärt ist das Problem, das bei zur Zeit angenommener Tesselation Leistung von 1,5-2x gegenüber dem RV870, nur die hälfte oder weniger bei z.b. Karten im Midrange Sektor zur Verfügung steht. Und je weniger SM Einheiten verbaut sind, desto geringer wird die Tesselation Performance.

Das heißt das Nvidia Käufer mit ihrem bigger PhysX Logo und DX11 Support in Midrange nicht nur für manche Titel nicht die Leistung für PhysX haben, sondern auch Tesselation deaktivieren über deinen Slider, weil mit Tesselation die Performance stark einzubrechen droht.

du übertreibst die problematik, da kleinere auflösungen auch weniger tesselation beanspruchen. irgendwann macht es nämlich keinen sinn mehr, dreiecke zu erzeugen, wenn sie kleiner wie ein pixel werden.

3. Siehe den Kommentar von y33H@, siehe die Benchmark Daten vom RV840 (5770) die ich verlinkt habe; ohne die Tesselation Leistung wäre diese Karte in DX11 aufgeschmissen, in Dirt 2 vermutlich unspielbar.

der gegenteil ist der fall, tesselation erhöht den renderaufwand für die grafikkarte. ohne tesselation wird man immer höhere fps erreichen.

4. Ich Poste hier schon ne Knappe woche nicht mehr, und ich werde es auch nicht mehr oft tun, bei diesen Unsinn den man hier oftmals liest. Es ist einfach überflüssig.
Außerdem erträume ich mir nicht den Fermi zu einer Wunderkarte, wie es hier sehr viele tun. (wie ich mir auch die HD5000er nicht schön gemalt habe, im Gegenteil).
Die Gerüchte, Hinweise und Vorzeichen sind da, aber so einige verschließen davor ganz kräftig die Augen, und phantasieren sich ihre eigenen Vorstellungen zur Wahrheit.

allerdings muss man auch nicht davon träumen oder phantasieren, dass gf100 der totale reinfall wird.
 
bevor ihr darüber lästert das der Fermi nicht immer die gleiche Tesselation Leistung hat, sollte man klären ob das überhaupt bei ATI der Fall ist.

ich bin mir sicher die HD5450 hat nicht die selbe Tesselation Einheit wie die HD5870.
wozu auch?
 
florian. schrieb:
ich bin mir sicher die HD5450 hat nicht die selbe Tesselation Einheit wie die HD5870.
wozu auch?

ich schon, weil die beiden leistungsmässig nicht so weit auseinanderliegen. zudem machte es die entwicklung einfacher. ich tippe allerdings darauf, dass ati mit der nächsten generation den gleichen weg wie nvidia gehen wird.
 
Alle haben die selbe Tesselation Einheit. Sogar die Xbox360 hat einen Tessellator und auch alte Ati Karten haben schon lange einen Tessellator der nur sehr selten genutzt wurde von Programmierern. Der Tessellator wird wie z.B. die UVD Unit für die HD Video Ausgabe als eigenständiges Modul entwickelt und dann verbaut.

http://blogs.amd.com/play/tag/tessellation/
1. A beast called the tessellator has been added which enables games developers to create smoother, less blocky and more organic looking objects in games. This is the change you’ll probably be most aware of. And it’ll show up when you look at the silhouettes of hills and mountains or the profiles of characters in games. Where artists previously had to trade off quality for performance, now artists will have the freedom to create naturalistic scenery. We’ve gotten used to seeing strangely blocky ears and noses on our opponents. But the new generation of games should allow those opponents to scare the heck out of us instead. The tessellator represents a natural next step in gaming hardware (in fact the Xbox 360 graphics chip that AMD designed already has a tessellator, and AMD graphics hardware has featured tessellator technology starting with the ATI RadeonTM HD 2000 series right up to the latest ATI RadeonTM HD 4000 series cards today).

Tessellation der HD4800
http://www.heise.de/newsticker/meld...pft-Konkurrenz-auf-allen-Gebieten-216128.html
Für die Spielfiguren setzte AMD ein Level-of-Detail-System ein, das die Spielfigur je nach Entfernung aus 900 bis 6000 Polygonen zusammensetzt. Bei Naheinstellungen kann der 4800er-Chip mit seiner Tessellation-Engine die Polygonzahl bis auf 1,6 Millionen ansteigen lassen, um feinste Details darzustellen. Die Gesamtzahl der pro Bild verwendeten Polygone soll zwischen 6 und 8 Millionen liegen. Aktuelle Spiele verwenden heute selten mehr als 2 Millionen Polygone pro Bild. SEGA und der koreanische Spieleentwickler NHN (kommender Titel: "Cloud 9") kündigen an, DirectX 10.1 und Tessellation unterstützen zu wollen.

Tessellation der HD2900XT
https://www.computerbase.de/artikel/grafikkarten/ati-radeon-hd-2900-xt-test.648/seite-4
Doch was macht eine Tessellation-Unit überhaupt? Einfach ausgedrückt, ein Tessellator kann ein Polygon (sei es nun ein Dreieck, Viereck oder eine andere Form) in mehrerer kleinere Polygone mit derselben Form ohne einen allzu großen Rechen- und Programmieraufwand aufteilen. Dies ist auf dem R600 bis zu 15 Mal mit einem Polygon möglich, wobei pro Tessellations-Stufe ein Drawcall, also ein Zeichenaufruf für die API, nötig ist.

Somit kann man ein schnell zu berechnendes Low-Polygon-Modell mit der Tessellations-Einheit bearbeiten, anschließend eine Displacement-Map auflegen und schon hat man ein detailliertes High-Polygon-Modell ohne die GPU großartig zu belasten bei nur marginal gestiegenem Speicherverbauch.

http://www.guru3d.com/article/radeon-hd-5870-review-test/7
Now some of you might have noticed it already from previous reviews. Tessellation isn't new, ATI already had a hardware tessellation unit in their GPUs for years. But the older units could not be addressed whatsoever in DirectX. The tessellation units featured in the ATI Radeon HD 2000, HD 3000 and HD 4000 series are all very much based on the same functionality found in the XBOX 360 'Xenos' graphics chip.
[...]
Anyway, though technical and somewhat difficult to explain, try and remember this... tessellation will allow much higher quality rendering and animation at very low GPU compute cost. The generic rule here is the more tessellation, the slower the GPU gets, yet since there's now dedicated core logic for it on the GPU, it's fast and can boost your detail massively, thus giving an impression of sharpness and much finer quality.

As stated, the new DX 11 tessellation unit is programmable though two new shaders, the Domain and Hull shader. And remember, the higher the level of tessellation, the closer to realism the sharpness of the surface approaches.
 
Schließlich sollte Tesslation schon in DX10 kommen, dass wurde aber verhindert ;)
 
acc schrieb:
1. auch ati hat nicht alles auf einen schlag herausgebracht, das ging über monate stück für stück.

2. du übertreibst die problematik, da kleinere auflösungen auch weniger tesselation beanspruchen. irgendwann macht es nämlich keinen sinn mehr, dreiecke zu erzeugen, wenn sie kleiner wie ein pixel werden.

3. der gegenteil ist der fall, tesselation erhöht den renderaufwand für die grafikkarte. ohne tesselation wird man immer höhere fps erreichen.

4. allerdings muss man auch nicht davon träumen oder phantasieren, dass gf100 der totale reinfall wird.

1. Ich habe doch nicht behauptet, das sie alle Karten am gleichen Tag veröffentlicht haben. Sie haben aber diese skalierbare Architektur seit September auf dem Markt. Es waren doch andere User die dies dem RV8x0 abgesprochen, und dies nur vom Fermi behauptet haben. Das ATIs Karten auf dem selben Chip basieren, und man nur Einheiten "weg lasern" würde.

2. Ob überhaupt ein Problem besteht werden wir erst noch sehen, fakt ist jedoch das mit jedem SM weniger die Tesselation Performance sinkt. Auch macht deine Aussage keinen Sinn, da du zum einen nicht weisst wie groß die Auswirkung der Auflösung auf Tesselation ist, und zum anderen die verschiedenen GPU Klassen nicht an irgendwelche Auflösungen gebunden sind.
Schau dir die Benchmarks hier und hier an;
Damit eine Karte im unteren Sektor aufgrund beschnittener Tesselation Leistung nicht einbricht, müßte im Fall des Fermi ja so viel Leistung der Tesselation Funktion vorhanden sein das mit, die selben FPS zu erreichen wären wie ohne. Aktivierte Tesselation dürfte also die Leistung nicht beschränken.

3. Nochmal; schau dir die FPS einer 5770 in Dirt 2 DX11 an, und dann denke dir die halbierte Tesselation Leistung dazu. Es ist doch offensichtlich das die Karte hier durch geringere Tesselation Leistung deutlich weiter einbrechen würde, als es eine 5870 tut.

4. Ein totaler Reinfall wäre je nach Sichtweise wohl auch übertrieben, jedoch wird sie nach allen vorliegenden Informationen nicht Ansatzweise die Leistung bringen, die vor Monaten noch überall vermutet wurden. Und das muss man sich nicht durch Wunschdenken ausmalen - zumal ich auch keinen Grund wüsste, mir einen langsamen Fermi zu wünschen - die Leaks und Infos sagen dies an vielen vielen Ecken so aus.
 
Zuletzt bearbeitet:
acc schrieb:
...
der gegenteil ist der fall, tesselation erhöht den renderaufwand für die grafikkarte. ohne tesselation wird man immer höhere fps erreichen.
...
Das ist schlicht nicht richtig!

Tesselation hat mit dem „renderaufwand“ ersteinmal gar nichts zu tun. Ob die GPU eine Szene von zb 100.000 Tris rendert die mit oder ohne Tessellator entstanden sind, ist der GPU Jacke wie Hose.

Wo der Tessellator aber (Zeit) bringt, ist beim Geometriesetup.
Es ist ein unterschied ob das Geometriesetup bei Transformationen jedes mal zb 100.000*3 Vertex „durchgehen“ muss oder ob nur 10.000*3 Vertex „durchgegangen“ werden und die restlichen (dann ohne „extra“ transformation) vom Tessellator kommen.

Zudem bedeuten weniger Tris/Vertex im vorGeometriesetup eine schnelleres abarbeiten im eigentlichem Programm und Treiber -- zb Clipping.

Insofern bedeutet tesselation, bei gleichem qualitativen Ergebnis, mehr FPS.
 
lalachen schrieb:
Das ist schlicht nicht richtig!

Tesselation hat mit dem „renderaufwand“ ersteinmal gar nichts zu tun. Ob die GPU eine Szene von zb 100.000 Tris rendert die mit oder ohne Tessellator entstanden sind, ist der GPU Jacke wie Hose.

Wo der Tessellator aber (Zeit) bringt, ist beim Geometriesetup.
Es ist ein unterschied ob das Geometriesetup bei Transformationen jedes mal zb 100.000*3 Vertex „durchgehen“ muss oder ob nur 10.000*3 Vertex „durchgegangen“ werden und die restlichen (dann ohne „extra“ transformation) vom Tessellator kommen.

Zudem bedeuten weniger Tris/Vertex im vorGeometriesetup eine schnelleres abarbeiten im eigentlichem Programm und Treiber -- zb Clipping.

Insofern bedeutet tesselation, bei gleichem qualitativen Ergebnis, mehr FPS.

unfug, tesselation erhöht insofern den aufwand, dass mehr dreiecke im endeffekt gerendert werden müssen. dass da keineswegs mehr fps rausspringen ist doch logisch, die benches zu den thema bestätigen den trend auch.
 
Status
Für weitere Antworten geschlossen.
Zurück
Oben