das kann ich ja leiden - einfach mal überall widersprechen um des widersprechens willen.
SOWJETBÄR schrieb:
Nicht nein, wie ich schrieb eine andere Architektur als andere GPUs, ist ja kein Widerspruch.
du bist also der meinung, dass nvidia fermi eine "ausnahmearchitektur" war? meine aussage war, dass ab fermi nvidia gpus (architekturen) auf extreme tessellationsworkloads ausgelegt wurden.
du hast das verneint mit der aussage, dass fermi eine andere architektur als andere gpus hat.
ich mein natürlich sind architekturen von generation von generation unterschiedlich, aber die grundlegende ausrichtung von nvidia architekturen ab fermi folgt dem selben schema.
The Kepler Architecture: Fermi Distilled
https://www.anandtech.com/show/5699/nvidia-geforce-gtx-680-review/2
Since Fermi NVIDIA has a similar principle architecture.
https://developer.nvidia.com/content/life-triangle-nvidias-logical-pipeline
Tessellation is a GPU-bound item. Modern architectures – Fermi, Kepler, and Maxwell included – include dedicated tessellation units that allow for independent processing of tessellated objects. Impact on hardware will depend based on the game, engine, and implementation of tessellation.
https://www.gamersnexus.net/guides/1936-what-is-tessellation-game-graphics
PolyMorph Engine 3.0
Tessellation was one of DirectX 11’s key features and
will play a bigger role in the future as the next generation of games are designed to use more tessellation [Schöne Kristallkugel an der Stelle - die müssen sich ja ziemlich sicher sein, dass mehr Tessellation eingesetzt wird]. With the addition of more SMs in GM204, GTX 980 also benefits from
2x the Polymorph Engines, compared to GTX 680. As a result,
performance on geometry heavy workloads is roughly doubled, and due to architectural improvements within the PE, can achieve up to 3x performance improvement with high tessellation expansion factors.
http://international.download.nvidi...nal/pdfs/GeForce_GTX_980_Whitepaper_FINAL.PDF
und dann letztendlich pascal als "maxwell refresh":
In a by-the-numbers comparison then, Pascal does not bring any notable changes in throughput relative to Maxwell. CUDA cores, texture units, PolyMorph Engines, Raster Engines, and ROPs all have identical theoretical throughput-per-clock as compared to Maxwell. So on a clock-for-clock, unit-for-unit basis, Pascal is not any faster on paper
https://www.anandtech.com/show/10325/the-nvidia-geforce-gtx-1080-and-1070-founders-edition-review/4
können wir uns jetzt also darauf einigen, dass nvidia an der grundlegenden ausrichtung seit fermi nichts mehr geändert hat und der hardwarefokus auf tessellation nach wie vor gegeben ist, bspw. mit jeder generation noch weiter ausgebaut wurde?
fermi ist weder ein ausreißer noch eine komplett eigenständige architektur, sondern viel eher die basisarchitektur für alle folgenden architekturen.
SOWJETBÄR schrieb:
Nein, du meinst da die hohen Tesselationsfaktoren, die AMD Karten einfach nicht so gut können.
nein, meine ich nicht. "einfach nicht so gut können" ist in so einem komplexen gebiet eine gefährliche pauschalisierung, die du nicht belegen kannst.
ich will damit nicht sagen, dass die absurde menge an polys, die tessellation nach nvidias vorbild generiert (sub pixel tessellation), nicht das hauptproblem ist - das ist nämlich definitiv der fall - aber es ist nicht von der hand zu weisen, dass nvidia mit tessellationseinheiten bzw. später "polymorph engines" ein extrem spezialisiertes gegenstück zum "softwarebaustein tessellation" hat. wenn dann noch gameworks dazukommt, das großteils auf tessellation basiert, wird klar, dass hier zwei puzzlestücke ineinandergreifen.
und bei ineinandergreifen wirds interessant.
der scheduler von amd und nvidia unter DX11 funktioniert grundlegend anders.
amd nutzt einen hardwarescheduler, der direkt von der software angesprochen werden muss, was bei DX11 im regelfall nicht wirklich gut funktioniert ("auslastungsprobleme") - hier liegt der fokus ganz klar auf direkter ansprache durch low level apis wie dx12 oder vulkan. amd karten werden unter low level apis nicht "schneller", hier fällt lediglich das bottleneck durch DX11 weg.
dass DX11 auf amd trotzdem sehr performant sein kann (wenn richtig umgesetzt) sieht man an star wars battlefront 2, ist aber absolut nicht der regelfall.
nvidia arbeitet mit ihrem treiber mit einem extrem aufwendigen software scheduler (tolle ingenieursleistung an der stelle), d.h. der nvidia treiber sammelt die ganzen aufgaben, die für die gpu anfallen und füttert die gpu entsprechend. das produziert einen overhead unter dx12, weil hier der software scheduler nvidia im weg steht - daher schneiden nvidia gpus mit ryzen cpus unter dx12 schlechter ab.
weil gameworks mit dem nvidia treiber kommuniziert, kann man davon ausgehen, dass die tessellationseinheiten von geforce karten optimal gefüttert werden.
das ist bei amd mit dem hardware scheduler + nvidia optimiertem dx11 gameworks spiel schonmal ziemlich sicher nicht der fall.
amd wäre mit einem angepassten software scheduler, wie nvidia ihn hat, sicherlicher auch besser dran, aber das ist wohl eher eine budgetfrage als alles andere.
SOWJETBÄR schrieb:
Das funktioniert auf AMD Karten genauso, nur halt ist der Tesselator der AMDs langsamer. Das ist aber auch bekannt und per se nix schlimmes.
zwischen amd und nvidia gibts im gegensatz zu fermi -> pascal dramatische unterschiede in der architektur, ausrichtung und funktionsweise. zu sagen "amd ist langsamer" ist zwar letztendlich nicht falsch, aber auch zu kurz gegriffen.
wir sehen bei nvidia einen extremen fokus auf tessellation, der tief in der architektur verankert ist - man könnte fast von überzüchtet und "komplett übertrieben" sprechen - dann kommt noch die verzahnung mit gameworks dazu.
man kann mit ziemlicher sicherheit davon ausgehen, dass "funktioniert auf amd genau so" eine falsche aussage ist.
wir sehen in der präsentation zu GCN (Hawaii), dass die gesamte pipeline von amd grundlegend anders aufgebaut ist - während nvidia hardware darauf ausgelegt ist komplett abstruse tessellationsfaktoren (sub pixel tessellation) zu berechnen (abermillionen polygone), "verstopft" bei amd übermäßige tessellation die pipeline. zufall, dass bei the witcher 3 hairworks mit tess level 64 läuft?
SOWJETBÄR schrieb:
Da kann AMD sich ja entscheiden die Einheit zu verstärken oder auch nicht (wenn die Effekte sowieso nichts bringen, warum auch nicht, es spricht nichts dagegen die ohnehin unnnötigen Effekte einfach abzuschalten, das geht ja), das ist keine Benachteiligung.
ohne eine komplett andere architektur, die genau so auf tessellation spezialisiert ist wie die von nvidia, gibts einfach irgendwo ne grenze. GCN ist nicht für solche tessellationsexzesse ausgelegt - und das ist auch eigentlich richtig so. dieser missbrauch von tessellation kommt einzig und alleine von nvidia - das hat nichts mit effizientem game-design zu tun, das ist einfach nur ressourcenverschwendung. für einen "normalen" gebrauch von tessellation reicht die tessellationsleistung von radeon karten absolut aus.
die benachteiligung daraus entsteht, wenn man tessellation nicht abschalten kann, oder mit vollem tessellationslevel gebencht wird (wie bei CB).
nvidia ist alles egal, solange sie über tessellationsleistung / gameworks alte karten bei bedarf ausknipsen können ("keplered") und in benchmarks nach "the way its meant to be played (gimped)" ablaufen.
die techpresse könnte hergehen und amd karten mit limiterter tessellation testen, stattdessen wird nvidia mit vollem tessellationslevel voll in die karten gespielt - was ich angesichts des missbrauchs regelrecht zum kotzen finde.
niemand profitiert von einem tessellationslevel von >8x, weil das alles sinnlose sub pixel tessellation ist. d.h. die 3D mesh segmente haben ne höhere dichte als die pixel/auflösung in der gerendert wird - das ist einfach nur bescheuert.
SOWJETBÄR schrieb:
Falsch, basieren != sind.
ist toast hawaii also kein toast? natürlich sind tessellationsbasierte effekte tessellation. waveworks ist genau das selbe wie hairworks, ist genau das selbe wie turf - die unterscheidung ist reines marketing. alles basiert auf dem dynamischen anpassen von geometrie und deren komplexität.
SOWJETBÄR schrieb:
Alle Effekte so ziemlich jeden Spiels basieren auf DX, sie sind es aber nicht.
was soll das bedeuten?
SOWJETBÄR schrieb:
Sie können Tesselation verwenden, das ändert aber nichts daran, dass die gleich ist bei AMD und NVIDIA, nur halt die NIVIDIA-HW größere Faktoren schneller kann.
es ist nicht nur die hardware, es ist auch die software. wenn nvidia durch speziell darauf ausgerichtete hardware die eigenen (!) effekte schneller berechnen kann, ist das für mich eine form von (legitimer) vorteilsnahme.
das wäre also alles halb so schlimm, wenn man amd karten mit der amd tesellationstreiberoptimierung benchen würde -
was aber nicht der fall ist. man gewährt nvidia auf der einen seite die kompletten vorteile aus ihrem eigenen ökosystem, zwingt aber amd, durch den gezwungenen verzicht auf ihre tessellationsoptimierung, auf der anderen seite in eine unfaire situation, die von nvidia genau so vorgesehen ist.
niemand, der die wahl hat, spielt mit nativen tessellationsfaktoren - optischer gewinn gleich null bei exorbitanten performanceeinbrüchen. im prinzip sollte man nvidia im eigenen sud kochen und amd ihre architektur vorm tessellationswahnsinn schützen lassen. man lässt stattdessen amd im nvidia sud kochen, indem man bewusst nvidias "Ddos" auf die renderpipeline von GCN gutheißt - alles für einen "fairen" benchmarkvergleich, weil die karten "das selbe" berechnen.
wie man das als "unabhängiger" technikredakteur rechtfertigen kann ist für mich unverständlich.