nV30: Shaderleistung seziert
Einen interessanten und überraschenden Artikel über die Architektur des nV30, dem Urvater der GeForceFX-Reihe, gibt es seit heute bei den Kollegen des 3DCenter zu lesen. Erklärt wird auf der Basis eines von nVidia eingereichten Patentes, wie es um die Besonderheiten der CineFX-Architektur bestellt ist.
Der Artikel ist anfänglich sehr technisch und für den Laien nur bedingt geeignet. Ab der vierten Seite werden jedoch nachvollziehbare Vergleiche zur Shaderleistung des R300, also des Motors der Radeon 9700 Pro und Verwandter, gezogen, mit der jedermann etwas anfangen kann.
Nun wird auch um einiges klarer, warum es bei aktuellen Spielen, wie z.B. Tomb Raider: Angel of Darkness, wie bei Beyond3D gezeigt wurde, um die umgesetzte Shaderleistung der FX-Reihe eher mäßig bestellt ist.
So benötigt die Pixelshadereinheit des nV30 ganz bestimmte Voraussetzungen unter anderem bei der Instruktionsreihenfolge, um ihre maximale Leistung zu entfalten. Dummerweise sind die 2.0-Shadercodes, die von dem im DX9-SDK mitgelieferten Compiler erzeugt werden nach den Optimierungsregeln für ATis R300-Chips aufgebaut, die zum Zeitpunkt der Veröffentlichung als einzige am Markt erhältlich und somit die einzig logische Wahl waren.
Ein neuer Compiler, der die spezifischen Eigenheiten der nV3x-Chips berücksichtigt, wird aber bereits in der aktuellen Beta des DX9-SDK genutzt, so dass zukünftige Spiele auch besser mit den Möglichkeiten der GeForceFX-Reihe harmonieren sollten.
Der nV35 kann sogar unter bestimmten (allerdings recht theoretischen) Umständen eine schnellere Ausführung von Pixelshader-2.0-Code erreichen, als es die R300/R350-Chips zuwege bringen.
Im allgemeinen und für die Realität nutzbaren Verhältnis von Textur- und Rechenoperationen innerhalb eines Shaders sind die Radeons jedoch zumeist leistungsfähiger als die GeForceFX-Reihe.
Hier nochmal der Link zum Artikel vom 3DCenter.