News GeForce GTX 970: Nvidia bestätigt Limitierungen am Speicher

DrToxic schrieb:
Jein. Es sind zwar sowohl die 3,5GB als auch die 0,5GB nutzbar, jedoch nicht gleichzeitig.

edit:
Klarstellung: Es können natürlich bis zu 4GB Daten reingeschrieben werden (auch wenn der Treiber tunlichst auf 3,5GB deckelt), es ist jedoch nicht möglich, die beiden Speicherblöcke zeitgleich anzusprechen, bei >3,5GB muss zwischen beiden Bereichen hin und her gewechselt werden

Das kannst du aber nur schreiben, wenn du erklären kannst weshalb dies so ist. Warum genau soll man denn nicht gleichzeit die beiden DRAM Segmente ansprechen?
 
Mal ganz ehrlich, Nvidia UND AMD kann sich freuen,

die einen kaufen sich jetzt ne 980 und die anderen ne 290x und freuen sich gleichzeitig auf ne 30 Euro Gutschrift seitens Caseking oä :D

Frage ist was nun mehr gekauft wird ^^
 
cl55amg schrieb:
Das kannst du aber nur schreiben, wenn du erklären kannst weshalb dies so ist

Könnte ich, ich will mich aber nicht ständig wiederholen. Das Schöne ist aber, dass ich das auch nicht brauche, weil das ein Techniker von nvidia schon aufgeklärt hat (schon am Montag) :p

GTX 970 can read the 3.5GB segment at 196GB/sec (7GHz * 7 ports * 32-bits), or it can read the 512MB segment at 28GB/sec, but it cannot read from both at once; it is a true XOR situation. The same is also true for writes, as only one segment can be written to at a time.

http://www.anandtech.com/show/8935/...cting-the-specs-exploring-memory-allocation/2

edit:
Daraus wird auch ersichtlich, dass die eigentlich überall gemachte Angabe eines 256bit Speicherinterfaces falsch ist, womit der Sachmangel imo unwiderlegbar fest steht.
Real gibt es nur 224bit+32bit, die nur separat angesprochen werden können
 
Zuletzt bearbeitet:
DrToxic schrieb:
Daraus wird auch ersichtlich, dass die eigentlich überall gemachte Angabe eines 256bit Speicherinterfaces falsch ist, womit der Sachmangel imo unwiderlegbar fest steht.
Real gibt es nur 224bit+32bit, die nur separat angesprochen werden können

Danke, das versuche ich schon seit Thread ~669 hier zu erklären, zuletzt hier:

https://www.computerbase.de/forum/t...en-am-speicher.1440060/page-109#post-16938012

auch unter Verweis auf Anandtech, der das sehr schön ausgeführt hat, dass MC 7 und 8 nie beide Volllast fahren können, sondern wenn beide laufen sich einen Zugang teilen müssen, womit sie im Ergebnis auf 50% laufen.

Entweder

=> 7*32bit = 224bit

oder

=> 6*32bit + 2*32bit/2 = 224bit

Das ist wie beim Golf 16V, bei dem 8V im Motor eingebaut sind und 8 im Handschuhfach liegen. Das ist auch kein 16V, auch wenn er 16 Ventile "hat", so wie die GTX970 8 MC mit 32bit = 256bit "hat", die sie aber nie alle zusammen voll nutzen kann, weil das technisch unmöglich ist.

Damit stimmen auch die "bis zu 224 GB/s" nicht.

Endlich ist das jetzt mal durch ! Und völlig richtig: der Sachmangel steht damit ebenfalls fest, das habe ich bereits in Thread 669 ausgeführt.

https://www.computerbase.de/forum/t...gen-am-speicher.1440060/page-34#post-16921655
 
Zuletzt bearbeitet:
DrToxic schrieb:
Könnte ich, ich will mich aber nicht ständig wiederholen. Das Schöne ist aber, dass ich das auch nicht brauche, weil das ein Techniker von nvidia schon aufgeklärt hat

Kurz gefasst kann man sagen, dass es unter Vollast nicht möglich ist auf beide Segmente lesend zu zugreifen, da einer der 4 Blöcke bestehend auf L2 Cache/ Memory Controller usw. nur eine einzige Anbindung zur Crossbar hat. Unter nicht "Vollast- Szenarien" ist es möglich auf beide Segmente zu zugreifen.

Ultimately due to the design of the crossbars and the memory controllers, it is not possible for 1 crossbar port to carry the full load of 2 memory channels in all circumstances.

Damit ist die Angabe eines parallelen 256 Bit Interface in Kombination mit 4GB RAM irreführend.
 
cl55amg schrieb:
Unter nicht "Vollast- Szenarien" ist es möglich auf beide Segmente zu zugreifen.

Genau dies verhindert Nvidia mit seinen Treibern. Wie in dem Interview bei PCper ausgeführt wurde, würde ansonsten der Zugriff auf allen 7 Ports sich halbieren, weil die anderen 6 Ports durch Loadbalancing vom 7ten Port ausgebremst würden wenn er nur jeden zweiten Zugriff auf den 3,5 GB Speicherpool machen kann.

Siehe vor 3 Tagen hier im Thread:
Daedal schrieb:
Laut den technischen Ausführungen bei PCPer ist aber nciht nur der kleinere Speicherpool langsamer angebunden sondern automatisch auch der ganze große Speicherpool.

Es wird zwar behauptet es ist ein 256-Bit SI, doch in der dortigen, Extra für dieses Problem angefertigten, Grafik ergibt sich folgendes Bild:

GM204_arch_0.jpg


Offensichtlich sind die 3,5 GB Pool mit lediglich 7 ports anstatt 8 angebunden, weil eben dieser achte Port die restlichen 500MB separat anbindet, da sonst das Loadbalancing alle Ports mit der max. Geschwindigkeit des langsamsten achten Ports angebunden gewesen wären.
But the GTX 970 and its altered design has to do things differently. If you walked across the memory interface in the exact same way, over the same 4GB capacity, the 7th crossbar port would tend to always get twice as many requests as the other port (because it has two memories attached). In the short term that could be ok due to queuing in the memory path. But in the long term if the 7th port is fully busy, and is getting twice as many requests as the other port, then the other six must be only half busy, to match with the 2:1 ratio. So the overall bandwidth would be roughly half of peak. This would cause dramatic underutilization and would prevent optimal performance and efficiency for the GPU.
Damit fehlt allerdings auch der achte Port an dem grossen Speicherpool der 3,5 GB - somit kann wohl davon ausgehen, dass auch hier nicht die volle versprochene Anbindung vorhanden sein kann wie bei GTX980 - also selbst der 3,5 GB VRAM langsamer angesprochen wird um 1/8. Im Prinzip ist die Anbindung max. so schnell als wären lediglich 3,5 GB verbaut und somit haben alle echten 4 GB GPUs wie die GTX980 eine Bandbreite die um 1/8 höher ist.

Auf jeden Fall hat kein Stück des 3,5 GB VRAMs einer GTX 970 224 GB/s Bandbreite wie zugesagt. Die restlichen 500 MB sowieso nicht.
 
Daedal schrieb:
Genau dies verhindert Nvidia mit seinen Treibern. Wie in dem Interview bei PCper ausgeführt wurde, würde ansonsten der Zugriff auf allen 7 Ports sich halbieren, weil die anderen 6 Ports durch Loadbalancing vom 7ten Port ausgebremst würden wenn er nur jeden zweiten Zugriff auf den 3,5 GB Speicherpool machen kann.

Ja das habe ich auch nicht verneint. Die Architektur ermöglicht einen parallelen Zugriff auf beide Segmente, in der Praxis verhindert es sinnvollerweise der Treiber. Unterm Strich hat man performant nur eine 224Bit Anbindung zu 3,5GB RAM bei 1,8MB Cache.
 
Auch muss man wohl zusätzlich davon ausgehen, dass der L2 Cache in diesen beiden letzten DRAM Modulen keinen Nutzen hat. Nicht nur dass eben 1/8 des L2 fehlen, sonder einer der verbliebenen muss sich auch noch zwischen dem grossen und kleinen Speicherpool aufteilen. Dies bedeutet, dass wenn beide Speicherpools zeitgleich verwendet werden würden, sobald irgendwelche Daten im kleinen Pool liegen, die abwechselnden Zugriffe auch einen dauernden L2-Flush verursachen würden und dieses 1/8 L2 auch noch nutzlos machen würde und eben den gesamten 3,5GB Speicherpool in der Performance beschneidet. Daher verhindert Nvidia dies auch so rigoros, damit eben nicht auch noch der L2-Cache des gesamten 3,5 GB Speichers nutzlos wird (da ja wieder die anderen 6 Ports auf den langsamen Zugriff warten müssen)
Ergänzung ()

cl55amg schrieb:
Ja das habe ich auch nicht verneint. Die Architektur ermöglicht einen parallelen Zugriff auf beide Segmente, in der Praxis verhindert es sinnvollerweise der Treiber. Unterm Strich hat man performant nur eine 224Bit Anbindung zu 3,5GB RAM bei 1,8MB Cache.
Ich weiss, ich wollte es nur ergänzen und auch die L2 Cache Situation einbringen. Denn wenn man eben bei kleinen Loads die 500MB auch nutzen würde, hätte der L2 Cache insgesamt gar keinen Nutzen und somit hätte man auch diese 1,8 MB nicht.
 
Zuletzt bearbeitet:
DrToxic schrieb:
Korrekt.

Und die 256bit sind somit auf jeden Fall falsch.

Rechtlich geht es eher in Richtung Irreführend. Die Anbindung ist ja physisch vorhanden, aber die erwartete Nutzung der Anbindung in Relation zum Speicher ist nicht gegeben bzw. man wurde darüber nicht aufgeklärt. Irreführend eben...
Trotzdem aber für mich ein eindeutiger Grund den Kaufvertrag anzufechten.

Ich habe nicht Jura studiert, sondern Informatik auf einer Universität. Daher kann ich die Rechtslage nicht eindeutig beurteilen, obwohl ich dafür ein ganz gutes Gefühl habe.
 
@Daedal

Deswegen auch die korrigierte Angabe: 196 + 28 GByte/s

Das Problem sollte sich auch etwas von selbst lösen. Was machen nun die Händler mit den gebrauchten Karten?
Diese kann man nicht mehr als neu verkaufen und somit ist ein Verlust vorhanden.
 
Zuletzt bearbeitet:
Bert schrieb:
@Daedal

Deswegen auch die korrigierte Angabe: 196 + 28 GByte/s

Das Problem sollte sich auch etwas von selbst lösen. Was machen nun die Händler mit den gebrauchten Karten?
Diese kann man nicht mehr als neu verkaufen und somit ist ein Verlust vorhanden.

Vermutlich wollen sie diese an Nvidia senden bzw. deren Vertreter und natürlich eine Entschädigung für entgangenes Geschäft.
Genau hier wird es rechtlich spannend, nämlich auf Händlerseite!
 
@Bert
Nur stimmt dies ja auch nicht. Es ist 196 oder 28 GByte. Ein "+" assoziert, dass diese beide gleichzeitig genutzt werden könnten. Nur werden diese beiden gleichzeitig genutzt reduziert sich die Bandbreite auf 98+14GByte/s, da die beiden Speicherpools sich den 7 Port teilen und abwechselnd den L2 Cache leeren, dürfte es sogar noch langsamer sein - praktisch ohne L2 Cache in der Performance.

Somit ist selbst diese Korrektur falsch und daher gibt es auch viele die hier immer noch schreiben es seien ja schließlich 4 GB verbaut und benutzt würden sie ebenfalls nur des bissl eben etwas langsamer. Nur eben niemals gleichzeitig - Die Karte kann keine 4GB gleichzeitig nutzen da die Zugriffe abwechseln stattfinden und niemals zeitgleich.
 
Ich finds heftig dass Nvidia versucht das Thema totzuschweigen und sich die Kunden mit den verunsicherten Händlern rumschlagen müssen und quasi alle im Regen stehen...

edit:Ich glaub auf ne offizielle Stellungnahme in Bezug auf eine zufriedenstellende Lösung seitens Nvidia brauchen wir nicht mehr hoffen...
 
Zuletzt bearbeitet:
So schnell wird da nix passieren..

Nvidia gibt die GTX 970 auf Ihrer Webseite nach wie vor mit eine Datentransferrate von 224 GByte pro Sekunde an (256 Bit). :rolleyes:
 
Als Reaktion von AMD: Preissenkung der R9 290X

http://www.techpowerup.com/209412/amd-cashes-in-on-gtx-970-drama-cuts-r9-290x-price.html


edit:
Im nvidia Forum geht es ja richtig ab :D

https://forums.geforce.com/default/...eries/asus-strix-gtx-970-tech-support-result/

ASUS beruft sich jetzt wohl darauf, dass ihrer Ansicht nach nur manche Mainboards "4k-geeignet" seien. Jeder, der eine 970 und ein Mainboard hat, das nicht auf der neuen "4k compatible" Liste von ASUS steht, kann nichts umtauschen, da er nach der Logik ja eh nicht betroffen sein kann.

CUDA oder sowas scheint es bei denen nicht zu geben?
 
Zuletzt bearbeitet:
Und diese 256-bit sind ja nach wie vor nicht korrigiert, obwohl ein kompletter 32-Bit Port fehlt wie man an der Grafik sehen kann. Zwar sind die 256-bit SI physisch vorhanden doch ohne Funktion da nur Ports 7 aktiv sind. Das wäre als ob man die deaktivierten defekten Shader auch mit dazu zählen würde. Das SI hat maximal 224-bit, und zwar immer zur Verfügung. Und davon werden 32-bit doppelt angesprochen von zwei Speicherpools.

Also wäre richtig 224-bit ( bis 3,5 GB) oder 32-bit (bis 512 MB) oder 112-bit ( bis 4GB) wenn die 3,5 GB überschritten werden). Es gibt drei Bandbreiten-"Zustände" durch die beiden Speicherpools.
 
Asus hilft doch weiter was man an anderen Posts sieht also warum muss man da jetzt so hetzen?

"Please contact the point of purchase if you wish to exchange it for an alternative product like the R9 290X or upgrade to the 980. However, if you read and understand the details of the situation, and don't buy products on x numbers alone - on real world performance - the concern is overblown. We appreciate your concern but we feel the GTX 970 is a great performing, highly efficient card."
 
Zuletzt bearbeitet:
Zurück
Oben