- Registriert
- Juni 2001
- Beiträge
- 18.729
Ist aber kein Fakt, vermutet die eine Seite nur allein.Simanova schrieb:@Volker Da es im Artikel nicht erwähnt wird:
(D) steht für Dragon / Drache
Und halt inhaltlich auch nicht relevant.
Die Folie klauen sie jedes Mal und binden sie überall ein. Hat keinen Sinn.[wege]mini schrieb:@Volker
Die offizielle Folie hier, ist z.B. ein guter Ansatz.
https://cdn.wccftech.com/wp-content/uploads/2023/11/US-Goverment-NVIDIA-GPUs-NAC.png
Leider auch mit zu wenigen weiterführenden Informationen.
Es geht halt um einen anderen Wert, den man unterschreiten muss, primär TPP. Und geht es nach dem, müsste man primär Int8 um nur rund 10% beschränken.
Die TPP-Folie hatten wir damals schon bei der L20-Geschichte eingebaut: https://www.computerbase.de/2023-11...ten-fuer-china-umgehen-schaerfere-sanktionen/
Aber auch das sind eben eher Vermutungen das es in die Richtung gehen könnte, THG hat mal bissel gerechnet https://www.tomshardware.com/news/n...o-comply-with-us-export-regulations-for-china
The main metric that the 4090 D will need to meet is TPP, Total Processing Power. This is calculated by the maximum compute for a given bit-depth, using TFLOPS (or TOPS for integer work) multiplied by the number of bits. For the RTX 4090, TPP is 660.8 * 8 = 5,286 for FP8 work running on the Tensor cores (sparsity doesn't count). Also note that the value is the same for FP16: 330.4 * 16 = 5,286. The allowed limit is 4,800, so the RTX 4090 is about 10% "too powerful."
This is why the RTX 4080 can still be sold (and manufactured / assembled) in China. It has a TPP of 389.6 * 8 = 3,117. There's a secondary metric for data center parts called Performance Density (TPP divided by die area), but that doesn't come into play for consumer GPUs. It's the reason the Nvidia L4 also falls under the restrictions, as it has a PD rating of 6.6, using the AD104's 294 mm^2 die size and a TPP value of 1,936. (It's a good thing PD doesn't apply to consumer products, as the entirety of Nvidia's desktop RTX 40-series has a PD above 6.0.)
Assume a clock speed of 2.7 GHz and we get a maximum number of SMs of 108. That would still have a TPP score of 4,778, however, so Nvidia will likely be aiming a bit lower, like around 100 SMs (4,428 TPP), just to be safe.
Zuletzt bearbeitet: