KlaasKersting
Captain
- Registriert
- Okt. 2015
- Beiträge
- 3.090
Nvidia's FP32 Einheiten können 2 Operationen pro Takt ausführen.bensen schrieb:So unrealistisch ist das nicht. Von TSMC 10nm auf N5P wird die Power Consumption auf 40% reduziert. Jetzt mag 8LPP etwas sparsamer als TSMC 10nm sein und die theoretische Ersparnis nicht voll ausgenutzt werden, da man auch den Takt erhöht. Aber zusammen mit dem höheren Powerbudget klingt das nicht utopisch.
Der Performancesprung an sich auch nicht. Die theoretische Transistordichte steigt auf das 2.8 fache. Praktisch ist die Dichte von H100 2.2x so hoch wie GA102.
Das was überrascht ist, dass die direkt in der ersten Generation All-in gehen. Die werden so schnell nicht auf N3 umsteigen. Wird spannend wie die die folgenden Jahre gestalten.
So kommst du auf die 13 TFLOPS einer 2080 Ti (4352 SMs * 1545 MHz Takt * 2) und die 35 TFLOPS einer 3090 (10496 SMs * 1695 MHz Takt * 2)
Auf 40 TFLOPS kommt eine 3090 nur, wenn man den real oft höheren Boosttakt von 1900+ MHz nimmt statt den aus dem Spec Sheet.