Du verwendest einen veralteten Browser. Es ist möglich, dass diese oder andere Websites nicht korrekt angezeigt werden. Du solltest ein Upgrade durchführen oder einen alternativen Browser verwenden.
NewsNvidia Tesla K80 rechnet mit bis zu 8,7 TeraFLOPS
Ein Jahr ist vergangen, seitdem Nvidia mit der Tesla K40 das bis heute amtierende Flaggschiff im Bereich der GPU-basierten Beschleunigerkarten für Hochleistungsrechner vorstellt hat. Seit heute nimmt die Tesla K80 mit bis zu 8,7 TeraFLOPS bei einfacher und 2,9 TeraFLOPS bei doppelter Genauigkeit den Spitzenplatz ein.
Auf was ist die wesentlich verhältnismäßig schlechtere DP- zur SP-Leistung bei NVIDA zurückzuführen? Architektur?
Vergleicht man diese mit AMD, ist diese ziemlich genau die Hälfte der SP-Leistung.
Also gibt es ihn doch, den ominösen GK210. Was mich natürlich zu der Frage bringt, wozu jetzt noch GK210 bringen, wenn doch scheinbar GM200 vor der Tür steht? Ein Schelm wer böses denkt.
Auf was ist die wesentlich verhältnismäßig schlechtere DP- zur SP-Leistung bei NVIDA zurückzuführen? Architektur?
Vergleicht man diese mit AMD, ist diese ziemlich genau die Hälfte der SP-Leistung.
hmm die Tabellenwerte im Vergleich zu den 1-Chipigen AMD Karten sehen ja nicht schlecht aus ;-)
vielleicht sollte man der fairness halber aber auch noch stärker betont angeben, dass das bei Nvidia absolute Peak-werte sind
-> gerade der "GFLOPS (DP) pro Watt" Wert in der Tabelle sieht sonst etwas aus wie ausm Nvidia Marketing....
die Karte schafft auf Dauer nämlich eher so knapp 1,9TFLOPs DP....
und das sind dann ehr so "nur" 6,23 GFLOPS (DP) pro Watt.
Nein, das war voller Ernst. Das steht sogar so im Artikel:
Damit übertrifft die Tesla K80 AMDs FirePro S9150 mit einer Hawaii-GPU, benötigt dafür aber mehr Strom und liegt bei der Effizienz hinter der AMD-Karte.
Also gibt es ihn doch, den ominösen GK210. Was mich 9natürlich zu der Frage bringt, wozu jetzt noch GK210 bringen, wenn doch scheinbar GM200 vor der Tür steht? Ein Schelm wer böses denkt.
Gut möglich dass ein einzelner GM200 langsamer, etwas langsamer ist. Der dürfte später kommen da NV offensichtlich noch viele große 28nm Chips loswerden will und muss, zudem ist 20nm oder darunter bei TSMC extrem teuer und derzeit auch nicht wirklich nötig.
oach da muss ich ihn mal unterstützen denn sooo nach hinten ging das ja nich los, bei ner Neuvorstellung die 6,23 GFLOPS (DP) pro Watt auf Dauer bringt ;-)
(Details s.o.)
Wenn man der Gerüchteküche glauben möchte, hat Nvidia anscheinend in letzter Minute den großen Maxwell gecancelt, und dann ist das jetzt nunmal genau das Konkurrenzprodukt zur S9150 und da sprechen die Werte nunmal für sich.
AMD nutzt 2 Shadereinheiten für DP Berechnungen. Eine CU mit 64 Shadereinheiten entspricht bei DP-Berechnung 32 Einheiten->2:1. Bei Nvidia sind extra FP64-Units verbaut. Auf 192 Cuda-Cores pro SMX-Block kommen 64 FP64-Units bei den großen Chips->3:1. Beim GK104 und kleiner kommen auf 192 Cuda-Cores nur noch 8 FP64-Units->24:1.
sicher nicht alles. Hängt stark von der Anwendung ab. Von der Hardware Seite ist SP-Leistung je nach Anwendung auch wichtig.
Bei beidem ist natürlich die Effizienz/Watt ziemlich wichtig.
Auch die gebotenen Software drum herum hat einen großen Anteil (hier ist NV sehr gut!)
Aber auch die Unterstützung von vorhandenen offen Standards (OpenCL) ist/wird zunehmend wichtiger...
Keine Sorge wir wissen schon wovon wir sprechen - und würdigen das gesamt Paket
trotzdem muss man bei dieser neuen Hardware nicht unbedingt jubeln...