Conqi schrieb:
Bei KI/Machine Learning und Co. kommen oft ja gar keine Gleitkommazahlen zum Einsatz. Nicht umsonst wird in dem Bereich mit Unterstützung von Int8-, Int4- und teils sogar Int2-Werten direkt in der Hardware geworben. TOPS sind da der deutlich häufiger anzutreffende Vergleichswert gegenüber TFLOPS.
Mir ist nur nicht klar was alles in den OPS eingeschlossen ist, ganz zu schweigen von den Möglichkeiten der Hardware für SIMD.
Sind 10 OPS nun entweder
10 Additionen/Multiplikationen inklusive speicherzugriff unabhängig vom Datentyp?
10 64 Bit Integer Add/Mul, 20 32 Bit, 40 16 Bit etc?
10 Operationen aus dem Pool Add, Mul, Load, Store und ähnliches? Also eventuell nur 2 vollständige 64 Bit Integer Additionen
Eventuell werden manche OPS wie Division, Modulo oder sogar Multiplikation auch in mehreren atomaren OPS aufgeteilt.
Die reine OPS Angabe ist für mich eher eine typische Klischee-Microsoftsupportaussage - wahr, korrekt, aber nicht hilfreich
Ja, formal lässt sich damit die Leistungsfähigkeit von Hardware vergleichen, aber ohne weitere Informationen praktisch nur für die gleiche Architektur unter verwendung des gleichen Compilers. Da aber bei diesen Chips offenbar jeder sein eigenes Design hat ...
Dazu gilt wie immer: theoretische Leistung < Benchmarkleistung < Leistung bei der praktischen Nutzung
Ich kann zwar bei x86 CPUs einfach annehmen dass die entsprechung zu oben etwa 1; 0,6-0,99; 0,1-0,99 ist, aber bei solchen Chips habe ich keine Ahnung und hätte gerne irgendeinen Vergleichswert um das in Relation zu setzen. FLOPS, Integer OPS, LINPACK, Zeit für Pi auf 100 Mio stellen, FPS von Doom 1 mit Software Renderer ... sowas in der Richtung.
calluna schrieb:
Dir sind die Jahreszahlen in dem Vergleich aufgefallen?
Ja. Und? Was sollen die mir noch sagen, außer der Zeit für den jeweiligen Messpunkt?