News Autonomes Fahren: Nvidia Orin vereint neue GPU mit ARM Hercules zu 200 TOPS

nlr

Redakteur
Teammitglied
Registriert
Sep. 2005
Beiträge
10.387
  • Gefällt mir
Reaktionen: estros, Kazuja und [wege]mini
An sich interessant, aber der Graph ist ziemlicher Bullshit, was fragen zum restlichen Gehalt aufwirft.
Moores Law gilt für die Speerspitze der CPU Entwicklung. Natürlich kann man auch kleinere, langsamere CPUs bauen und davon ausgehend größere Wachstumsraten erreichen.
Dazu der Performancevergleich mit den Intel ... Kastraten? Nein ... Energieverbrauchsgedeckelten klingt komisch. U-Prozessoren. Die stellen absolut nicht die Leistungsspitze dar, nicht mal die Energieeffizienzspitze. Das sind nur CPUs für den Einsatz in Gebieten mit stark begrenzten Leistungsreserven (Akkubetrieb z.b.) und/oder Wärmeabfuhr (wie z.b. dünne Laptops, Tablets ...), beides ist sicher wenig relevant für den Nachfolger eines 300 W Chips. Auch hier ist Moores Law eher nicht anwendbar, dazu muss man eher die jeweils dicksten Serverprozessoren heranziehen.
Dazu kommt dass momentan Intel nicht mehr die Spitze stellt ^^
so als kleines Detail am Rande, denn aktuelles Maß für Leistung und Energieeffizienz stellen im CPU Bereich momentan AMD CPUs.

Mich persönlich stört auch die Angabe von TOPS ein wenig. FLOPS sind wenigstens Leistungsrelevant, aber reine OPS? Wenn man Load, Store etc mit dazu nimmt könnten CPUs und Grakas in ähnliche Bereiche kommen ohne dass es etwas besonderes wäre. Doch irgendetwas zu tun hilft noch nicht notwendigerweise dabei etwas bestimmtes zu tun. Hat da jemand eine Erleuchtung für mich, oder ist die Angabe so schwammig wie ich sie interpretiere?
 
  • Gefällt mir
Reaktionen: aid0nex, iNFECTED_pHILZ, Grimey und 4 andere
Bigeagle schrieb:
Das sind nur CPUs für den Einsatz in Gebieten mit stark begrenzten Leistungsreserven (Akkubetrieb z.b.) und/oder Wärmeabfuhr (wie z.b. dünne Laptops, Tablets ...), beides ist sicher wenig relevant für den Nachfolger eines 300 W Chips.
Naja, der überwiegende Anteil des Power-Budget wird bei nvidia's Chip für den GPU-Teil reserviert sein.

Außerdem soll die Leistungsaufnahme im Vergleich zum Vorgänger reduziert sein.

efferman schrieb:
was bedeutet das T in TOPS? Um Damenoberbekleidung handelt es sich dabei ja wohl nicht, oder?
https://en.wikipedia.org/wiki/TOPS
 
  • Gefällt mir
Reaktionen: efferman
Bigeagle schrieb:
Mich persönlich stört auch die Angabe von TOPS ein wenig. FLOPS sind wenigstens Leistungsrelevant, aber reine OPS?

Dito....

Am Ende vergleicht man ja aber alle Zahlen mit anderen Zahlen. Ob die "Rechenleistung" in Mips, Flops, Ops, Fps oder Lochkarten pro Stunde angegeben wird, bringt ja immer nur im Zusammenhang mit der Anwendung einen verwertbaren Wert.

Einordnen kann man das neue Baby aber ein wenig, damit.

https://www.computerbase.de/2019-04/tesla-fsd-computer-autonomes-fahren-nvidia-drive-agx-xavier/

"Drive AGX Pegasus ist Nvidias Plattform für autonomes Fahren nach Level 5, die mit 320 TOPS deutlich mehr Leistung bietet als Teslas FSD-Platine. Der große Nachteil: Dafür benötigt Nvidia zwei Xavier-SoCs und zwei TU104-GPUs. Der Verbrauch steigt auf 500 Watt, sodass der Energiebedarf pro TOPS beim Dreifachen von Tesla liegt. "

Wenn die neuen 200 TOPS mit so wenig Stromverbrauch schaffen, ist das schon ordentlich. Der gesamte Chip ist so riesig wie ein TU102....Da geht was, egal welche Zahlen du verwendest, um diese These zu untermauern. :smokin:

mfg
 
efferman schrieb:
Operations per second sein?

Bigeagle schrieb:
FLOPS sind wenigstens Leistungsrelevant, aber reine OPS?

So sieht es schonmal aus. :D

Eine Floating Point Operation per Second kann man sich ja noch vorstellen....Bei 200 Tera davon (das kommt nach Giga) wird es schon schwerer.

https://de.wikipedia.org/wiki/Floating_Point_Operations_Per_Second

Selbst mips sind irgend wo ja noch "verständlich"...millionen Instruktionen pro Sekunde.

https://de.wikipedia.org/wiki/Instruktionen_pro_Sekunde

Wie schon erwähnt, reine Operations per Second anzugeben und dann davon noch 200 Tera, sagt usern wie uns überhaupt nichts.

Die Programmierer der Software können das ganz sicher einordnen und wir wissen, es ist in bestimmten Szenarien ähnlich schnell wie ein TU102 bei viel kleinerem Stromverbrauch.....sagt Nvidia.

mfg
 
  • Gefällt mir
Reaktionen: aid0nex und Alpha.Male
Bigeagle schrieb:
Mich persönlich stört auch die Angabe von TOPS ein wenig. FLOPS sind wenigstens Leistungsrelevant, aber reine OPS?

Bei KI/Machine Learning und Co. kommen oft ja gar keine Gleitkommazahlen zum Einsatz. Nicht umsonst wird in dem Bereich mit Unterstützung von Int8-, Int4- und teils sogar Int2-Werten direkt in der Hardware geworben. TOPS sind da der deutlich häufiger anzutreffende Vergleichswert gegenüber TFLOPS.

efferman schrieb:
was bedeutet das T in TOPS? Um Damenoberbekleidung handelt es sich dabei ja wohl nicht, oder?

Wie meistens im PC-Bereich Tera. Es sind also x Milliarden Operationen pro Sekunde. Im Endeffekt das nur ohne den Gleitkomma-Teil.
 
  • Gefällt mir
Reaktionen: Alpha.Male, Saint81, estros und eine weitere Person
efferman schrieb:
Danke, aber ich glaub das ist was anderes. Müsste das nicht etwas mit Operations per second sein?
Whoops :D
 
  • Gefällt mir
Reaktionen: Alpha.Male
Chips für Automotive sind schon mal ein interessanter anderer Markt...

Die Rechenpower ist weit über dem was eigentlich in den nächsten 10 Jahren gesetzlich erlaubt ist und von Versicherungen abgedeckt ist.
Stichwort Level 5 = 2040 oder später :jumpin: :schaf:

Ich höre immer nur von den Chip-Produzenten, die absetzen wollen. Von Politik, Verbänden und Versicherungen kommt nichts, hulla Hoop.
 
engineer123 schrieb:
Die Rechenpower ist weit über dem was eigentlich in den nächsten 10 Jahren gesetzlich erlaubt ist und von Versicherungen abgedeckt ist

Die Rechenleistung ist aber auch nur bedingt ein Problem. Ich erinnere mich daran mal eine Doku gesehen zu haben über einen deutschen Professor, dessen Mercedes schon vor 25 Jahren autonom im normalen Verkehr mitfahren konnte. Klar wird das nicht mit Level 5 vergleichbar sein, aber es zeigt seinerzeit, dass die Software weitaus relevanter ist.
 
Bigeagle schrieb:
Dazu der Performancevergleich mit den Intel ... Kastraten?

Dir sind die Jahreszahlen in dem Vergleich aufgefallen?

Davon abgesehen geht es hier doch offensichtlich um Prozessoren für ein ganz spezielles Problem, bei dem geringe Rechengenauigkeit ausreichend ist. Und die Angabe in TOPS ist in diesem Fall üblich.

Jede CPU und auch GPU ist für diese Art von Berechnungen Verschwendung.
 
Toller Artikel CB, danke!
engineer123 schrieb:
Die Rechenpower ist weit über dem was eigentlich in den nächsten 10 Jahren gesetzlich erlaubt ist und von Versicherungen abgedeckt ist.
Politiker denken nicht so weit voraus, ist kein Vorwurf, sondern gesunde Realität.
Unternehmen müssen jedoch voraus planen, besonders CV erfordert unfassbar viel DL. Vor allem Level 5. Die nächsten Jahre werden spanned, aber mMn auch ungewiss, wie schnell die Entwicklung abseits der Recheneinheit voranschreitet.
 
@derSafran : Falls wir die gleiche "Doku" meinen - der Mercedes konnte Abstand halten und lenken. Was damals schon ganz gut war und zu der Ansicht verleiten konnte dass man "das mit dem autonomen Fahren" wohl bald allgemein verwenden könne. Hat dann doch etwas länger gedauert, siehe DARPA Grand Challenge.
 
  • Gefällt mir
Reaktionen: Conqi und derSafran
Ähm, bin ich blind, oder steht da tatsächlich nirgends, wie viel Watt der Orin denn nun real benötigt? o_O

Die Pegasus-Combo verbraucht mit seinen 500W übrigens nicht 3x, sondern 7x so viel wie der Tesla-FSD. Das war ja auch der Grund warum Elon ein eigenes Design forciert hatte: Es war klar, dass die etablierten HW-Hersteller (namentlich Nvidia) zu spät auf die Anforderung nach drastisch reduziertem Stromverbrauch, der bei einem E-Auto angesagt ist, Rücksicht nehmen würden.

Unterm Strich kann man beide Lösungen natürlich in Sachen Specs vergleichen, aber da Tesla einen ganz anderen Weg geht, als die anderen Marktteilnehmer im Rennen zur Voll-Autonomie, nützt ein reiner Vergleich nur der Zahlen eh nicht so viel.
 
"Orinieren" wir mal zusammen. Autonomen Autos wird kräftig an Rechenleistung spendiert Level 4 in 2 Jahren! Skynet in 10. Hr hr hr..
 
Ist zwar etwas erbsenzählerisch, aber:

Orin versammelt 17 Milliarden Transistoren auf bislang unbekannter Fläche bei ebenso unbekanntem Fertigungsprozess. Das ist gut das Doppelte der 9 Milliarden Transistoren des Xavier-SoCs, den Orin ablösen soll.

Nicht ganz....
 
Odysseus277 schrieb:
Ähm, bin ich blind, oder steht da tatsächlich nirgends, wie viel Watt der Orin denn nun real benötigt?

Ist das in dem Bereich überhaupt so relevant? Ich vermute verglichen mit den restlichen Verbrauchern eines Fahrzeugs wird das nicht so ins Gewicht fallen, die Einsatzmöglichkeiten scheinen da viel wichtiger zu sein.
 
Conqi schrieb:
Bei KI/Machine Learning und Co. kommen oft ja gar keine Gleitkommazahlen zum Einsatz. Nicht umsonst wird in dem Bereich mit Unterstützung von Int8-, Int4- und teils sogar Int2-Werten direkt in der Hardware geworben. TOPS sind da der deutlich häufiger anzutreffende Vergleichswert gegenüber TFLOPS.
Mir ist nur nicht klar was alles in den OPS eingeschlossen ist, ganz zu schweigen von den Möglichkeiten der Hardware für SIMD.
Sind 10 OPS nun entweder
10 Additionen/Multiplikationen inklusive speicherzugriff unabhängig vom Datentyp?
10 64 Bit Integer Add/Mul, 20 32 Bit, 40 16 Bit etc?
10 Operationen aus dem Pool Add, Mul, Load, Store und ähnliches? Also eventuell nur 2 vollständige 64 Bit Integer Additionen

Eventuell werden manche OPS wie Division, Modulo oder sogar Multiplikation auch in mehreren atomaren OPS aufgeteilt.
Die reine OPS Angabe ist für mich eher eine typische Klischee-Microsoftsupportaussage - wahr, korrekt, aber nicht hilfreich
Ja, formal lässt sich damit die Leistungsfähigkeit von Hardware vergleichen, aber ohne weitere Informationen praktisch nur für die gleiche Architektur unter verwendung des gleichen Compilers. Da aber bei diesen Chips offenbar jeder sein eigenes Design hat ...
Dazu gilt wie immer: theoretische Leistung < Benchmarkleistung < Leistung bei der praktischen Nutzung
Ich kann zwar bei x86 CPUs einfach annehmen dass die entsprechung zu oben etwa 1; 0,6-0,99; 0,1-0,99 ist, aber bei solchen Chips habe ich keine Ahnung und hätte gerne irgendeinen Vergleichswert um das in Relation zu setzen. FLOPS, Integer OPS, LINPACK, Zeit für Pi auf 100 Mio stellen, FPS von Doom 1 mit Software Renderer ... sowas in der Richtung.
calluna schrieb:
Dir sind die Jahreszahlen in dem Vergleich aufgefallen?
Ja. Und? Was sollen die mir noch sagen, außer der Zeit für den jeweiligen Messpunkt?
 
NoD.sunrise schrieb:
Ist das in dem Bereich überhaupt so relevant?

Nehmen wir mal eine Verlustleistung von 150W-200W + Kühlung bei so etwas an, dann ist das schon nicht ganz ohne Relevanz. Zumindest bei Elektroautos wird typischerweise ja um jeden Kilometer Reichweite gefeilscht und hoher elektrischer Verbrauch dürfte da nicht gerne gesehen sein.
 
Zurück
Oben